HPE 慧與科技 AIOps AI 資料中心 資料中心管理

透過 AI Ops 研發合作,提升資料中心的運作效率、持續性與彈性復原力

2019-12-09
藉由HPE與美國能源部國家再生能源實驗室長期合作,將資料中心的能源、散熱與IT操作最佳化,為百萬兆級運算(exascale)的時代打造更智慧化、更環保的資料中心。

HPE 慧與科技(Hewlett Packard Enterprise)宣布與美國能源部國家再生能源實驗室(National Renewable Energy Laboratory, NREL)展開AI Ops的研發合作,共同開發人工智慧(AI)與機器學習(ML)技術,將資料中心的運作自動化,並提升運作效率,包括彈性復原力與能源使用率,以因應百萬兆級(exascale)運算時代的需求。

身為先進節能與再生能源技術的全球領導者,NREL將透過此次合作開發與執行新解決方案,以降低資料中心的耗電量與運營成本。此專案合作將為期三年,並將於NREL能源系統整合設施(Energy Systems Integration Facility, ESIF)HPC資料中心的電力與散熱系統導入監控與預測式分析技術。

NREL的Peregrine與Eagle超級電腦,以及實驗室設備中的感測器在過去五年收集到了16TB資料。現在,HPE與NREL要利用這些資料訓練異常偵測模型,以防患未然。

此項合作也有助於解決資料中心未來的用水與用電需求。美國資料中心的用電量預計於2020年達到730億度(kWh),用水量也將達到1740億加侖。因此,HPE與美國國家再生能源實驗室將著重在監控能源使用狀況,包括能源使用效率(PUE)、水利用效率(WUE)與二氧化碳利用效益(CUE)等重要衡量指標,以達到最佳的能源效率與永續性。

利用這些歷史資料進行訓練的模型已成功預測或識別NREL資料中心發生過的事件,可見預測式分析在未來資料中心具有龐大潛力。

由HPE研發人員創建的AI Ops專案將參與美國能源部支援的PathForward計畫。此計畫旨在加速開發百萬兆級運算所需的國家級技術,這將是超級電腦的重大發展。隨著百萬兆級運算時代的到來,HPE已體認到利用AI與自動化技術管理與最佳化資料中心的重要性。

由於百萬兆級超級電腦的執行速度比時下的系統快1,000倍,因此在超級電腦的操作中導入AI技術不僅能利用自動化的智慧型功能節省能源,還能提升彈性復原力與穩定性。

HPE先進技術事業群副總裁Mike Vildibill表示,期待開發出百萬兆級運算的新世代創新技術,以滿足其運營需求。美國國家再生能源實驗室是長期的創新合作夥伴。相信與美國國家再生能源實驗室共同開發與測試AI Ops將能幫助產業建置更聰明、更節能的超級電腦資料中心,同時持續擴充功能與效能。

此專案將使用開放原始碼軟體與程式庫來開發機器學習演算法,例如TensorFlow、NumPy與Sci-kit,並著重於以下領域:

  • 監控:在對資料即時套用演算法前,先從各種來源收集龐大的IT與設施遙測資料,再加以處理與分析。
  • 分析:使用大數據分析與機器學習技術分析資料中心內部各種工具與裝置的資料。
  • 控制:套用演算法讓機器自動解決問題與執行重複性的工作,並對IT與資料中心設施執行預測性維護分析。
  • 資料中心操作:AI Ops將成為在現代化資料中心持續整合(CI)與持續部署(CD)核心IT功能的驗證工具。

未來,HPE打算升級HPE高效能叢集管理系統(High Performance Cluster Management,HPCM),以提供更完整的配置、管理與監控功能,讓叢集更快擴充至10萬個節點。HPE的其他試驗計畫包括HPE InfoSight的整合。此雲端AI管理工具能監控、收集與分析IT基礎架構的資料,並預測與預防可疑事件,以確保系統效能正常運作。


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!