彈性高效能運算E-HPC

彈性高效能運算(E-HPC)基於阿里雲基礎設施,為用戶提供一站式公用雲端HPC服務,面向教育科研,企事業單位和個人,提供快捷,彈性,安全和與阿里雲產品互通的技術計算雲平台。

立即開通 聯絡我們

彈性高效能運算 E-HPC

阿里雲彈性高效能運算E-HPC產品構建在飛天平台基礎設施之上,為用戶提供一站式的高效能運算服務的雲平台,即HPCaaS公用雲端服務。E-HPC支援高效能CPU、異構計算GPU實例的IaaS服務,高效能運算支架軟體棧的PaaS服務和根據套用範本定製的SaaS服務。主要面向需求大級別計算能力的企事業單位,支援HPC、AI和大級別資料分析等並行套用。


特點

阿里雲彈性高效能運算E-HPC與傳統超算中心以及自建叢集相比,提供了一種快捷,彈性,安全以及互通的公共雲高效能運算服務。

快捷

快速建立基於阿里雲ECS/EGS/VPC/NAS等資源的計算叢集,根據用戶選擇快速構建執行階段環境和豐富的支架軟體棧。

彈性

根據計算負荷,時間和效能要求增減和釋放計算節點,儲存等資源,節約大量的CAPEX費用,包括但不限於硬體系統費用,永久軟體授權數費用,機房水電風費用,運維人工費用等。由於使用的是阿里雲彈性計算資源,可以是實現即買即用的任意級別群組和節點自動縮容擴容的功能。

安全

E-HPC是構建在阿里雲IaaS產品之上的PaaS平台,所以整合了阿里雲產品的群組安全性,如VPC許諾的網路安全,ECS許諾的計算安全和NAS許諾的高可用高可靠儲存等。

互通

由於構建在阿里雲IaaS資源之上,E-HPC和其它雲產品可全面打通,例如通過雲盤,共用儲存和VPC網路安全交換資料,並可以和其它資料分析,視覺效果產品互通完成複雜的數值模擬和資料分析閉環。


產品優勢

E-HPC 相比傳統超算中心

  • E-HPC 按需要使用的級別購買,無需排期,即買即用。

  • E-HPC 機型種類多,可根據套用需求購置最適合的計算資源配比(如 SCC,EGS 實例)。

  • E-HPC 充分複用阿里雲產品,大大提高了資料安全性和高可用工時。

E-HPC 相比自建物理 HPC 叢集

  • E-HPC 可節約巨量 CAPEX 投入,包括但不限於:硬體系統費用;軟體授權數費用 (多核,多節點);伺服器機房建設,電力和製冷費用;平日運作的維修支援費用。

  • 使用 E-HPC 無需顧慮硬體升級換代。

  • E-HPC打通阿里雲全系列產品,可擴充性極強。

E-HPC 相比自建雲端服務器叢集

  • E-HPC 提供方便的軟體管理服務,覆寫 HPC 套用全部支架軟體棧功能,並隨 HPC 共同體(OEM/OSV/ISV/用戶/開發人員/開源社群)版本升級。

  • E-HPC 提供優化的軟體授權數調度機制,節約成本。

  • E-HPC 提供叢集節點自主擴容/縮容服務以及autoscale功能。


推薦設定

E-HPC 推薦實例設定主要包括以下幾種,如下表所示。
:表格中閱聽的是各系列機型最高規格設定的實例。實際以建立叢集時可供選擇的設定為準。

機型CPU記憶體GPU網路
Super Computing Cluster sccgn564核 E5-2682 v4 2.5GHz512 GBNvidia Tesla P100 x 825 Gbps RoCE + DPDK
GPU計算型 gn516核 E5-2682 v4 2.5GHz120GBNvidia Tesla P100 x 825 Gbps
高主頻計算型 scch564核 Skylake Xeon Platinum 3.1 GHz192 GBN/A25 Gbps RoCE + DPDK
通用型 g564核 Skylake Xeon Platinum 8163 2.5GHz256 GBN/A20 Gbps
計算網路美化型 sn1ne32核 E5-2682 v4 2.5GHz64 GBN/A10 Gbps + DPDK

價格

E-HPC產品的費用包含 ECS 產品的費用、E-HPC產品的費用、共用儲存NAS費用以及登入節點的外網流量費用。

注意:若您的叢集級別較大,可以通過提交工單的方式與我們聯繫以獲得優惠。

ECS 產品費用

在開通 E-HPC 叢集時,E-HPC叢集內每個節點都是一個ECS實例,價格隨選擇的ECS實例硬體設定變化。建立E-HPC叢集時會自動完成購買阿里雲ECS的動作,所以您無需提前準備 ECS。如果您有 ECS 的優惠折扣,在這裡購買時同樣享有。

ECS價格

E-HPC 產品費用

E-HPC會提供叢集的多維度管理服務,包括彈性節點增減、Open API 支援、監控報警、運維工具、服務端背景自動化運維等。這部份費用按照用戶核時數進行隨用隨付,用戶在一個地域的所有叢集總核數小於200核(vCPU)不收費,高於200核(vCPU)按每核時0.02元計費。

NAS 產品費用

E-HPC叢集中需要使用NAS作為各節點的共用儲存空間。價格可參考Network Attached Storage 詳細價格資訊

登入節點外網流量費用

建立完成的E-HPC叢集會預設給登入節點繫結EIP並開啟一定量的公網頻寬。這個流量是按量(小時)計費的,僅單面收取流出流量費用,流入流量免費。

例如,您在 1 小時內公網流出流量為 10GB,收取費用為 10GB × 每 G 價格 元 / 小時。每個 Region 的流量費略有不同。

Elastic IP Address計費說明

E-HPC叢集總費用

E-HPC叢集總費用以建立叢集時計價器顯示的總價為準。

典型高效能運算套用場景

HPCaaS 彈性高效能運算雲平台

彈性構建敏捷伸縮

支援基於阿里雲ECS、EGS彈性計算實例,VPC專有網路,NAS儲存實例快速構建任意級別的並行計算叢集,並根據用戶需求動態增刪節點個數和儲存級別。

主要優勢

不用排隊:用戶只需購買EHPC的叢集實例,就可以立刻獲得相應數目的ECS,EGS,NAS和搭配的RDS,OSS等服務。

級別Auto Scaling:用戶可以根據初期使用叢集級別生成叢集,在執行階段通過叢集調度動態伸縮叢集數目。突破線下物理叢集的級別節流。

安全隔離:管控空間和用戶空間分離,並採用阿里雲原生ECS,EGS,VPC安全隔離許諾多租戶間資料安全隔離。

E-HPC套用場景架構圖

使用入門

通過管理主控台使用阿里雲 E-HPC

彈性高效能運算E-HPC管理主控台提供基於 Web 的使用者介面,您可以利用它存取和設定 E-HPC 叢集。
您可以使用該主控台對 E-HPC 的相關元件(如節點、共用儲存、用戶等)進行建立、查看和管理。

前往E-HPC主控台

有關如何通過管理主控台建立和使用彈性高效能運算E-HPC叢集,請參閱:

快速建立E-HPC叢集

存取阿里雲 E-HPC 產品文件

要建立使用彈性高效能運算E-HPC叢集,請參閱E-HPC文件以詳細了解彈性高效能運算E-HPC叢集的工作原理以及如何修改和管理E-HPC叢集元件。

E-HPC用戶指南

阿里雲 E-HPC API 參考

您可以使用E-HPC OpenAPI,通過編程建立、管理彈性高效能運算E-HPC叢集的資源,並實現更好的掌控力。

E-HPC API概覽

資源

以下這些文件、API 及其他產品相關資源的連結有助您充分利用彈性高效能運算E-HPC的功能和強大的計算能力。

開發人員資源

通過以下連結,您可以查看E-HPC進階功能、說明文件等。
這些連結可以說明開發人員將E-HPC叢集與其現有高效能運算套用進行整合或改進設定。

阿里雲供應項目API總覽

相關服務

通過以下連結可以查看E-HPC元件相關產品服務的詳細說明文件和開發資源等

Elastic Compute Service

常見問題

如何登入叢集?

E-HPC叢集建立完成後,會自動為每個登入節點配置一個公網IP。

在E-HPC主控台主介面點選左側欄的“節點”標籤,在刷新後的主介面的“叢集”右側下拉式功能表中選擇所建立叢集的名字。再到節點類型右側下拉式功能表中選擇登入節點。表格中IP位址/ID欄即顯示登入節點對應的公網位址。

若在叢集建立最後一步生成了金鑰組,則可通過支援通行金鑰登入的終端軟體(如putty等)使用金鑰登入(推薦,安全性更好也更方便)。或通過普通ssh終端使用預設root密碼即可登入。預設登入shell為bash。

為何某些地域無法開通E-HPC叢集?

一般來說,部份地域+可用區無法開通E-HPC叢集是受到以下幾方面因素的節流:

  • 該地區沒有部署NAS,E-HPC叢集無法建立共用儲存。

  • 該地域+可用區沒有符合E-HPC叢集計算節點設定的ECS可供選擇(如無GPU實例)。

  • 該地域+可用區沒有足夠數量的資源滿足E-HPC叢集所需的節點數量。

如無特殊需求請選擇其它地區進行E-HPC叢集建立。

為何不能使用ECS管理主控台對E-HPC叢集節點進行動作?

儘管E-HPC叢集是基於ECS雲端服務器組建,但E-HPC還提供了額外的部署流程,包括且不限於以下條目:

  • E-HPC說明用戶按照既定節點配比(如開通高可用情況下,4管控:1登入:n計算)和指定實例設定,為各類節點批量開通ECS雲端服務器。

  • E-HPC在開通各個節點對應的ECS雲端服務器後,會進一步部署管控系統。

  • E-HPC通過管控系統為用戶預裝選定的軟體及其依賴軟體包。

  • E-HPC根據節點類型分別設定作業調度器server和client。

以上動作和相關服務都依賴於E-HPC叢集部署流程。若用戶自行使用ECS管理主控台對各個節點進行幹預則很可能導致叢集建立失敗,節點掉線或調度系統失效。因此我們強烈建議如非排查故障,禁止使用ECS管理主控台對E-HPC叢集節點進行動作。

如有特殊需要,請在E-HPC開發維修人員指引下使用ECS管理主控台對節點進行檢查。

什麼是高可用?

高可用指的是建立的叢集支援HA(High Availability)功能,不會因單點故障而導致整個叢集失能的問題,建立出來的叢集前端節點(調度節點)和域賬戶管理節點都支援高可用設定。比如針對PBS Pro叢集的前端節點和NIS域賬戶管理節點都分別有兩個,master和slave,當master節點不能工作的時候,會自動切換到slave節點上。

如何進行實名註冊以購買中國大陸地域雲產品服務?

根據中國大陸相關法規要求,購買和使用中國大陸節點(不含香港節點)雲產品服務的用戶(包括存量、新購、續費用戶)需要進行實名註冊。
當用戶進行購買相關動作時,如選擇了中國大陸區域(不含香港),系統將檢查用戶的實名註冊資訊,若未完成,購買流程將報錯並被要求先進行實名註冊。
實名註冊流程參見:https://www.alibabacloud.com/help/zh/faq-detail/52595.htm