全部產品
Search
文件中心

Elastic High Performance Computing:建立混合雲叢集

更新時間:Apr 21, 2026

混合雲叢集指混合部署在本地和雲上的叢集,調度節點、域帳號節點都在本地,計算節點在本地和雲上。您可以利用本地的HPC叢集在阿里雲擴容計算節點資源,統一調度雲上資源和您的本地資源進行高效能運算。本文介紹如何通過E-HPC管理主控台建立混合雲叢集。

前提條件

背景資訊

本地HPC叢集管控節點的環境要求如下:

  • 作業系統:CentOS 7.2、7.3、7.4、7.5、7.6、8.0

  • 調度叢集類型:custom、deadline、PBS 18.1.1、SGE(Open Grid Scheduler)

    說明

    PBS和SGE叢集僅支援作業系統CentOS 7.x。

  • 帳號管理類型:custom

使用流程

建立並使用混合雲叢集的流程如下所示:

  1. 步驟一:建立混合雲叢集

    建立混合雲叢集時,您需要配置叢集計算節點的硬體設定、軟體配置、基礎配置等資訊。

  2. 步驟二:擴容混合雲叢集

    建立混合雲叢集後,叢集中並沒有任何計算節點,若需要使用混合雲叢集,還需要進行擴容。

    擴容前,請根據業務需要準備好自訂鏡像,該自訂鏡像中須安裝有deadline或custom調度器。關於如何建立自訂鏡像,請參見使用執行個體建立自訂鏡像

步驟一:建立混合雲叢集

  1. 登入彈性高效能運算控制台

  2. 在頂部功能表列左上方處,選擇地區。

  3. 在左側導覽列,選擇集群

  4. 集群頁面右上方,單擊创建混合云集群

  5. 配置硬體資訊。

    1. 填寫基本配置資訊。

      配置項

      說明

      可用区

      叢集計算節點的可用性區域。

      付费类型

      叢集計算節點的計費方式,其中不包括Elastic IP Address、NAS儲存的費用。

      • 包年包月:按周、月或年購買及續約,為預付費模式。

      • 按量付费:按實際開通時間長度以小時為單位進行收費,為後付費模式。

      • 抢占式实例:相對於隨用隨付執行個體價格有一定的折扣,價格隨供求波動,按實際使用時間長度進行收費,後付費模式。

      更多資訊,請參見計費方式概述

      计算节点

      用於執行高效能運算作業的節點,其配置決定了E-HPC叢集的總體效能。

      使用代理模式

      開啟後,在雲上建立代理節點,用於管理雲上叢集資源。

      雲上代理節點

      開啟使用代理模式時,配置雲上代理節點的執行個體規格。

    2. 展開高级配置,按需設定參數。

      配置項

      說明

      网络配置

      VPC交换机

      叢集所在的專用網路,不同的專用網路之間邏輯上徹底隔離。您可以在專用網路內建立和管理叢集。

      預設選擇第一個已建立的VPC和交換器,請確保交換器下的IP地址空間足夠(可用IP數大於叢集所有節點的數量)。

      您可以分別單擊创建VPC创建子网(交换机)建立專用網路和交換器。具體操作,請參見建立專用網路建立交換器

      新建安全组安全组名称

      目前僅支援新建安全组,請輸入建立的安全性群組名稱。

      共享存储

      檔案儲存體位置

      選擇檔案儲存體位置。支援不掛載檔案儲存體、使用本地檔案儲存體和使用雲上儲存

      本地叢集儲存掛載地址

      使用本地檔案儲存體時,本機存放區的地址。

      掛載路徑

      使用本地檔案儲存體時,要掛載儲存的叢集路徑。

      本地路徑

      使用本地檔案儲存體時,要掛載到叢集的本地路徑。

      按文件夾配置

      使用雲上檔案儲存體時,選擇是否為各個檔案夾分別掛載不同的檔案系統。

      檔案系統類型

      使用雲上檔案儲存體時,選擇檔案系統的類型。

      文件系统ID挂载点

      預設選擇第一個已建立的檔案系統ID和掛載點,請確保該檔案系統還有可用的掛載點餘量。

      您也可以分別單擊创建文件系统创建挂载点建立新的檔案系統和掛載點。具體操作,請參見建立檔案系統添加掛載點

      掛載選項

      掛載通用型NAS時,可選擇掛載協議,支援使用NFS v3協議或NFS v4協議掛載。

      远程目录

      要掛載的檔案系統的遠程目錄。

  6. 單擊下一步,配置軟體資訊。

    配置項

    說明

    镜像类型镜像

    按需選擇鏡像類型和對應的鏡像,用於部署計算節點環境。

    调度器

    本地叢集的調度器類型。

    调度器节点IP

    本地叢集中部署了調度器的節點的IP地址。

    調度器節點主機名稱

    本地叢集中部署了調度器的節點的主機名稱。

    账号系统

    本地叢集中域帳號服務的類型。

    本地叢集網域名稱

    本地叢集的網域名稱。

    账号节点IP

    本地叢集中部署了域帳號服務的節點的IP地址。

    帳號節點主機名稱

    本地叢集中部署了域帳號服務的節點的主機名稱。

  7. 單擊下一步,配置基礎資訊。

    配置項

    說明

    名称

    叢集名稱,該名稱將會在叢集列表中顯示,便於您尋找識別。

    登录密码

    叢集的登入密碼。該密碼用於遠程SSH訪問叢集登入節點,對應的使用者名稱為root。

    說明

    當開啟代理模式時,叢集登入密碼必須與本地叢集root密碼保持一致。

    确认密码

    再次輸入登入密碼。

  8. 在右側配置清单查看建立的叢集配置,閱讀並選中《E-HPC服务条款》,單擊确认

    建立完成後,在E-HPC叢集頁面,當新建立的叢集狀態為運行中,則混合雲叢集已建立。

步驟二:擴容混合雲叢集

  1. 集群頁面,選擇需要擴容的混合雲叢集,單擊扩容

  2. 集群扩容面板,完成基本配置。

    具體操作,請參見手動擴容叢集。請注意以下配置參數:

    • 镜像类型:選擇自定义镜像

    • 镜像:選擇已建立好的自訂鏡像。

  3. 確認當前配置,閱讀並選中《E-HPC服务条款》,單擊立即购买

    擴容後,您可以單擊資源管理 > 節點與隊列,在叢集列表中選擇已擴容的混合雲叢集,在節點類型列表中選擇计算节点,即可查看已擴容節點的狀態。當該節點狀態為運行中,說明擴容混合雲叢集已完成。