Lindorm計算引擎RAY資源群組提供分散式運算服務,支援AI負載端到端處理。該資源群組相容完整RAY計算模型及編程介面,深度融合Lindorm多模儲存引擎特性,可高效完成資料預先處理、訓練及推理任務。本文介紹RAY資源群組的開通、管理及計費方式。
RAY資源群組目前處於邀測階段,如有使用需求,請聯絡Lindorm支援人員(DingTalk號:s0s3eg3)申請使用名額。
前提條件
計費方式
RAY資源群組提供常駐運行模式,費用包含以下兩部分:
開通RAY資源群組
登入Lindorm管理主控台。在左上方選擇執行個體所屬的地區。在实例列表頁,單擊目標執行個體ID或者目標執行個體所在行操作列的管理。
-
在实例详情頁的配置信息地區,單擊计算引擎操作列的资源组管理。
-
在资源组详情頁中單擊创建资源组,配置以下內容:
-
资源组类型:選擇RAY。
-
资源组名称:資源群組的名字,僅支援小寫字母和數字,且長度不超過63個字元。例如
raycg。 -
运行模式:RAY 資源群組的運行模式,預設常驻。常駐啟動並執行 Ray 叢集,將 RAY 作業提交到指定的 RAY 叢集運行。在無作業運行情況下,RAY 叢集以最小的資源保有量運行;有作業提交後,RAY 叢集按照作業需求動態申請資源。
-
RAY 常駐資源群組參數說明:
-
Head 節點配置。請根據您的叢集規模選擇 Head 節點資源規格以及磁碟空間。
-
Worker Group 數量。您可以根據業務情境選擇一個或多個 Worker Group,每個 Worker Group 擁有不同的資源規格。
-
Worker Group 配置。您可以為每個 Worker Group 配置獨立的資源規格、磁碟空間以及 Worker Group 內最大、最小運行副本數。
Head 節點配置
配置項
參數說明
Head资源类型
RAY 資源群組支援選擇 CPU、GPU 2種類型資源。
Head资源规格
-
CPU 資源類型,請選擇您的 CPU、記憶體配額,比如 4核8G、4核16G、8核32G 等。請根據您的叢集規模選擇,預設為 4核16G。
-
GPU 資源類型,當您需要使用 GPU 資源時,受機型、庫存限制,請聯絡Lindorm支援人員(DingTalk號:s0s3eg3)。
Head磁盘大小
Head節點的磁碟空間,用於儲存日誌、記憶體溢出檔案,以及您作業運行過程中所使用的資源檔,預設為 30G。
Worker Group 配置
配置項
參數說明
Worker资源类型
RAY 資源群組支援選擇 CPU、GPU 2種類型資源。
Worker资源规格
-
CPU 資源類型,請選擇您的 CPU、記憶體配額,比如 4核8G、4核16G、8核32G 等。Worker Group 資源規格請根據您實際啟動並執行作業需求選擇,預設為 4核16G。
-
GPU 資源類型,當您需要使用 GPU 資源時,受機型、庫存限制,請聯絡Lindorm支援人員(DingTalk號:s0s3eg3)。
Worker磁盘空间
Worker節點的磁碟空間,用於儲存日誌、記憶體溢出檔案,以及您作業運行過程中所使用的資源檔,預設為 30G。
最小Worker个数
Worker Group 內最小運行副本數。當無作業運行時,以該資源配額運行。
最大Worker个数
Worker Group 內最大運行副本數。當有作業運行時,能申請的最大 Worker 節點數量。
-
-
-
單擊確定,建立RAY資源群組。建立過程大約需要20分鐘。
管理RAY資源群組
登入Lindorm管理主控台。在左上方選擇執行個體所屬的地區。在实例列表頁,單擊目標執行個體ID或者目標執行個體所在行操作列的管理。
-
在实例详情頁的配置信息地區,單擊计算引擎操作列的资源组管理。
-
在资源组详情介面,將滑鼠移至上方在RAY資源群組操作列的WebUI之上,擷取資源群組的WebUI地址,例如:
http://alb-57k7r581oht8rd****.cn-hangzhou.alb.aliyuncsslb.com/ray/raycg/dashboard/。 -
在瀏覽器中訪問資源群組的WebUI地址來查看資源群組的運行狀態。

-
在WebUI的上方導覽列,切換標籤頁可以依次查看作業列表(Jobs)、叢集狀態(Cluster)、Actor列表(Actors)、叢集日誌(Logs)。
-
在叢集狀態(Cluster)標籤頁,可查看叢集中所有節點的CPU、記憶體、GPU、Object Store等資源的使用方式。
-
-
(可選)在资源组详情頁中,您還可以删除已建立的資源群組。
說明RAY資源群組暫不支援修改和重啟操作。