DataWorks的Lindorm Ray節點支援使用Ray分散式運算架構進行Python任務的開發和周期性調度。本文為您介紹使用Lindorm Ray節點進行任務開發的主要流程。
節點介紹
Lindorm計算引擎提供基於Ray分散式運算架構的計算服務,相容開源Ray介面,支援Python編程模型,適用於分散式運算、機器學習、資料處理等情境。通過DataWorks的Lindorm Ray節點,線上編寫Python代碼並配置Ray提交命令,實現Ray作業的開發、調試和周期性調度。
使用限制
資源群組限制:Lindorm Ray節點僅支援通過Serverless資源群組運行。
語言限制:Lindorm Ray節點僅支援Python語言。
運行限制:不支援單行或代碼塊運行,僅支援整體提交運行。
準備工作
已建立Lindorm執行個體並綁定至DataWorks工作空間,詳情請參見綁定Lindorm計算資源。
已在Lindorm控制台建立Ray資源群組,詳情請參見使用RAY資源群組。
(可選,RAM帳號需要)進行任務開發的RAM帳號已被添加至對應工作空間中,並具有開發或空間管理員(許可權較大,謹慎添加)角色許可權,新增成員的操作詳情請參見為工作空間增加空間成員。
說明如果您使用的是主帳號,則忽略該添加操作。
建立Lindorm Ray節點
建立入口參考:建立Lindorm Ray節點。
開發Lindorm Ray節點
Lindorm Ray節點的開發包含兩部分:在代碼編輯區編寫Python代碼,並在Ray提交命令區配置作業提交命令。
調試Lindorm Ray節點
配置調試屬性。
您可在節點右側回合組態中配置計算資源、Lindorm資源群組及資源群組資訊,具體參數資訊如下。
參數名稱
描述
計算資源
選擇您所綁定的Lindorm計算資源。
Lindorm資源群組
選擇您在Lindorm控制台建立的Ray資源群組。
資源群組
選擇已通過網路連通性測試的Serverless資源群組。Lindorm Ray節點僅支援Serverless資源群組。
指令碼參數
在配置節點內容時,通過${參數名}的方式定義變數,需要在指令碼參數處配置參數名、參數值資訊,任務運行時會將它動態替換為真實的取值。詳情請參見調度參數來源及其運算式。
調試運行節點。
執行節點任務,您需單擊儲存並運行節點任務。
表徵圖喚起發布流程,通過該流程將任務發布至生產環境。專案目錄下的節點只有在發布至生產環境後,才會進行周期性調度。