若您要在DataWorks中使用EMR Serverless Ray進行Ray作業開發,需先將EMR Serverless Spark工作空間下的Ray叢集綁定為DataWorks的Serverless Ray計算資源。綁定完成後,可在資料開發(Data Studio)中通過Serverless Ray節點選擇該計算資源運行任務。
準備工作
已在E-MapReduce中建立EMR Serverless Spark工作空間,並在該工作空間下建立可用的Ray叢集。
DataWorks已建立工作空間,操作者使用的RAM帳號已加入工作空間並設定為工作空間管理員角色。
重要僅支援選擇使用新版資料開發(Data Studio)的工作空間。
已使用Serverless資源群組,並綁定到目標DataWorks工作空間。
使用限制
地區限制:與綁定EMR Serverless Spark計算資源一致,支援華東1(杭州)、華東2(上海)、華北2(北京)、華南1(深圳)、西南1(成都)、中國香港、日本(東京)、新加坡、印尼(雅加達)、德國(法蘭克福)、美國(矽谷)、美國(維吉尼亞)等。實際支援地區以控制台為準。
許可權限制:
操作人
具備許可權說明
阿里雲主帳號
無需額外授權。
阿里雲RAM帳號/RAM角色
DataWorks系統管理權限:僅擁有營運和空間管理員角色的空間成員,或擁有
AliyunDataWorksFullAccess許可權的空間成員可建立計算資源。授權詳情請參見授權使用者空間管理員權限。EMR Serverless Spark服務許可權:需具備
AliyunEMRServerlessSparkFullAccess權限原則,以及目標Spark工作空間Owner許可權。詳情請參見系統管理使用者和角色。
綁定Serverless Ray計算資源
在計算資源清單頁,將Ray叢集綁定為DataWorks的Serverless Ray計算資源。
選擇綁定計算資源類型。
單擊綁定計算資源,進入綁定計算資源頁面。
在綁定計算資源頁面,選擇計算資源類型為Serverless Ray,進入綁定Serverless RAY計算資源設定精靈。
在設定精靈中填寫綁定資訊。
在第二步請填寫資訊頁面,根據下表配置參數。
參數
說明
Spark工作空間
選擇Ray叢集所在的EMR Serverless Spark工作空間。您也可在下拉式功能表中建立Spark工作空間。
付費類型
由所選Spark工作空間決定,例如隨用隨付,無需單獨修改。
RAY叢集
選擇需要綁定的Ray叢集。列表中展示當前Spark工作空間下已建立的Ray叢集。
引擎版本
根據所選Ray叢集自動展示,例如引擎版本與內建的Ray、Python版本資訊。具體以控制台顯示為準。
計算資源執行個體名稱
用於在DataWorks任務中標識該計算資源。任務運行時在節點中選擇對應的計算資源執行個體名稱即可使用該綁定。
描述
可選,用於備忘該計算資源的業務用途,便於後續管理。
重要請注意,為了在DataWorks中正常擷取叢集資訊,請勿在E-MapReduce Serverless Spark工作空間中移除DataWorks服務關聯角色
AliyunServiceRoleForDataWorksOnEmr和AliyunServiceRoleForDataWorksEngine的管理員角色。單擊確認,完成Serverless Ray計算資源綁定。
後續操作
綁定完成後,您可在資料開發中建立Serverless Ray節點,並選擇本計算資源運行Ray作業。