DataWorks官方鏡像為資料開發中的不同節點提供常用的運行環境,以滿足不同任務的執行環境需求,您可在資料開發中直接使用官方鏡像,也可以基於官方鏡像建立自訂鏡像後使用,本文將介紹官方鏡像。
鏡像介紹
進行資料開發時,若未給節點配置運行環境的鏡像,則預設使用Default標準鏡像。Default標準鏡像僅提供基礎運行環境,可能無法滿足特定任務的需求。可通過官方鏡像配置的基礎鏡像,在資料開發中為不同任務類型提供標準化環境。此外,官方鏡像是預配置的基礎鏡像,可基於自身建立自訂鏡像,通過額外配置,可以擴充更多環境情境,滿足不同任務類型的需求。
鏡像列表
支援版本和地區,以DataWorks控制台為準。
DataWorks提供以下鏡像供您使用:
鏡像名稱 | 鏡像說明 | 適用任務 |
dataworks_pyodps_py311_task_pod | DataWorks PyODPS節點的官方鏡像,該鏡像的Python版本為3.11。 | |
dataworks_pairec_task_pod | DataWorks PAI-Rec官方鏡像,用於運行PAI-Rec產生的演算法。feature_store sdk版本和pyfg版本以控制台顯示為準。 | |
dataworks_pyodps_task_pod | DataWorks PyODPS節點的官方鏡像,該鏡像的Python版本為3.7。 | |
dataworks_emr_base_task_pod | EMR叢集基礎鏡像,支援EMR Serverless Spark、EMR on ECS DataLake、EMR on ECS Custom叢集類型。 | |
dataworks_shell_jdk17_task_pod | DataWorks Shell節點的官方鏡像,該鏡像的JDK版本為JDK17。 | |
dataworks_shell_task_pod | DataWorks Shell節點的官方鏡像,JDK版本為JDK7。若需要自訂運行環境並且該環境支援Subprocess傳參,可基於該鏡像構建自訂鏡像。 | |
dataworks_python_task_pod | DataWorks Python節點的官方鏡像,Python版本為3.7。 | |
dataworks_cdh_custom_task_pod | DataWorks CDH叢集基礎鏡像,無法直接使用。必須通過自訂鏡像安裝 | |
dataworks_controller_task_pod | DataWorks賦值節點官方鏡像,若需要自訂運行環境並且需要使用賦值節點或賦值參數用於將參數傳遞到下遊節點的情境,請基於該鏡像構建自訂鏡像。 | |
dataworks-mcp | 適用於DataWorks Agent任務開發。相關係統資訊:py3.11-ubuntu22.04。 | |
dataworks-notebook | 適用於Notebook開發任務開發。相關係統資訊:py3.11-ubuntu22.04。 | |
dataworks_notebook_task_pod | DataWorks Notebook Ubuntu Image,支援關聯角色注入。 | |
dataworks-maxcompute | 適用於個人開發環境製作MaxCompute鏡像。相關係統資訊:py3.11-ubuntu20.04。 |
使用鏡像
在資料開發中除了支援使用官方鏡像外,還支援使用已綁定空間的自訂鏡像。
新版資料開發使用鏡像:需在節點開發頁面右側的調試配置和調度配置內配置測試回合以及發布後啟動並執行資源群組與鏡像。
舊版資料開發使用鏡像:需在節點開發頁面中,單擊帶參運行後的彈窗內,或在節點開發頁面右側的調度配置頁面為節點的測試回合和發布後運行配置資源群組與鏡像。
個人開發環境使用鏡像:建立個人開發環境執行個體時,可在鏡像配置中選擇需要的不同的官方鏡像。
配置資源群組與鏡像時,需注意:
調度資源群組:選擇Serverless資源群組。
鏡像:直接選擇官方鏡像或已發布的自訂鏡像。