DataWorks OpenData 為使用者提供集中、統一、易用的DataWorks平台的“中繼資料集合”。使用者無需複雜配置,即可通過MaxCompute Package 視圖授權共用的方式,快速擷取標準化、可追溯的中繼資料資訊。資料範圍包含各類 表、任務節點及執行個體、工作空間、成員、專案、資料品質、資料資產等對象的詳細中繼資料,助力資料治理與分析。
應用情境
DataWorks開放資料(DataWorks OpenData)是原有邀測版開放資料的全新升級,本次提供公開使用版本。與以往通過命令列操作開放資料的方式不同,新版提供了可視化介面,方便您更直觀、高效地使用和管理中繼資料。
基於DataWorks平台提供的開放資料,您可進行以下應用:
資料盤點:清晰統計工作空間、負責人管理的資料對象(如表、任務),瞭解資料結構、來源、更新頻率及依賴關係,消除“資料黑盒”問題。
全鏈路追溯:基於表和資料血緣等中繼資料,支援自訂查詢具體表的上下遊血緣路徑,可完整追蹤從來源資料到下遊應用的流轉過程,快速定位問題或分析影響範圍。
自訂中繼資料分析:在原有OpenAPI的基礎上,支援通過SQL方式直接存取和統計中繼資料,從而簡化分析流程,縮短資料治理周期。
前提條件
已建立DataWorks工作空間並綁定MaxCompute計算資源。
使用限制
版本要求:僅支援 DataWorks 企業版及以上版本,其他版本暫不支援。
許可權限制:僅租戶所有者、租用戶系統管理員、資料治理系統管理員使用者角色,或被授予
DataWorksFullAccess許可權的RAM使用者,可安裝和卸載DataWorks開放資料。授許可權制:當前僅支援通過 MaxCompute 接收授權的中繼資料視圖,暫不支援其他類型資源。
資料更新時效性:中繼資料更新為 T+1 延遲,即當日可查詢昨日統計結果。
管理開放資料
您可以查看並瞭解DataWorks開放資料的相關資訊,同時完成開放資料的安裝與使用。
查看開放資料
您可以通過以下內容瞭解開放資料中不同Package所包含的當前租戶下的中繼資料資訊及其適用情境,從而在使用時能夠按需選擇和靈活應用。
登入DataWorks控制台,切換至目標地區後,單擊左側導覽列的,在右側頁面中單擊進入資料地圖。
單擊資料地圖左側導覽列中的
表徵圖,進入資料目錄頁面。在目錄列表中單擊DataWorks OpenData,即可進入開放資料(DataWorks OpenData)頁面。
切換至Package列表頁簽後,可單擊對應的Package詳情,並在表列表中查看該Package包含的中繼資料表及其說明資訊。
MetaData中繼資料與Examples中繼資料的區別:
Package名稱
開放資料
適用情境
MetaData
表資訊(如表結構、欄位描述、血緣關係)。
調度節點及執行個體(如任務執行狀態、依賴關係)。
工作空間、成員、專案等管理中繼資料資訊。
資料品質明細、資料治理明細等中繼資料。
適用於資料資產盤點、資料血緣分析、依賴關係管理。
Examples
中繼資料指標集合資料。
說明Examples Package由DataWorks提供,基於中繼資料產生的樣本性指標統計表集合。實際資料將根據具體業務情況動態調整,最終以系統介面顯示為準。
結合MetaData Package的未經處理資料,可快速構建常見分析情境(如資源使用率分析、任務健康度評估)。
重要中繼資料表的結構及欄位詳細說明,請參見開放資料表結構詳情。
如需進一步瞭解中繼資料表的詳細資料,可單擊對應表的詳情,在表詳情頁查看具體欄位及其描述資訊,方便您在使用過程中快速建立開放資料中繼資料表之間的關聯關係。
安裝開放資料
您可以參考開放資料中的詳情資訊,根據業務需求,將本租戶範圍內的所有相關資料檢視通過Package安裝方式,以Package形式授權至指定目標工作空間的MaxCompute計算資源中。
進入開放資料頁面,在Package列表頁簽中選擇目標Package(MetaData或Examples),單擊操作列的詳情。
進入Package頁面,安裝所需使用的Package。
初次安裝:單擊Package頁面右上方的安裝按鈕,進行安裝。
已存在安裝記錄:單擊Package頁面安裝記錄頁簽下方的安裝按鈕進行安裝。

在彈出的安裝DataWorks中繼資料對話方塊中,選擇目標工作空間及授權使用的MaxCompute專案。
說明授權使用的MaxCompute專案為目標工作空間綁定的計算資源。
如目標工作空間綁定的MaxCompute計算資源顯示已安裝,無需重複安裝。
如需在標準模式的工作空間中操作開放資料中的中繼資料資訊,建議分別為開發環境和生產環境綁定的MaxCompute計算引擎進行安裝授權。
勾選確認安裝說明後,單擊確認安裝。安裝成功後,您可以在安裝記錄頁簽下查看新增的安裝記錄。
如需在目標工作空間的 MaxCompute 計算引擎中使用其他Package對應的中繼資料資訊,您可以參考以上步驟進行安裝和授權。
使用開放資料
將開放資料安裝到目標工作空間的 MaxCompute 計算資源後,您可以在資料開發或資料分析模組中,基於該目標工作空間的MaxCompute計算資源,直接存取已授權的中繼資料視圖資訊。
在資料地圖左側導覽列中,單擊
表徵圖,進入資料目錄頁面。在目錄列表中單擊MaxCompute,單擊以u_meta為首碼、地區為尾碼的Package。

在詳情頁單擊或,即可前往對應模組查詢使用已授權的中繼資料視圖。
資料開發使用:
在Data Studio頂部功能表列中,切換地區和工作空間到已安裝開放資料的目標工作空間。
建立MaxCompute節點,在節點編輯頁面使用開放資料進行相關任務開發。
您可以通過以下範例程式碼驗證並測試安裝是否成功。
SELECT dt ,COUNT(*) AS database_count FROM u_meta_hangzhou.databases GROUP BY dt ORDER BY dt ASC LIMIT 32 ;重要測試代碼時,計算資源需要使用您已授權的MaxCompute計算資源。
u_meta_hangzhou需調整為您所使用的MaxCompute資料目錄中以u_meta為首碼、地區為尾碼的Package。
資料分析使用:
進入資料分析的SQL查詢頁面後,系統提供了常見的樣本中繼資料分析指令碼,您可以根據需求自行調整指令碼內容。
單擊SQL查詢頁面右上方的
表徵圖,選擇您已授權的工作空間,並綁定MaxCompute計算資源時系統產生的同名資料來源。即可在資料分析中運行已授權的中繼資料。說明在執行樣本指令碼前,您可將指令碼中的
REPLACE_WITH_WORKSPACE_ID參數替換為您所需查詢的工作空間ID,否則會執行報錯,工作空間ID擷取請參見配置工作空間。
卸載開放資料
如果後續不再使用開放資料,或需要解除對某個工作空間中MaxCompute專案的授權,您可以卸載對應的開放資料。
在資料地圖左側導覽列中,單擊
表徵圖進入資料目錄頁面。在目錄列表中選擇MaxCompute,然後單擊以u_meta為首碼、地區為尾碼的Package。
在詳情頁的可訪問專案頁簽找到目標專案,單擊對應操作欄中的卸載,在彈出的確認卸載DataWorks中繼資料視窗中,勾選確認卸載說明後,單擊確認卸載。
重要請謹慎執行卸載操作,確保在資料開發或資料分析任務中已停止使用相關資料,否則卸載開放資料後會導致任務無法正常執行。
常見問題
Q:中繼資料更新延遲如何影響使用?
A:中繼資料按T+1產生,若需即時資料,建議通過DataWorks OpenAPI直接擷取。
Q:DataWorks開放資料安裝後是否可卸載?
A:可卸載,卸載後會取消授權,需謹慎操作以避免影響依賴該視圖的分析任務。
Q:如何確保中繼資料安全性?
A:通過MaxCompute資料存取權限控制管理控制存取範圍,避免將敏感中繼資料共用給無關團隊。