DataWorks 資料地圖是一個集中的資料資產管理與發現平台。它協助您全面瞭解企業內的資料狀況,並像使用搜尋引擎一樣,快速、準確地找到您需要的資料。核心功能包括:
數據總覽:提供資料資產的統計視圖,協助您快速洞察資料現狀。
全域關鍵字搜尋:通過單一入口,快速定位您關心的表、欄位或業務術語。
多維度篩選與瀏覽:通過組合條件,進行精細化、探索性的資料尋找。
使用限制
已建立PAI工作空間的租戶支援搜尋查看對應類型(資料集、AI模型、演算法任務、模型服務)的AI資產。
程式碼搜尋僅支援DataWorks標準版及以上使用者。
進入資料地圖
登入DataWorks控制台,切換至目標地區後,單擊左側導覽列的,在右側頁面中單擊進入數據地圖。
資料總覽:從宏觀視角洞察
資料總覽為您提供資料來源的整體使用方式。
在資料地圖首頁,單擊元數據採集後的數據總覽。
在資料總覽頁,查看當前地區所有的引擎資源。
MaxCompute關鍵計量說明:
名稱
描述
總項目數
當前地區下,所有MaxCompute專案總數。准即時資料。
總表數
當前地區下,所有MaxCompute表總個數。此資料為離線統計,有T+1延遲。
存儲量
當前地區下,所有表的邏輯儲存大小總和,包含調度任務的臨時檔案、刪除表後尚未釋放的儲存空間。此資料為離線統計,有T+1延遲。
總API數
當前地區下,發行至API Gateway的MaxCompute類型的API總數。
存儲趨勢圖
當前地區下,MaxCompute專案的邏輯儲存總和趨勢圖,此資料包含調度任務的臨時檔案、刪除表後尚未釋放的儲存空間。此資料為離線統計,有T+1延遲。
專案佔用儲存Top
當前地區下,MaxCompute專案的邏輯儲存大小的排行。此資料為離線統計,有T+1延遲。可單擊查看專案中繼資料。
重要專案儲存量除表格儲存體量外,還會計算包括資源儲存量、資源回收筒儲存量及其它系統檔案儲存體量等在內,會大於表格儲存體量。
表佔用儲存Top
按照MaxCompute表大小展示的熱門排行榜。此資料為離線統計,有T+1延遲。可單擊查看錶中繼資料。
重要表的儲存計算的是表的邏輯儲存而非實體儲存體。
熱門瀏覽表
最近30天內的頁面熱門瀏覽表,根據30天內在資料地圖點擊瀏覽表詳情頁面的PV進行統計,准即時資料。
其他引擎指標說明:展示資料庫總數、總表數、叢集總數等資訊。
如何尋找資料:從搜尋到發現
資料地圖提供兩種互補的搜尋方式來滿足您不同的找數需求。
全域關鍵字搜尋
當您對要找的資料有明確線索時,全域搜尋是最高效的方式。同時,首頁提供快捷入口展示最近瀏覽、關注專輯、管理專輯。
進入搜尋欄:在資料地圖的首頁頂部,找到醒目的搜尋方塊。
輸入關鍵字:選擇中繼資料類型,輸入表名、欄位名、中文注釋等關鍵字。例如,輸入“使用者”、“訂單”或“user_info”。
執行搜尋:按下斷行符號鍵,系統將返回一個包含所有相關資料資產的列表,單擊查看詳情。
多維度篩選與瀏覽
當需要更精確地縮小尋找範圍,或想按業務分類進行探索時,可進入搜尋網頁進行進階搜尋。同時,導覽列上方仍然提供首頁的全域關鍵字搜尋。
進入搜尋網頁:從左側導覽列點擊搜尋表徵圖
,進入進階搜尋頁面。組合篩選條件:在頁面左側,通過勾選不同的篩選條件來層層過濾:
類型:選擇中繼資料類型,支援表、代碼、索引、API、數據集、工作空間等。如果您的租戶已建立 PAI 工作空間,還可以篩選 AI模型、算法任務、模型服務 等 AI 資產類型(當前為 Beta)。
資料來源:當選擇表時,限定只在某個引擎中尋找,如 MaxCompute、EMR Hive、Hologres 等。
重要若資料來源超過一定數量時,點擊右上方的更多按鈕可展示隱藏資料來源。
篩選條件:支援專案、負責人、環境、叢集、資料目錄、資料庫等篩選。
篩選條件依據中繼資料的不同類型而有所差異。
使用樣本:
我想找MaxCompute中,由“張三”負責的所有生產環境的表。操作: 在“資料來源”中選擇MaxCompute-> 在“負責人”中輸入張三-> 在“環境”中選擇生產。
人工智能搜尋
當您難以用單一關鍵字描述要找的資料,或希望基於業務情境擷取建議時,可使用人工智能搜尋,通過自然語言提問讓資料地圖為您智能定位資產、推薦相關表,並解釋推薦依據。
從搜尋網頁進入:在資料地圖搜尋網頁右上方,切換到人工智能搜尋頁簽,即可進入會話式搜尋體驗。
從首頁進入:在資料地圖首頁的搜尋方塊可切換到智能問答模式,輸入您的問題,系統會跳轉到 AI 搜尋會話頁繼續對話。
使用方式:在輸入框中以自然語言描述您的需求,例如:
找一下交易業務相關的事實表;查詢最近 7 天新增的資料集;列出歸屬"資料治理"業務部門的 MaxCompute 專案。
會話管理:從首頁發起的提問會建立一個新會話;進入 AI 搜尋網頁時,若未指定會話則繼續您上一次的會話。您可以根據需要建立會話或回到歷史會話。
快捷提問模板:AI 搜尋會話頁底部提供常用問題範本,單擊即可發送,便於您快速上手。
與綜合搜尋的關係:綜合搜尋按關鍵字與篩選條件精確匹配中繼資料,AI 搜尋按自然語言與語義上下文理解需求並給出推薦,兩者互補;建議在明確目標對象時使用綜合搜尋,在描述業務訴求時使用 AI 搜尋。
AI 搜尋能力當前按租戶灰階開放,僅當您的租戶已開通該能力時可見。如需開通,請聯絡您的管理員或提交工單諮詢。
常見問題
Q:搜不到我想要的表?
A:在 DataWorks 資料地圖中找不到目標表,通常由以下原因導致,您可以逐一排查並參考對應的解決方案。
搜尋關鍵詞不匹配:支援按表名、描述、欄位名等檢索,建議嘗試更精確或部分關鍵詞。
中繼資料未同步:DataWorks 綁定 MaxCompute 或 DLF 後會自動採集中繼資料,但建立表或結構變更後可能存在延遲。
解決方案:進入我的資料 > 我的工具 > 重新整理表中繼資料,操作成功後,重新搜尋即可。表被隱藏:表可能被設定為“隱藏”狀態,導致無法通過搜尋發現。表狀態設為“隱藏”時,所有人不可見;設為“僅專案”時,僅本工作空間成員可見。
許可權不足:預設搜尋僅覆蓋當前工作空間及已授權專案。若目標表屬於其他帳號或未授權的工作空間,即使存在也無法檢索到。另外,若無表的查詢許可權,預設無法在資料地圖中看到該表(尤其在標準模式工作空間)。
解決方案:聯絡表 Owner 或管理員申請許可權,或確認是否已加入對應專案。