DataWorks的資料對比節點可實現對不同表之間的資料進行多種方式的對比,並可在工作流程中使用。本文為您介紹使用資料對比節點進行任務開發的主要流程。
節點介紹
資料對比節點不僅僅用於Data Integration,還支援表與表之間的對比。同時,它還支援自訂對比範圍以及自訂對比的指標,從而實現更多方面的資料對比。
條件限制
僅支援Serverless資源群組,使用Serverless資源群組可參見:資源群組管理。
操作步驟
步驟一:建立資料對比節點
進入資料開發頁面。
登入DataWorks控制台,切換至目標地區後,單擊左側導覽列的,在下拉框中選擇對應工作空間後單擊進入資料開發。
單擊
表徵圖,選擇。根據介面指引,輸入節點的路徑、名稱等資訊。
步驟二:配置資料對比節點
配置對比表資訊
資料對比節點只需通過簡單配置對比表資訊,即可對不同資料來源的表資料進行對比,配置詳情可參見以下表格:
參數 | 說明 |
資源群組 | 下拉選擇已有資源群組。 |
任務資源佔用 | 調整資料對比節點啟動並執行資源佔用量。 |
資料來源類型 | 選擇需要進行對比的來源表和目標表的資料來源類型。 |
資料來源名稱 | 選擇需要進行對比的來源表和目標表的資料來源。 |
連通性 | 配置完成後,單擊測試查看資料來源是否與資源群組連通。 |
表名 | 下拉選擇需要進行來源表和目標表。 |
Where篩選 | 對需要進行對比的來源表和目標表進行過濾。 |
切分鍵 | 為來源表配置切分鍵,以將資料表中某一列作為切分鍵,建議使用主鍵或有索引的列作為切分鍵。 |
配置對比規則
對比規則可以進行指標對比或全文對比,從而實現對資料的來源與目標按照不同的對比規則進行對比。
調度配置
完成規則配置後,即可對資料對比節點進行調度配置,配置詳情可參見:節點調度配置。
步驟三:發布與營運
發布資料對比節點
節點任務配置完成後,需執行提交發佈動作,提交發布後節點將根據調度配置內容進行周期性運行。
單擊工具列中的
表徵圖,儲存節點。單擊工具列中的
表徵圖,提交節點。提交時需在提交對話方塊中輸入變更描述,並根據需要選擇是否在節點提交後執行程式碼檢閱及煙霧測試 (Smoke Test)。
說明您需設定節點的重跑屬性和依賴的上遊節點,才可提交節點。
程式碼檢閱可對任務的代碼品質進行把控,防止由於任務代碼有誤,未經審核直接發布上線後出現任務報錯。如進行程式碼檢閱,則提交的節點代碼必須通過評審人員的審核才可發布,詳情請參見程式碼檢閱。
為保障調度節點任務執行符合預期,建議您在發布前對任務進行煙霧測試 (Smoke Test),詳情請參見煙霧測試 (Smoke Test)。
如您使用的是標準模式的工作空間,任務提交成功後,還需單擊節點編輯頁面右上方的發布,將該任務發布至生產環境執行,操作請參見發布任務。
營運資料對比節點
資料對比節點發布成功後,可在營運中心內對該節點進行營運操作,詳情可參見:營運中心。
查看資料校正報告
資料校正報告可在任務作業記錄中查看,可通過以下方式進行查看:
營運中心查看:
單擊
按鈕,選擇進入營運中心。在營運中心左側導覽列單擊進入查看資料對比節點產生執行個體,單擊操作列的更多,選擇查看作業記錄。
在日誌頁面單擊資料對比頁簽即可查看。
作業記錄查看:
若僅在資料開發頁面對資料對比節點運行,可在資料開發頁面單擊如下圖連結,將跳轉至資料校正報告頁面。

