DataWorks的離線同步節點提供讀取(Reader)和寫入(Writer)外掛程式,簡化了從來源資料庫到目標資料庫的資料移轉過程。您可以在可視化介面配置資料來源與目標源,結合DataWorks的調度能力,實現全量或增量資料同步。本文將以MaxCompute作為來源資料庫,Hologres作為目標資料庫,為您介紹如何使用離線同步節點完成資料同步。
前提條件
(可選,RAM帳號需要)進行任務開發的RAM帳號已被添加至對應工作空間中,並具有開發或空間管理員(許可權較大,謹慎添加)角色許可權,新增成員的操作詳情請參見為工作空間增加空間成員。
說明如果您使用的是主帳號,則可忽略該添加操作。
已在DataWorks配置MaxCompute資料來源、Hologres資料來源並通過連通性測試,詳情請參見建立並管理資料來源。
說明離線同步節點支援多種資料來源,詳情請參見支援的資料來源列表。
使用限制
DataWorks的離線同步暫不支援跨時區同步資料。如果資料同步任務中的資料來源與使用的DataWorks資源群組不在同一個時區,則會導致同步的資料有誤。
1. 建立離線同步節點
已建立離線同步節點,詳情請參見建立周期任務。
2. 配置網路與資源
在離線同步節點編輯頁面,依次完成資料來源類型、來源資料來源名稱、資源群組配置、資料去向類型、去向資料來源名稱的資訊配置,並保證資料來源:可連通。
3. 配置同步任務
在配置離線任務嚮導頁面,您可根據以下不同方式來配置離線同步任務。
通常推薦使用直觀簡便的嚮導模式進行配置。如果資料來源不支援通過嚮導模式來配置任務,您可以選擇使用頁面上方的指令碼模式手動編輯和配置離線同步任務。
如果將嚮導模式切換為指令碼模式,將無法重新切換迴向導模式,只能重新建立離線同步節點。
4. 配置調試參數
在離線同步任務配置頁面右側單擊調試配置,配置以下參數,在調試運行中使用調試配置的相關參數測試回合。
配置項 | 配置說明 |
資源群組 | 選擇配置網路與資源時的Serverless資源群組。 |
指令碼參數 | 如果您的離線同步任務中配置了參數,則需在調試配置中為參數手動賦值,確保在整合任務在調試運行時順利拿到參數。 說明 當您同步分區表並預設選中分區過濾時,並設定了分區參數為${bizdate},調試運行需配置bizdate為源表中存在的分區。 |