資料同步至MaxCompute,Hologres資料同步至MaxCompute - DataWorks

前提條件

進入資料同步至MaxCompute節點編輯頁面，您可以按照以下步驟在節點編輯頁面完成節點的配置。

在選擇和配置Hologres源表時，您可根據以下參數說明選擇所需的源表進行同步。

參數	配置說明
源端對象類型	預設為`Hologres Table`。
數據源	選擇您所需同步的Hologres計算資源。
實例	Hologres執行個體ID，系統會自動擷取。
Database	選擇您所需同步的Hologres資料庫。
Schema	選擇您所需同步的Schema。
Table	選擇您所需同步的表名稱。
過濾條件	系統會根據您使用的分區表自動產生過濾條件，您也可以根據實際需求進行調整。滿足過濾條件的資料將被保留。說明過濾條件即SQL語句中`WHERE`後面的語句內容。

在設定MaxCompute目標表時，您可以根據以下參數說明資訊，配置所需同步的目標表資訊。

參數		配置說明
數據源		選擇您所需同步的目標MaxCompute計算資源。
Project		資料來源對應的MaxCompute專案，系統自動擷取。
Schema		選擇您想要儲存的Schema。開啟了三層模型的MaxCompute專案需要配置該參數，沒有開啟三層模型的專案不存在該配置參數。
Table		自訂MaxCompute內部表名稱。
生命周期		設定表的生命週期。從最後一次更新時間算起，如果表資料在指定時間內沒有變動，MaxCompute將自動回收該表。
字段	同步字段	您可以在此勾選需要同步的欄位資訊，並設定MaxCompute目標表欄位的資料類型。
	分區配置	您可以在此自訂MaxCompute內部表的分區列。分區資料來源可以通過以下兩種方式擷取：指定的holo 字段：選擇Hologres表中的特定欄位作為分區列資料來源。配置调度变量：使用調度任務中的變數來定義分區列。

在進行資料同步時，您可以在数据同步设置中配置資料匯入方式和訪問Hologres執行個體的許可權資訊。以下是詳細的參數配置說明：

參數	配置說明
导入方式	您可以選擇以下兩種方式之一來匯入資料：覆蓋寫入：當您需要刪除原有資料，將新資料寫入到目標表時，可以選擇覆蓋寫入的方式。追加寫入：當您需要保留原有資料，將新資料追加到目標表時，可以選擇追加寫入的方式。
訪問 Hologres 權限	您可以根據實際情況選擇以下方式訪問Hologres執行個體：雙簽名訪問方式：通過當前身份進行Hologres許可權校正。您需確保在MaxCompute專案下，擁有MaxCompute表讀取許可權的同時，也需要有該MaxCompute表對應的Hologres源表許可權。MaxCompute側許可權控制參見：湖倉一體2.0使用指南、Hologres側許可權控制參見：許可權管理概述。 RamRole訪問方式：通過指定RAM角色進行訪問身份校正。為RAM角色授權AliyunSTSAssumeRoleAccess權限原則。詳情請參見RAM角色授權模式。授權完成後，在RAM Role中配置您所指定的RAM角色。
Location	在同步過程中，系統會基於Hologres外部儲存路徑自動產生一個MaxCompute表。您可以選擇使用系統產生的預設儲存路徑，或者自訂Hologres外部儲存路徑。

如需調試執行同步節點任務，請根據您的業務需求配置相應的調試資訊。

配置調試節點屬性。

您可在同步節點編輯頁面右側回合組態中配置計算資源及資源組資訊，具體參數資訊如下。

參數名稱	描述
計算資源	選擇您所綁定的MaxCompute計算資源。
计算配额	選擇您在建立MaxCompute專案時產生的計算配額，或單擊下拉框最下方的建立計算配額，進行建立。詳情請參見計算資源-Quota管理。
資源組	選擇您綁定MaxCompute計算資源時已通過測試連通性的資源群組。
調度 CU	當前節點使用預設CU值，無需修改。
參數	在配置過濾條件中通過${參數名}的方式定義變數時，需要在腳本參數處配置參數名、參數值資訊，任務運行時會將它動態替換為真實的取值。詳情請參見節點調度配置。

節點調度配置：若專案目錄下的節點需要周期性調度執行，您需要在節點右側的調度配置中設定調度策略，配置相關的調度屬性。
節點發布：若任務需要發布至生產環境執行，請單擊介面表徵圖喚起發布流程，通過該流程將任務發布至生產環境。專案目錄下的節點只有在發布至生產環境後，才會進行周期性調度。