DataWorksData Integration即時ETL支援字串替換組件使用,可以在來源與去向組件間新增字串替換組件,對字串進行替換。
前提條件
已完成Data Integration的基本配置與網路資源配置。
僅支援如下資料來源類型的資料來源和資料去向,配置單表即時同步任務時,使用資料處理組件。
資料來源:Hologres、Kafka、Loghub、Oracle、DataHub
資料去向:ApsaraDB for OceanBase、DLF 2.0、Doris、Hologres、Kafka、MaxCompute、OSS-HDFS、Tablestore、StarRocks
步驟一:配置Data Integration任務
建立資料來源,詳情請參見:建立並管理資料來源。
建立Data Integration任務,詳情請參見:Data Integration側同步任務。
說明當Data Integration側同步任務的同步類型為單表即時,可在資料來源組件與資料去向組件之間新增資料處理組件。詳情可參見支援的資料來源及同步方案。
步驟二:添加字串替換組件
在即時ETL任務編輯頁DAG畫布中,單擊來源與去向組件之間的
按鈕,新增選擇字串替換組件。
配置替換規則。
將命中規則的資料替換成新的字串。
規則配置:
欄位名:選擇前一個步驟的文本類型輸入欄位。
原字串:尋找的原字串,當關閉正則匹配時,支援Java逸出字元,例如
\t(定位字元)、\n(分行符號)、\u0001(unicode字元)。新字串:替換後的新字串,當關閉正則匹配時,支援Java逸出字元,例如
\t(定位字元)、\n(分行符號)、\u0001(unicode字元)檢索時:可配置正則匹配與大小寫敏感。
說明正則匹配:是否啟用Regex匹配,開啟正則匹配時,原字串支援的Regex規則參考Class Pattern,新字串替換支援使用
$+數字引用Regex中的分組,例如欄位內容為no.9526,原字串配置no.([0-9]+),新字串配置$1,則替換後的欄位內容為9526。大小寫敏感:原字串尋找是否大小寫敏感。

添加條件:單擊添加條件可新增一條規則。
輸出欄位:來來源資料替換後的輸出欄位名,與輸入欄位名和格式一致。
後續操作
完成來源資訊、字串替換以及去向資訊的配置後,可單擊右上方的類比運行,對Data Integration任務進行類比運行,以便查看輸出資料結果,是否符合您的需求。