全部產品
Search
文件中心

DataWorks:字串替換

更新時間:Feb 15, 2025

DataWorksData Integration即時ETL支援字串替換組件使用,可以在來源與去向組件間新增字串替換組件,對字串進行替換。

前提條件

  • 已完成Data Integration的基本配置與網路資源配置。

  • 僅支援如下資料來源類型的資料來源和資料去向,配置單表即時同步任務時,使用資料處理組件。

    • 資料來源:Hologres、Kafka、Loghub、Oracle、DataHub

    • 資料去向:ApsaraDB for OceanBase、DLF 2.0、Doris、Hologres、Kafka、MaxCompute、OSS-HDFS、Tablestore、StarRocks

步驟一:配置Data Integration任務

  1. 建立資料來源,詳情請參見:建立並管理資料來源

  2. 建立Data Integration任務,詳情請參見:Data Integration側同步任務

    說明

    當Data Integration側同步任務的同步類型為單表即時,可在資料來源組件與資料去向組件之間新增資料處理組件。詳情可參見支援的資料來源及同步方案

步驟二:添加字串替換組件

  1. 在即時ETL任務編輯頁DAG畫布中,單擊來源去向組件之間的image按鈕,新增選擇字串替換組件。image

  2. 配置替換規則

    將命中規則的資料替換成新的字串。

    • 規則配置

      • 欄位名:選擇前一個步驟的文本類型輸入欄位。

      • 原字串:尋找的原字串,當關閉正則匹配時,支援Java逸出字元,例如\t(定位字元)、\n(分行符號)、\u0001(unicode字元)。

      • 新字串:替換後的新字串,當關閉正則匹配時,支援Java逸出字元,例如\t(定位字元)、\n(分行符號)、\u0001(unicode字元)

      • 檢索時:可配置正則匹配與大小寫敏感。

      說明
      • 正則匹配:是否啟用Regex匹配,開啟正則匹配時,原字串支援的Regex規則參考Class Pattern,新字串替換支援使用$+數字引用Regex中的分組,例如欄位內容為no.9526,原字串配置no.([0-9]+),新字串配置$1,則替換後的欄位內容為9526

      • 大小寫敏感:原字串尋找是否大小寫敏感。

      image

    • 添加條件:單擊添加條件可新增一條規則。

    • 輸出欄位:來來源資料替換後的輸出欄位名,與輸入欄位名和格式一致。

後續操作

完成來源資訊字串替換以及去向資訊的配置後,可單擊右上方的類比運行,對Data Integration任務進行類比運行,以便查看輸出資料結果,是否符合您的需求。