全部产品
Search
文档中心

DataWorks:Komponen penggantian string

更新时间:Jul 02, 2025

Tugas ekstraksi, transformasi, dan pemuatan (ETL) waktu nyata dari DataWorks Data Integration mendukung komponen penggantian string. Anda dapat menambahkan komponen ini di antara komponen sumber dan tujuan untuk mengganti string.

Prasyarat

  • Pengaturan dasar dan sumber daya jaringan untuk sinkronisasi data telah dikonfigurasi.

  • Jenis sinkronisasi data diatur ke real-time synchronization of data from a single table. Komponen pemrosesan data hanya dapat dikonfigurasikan untuk tugas sinkronisasi waktu nyata dengan jenis sumber dan tujuan berikut:

    • Jenis sumber: Hologres, Kafka, LogHub, Oracle, dan DataHub.

    • Jenis tujuan: ApsaraDB for OceanBase, DLF 2.0, Doris, Hologres, Kafka, MaxCompute, OSS-HDFS, Tablestore, dan StarRocks.

Langkah 1: Konfigurasikan tugas sinkronisasi di Data Integration

  1. Tambahkan sumber data yang diperlukan ke DataWorks. Untuk informasi lebih lanjut, lihat Tambahkan dan Kelola Sumber Data.

  2. Buat tugas sinkronisasi di Data Integration. Untuk informasi lebih lanjut, lihat topik-topik dalam direktori Tugas Sinkronisasi Sisi Data Integration.

    Catatan

    Jika Anda membuat tugas sinkronisasi untuk menyinkronkan data dari tabel tunggal secara real-time, Anda dapat menambahkan komponen pemrosesan data di antara komponen sumber dan tujuan. Untuk informasi lebih lanjut, lihat Jenis Sumber Data yang Didukung dan Operasi Sinkronisasi.

Langkah 2: Tambahkan komponen penggantian string

  1. Di wizard bagian atas halaman konfigurasi tugas sinkronisasi, klik ikon image di antara jenis sumber dan tujuan, lalu pilih Ganti String. Bagian Aturan Penggantian String akan muncul.

    image

  2. Di bagian String Replacement Rule, konfigurasikan aturan penggantian string. Data yang sesuai dengan aturan ini akan diganti dengan string baru.

    Data yang memenuhi aturan penggantian string akan diganti dengan string baru.

    • Aturan:

      • Nama Kolom: Pilih kolom bertipe TEXT yang dikonfigurasikan di Langkah 1.

      • String Asli: Masukkan string yang ingin dicocokkan. Jika tidak memilih Pencocokan Reguler, Anda dapat menggunakan karakter escape Java seperti tab \t, baris baru \n, atau karakter Unicode \u0001.

      • String Baru: Masukkan string yang akan menggantikan string asli. Jika tidak memilih Pencocokan Reguler, Anda dapat menggunakan karakter escape Java seperti tab \t, baris baru \n, atau karakter Unicode \u0001.

      • Kondisi Pencarian: Pilih Pencocokan Reguler atau Sensitif Huruf Besar-Kecil.

      Catatan
      • Regular matching: Menentukan apakah pencocokan berbasis ekspresi reguler diaktifkan. Jika Anda memilih Pencocokan Reguler, Anda dapat merujuk ke Class Pattern untuk mempelajari aturan ekspresi reguler yang didukung oleh string asli. Saat menentukan string baru, Anda dapat menggunakan $+Digit untuk merujuk pada grup dalam ekspresi reguler untuk string asli. Sebagai contoh, jika data dalam sebuah kolom adalah no.9526, dengan konfigurasi no.([0-9]+) untuk string asli dan $1 untuk string baru, maka data dalam kolom setelah penggantian menjadi 9526.

      • Case Sensitive: Tentukan apakah pencarian sensitif terhadap huruf besar-kecil.

      image

    • Add condition: Klik Tambahkan Kondisi untuk menambahkan baris baru dan konfigurasikan aturan tambahan.

    • Output Fields: Nama kolom keluaran setelah penggantian. Nama-nama ini sama dengan nama kolom masukan dan memiliki format yang identik.

Apa yang harus dilakukan selanjutnya

Setelah mengonfigurasi informasi tentang sumber, komponen penggantian string, dan tujuan untuk tugas sinkronisasi, klik Perform Simulated Running di pojok kanan atas halaman konfigurasi untuk menguji tugas sinkronisasi dan memastikan hasil keluaran memenuhi persyaratan bisnis Anda.