Tugas ekstraksi, transformasi, dan pemuatan (ETL) waktu nyata dari DataWorks Data Integration mendukung komponen penggantian string. Anda dapat menambahkan komponen ini di antara komponen sumber dan tujuan untuk mengganti string.
Prasyarat
Pengaturan dasar dan sumber daya jaringan untuk sinkronisasi data telah dikonfigurasi.
Jenis sinkronisasi data diatur ke real-time synchronization of data from a single table. Komponen pemrosesan data hanya dapat dikonfigurasikan untuk tugas sinkronisasi waktu nyata dengan jenis sumber dan tujuan berikut:
Jenis sumber: Hologres, Kafka, LogHub, Oracle, dan DataHub.
Jenis tujuan: ApsaraDB for OceanBase, DLF 2.0, Doris, Hologres, Kafka, MaxCompute, OSS-HDFS, Tablestore, dan StarRocks.
Langkah 1: Konfigurasikan tugas sinkronisasi di Data Integration
Tambahkan sumber data yang diperlukan ke DataWorks. Untuk informasi lebih lanjut, lihat Tambahkan dan Kelola Sumber Data.
Buat tugas sinkronisasi di Data Integration. Untuk informasi lebih lanjut, lihat topik-topik dalam direktori Tugas Sinkronisasi Sisi Data Integration.
CatatanJika Anda membuat tugas sinkronisasi untuk menyinkronkan data dari tabel tunggal secara real-time, Anda dapat menambahkan komponen pemrosesan data di antara komponen sumber dan tujuan. Untuk informasi lebih lanjut, lihat Jenis Sumber Data yang Didukung dan Operasi Sinkronisasi.
Langkah 2: Tambahkan komponen penggantian string
Di wizard bagian atas halaman konfigurasi tugas sinkronisasi, klik ikon
di antara jenis sumber dan tujuan, lalu pilih Ganti String. Bagian Aturan Penggantian String akan muncul.
Di bagian String Replacement Rule, konfigurasikan aturan penggantian string. Data yang sesuai dengan aturan ini akan diganti dengan string baru.
Data yang memenuhi aturan penggantian string akan diganti dengan string baru.
Aturan:
Nama Kolom: Pilih kolom bertipe TEXT yang dikonfigurasikan di Langkah 1.
String Asli: Masukkan string yang ingin dicocokkan. Jika tidak memilih Pencocokan Reguler, Anda dapat menggunakan karakter escape Java seperti tab
\t, baris baru\n, atau karakter Unicode\u0001.String Baru: Masukkan string yang akan menggantikan string asli. Jika tidak memilih Pencocokan Reguler, Anda dapat menggunakan karakter escape Java seperti tab
\t, baris baru\n, atau karakter Unicode\u0001.Kondisi Pencarian: Pilih Pencocokan Reguler atau Sensitif Huruf Besar-Kecil.
CatatanRegular matching: Menentukan apakah pencocokan berbasis ekspresi reguler diaktifkan. Jika Anda memilih Pencocokan Reguler, Anda dapat merujuk ke Class Pattern untuk mempelajari aturan ekspresi reguler yang didukung oleh string asli. Saat menentukan string baru, Anda dapat menggunakan
$+Digituntuk merujuk pada grup dalam ekspresi reguler untuk string asli. Sebagai contoh, jika data dalam sebuah kolom adalahno.9526, dengan konfigurasino.([0-9]+)untuk string asli dan$1untuk string baru, maka data dalam kolom setelah penggantian menjadi9526.Case Sensitive: Tentukan apakah pencarian sensitif terhadap huruf besar-kecil.

Add condition: Klik Tambahkan Kondisi untuk menambahkan baris baru dan konfigurasikan aturan tambahan.
Output Fields: Nama kolom keluaran setelah penggantian. Nama-nama ini sama dengan nama kolom masukan dan memiliki format yang identik.
Apa yang harus dilakukan selanjutnya
Setelah mengonfigurasi informasi tentang sumber, komponen penggantian string, dan tujuan untuk tugas sinkronisasi, klik Perform Simulated Running di pojok kanan atas halaman konfigurasi untuk menguji tugas sinkronisasi dan memastikan hasil keluaran memenuhi persyaratan bisnis Anda.