Tugas ekstraksi, transformasi, dan pemuatan (ETL) waktu nyata dari DataWorks Data Integration mendukung komponen penyaringan data. Anda dapat menambahkan komponen ini di antara komponen sumber dan tujuan untuk menyaring data berdasarkan bidang tertentu.
Prasyarat
Pengaturan dasar dan sumber daya jaringan untuk sinkronisasi data telah dikonfigurasi.
Jenis sinkronisasi data diatur ke real-time synchronization of data from a single table. Komponen pemrosesan data hanya dapat dikonfigurasi untuk tugas sinkronisasi waktu nyata yang menggunakan salah satu jenis sumber dan tujuan berikut:
Jenis sumber: Hologres, Kafka, LogHub, Oracle, dan DataHub.
Jenis tujuan: ApsaraDB for OceanBase, DLF 2.0, Doris, Hologres, Kafka, MaxCompute, OSS-HDFS, Tablestore, dan StarRocks.
Langkah 1: Konfigurasikan tugas sinkronisasi di Data Integration
Tambahkan sumber data yang diperlukan ke DataWorks. Untuk informasi lebih lanjut, lihat Tambahkan dan kelola sumber data.
Buat tugas sinkronisasi di Data Integration. Untuk informasi lebih lanjut, lihat topik-topik dalam direktori Tugas sinkronisasi sisi Data Integration.
CatatanJika Anda membuat tugas sinkronisasi untuk menyinkronkan data dari tabel tunggal secara real-time, Anda dapat menambahkan komponen pemrosesan data di antara komponen sumber dan tujuan. Untuk informasi lebih lanjut, lihat Jenis sumber data yang didukung dan operasi sinkronisasi.
Langkah 2: Tambahkan komponen penyaringan data
Di wizard bagian atas halaman konfigurasi tugas sinkronisasi, klik ikon
di antara jenis sumber dan tujuan, lalu pilih Data filtering. Bagian Kondisi Penyaringan akan muncul.
Di bagian Kondisi Penyaringan, konfigurasikan aturan penyaringan data.
Field name: Pilih bidang masukan yang dikonfigurasi di Langkah 1. Nilai dari bidang masukan menjadi operand kiri dari ekspresi kondisional.
Judgement: Pilih jenis operasi kondisional. Tabel berikut menjelaskan jenis-jenis operasi kondisional.
Value: Tentukan operand kanan dari ekspresi kondisional. Anda dapat memasukkan bidang masukan yang dikonfigurasi di Langkah 1 atau memasukkan konstanta sebagai operand kanan. Jika menggunakan konstanta, Anda tidak dapat menggunakan ekspresi reguler, namun dapat menggunakan karakter escape Java seperti karakter tab
\t, baris baru\n, atau karakter Unicode\u0001.
Klik Add rule untuk menambahkan lebih banyak aturan penyaringan data.

Di bagian Output Fields, tinjau nama-nama bidang keluaran yang diperoleh setelah penyaringan. Nama-nama tersebut sama dengan nama-nama bidang masukan dan memiliki format yang identik.
Apa yang harus dilakukan selanjutnya
Setelah mengonfigurasi informasi tentang sumber, komponen penyaringan data, dan tujuan untuk tugas sinkronisasi, klik Perform Simulated Running di sudut kanan atas halaman konfigurasi untuk menguji tugas sinkronisasi dan memeriksa apakah hasil keluaran memenuhi persyaratan bisnis Anda.