Setelah mengonfigurasi sumber data, jaringan, dan resource, Anda dapat membuat tugas sinkronisasi real-time untuk menyinkronkan data dari satu tabel atau seluruh database. Topik ini menjelaskan cara membuat tugas sinkronisasi real-time untuk data inkremental tabel tunggal atau seluruh database serta melihat status tugas setelah pembuatan.
Prasyarat
Telah menyelesaikan Konfigurasi sumber data. Anda harus mengonfigurasi database sumber dan tujuan sebelum membuat tugas agar dapat memilih sumber data yang diperlukan untuk membaca dan menulis selama konfigurasi tugas. Untuk detail mengenai sumber data yang didukung dan konfigurasinya untuk sinkronisasi real-time, lihat Sumber data yang didukung dan solusi sinkronisasi.
Membeli resource group dengan spesifikasi yang sesuai dan menyambungkannya ke workspace. Untuk informasi lebih lanjut, lihat Menggunakan resource group Serverless.
Konektivitas jaringan antara resource group dan sumber data telah tersedia. Untuk informasi lebih lanjut, lihat Konfigurasi Konektivitas Jaringan.
Batasan
Versi sinkronisasi real-time ini hanya didukung di DataStudio (versi lama).
Buka Data Studio
Untuk beberapa channel, Anda harus membuat tugas sinkronisasi real-time tabel tunggal di Data Studio. Untuk detail dukungan channel, lihat Sumber data yang didukung.
Login ke Konsol DataWorks. Pilih wilayah yang diinginkan, lalu klik pada panel navigasi kiri. Pilih workspace yang diinginkan dari daftar drop-down dan klik Go to Data Studio.
Langkah 1: Buat tugas
Data Studio (versi baru)
Buat workflow. Untuk detailnya, lihat Workflow.
Buat node sinkronisasi real-time. Anda dapat menggunakan salah satu metode berikut:
Metode 1: Klik ikon
di pojok kanan atas daftar workflow dan pilih .Metode 2: Klik ganda nama workflow, perluas direktori Data Integration pada daftar node di sebelah kiri, lalu seret node Real-time Synchronization ke canvas di sebelah kanan.

Pada kotak dialog Create Node, konfigurasikan parameter node dan klik OK.
Data Studio (versi lama)
Buat business flow. Untuk detailnya, lihat Buat workflow.
Buat tugas sinkronisasi real-time.Anda dapat menggunakan salah satu metode berikut:
Metode 1: Perluas business flow, klik kanan .
Metode 2: Klik ganda nama business flow, klik Create Node, lalu seret node Real-time Synchronization dari direktori Data Integration ke panel pengeditan business flow di sebelah kanan.

Pada kotak dialog Create Node, konfigurasikan parameter.
Parameter | Deskripsi |
Type | Nilai default adalah Real-time Synchronization. |
Synchronization Method |
|
Path | Direktori tempat tugas sinkronisasi real-time disimpan. |
Name | Nama node dapat berisi huruf, karakter Tionghoa, angka, garis bawah (_), dan titik (.). Panjangnya tidak boleh melebihi 128 karakter. |
Langkah 2: Konfigurasikan resource group
Tugas sinkronisasi real-time hanya dapat menggunakan resource group Serverless atau resource group eksklusif untuk Data Integration. Anda dapat mengklik Basic Configuration pada bilah navigasi kanan halaman pengeditan tugas sinkronisasi real-time. Pada daftar drop-down Resource Group, pilih resource group yang memiliki konektivitas jaringan ke database.
Jika Anda telah membuat resource group tetapi tidak ditampilkan, periksa apakah resource group tersebut telah disambungkan ke workspace. Untuk informasi lebih lanjut, lihat Menggunakan resource group Serverless.
Disarankan menjalankan tugas sinkronisasi real-time dan offline pada resource group yang berbeda untuk mencegah konflik sumber daya. Konflik sumber daya CPU, memori, dan jaringan dapat menyebabkan tugas offline melambat, tugas real-time tertunda, atau tugas dihentikan oleh OOM (Out of Memory) killer dalam kasus ekstrem.
Resource group Serverless mendukung penentuan batas CU untuk tugas sinkronisasi. Jika tugas sinkronisasi Anda mengalami masalah OOM karena sumber daya tidak mencukupi, sesuaikan nilai penggunaan CU resource group secara tepat.
Langkah 3: Konfigurasikan tugas
Konfigurasikan sinkronisasi tabel tunggal
Konfigurasikan sumber data input.
Saat ini, jenis dan konfigurasi sumber data input yang didukung untuk sinkronisasi data tabel tunggal adalah sebagai berikut:
Seret komponen sumber data input dari daftar Input di sebelah kiri ke canvas di sebelah kanan.

Klik komponen input dan konfigurasikan informasi terkait pada kotak dialog Node Configuration di sebelah kanan.
Opsional:Konfigurasikan transformasi data.
Anda dapat mengonfigurasi transformasi data untuk memodifikasi data input.
Saat ini, metode transformasi yang didukung untuk sinkronisasi data tabel tunggal adalah sebagai berikut:
Konfigurasikan transformasi penyaringan data: Menyaring data berdasarkan aturan. Hanya data yang cocok yang dipertahankan.
Konfigurasikan String Replace: Memungkinkan penggantian bidang bertipe string.
Konfigurasikan penyamaran data: Memungkinkan penyamaran data sensitif selama sinkronisasi real-time tabel tunggal dan penyimpanan di lokasi database tertentu.
Pada area Conversion di sisi kiri halaman pengeditan tugas sinkronisasi real-time, seret komponen transformasi data yang diperlukan ke panel di sebelah kanan. Arahkan kursor ke komponen input untuk menampilkan titik koneksi. Hubungkan titik koneksi bagian bawah komponen input ke titik koneksi bagian atas komponen transformasi. Setelah terhubung, Anda dapat melakukan Node Configuration untuk komponen transformasi.

Klik komponen transformasi dan konfigurasikan informasi terkait pada kotak dialog Node Configuration di sebelah kanan.
Konfigurasikan sumber data output.
Saat ini, jenis dan konfigurasi sumber data output yang didukung untuk sinkronisasi data tabel tunggal adalah sebagai berikut:
Pada area Output di sisi kiri halaman pengeditan tugas sinkronisasi real-time, seret komponen sumber data output tujuan ke panel di sebelah kanan dan hubungkan ke komponen hulu. Konfigurasikan pemetaan hubungan sumber data tujuan, tabel, dan bidang. Jika tabel tujuan belum ada, klik Create Table untuk membuat tabel tersebut secara cepat.

Klik komponen output dan konfigurasikan informasi terkait pada kotak dialog Node Configuration di sebelah kanan.
Klik Save pada bilah alat di atas canvas untuk menyelesaikan konfigurasi tugas.
Konfigurasikan sinkronisasi seluruh database
DataWorks merekomendasikan penggunaan Tugas sinkronisasi database real-time di Data Integration.
Atur sumber sinkronisasi dan aturan.
Pada area Data Source, pilih Type dan nama Data Source yang akan disinkronkan.
Pilih tabel yang akan disinkronkan.
Pada bagian Select Source Table for Synchronization, pilih tabel yang akan disinkronkan dari daftar Source Table dan klik ikon
untuk memindahkannya ke daftar Selected Table.PentingSinkronisasi real-time tidak dapat dilakukan jika tabel yang dipilih tidak memiliki primary key.
Atur aturan pemetaan untuk nama tabel.
Pada langkah ini, Anda dapat memilih database dan tabel yang akan disinkronkan dari sumber data. Secara default, solusi sinkronisasi menulis data database dan tabel sumber ke skema atau tabel dengan nama yang sama di tujuan. Jika skema atau tabel tersebut tidak ada di tujuan, maka akan dibuat secara otomatis. Anda juga dapat menentukan nama skema atau tabel akhir yang ditulis ke tujuan dengan menggunakan Mapping Rules for Table Names. Hal ini memungkinkan Anda menulis data dari beberapa tabel ke satu tabel atau memperbarui awalan tetap dari nama database atau tabel sumber secara seragam saat menulis ke database atau tabel tujuan.
Source table name and destination table name conversion rules: Mendukung konversi nama tabel sumber menjadi nama tabel tujuan akhir menggunakan ekspresi reguler.
Contoh 1: Menulis data dari tabel dengan awalan "doc_" di sumber ke tabel dengan awalan "pre_" di tujuan.

Contoh 2: Menulis data dari beberapa tabel ke satu tabel tujuan.
Sinkronkan tabel bernama "table_01", "table_02", dan "table_03" di sumber ke tabel bernama "my_table". Konfigurasikan aturan konversi nama tabel regex sebagai berikut: Source: table.*, Destination: my_table.

Rule for Destination Table Name: Mendukung pembuatan nama tabel tujuan menggunakan kombinasi variabel bawaan. Anda juga dapat menambahkan awalan dan akhiran ke nama tabel tujuan yang telah dikonversi. Variabel bawaan yang tersedia adalah:
${db_table_name_src_transed}: Nama tabel setelah konversi di Source table name and destination table name conversion rules.
${db_name_src_transed}: Nama skema tujuan setelah konversi di "Aturan Konversi Nama Database Sumber dan Skema Tujuan".
${ds_name_src}: Nama sumber data sumber.
Contoh: Memproses lebih lanjut nama tabel yang telah dikonversi pada langkah sebelumnya melalui penggabungan string. Gunakan ${db_table_name_src_transed} untuk merepresentasikan hasil "my_table" dari langkah sebelumnya, lalu tambahkan awalan dan akhiran ke variabel bawaan ini, misalnya pre_${db_table_name_src_transed}_post. Hal ini memetakan ke tabel tujuan bernama "pre_my_table_post".
Rule for Conversion Between Source Database Name and Destination Schema Name: Mendukung konversi nama skema sumber menjadi nama skema tujuan akhir menggunakan ekspresi reguler.
Contoh: Mengganti awalan "doc_" dari nama database sumber dengan awalan "pre_".

Pilih sumber data tujuan dan konfigurasikan tabel atau topik tujuan.
Pada halaman Configure Destination Table, konfigurasikan informasi dasar tujuan. Misalnya, mode penulisan dan pengaturan partisi. Konfigurasi spesifik tergantung pada antarmuka sinkronisasi real-time masing-masing sumber data.
Klik Refresh Source and Destination Table Mapping untuk membuat hubungan pemetaan antara tabel sumber dan tabel tujuan yang akan disinkronkan.
Anda dapat menyesuaikan skema tujuan dan nama tabel tujuan, serta menambahkan konstanta atau variabel ke tabel tujuan melalui Edit Additional Fields. Konfigurasi spesifik tergantung pada antarmuka sinkronisasi real-time masing-masing sumber data.
CatatanJika jumlah tabel yang akan disinkronkan banyak, prosesnya mungkin lambat. Harap bersabar.
Opsional:Atur aturan sinkronisasi granularitas tabel.
Beberapa solusi sinkronisasi mendukung kebijakan pemrosesan DML tingkat tabel yang dapat dikustomisasi. Anda dapat menentukan kebijakan pemrosesan untuk operasi insert, update, dan delete pada tabel sumber.
CatatanOperasi DML yang didukung dapat berbeda-beda tergantung sumber data. Rujuk antarmuka produk untuk melihat apakah solusi sinkronisasi tertentu mendukung kebijakan pemrosesan DML. Untuk dukungan DML saat ini berdasarkan sumber data, lihat Operasi DML dan DDL yang didukung.
Atur aturan pemrosesan pesan DDL.
Anda dapat mengonfigurasi kebijakan untuk menangani operasi DDL selama sinkronisasi. Operasi DDL yang didukung dapat berbeda-beda tergantung sumber data. Untuk detailnya, lihat Operasi DML dan DDL yang didukung. Anda dapat mengonfigurasi kebijakan pemrosesan DDL untuk setiap tipe database tujuan pada halaman . Kebijakan pemrosesan pesan DDL yang berbeda ditunjukkan dalam tabel berikut.
Jenis Pesan DDL
Kebijakan Pemrosesan
Create Table
Saat DataWorks menerima pesan DDL dengan tipe yang sesuai, kebijakan pemrosesannya adalah sebagai berikut:
Normal Processing: Meneruskan pesan ke sumber data tujuan.
Ignore: Membuang pesan secara langsung dan tidak mengirimkannya ke sumber data tujuan.
Alert: Membuang pesan secara langsung dan mencatat peringatan di log sinkronisasi real-time, menunjukkan bahwa pesan tersebut dibuang karena kesalahan eksekusi.
Error: Tugas sinkronisasi real-time langsung menampilkan status error dan menghentikan eksekusi.
Drop Table
Add Column
Drop Column
Rename Table
Rename Column
Modify Column Type
Truncate Table
Konfigurasikan resource run.
Menyediakan kontrol konkurensi untuk membatasi jumlah maksimum pembacaan dan penulisan konkuren untuk Data Integration.
Mendukung pengendalian apakah tugas sinkronisasi mentolerir dirty data.
Jika dirty data tidak diizinkan: Jika dirty data dihasilkan selama eksekusi tugas, tugas akan gagal dan keluar.
Jika dirty data diizinkan: Tugas sinkronisasi akan mengabaikan dirty data (tidak akan ditulis ke tujuan) dan melanjutkan eksekusi secara normal.
Klik Complete Configuration.
Langkah 4: Kirim dan deploy node
Klik ikon
pada bilah alat untuk mengirim node.Pada kotak dialog Submit, masukkan Change Description.
Klik OK.
Jika Anda menggunakan workspace dalam mode standar, Anda perlu mendeploy tugas ke lingkungan produksi setelah pengiriman berhasil. Klik Deploy di sisi kiri bilah menu atas. Untuk detailnya, lihat Publikasikan tugas.
Langkah 5: Jalankan tugas
Tugas sinkronisasi real-time tidak dapat dijalankan di Data Studio. Publikasikan tugas ke Operation Center untuk memulai dan melihatnya.
Setelah konfigurasi tugas selesai, Anda dapat memulai dan mengelola tugas di panel . Untuk detailnya, lihat O&M untuk tugas sinkronisasi real-time.
Langkah selanjutnya
Setelah tugas dimulai, Anda dapat mengklik nama tugas untuk melihat detail eksekusi dan melakukan O&M dan tuning tugas.
FAQ
Untuk pertanyaan umum tentang tugas sinkronisasi real-time, lihat Sinkronisasi real-time.
Lampiran: Migrasi tugas
Anda dapat memigrasikan tugas integrasi real-time tabel tunggal dari Data Studio ke halaman Data Integration dengan mengklik Migrate to Data Integration.
Tugas integrasi real-time yang saat ini didukung:
Tugas integrasi real-time tabel tunggal Kafka ke MaxCompute.
Tugas integrasi real-time tabel tunggal Kafka ke Hologres.
Klik ganda tugas integrasi real-time tabel tunggal yang akan dimigrasikan untuk membuka halaman pengeditan tugas, lalu klik Migrate to Data Integration untuk memigrasikan tugas tersebut.

Klik
di pojok kiri atas dan pilih . Buka halaman Synchronization Task untuk melihat tugas integrasi real-time tabel tunggal yang berhasil dimigrasikan dalam daftar tugas.
Tugas yang dimigrasikan dapat dikelola langsung di situs utama Data Integration tanpa perlu beralih ke Operation Center. Migrasi tidak memengaruhi konfigurasi tugas yang telah disimpan atau tugas yang sedang berjalan.
Setelah migrasi, tugas asli akan dipindahkan ke Recycle Bin Data Studio. Operasi pengeditan dan pemeliharaan selanjutnya hanya dapat dilakukan di halaman daftar tugas situs utama Data Integration.