全部产品
Search
文档中心

DataWorks:Sinkronkan tabel Kafka ke ApsaraDB for OceanBase secara real-time

更新时间:Oct 29, 2025

Tugas sinkronisasi tabel tunggal secara real-time menginisialisasi struktur tabel tujuan ApsaraDB for OceanBase berdasarkan struktur konten topik yang ditentukan di sumber Kafka. Tugas ini menyinkronkan data historis dari topik Kafka yang ditentukan ke ApsaraDB for OceanBase dan terus menyinkronkan data inkremental secara real-time. Topik ini menjelaskan cara menyinkronkan data topik Kafka ke ApsaraDB for OceanBase secara real-time.

Prasyarat

Prosedur

Langkah 1: Pilih jenis tugas sinkronisasi

  1. Pergi ke halaman Integrasi Data.

    Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi kiri, pilih Data Integration > Data Integration. Di halaman yang muncul, pilih ruang kerja yang diinginkan dari daftar drop-down dan klik Go to Data Integration.

  2. Di panel navigasi kiri, klik Synchronization Task, lalu klik Create Synchronization Task di bagian atas halaman untuk pergi ke halaman pembuatan tugas sinkronisasi. Konfigurasikan informasi dasar berikut:

    • Data Source And Destination: KafkaApsaraDB for OceanBase

    • New Task Name: Sesuaikan nama tugas sinkronisasi.

    • Synchronization Type: Single-table Real-time.

Langkah 2: Konfigurasi jaringan dan sumber daya

  1. Di bagian Network And Resource Configuration, pilih Resource Group yang digunakan untuk tugas sinkronisasi. Anda dapat mengalokasikan jumlah CU untuk Task Resource Usage.

  2. Untuk Source Data Source, pilih sumber data kafka yang telah ditambahkan. Untuk Destination Data Source, pilih sumber data ApsaraDB for OceanBase yang telah ditambahkan. Lalu klik Test Connectivity.image

  3. Setelah Anda mengonfirmasi bahwa kedua sumber data sumber dan tujuan berhasil terhubung, klik Next.

Langkah 3: Konfigurasi tautan sinkronisasi

1. Konfigurasi sumber Kafka

Klik sumber data Kafka di bagian atas halaman untuk mengedit Kafka Source Information.

image

  1. Di bagian Kafka Source Information, pilih topik dalam kluster Kafka yang ingin Anda sinkronkan.

    Pertahankan nilai default untuk parameter lainnya, atau modifikasi konfigurasinya berdasarkan kebutuhan bisnis Anda.

  2. Klik Data Sampling di sudut kanan atas.

    Di kotak dialog yang muncul, tentukan Start Time dan Number Of Samples, lalu klik tombol Start Collection untuk mengambil sampel data dari topik Kafka yang ditentukan. Anda juga dapat melihat pratinjau data dalam topik untuk memberikan masukan bagi pratinjau data dan konfigurasi visual node pemrosesan data selanjutnya.

  3. Di bagian Output Field Configuration, pilih bidang yang ingin Anda sinkronkan sesuai kebutuhan.

2. Edit node pemrosesan data

Anda dapat mengklik ikon image untuk menambahkan metode pemrosesan data. Metode pemrosesan data berikut didukung: Data Masking, Replace String, Data filtering, JSON Parsing, dan Edit Field and Assign Value. Anda dapat mengatur metode pemrosesan data berdasarkan kebutuhan bisnis Anda. Saat tugas sinkronisasi dijalankan, data diproses berdasarkan urutan pemrosesan yang Anda tentukan.

image

Setelah Anda menyelesaikan konfigurasi node pemrosesan data, Anda dapat mengklik tombol Data Output Preview di sudut kanan atas. Di kotak dialog yang muncul, klik Retrieve Upstream Output Again untuk mensimulasikan hasil data sampel topik Kafka setelah diproses oleh node pemrosesan data saat ini.

image

Catatan

Pratinjau output data sangat bergantung pada Data Sampling dari sumber Kafka. Sebelum Anda melakukan pratinjau output data, Anda harus menyelesaikan pengambilan sampel data di formulir sumber Kafka.

3. Konfigurasi informasi tujuan ApsaraDB for OceanBase

Klik tujuan data ApsaraDB for OceanBase di bagian atas halaman untuk mengedit OceanBase Destination Information.

image

  1. Di bagian OceanBase Destination Information, pilih apakah akan Automatically Create Table atau Use Existing Table untuk tabel OceanBase yang akan ditulis.

    • Jika Anda memilih untuk membuat tabel secara otomatis, tabel dengan nama yang sama dengan tabel sumber data dibuat secara default. Anda dapat memodifikasi nama tabel tujuan secara manual.

    • Jika Anda memilih untuk menggunakan tabel yang ada, pilih tabel tujuan yang ingin Anda sinkronkan dari daftar drop-down.

  2. (Opsional) Modifikasi skema tabel tujuan.

    Jika Anda memilih Create tables automatically untuk parameter Tabel Tujuan, klik Edit Table Schema. Di kotak dialog yang muncul, edit skema tabel tujuan yang akan dibuat secara otomatis. Anda juga dapat mengklik Re-generate Table Schema Based on Output Column of Ancestor Node untuk meregenerasi skema berdasarkan kolom keluaran node leluhur. Anda dapat memilih kolom dari skema yang dihasilkan dan mengonfigurasikan kolom tersebut sebagai kunci utama.

    Catatan

    Tabel tujuan harus memiliki kunci utama. Jika tidak, konfigurasi tidak dapat disimpan.

  3. Konfigurasikan pemetaan antara bidang di sumber dan bidang di tujuan.

    Setelah Anda menyelesaikan konfigurasi sebelumnya, sistem secara otomatis menetapkan pemetaan antara bidang di sumber dan bidang di tujuan berdasarkan prinsip same-name mapping. Anda dapat memodifikasi pemetaan berdasarkan kebutuhan bisnis Anda. Satu bidang di sumber dapat dipetakan ke beberapa bidang di tujuan. Beberapa bidang di sumber tidak dapat dipetakan ke bidang yang sama di tujuan. Jika bidang di sumber tidak memiliki bidang yang dipetakan di tujuan, data di bidang di sumber tidak disinkronkan ke tujuan.

4. Konfigurasi aturan peringatan

Untuk mencegah kegagalan tugas sinkronisasi menyebabkan latensi pada sinkronisasi data bisnis, Anda dapat mengonfigurasi aturan peringatan yang berbeda untuk tugas sinkronisasi.

  1. Di sudut kanan atas halaman, klik Configure Alert Rule untuk pergi ke panel Configure Alert Rule.

  2. Di panel Konfigurasi Aturan Peringatan, klik Add Alert Rule. Di kotak dialog Tambah Aturan Peringatan, konfigurasikan parameter untuk mengonfigurasi aturan peringatan.

    Catatan

    Aturan peringatan yang Anda konfigurasikan di langkah ini berlaku untuk sub-tugas sinkronisasi real-time yang akan dihasilkan oleh tugas sinkronisasi. Setelah konfigurasi tugas sinkronisasi selesai, Anda dapat merujuk ke Kelola tugas sinkronisasi real-time untuk pergi ke halaman Tugas Sinkronisasi Real-Time dan memodifikasi aturan peringatan yang dikonfigurasikan untuk sub-tugas sinkronisasi real-time.

  3. Kelola aturan peringatan.

    Anda dapat mengaktifkan atau menonaktifkan aturan peringatan yang dibuat. Anda juga dapat menentukan penerima peringatan yang berbeda berdasarkan tingkat keparahan peringatan.

5. Konfigurasi parameter lanjutan

DataWorks memungkinkan Anda memodifikasi konfigurasi parameter tertentu. Anda dapat mengubah nilai parameter ini berdasarkan kebutuhan bisnis Anda.

Catatan

Untuk mencegah kesalahan tak terduga atau masalah kualitas data, kami sarankan Anda memahami arti parameter sebelum mengubah nilai parameter.

  1. Di sudut kanan atas halaman konfigurasi, klik Konfigurasi Parameter Lanjutan.

  2. Di panel Konfigurasi Parameter Lanjutan, ubah nilai parameter yang diinginkan.

6. Konfigurasi grup sumber daya

Anda dapat mengklik Configure Resource Group di sudut kanan atas halaman untuk melihat dan mengubah grup sumber daya yang digunakan untuk menjalankan tugas sinkronisasi saat ini.

7. Lakukan uji coba pada tugas sinkronisasi

Setelah konfigurasi sebelumnya selesai, Anda dapat mengklik Perform Simulated Running di sudut kanan atas halaman konfigurasi untuk memungkinkan tugas sinkronisasi menyinkronkan data sampel ke tabel tujuan. Anda dapat melihat hasil sinkronisasi di tabel tujuan. Jika konfigurasi tertentu dari tugas sinkronisasi tidak valid, terjadi pengecualian selama uji coba, atau data kotor dihasilkan, sistem melaporkan kesalahan secara real-time. Ini dapat membantu Anda memeriksa konfigurasi tugas sinkronisasi dan menentukan apakah hasil yang diharapkan dapat diperoleh sejak dini.

  1. Di kotak dialog yang muncul, konfigurasikan parameter untuk pengambilan sampel data dari tabel yang ditentukan, termasuk parameter Start At dan Sampled Data Records.

  2. Klik Start Collection untuk memungkinkan tugas sinkronisasi mengambil sampel data dari sumber.

  3. Klik Preview untuk memungkinkan tugas sinkronisasi menyinkronkan data sampel ke tujuan.

8. Jalankan tugas sinkronisasi

  1. Setelah konfigurasi tugas sinkronisasi selesai, klik Complete di bagian bawah halaman.

  2. Di bagian Tasks halaman Synchronization Task, temukan tugas sinkronisasi yang dibuat dan klik Start di kolom Operation.

  3. Klik name or ID tugas sinkronisasi di bagian Tasks dan lihat proses berjalan rinci dari tugas sinkronisasi.

Lakukan operasi O&M pada tugas sinkronisasi

Lihat status tugas sinkronisasi

Setelah solusi sinkronisasi data dibuat, Anda dapat pergi ke halaman Tugas untuk melihat semua solusi sinkronisasi data yang dibuat di ruang kerja dan informasi dasar dari setiap solusi.

image

  • Anda dapat Start atau Stop tugas sinkronisasi di kolom Tindakan. Anda juga dapat Edit atau View tugas sinkronisasi di daftar drop-down Lainnya.

  • Untuk tugas yang telah dimulai, Anda dapat melihat status berjalan dasar di Execution Overview, atau klik area ikhtisar yang sesuai untuk melihat detail eksekusi.

image

Tugas sinkronisasi tabel tunggal real-time dari Kafka ke ApsaraDB forOceanBase terdiri dari dua langkah:

  • Schema Migration: mencakup metode pembuatan tabel tujuan (tabel yang ada atau pembuatan tabel otomatis). Jika pembuatan tabel otomatis dipilih, DDL untuk pembuatan tabel akan ditampilkan.

  • Real-time Data Synchronization: mencakup informasi statistik untuk sinkronisasi real-time, termasuk lalu lintas baca dan tulis real-time, data kotor, failover, dan log operasi.

Jalankan ulang tugas sinkronisasi

Dalam beberapa kasus khusus, jika Anda ingin memodifikasi bidang untuk disinkronkan, bidang dalam tabel tujuan, atau informasi nama tabel, Anda juga dapat mengklik Rerun di kolom Operation tugas sinkronisasi yang diinginkan. Dengan cara ini, sistem menyinkronkan perubahan yang dibuat ke tujuan. Data di tabel yang sudah disinkronkan dan tidak dimodifikasi tidak akan disinkronkan lagi.

  • Klik langsung Rerun tanpa memodifikasi konfigurasi tugas sinkronisasi untuk memungkinkan sistem menjalankan ulang tugas sinkronisasi.

  • Modifikasi konfigurasi tugas sinkronisasi lalu klik Complete. Klik Apply Updates yang ditampilkan di kolom Operasi tugas sinkronisasi untuk menjalankan ulang tugas sinkronisasi agar konfigurasi terbaru berlaku.