Data Integration mendukung sinkronisasi waktu nyata seluruh database dari sumber seperti MySQL, PostgreSQL, dan OceanBase ke Data Lake Formation (DLF). Topik ini menjelaskan cara menyinkronkan seluruh database MySQL ke Data Lake Formation secara real-time.
Keterbatasan
Hanya Kelompok Sumber Daya Serverless yang didukung.
Prasyarat
Anda telah membeli Kelompok Sumber Daya Serverless.
Anda telah membuat sumber data MySQL dan Data Lake Formation. Untuk informasi lebih lanjut, lihat Buat Sumber Data untuk Data Integration.
Anda telah menetapkan konektivitas jaringan antara kelompok sumber daya dan sumber data. Untuk informasi lebih lanjut, lihat Ikhtisar Solusi Konektivitas Jaringan.
Prosedur
1. Pilih jenis tugas sinkronisasi
Pergi ke halaman Data Integration.
Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih Wilayah yang diinginkan. Di panel navigasi kiri, pilih . Pada halaman yang muncul, pilih ruang kerja yang diinginkan dari daftar drop-down dan klik Go to Data Integration.
Di panel navigasi kiri, klik Sync Tasks. Kemudian, klik Create Sync Task di bagian atas halaman untuk pergi ke halaman pembuatan tugas sinkronisasi. Konfigurasikan informasi dasar berikut:
Data Source And Destination:
MySQL→Data Lake FormationNew Task Name: Tentukan nama kustom untuk tugas sinkronisasi.
Sync Type:
Seluruh Database Waktu Nyata.Sync Steps: Pilih Full Sync dan Incremental Sync.
2. Konfigurasikan jaringan dan sumber daya
Di bagian Network And Resource Configuration, pilih Resource Group untuk tugas sinkronisasi. Anda dapat mengalokasikan jumlah unit komputasi (CUs) untuk Task Resource Usage.
Untuk Source Data Source, pilih sumber data
MySQLyang telah ditambahkan. Untuk Destination Data Source, pilih sumber dataData Lake Formationyang telah ditambahkan. Kemudian, klik Test Connectivity.
Setelah Anda mengonfirmasi bahwa kedua sumber data sumber dan tujuan terhubung, klik Next.
3. Pilih database dan tabel untuk disinkronkan
Filter database dan tabel yang ingin Anda sinkronkan berdasarkan Table Selection Method.

Select Specific Databases And Tables:
Di bidang Database Filter dan Table Filter untuk database dan tabel sumber, Anda dapat memasukkan karakteristik nama database atau tabel untuk memfilter database dan tabel yang ingin Anda sinkronkan. Pilih semua database dan tabel yang ingin Anda sinkronkan dan klik ikon
untuk memindahkannya ke bagian Selected Databases And Tables.Di bidang Database Filter dan Table Filter untuk Selected Databases And Tables, Anda dapat memasukkan karakteristik nama database atau tabel untuk memfilter database dan tabel yang tidak ingin Anda sinkronkan. Pilih semua database dan tabel yang tidak ingin Anda sinkronkan dan klik ikon
untuk memindahkannya ke bagian Source Databases And Tables.
Use Regular Expressions To Select Tables (Support Adding Or Removing Tables By Regular Expressions During Runtime):
Filter informasi tabel dengan menggunakan ekspresi reguler yang dikonfigurasi di bidang Database Filter dan Table Filter. Klik Confirm Selection untuk memilih database dan tabel yang ingin Anda sinkronkan.
CatatanSebagai contoh, untuk memfilter dan menyinkronkan database dengan nama yang dimulai dengan
adan tabel dengan nama yang dimulai denganorder, Anda dapat memasukkan di bidang Database Filtera.*Table Filtering danorder.*di bidang Filter Tabel.
4. Konfigurasikan pengaturan terkait tujuan
Setelah Anda memilih tabel dari mana Anda ingin menyinkronkan data, tabel yang dipilih akan otomatis ditampilkan di bagian Aturan Pemetaan untuk Tabel Tujuan. Properti tabel tujuan sedang menunggu untuk dipetakan. Anda harus secara manual mendefinisikan pemetaan antara tabel sumber dan tabel tujuan untuk menentukan hubungan pembacaan dan penulisan data. Kemudian, Anda dapat mengklik Refresh di kolom Tindakan. Anda dapat langsung menyegarkan pemetaan antara tabel sumber dan tabel tujuan. Anda juga dapat menyegarkan pemetaan setelah Anda mengonfigurasi pengaturan terkait tabel tujuan.
Anda dapat memilih tabel yang ingin Anda sinkronkan dan klik Batch Refresh Mapping. Jika tidak ada aturan pemetaan yang dikonfigurasi, aturan nama tabel default adalah
${Nama Tabel}. Jika tabel dengan nama yang sama tidak ada di tujuan, tabel baru akan otomatis dibuat.Anda dapat mengklik Edit di kolom Customize Mapping Rules for Destination Table Names untuk mengonfigurasi aturan pemetaan untuk nama tabel tujuan berdasarkan kebutuhan bisnis Anda.
Anda dapat menggabungkan variabel bawaan dan string tertentu menjadi nama tabel tujuan. Anda dapat mengedit variabel bawaan. Sebagai contoh, ketika Anda membuat aturan pemetaan, Anda dapat menambahkan akhiran ke variabel yang menunjukkan nama tabel sumber untuk membentuk nama tabel tujuan.
a. Ubah pemetaan tipe data untuk bidang
Pemetaan default ada antara tipe data bidang sumber dan tipe data bidang tujuan. Anda dapat mengklik Edit Mapping of Field Data Types di sudut kanan atas bagian Aturan Pemetaan untuk Tabel Tujuan untuk mengonfigurasi pemetaan tipe data antara bidang sumber dan bidang tujuan berdasarkan kebutuhan bisnis Anda. Setelah konfigurasi selesai, klik Apply and Refresh Mapping.
b. Ubah skema tabel tujuan untuk menambahkan bidang ke tabel dan menetapkan nilai ke bidang tersebut
Jika tabel tujuan berada dalam status to-be-created, Anda dapat melakukan langkah-langkah berikut untuk menambahkan bidang ke tabel dan menetapkan nilai ke bidang tersebut:
Tambahkan bidang ke satu atau lebih tabel tujuan.
Tambahkan bidang ke tabel tujuan tunggal: Temukan tabel tujuan ke mana Anda ingin menambahkan bidang dan klik ikon
di kolom Destination Table Name. Di kotak dialog yang muncul, tambahkan bidang.Tambahkan bidang ke beberapa tabel tujuan sekaligus: Pilih tabel tujuan ke mana Anda ingin menambahkan bidang sekaligus, klik Batch Modify di bagian bawah halaman, dan kemudian klik Destination Table Schema - Batch Modify and Add Field.
Tetapkan nilai ke bidang. Anda dapat melakukan salah satu operasi berikut untuk menetapkan nilai ke bidang:
Tetapkan nilai ke bidang yang ditambahkan ke tabel tujuan tunggal: Temukan tabel tujuan di mana Anda ingin menetapkan nilai ke bidang yang baru ditambahkan dan klik Configure di kolom Value assignment. Di kotak dialog Bidang Tambahan, tetapkan nilai ke bidang.
Tetapkan nilai ke bidang yang ditambahkan ke beberapa tabel tujuan sekaligus: Pilih tabel tujuan di mana Anda ingin menetapkan nilai ke bidang yang baru ditambahkan, klik Batch Modify di bagian bawah halaman, dan kemudian klik Value assignment untuk menetapkan nilai ke bidang yang sama di tabel tujuan yang dipilih sekaligus.
CatatanAnda dapat mengklik ikon
untuk beralih metode penugasan nilai dan menetapkan konstanta dan variabel ke bidang yang ditambahkan ke tabel tujuan.
c. Konfigurasikan aturan pemrosesan DML
Data Integration menyediakan aturan pemrosesan DML default. Anda juga dapat mengonfigurasi aturan pemrosesan DML untuk tabel tujuan berdasarkan kebutuhan bisnis Anda.
Konfigurasikan aturan pemrosesan DML untuk tabel tujuan tunggal: Temukan tabel tujuan untuk mana Anda ingin mengonfigurasi aturan pemrosesan DML dan klik Configure di kolom Configure DML Rule untuk mengonfigurasi aturan pemrosesan DML untuk tabel tersebut.
Konfigurasikan aturan pemrosesan DML untuk beberapa tabel tujuan sekaligus: Pilih tabel tujuan untuk mana Anda ingin mengonfigurasi aturan pemrosesan DML, klik Batch Modify di bagian bawah halaman, dan kemudian klik Configure DML Rule.
5. Konfigurasikan aturan peringatan
Untuk mencegah kegagalan tugas sinkronisasi menyebabkan latensi pada sinkronisasi data bisnis, Anda dapat mengonfigurasi aturan peringatan yang berbeda untuk tugas sinkronisasi.
Di sudut kanan atas halaman, klik Configure Alert Rule untuk pergi ke panel Configure Alert Rule.
Di panel Konfigurasikan Aturan Peringatan, klik Add Alert Rule. Di kotak dialog Tambah Aturan Peringatan, konfigurasikan parameter untuk mengonfigurasi aturan peringatan.
CatatanAturan peringatan yang Anda konfigurasikan pada langkah ini berlaku untuk sub-tugas sinkronisasi waktu nyata yang akan dihasilkan oleh tugas sinkronisasi. Setelah konfigurasi tugas sinkronisasi selesai, Anda dapat merujuk ke Kelola Tugas Sinkronisasi Waktu Nyata untuk pergi ke halaman Tugas Sinkronisasi Waktu Nyata dan memodifikasi aturan peringatan yang dikonfigurasikan untuk sub-tugas sinkronisasi waktu nyata.
Kelola aturan peringatan.
Anda dapat mengaktifkan atau menonaktifkan aturan peringatan yang dibuat. Anda juga dapat menentukan penerima peringatan yang berbeda berdasarkan tingkat keparahan peringatan.
6. Konfigurasikan parameter lanjutan
Anda dapat mengubah nilai parameter tertentu yang dikonfigurasikan untuk tugas sinkronisasi berdasarkan kebutuhan bisnis Anda. Sebagai contoh, Anda dapat menentukan nilai yang sesuai untuk parameter Koneksi Baca Maksimum untuk mencegah tugas sinkronisasi saat ini memberikan tekanan berlebih pada database sumber dan produksi data terpengaruh.
Untuk mencegah kesalahan tak terduga atau masalah kualitas data, kami sarankan Anda memahami arti parameter sebelum mengubah nilai parameter.
Di sudut kanan atas halaman konfigurasi, klik Konfigurasikan Parameter Lanjutan.
Di panel Konfigurasikan Parameter Lanjutan, ubah nilai parameter yang diinginkan.
7. Konfigurasikan aturan pemrosesan DDL
Operasi DDL mungkin dilakukan pada sumber. Anda dapat mengklik Configure DDL Capability di sudut kanan atas halaman untuk mengonfigurasi aturan untuk memproses pesan DDL dari sumber berdasarkan kebutuhan bisnis Anda.
Untuk informasi lebih lanjut, lihat Konfigurasikan Aturan untuk Memproses Pesan DDL.
8. Lihat dan ubah kelompok sumber daya
Anda dapat mengklik Configure Resource Group di sudut kanan atas halaman untuk melihat dan mengubah kelompok sumber daya yang digunakan untuk menjalankan tugas sinkronisasi saat ini.
9. Jalankan tugas sinkronisasi
Setelah konfigurasi tugas sinkronisasi selesai, klik Complete di bagian bawah halaman.
Di bagian Nodes halaman Data Integration, temukan tugas sinkronisasi yang dibuat dan klik Start di kolom <Actions.
Klik name or ID tugas sinkronisasi di bagian Tasks dan lihat proses jalannya tugas sinkronisasi secara rinci.
Lakukan operasi O&M pada tugas sinkronisasi
Lihat status tugas sinkronisasi
Setelah Anda membuat tugas sinkronisasi, Anda dapat melihat daftar tugas sinkronisasi yang dibuat dan informasi dasar tentang setiap tugas sinkronisasi di halaman Tugas Sinkronisasi.
Anda dapat mengklik Start atau Stop di kolom Tindakan untuk memulai atau menghentikan tugas sinkronisasi. Anda juga dapat mengklik Lebih Banyak untuk melakukan operasi seperti Edit dan View pada tugas sinkronisasi.
Untuk tugas yang telah dimulai, Anda dapat melihat status jalannya dasar di Execution Overview. Anda juga dapat mengklik area ikhtisar yang sesuai untuk melihat detail eksekusi.

Tugas sinkronisasi waktu nyata untuk menyinkronkan seluruh database MySQL ke Data Lake Formation terdiri dari tiga langkah:
Migrasi Skema: Tab ini menampilkan informasi seperti apakah tabel tujuan adalah tabel baru atau tabel yang sudah ada. Untuk tabel baru, pernyataan DDL yang digunakan untuk membuat tabel ditampilkan.
Inisialisasi Data Penuh: Tab ini menampilkan informasi seperti tabel sumber dan tabel tujuan yang terlibat dalam sinkronisasi batch, kemajuan sinkronisasi, dan jumlah catatan data yang disinkronkan.
Sinkronisasi Waktu Nyata: Tab ini menampilkan informasi statistik tentang sinkronisasi waktu nyata, termasuk kemajuan sinkronisasi, catatan DDL, catatan DML, dan informasi peringatan.
Jalankan ulang tugas sinkronisasi
Dalam beberapa kasus khusus, jika Anda menambahkan tabel ke atau menghapus tabel dari sumber, atau mengubah skema atau nama tabel tujuan, Anda dapat mengklik Lebih Banyak di kolom Actions tugas sinkronisasi dan kemudian klik Rerun untuk menjalankan ulang tugas setelah perubahan. Selama proses menjalankan ulang, tugas sinkronisasi hanya menyinkronkan data dari tabel yang baru ditambahkan ke tujuan atau hanya dari tabel sumber yang dipetakan ke tabel tujuan yang skema atau namanya diubah.
Jika Anda ingin menjalankan ulang tugas sinkronisasi tanpa mengubah konfigurasi tugas, klik Lebih Banyak di kolom Tindakan dan kemudian klik Rerun untuk menjalankan ulang tugas untuk melakukan sinkronisasi penuh dan sinkronisasi inkremental lagi.
Jika Anda ingin menjalankan ulang tugas sinkronisasi setelah Anda menambahkan tabel ke atau menghapus tabel dari tugas, klik Complete setelah perubahan. Dalam hal ini, Apply Updates ditampilkan di kolom Tindakan tugas sinkronisasi. Klik Apply Updates untuk memicu sistem menjalankan ulang tugas sinkronisasi. Selama proses menjalankan ulang, tugas sinkronisasi menyinkronkan data dari tabel yang baru ditambahkan ke tujuan. Data di tabel asli tidak disinkronkan lagi.
Lihat hasil sinkronisasi
Setelah tugas sinkronisasi dieksekusi, Anda dapat pergi ke Konsol DLF untuk melihat tabel data yang disinkronkan di database katalog yang sesuai di tujuan Data Lake Formation (DLF).