Topik ini menjelaskan cara menggunakan Data Transmission Service (DTS) untuk menyinkronkan data dari klaster PolarDB for PostgreSQL (Compatible with Oracle) ke instans Alibaba Cloud Message Queue for Apache Kafka.
Prasyarat
Atur parameter wal_level pada klaster sumber PolarDB for PostgreSQL (Compatible with Oracle) ke logical. Pengaturan ini menambahkan informasi yang diperlukan untuk logical decoding ke write-ahead log (WAL). Untuk informasi selengkapnya, lihat Konfigurasi parameter klaster.
Buat instans tujuan Alibaba Cloud Message Queue for Apache Kafka dengan kapasitas penyimpanan lebih besar daripada kapasitas penyimpanan yang digunakan oleh instans sumber PolarDB for PostgreSQL (Compatible with Oracle).
CatatanUntuk versi database sumber dan tujuan yang didukung, lihat Ikhtisar skenario sinkronisasi.
Buat topik di instans tujuan Alibaba Cloud Message Queue for Apache Kafka untuk menerima data yang disinkronkan. Untuk informasi selengkapnya, lihat Langkah 1: Buat topik.
Catatan
Jenis | Deskripsi |
Batasan database sumber |
|
Batasan lainnya |
|
Penagihan
Jenis sinkronisasi | Harga |
Sinkronisasi skema dan sinkronisasi data penuh | Gratis. |
Sinkronisasi data inkremental | Dikenai biaya. Untuk informasi selengkapnya, lihat Ikhtisar penagihan. |
Operasi SQL yang didukung untuk sinkronisasi inkremental
Jenis operasi | Pernyataan SQL |
DML | INSERT, UPDATE, DELETE |
DDL |
Catatan Pernyataan DDL tidak disinkronkan dalam skenario berikut:
|
Izin akun database
Database | Persyaratan izin | Metode pembuatan dan otorisasi akun |
Klaster PolarDB for PostgreSQL (Compatible with Oracle) | Akun istimewa |
Prosedur
Buka halaman daftar tugas sinkronisasi di wilayah tujuan. Anda dapat menggunakan salah satu dari dua metode berikut:
Dari Konsol DTS
Login ke Konsol Data Transmission Service (DTS).
Di panel navigasi sebelah kiri, klik Data Synchronization.
Di pojok kiri atas halaman, pilih wilayah tempat instans sinkronisasi berada.
Dari Konsol DMS
CatatanOperasi aktual dapat berbeda tergantung pada mode dan tata letak konsol DMS. Untuk informasi selengkapnya, lihat Mode sederhana dan Sesuaikan tata letak dan gaya antarmuka DMS.
Login ke Data Management (DMS).
Di bilah menu atas, pilih .
Di sebelah kanan Data Synchronization Tasks, pilih wilayah tempat instans sinkronisasi berada.
Klik Create Task untuk membuka halaman konfigurasi tugas.
Konfigurasikan database sumber dan tujuan.
CatatanUntuk informasi tentang cara memperoleh parameter untuk instans tujuan Alibaba Cloud Message Queue for Apache Kafka, lihat Konfigurasi parameter untuk instans Message Queue for Apache Kafka.
Kategori
Konfigurasi
Deskripsi
Tidak ada
Task Name
DTS secara otomatis menghasilkan nama tugas. Kami menyarankan agar Anda menentukan nama deskriptif untuk memudahkan identifikasi. Nama tersebut tidak harus unik.
Source Database
Select Existing Connection
Untuk menggunakan instans database yang telah ditambahkan ke sistem (baru dibuat atau disimpan), pilih instans database dari daftar drop-down. Informasi database akan dikonfigurasi secara otomatis.
CatatanDi konsol DMS, item konfigurasi ini bernama Select a DMS database instance..
Jika Anda belum menambahkan instans database ke sistem, atau Anda tidak perlu menggunakan instans yang sudah ditambahkan, konfigurasikan informasi database berikut secara manual.
Database Type
Pilih PolarDB (Compatible with Oracle).
Access Method
Pilih Alibaba Cloud Instance.
Instance Region
Pilih wilayah tempat klaster sumber PolarDB for PostgreSQL (Compatible with Oracle) berada.
Replicate Data Across Alibaba Cloud Accounts
Contoh ini menggunakan instans database yang dimiliki oleh Akun Alibaba Cloud saat ini. Pilih No.
Instance ID
Pilih ID klaster sumber PolarDB for PostgreSQL (Compatible with Oracle).
Database Name
Masukkan nama database di klaster sumber PolarDB for PostgreSQL (Compatible with Oracle) yang berisi objek yang akan disinkronkan.
Database Account
Masukkan akun database klaster sumber PolarDB for PostgreSQL (Compatible with Oracle). Untuk persyaratan izin, lihat Izin akun database.
Database Password
Masukkan password yang sesuai dengan akun database tersebut.
Destination Database
Select Existing Connection
Untuk menggunakan instans database yang telah ditambahkan ke sistem (baru dibuat atau disimpan), pilih instans database dari daftar drop-down. Informasi database akan dikonfigurasi secara otomatis.
CatatanDi konsol DMS, item konfigurasi ini bernama Select a DMS database instance..
Jika Anda belum menambahkan instans database ke sistem, atau Anda tidak perlu menggunakan instans yang sudah ditambahkan, konfigurasikan informasi database berikut secara manual.
Database Type
Pilih Kafka.
Access Method
Pilih Express Connect, VPN Gateway, or Smart Access Gateway.
CatatanDi sini, instans Alibaba Cloud Message Queue for Apache Kafka dikonfigurasi sebagai database Kafka yang dikelola sendiri untuk sinkronisasi data.
Instance Region
Pilih wilayah tempat instans tujuan Alibaba Cloud Message Queue for Apache Kafka berada.
Connected VPC
Pilih ID VPC instans tujuan Alibaba Cloud Message Queue for Apache Kafka.
Domain Name or IP
Masukkan alamat IP apa pun dari Default Endpoint instans tujuan Alibaba Cloud Message Queue for Apache Kafka.
Port Number
Masukkan port layanan instans tujuan Alibaba Cloud Message Queue for Apache Kafka. Port default adalah 9092.
Database Account
Contoh ini tidak memerlukan field ini.
Database Password
Kafka Version
Pilih versi yang sesuai dengan instans Kafka Anda.
Encryption
Berdasarkan kebutuhan bisnis dan keamanan Anda, pilih Non-encrypted atau SCRAM-SHA-256.
Topic
Pilih topik yang menerima data dari daftar drop-down.
Use Kafka Schema Registry
Kafka Schema Registry adalah lapisan layanan metadata yang menyediakan antarmuka RESTful untuk menyimpan dan mengambil skema Avro.
No: Jangan gunakan Kafka Schema Registry.
Yes: Gunakan Kafka Schema Registry. Masukkan URL atau alamat IP tempat skema Avro didaftarkan di Kafka Schema Registry di kotak teks URL or IP Address of Schema Registry.
Setelah menyelesaikan konfigurasi, klik Test Connectivity and Proceed di bagian bawah halaman.
CatatanPastikan blok CIDR alamat IP server DTS telah ditambahkan ke pengaturan keamanan database sumber dan tujuan untuk mengizinkan akses dari server DTS. Hal ini dapat dilakukan secara otomatis atau manual. Untuk informasi selengkapnya, lihat Tambahkan blok CIDR alamat IP server DTS ke daftar putih.
Jika database sumber atau tujuan adalah database yang dikelola sendiri (di mana Access Method bukan Alibaba Cloud Instance), Anda juga harus mengklik Test Connectivity di kotak dialog CIDR Blocks of DTS Servers.
Konfigurasikan objek tugas.
Di halaman Configure Objects, konfigurasikan objek yang akan disinkronkan.
Konfigurasi
Deskripsi
Synchronization Types
Incremental Data Synchronization dipilih. Secara default, Anda juga harus memilih Schema Synchronization dan Full Data Synchronization. Setelah pemeriksaan awal selesai, DTS melakukan sinkronisasi data penuh objek yang dipilih dari instans sumber ke klaster tujuan. Hal ini berfungsi sebagai data garis dasar untuk sinkronisasi data inkremental berikutnya.
CatatanSaat Access Method instans Kafka tujuan adalah Alibaba Cloud Instance, Schema Synchronization tidak didukung.
Processing Mode of Conflicting Tables
Precheck and Report Errors: Memeriksa apakah tabel dengan nama yang sama ada di database tujuan. Jika tabel dengan nama yang sama tidak ada, pemeriksaan awal berhasil. Jika tabel dengan nama yang sama ada, pemeriksaan awal gagal dan tugas sinkronisasi data tidak dimulai.
CatatanJika Anda tidak dapat menghapus atau mengganti nama tabel dengan nama yang sama di database tujuan, Anda dapat memetakannya ke nama tabel yang berbeda. Untuk informasi selengkapnya, lihat Map table and column names.
Ignore Errors and Proceed: Melewati pemeriksaan nama tabel duplikat di database tujuan.
PeringatanMemilih Ignore Errors and Proceed dapat menyebabkan ketidakkonsistenan data dan membahayakan bisnis Anda. Misalnya:
Jika skema tabel sama dan catatan di database tujuan memiliki nilai primary key atau unique key yang sama dengan catatan di database sumber:
Selama sinkronisasi penuh, DTS mempertahankan catatan di klaster tujuan. Catatan yang sesuai dari database sumber tidak disinkronkan.
Selama sinkronisasi inkremental, catatan dari database sumber menimpa catatan di database tujuan.
Jika skema tabel berbeda, sinkronisasi data awal dapat gagal. Hal ini dapat mengakibatkan hanya data kolom parsial yang disinkronkan atau kegagalan sinkronisasi total. Harap berhati-hati.
Data Format in Kafka
Pilih format penyimpanan data untuk sinkronisasi ke instans Kafka sesuai kebutuhan.
Jika Anda memilih Canal JSON, lihat Deskripsi Canal JSON untuk penjelasan parameter dan contoh.
CatatanSaat ini, hanya wilayah China (Qingdao) dan China (Beijing) yang mendukung Canal JSON.
Jika Anda memilih DTS Avro, Anda harus mengurai data berdasarkan definisi skema DTS Avro. Untuk informasi selengkapnya, lihat Definisi skema DTS Avro dan Kode contoh deserialisasi DTS Avro.
Jika Anda memilih Shareplex JSON, lihat Shareplex JSON untuk penjelasan parameter dan contoh.
Kafka Data Compression Format
Pilih format kompresi untuk pesan Kafka sesuai kebutuhan.
LZ4 (default): rasio kompresi rendah dan kecepatan kompresi tinggi.
GZIP: rasio kompresi tinggi dan kecepatan kompresi rendah.
CatatanFormat ini mengonsumsi lebih banyak sumber daya CPU.
Snappy: rasio kompresi sedang dan kecepatan kompresi sedang.
Policy for Shipping Data to Kafka Partitions
Pilih strategi sesuai kebutuhan.
Message acknowledgement mechanism
Pilih mekanisme pengakuan pesan sesuai kebutuhan.
Topic That Stores DDL Information
Pilih topik dari daftar drop-down untuk menyimpan informasi DDL.
CatatanJika Anda tidak memilih topik, informasi DDL disimpan di topik yang menerima data secara default.
Capitalization of Object Names in Destination Instance
Anda dapat mengonfigurasi kebijakan sensitivitas huruf besar/kecil untuk nama objek database, tabel, dan kolom yang disinkronkan ke instans tujuan. Secara default, DTS default policy dipilih. Anda juga dapat memilih untuk menggunakan kebijakan default database sumber dan tujuan. Untuk informasi selengkapnya, lihat Kebijakan sensitivitas huruf besar/kecil untuk nama objek tujuan.
Source Objects
Di kotak Source Objects, klik objek yang akan disinkronkan, lalu klik
untuk memindahkannya ke kotak Selected Objects.CatatanGranularitas pemilihan objek sinkronisasi adalah tabel.
Selected Objects
Contoh ini tidak memerlukan konfigurasi tambahan. Anda dapat menggunakan fitur pemetaan untuk mengatur nama topik, jumlah partisi, dan kunci partisi untuk tabel sumber di instans Kafka tujuan. Untuk informasi selengkapnya, lihat Informasi pemetaan.
CatatanJika Anda menggunakan fitur pemetaan nama objek, sinkronisasi objek lain yang bergantung pada objek ini mungkin gagal.
Untuk memilih operasi SQL untuk sinkronisasi inkremental, klik kanan objek yang akan disinkronkan di Selected Objects dan pilih operasi SQL yang diperlukan di kotak dialog yang muncul.
Klik Next: Advanced Settings untuk mengonfigurasi parameter lanjutan.
Konfigurasi
Deskripsi
Dedicated Cluster for Task Scheduling
Secara default, DTS menjadwalkan tugas di kluster bersama, dan Anda tidak perlu memilih klaster. Untuk kinerja yang lebih stabil, Anda dapat membeli klaster khusus untuk menjalankan tugas sinkronisasi DTS. Untuk informasi selengkapnya, lihat Apa itu klaster khusus DTS?.
Retry Time for Failed Connections
Setelah tugas sinkronisasi dimulai, jika koneksi ke database sumber atau tujuan gagal, DTS melaporkan kesalahan dan segera mulai mencoba menghubungkan kembali. Durasi percobaan ulang default adalah 720 menit. Anda juga dapat menentukan durasi percobaan ulang kustom dari 10 hingga 1.440 menit. Kami menyarankan agar Anda mengatur durasi minimal 30 menit. Jika DTS berhasil terhubung kembali ke database dalam durasi yang ditentukan, tugas sinkronisasi akan dilanjutkan secara otomatis. Jika tidak, tugas tersebut gagal.
CatatanJika Anda memiliki beberapa instans DTS (misalnya, Instans A dan Instans B) yang berbagi sumber atau tujuan yang sama, dan Anda mengatur waktu percobaan ulang jaringan menjadi 30 menit untuk Instans A dan 60 menit untuk Instans B, durasi yang lebih pendek yaitu 30 menit akan digunakan untuk keduanya.
Karena DTS membebankan biaya berdasarkan waktu proses tugas selama periode percobaan ulang koneksi, kami menyarankan agar Anda menyesuaikan durasi percobaan ulang berdasarkan kebutuhan bisnis Anda atau segera melepas instans DTS setelah instans database sumber dan tujuan dilepas.
Retry Time for Other Issues
Setelah tugas sinkronisasi dimulai, jika terjadi masalah non-konektivitas lainnya di database sumber atau tujuan (seperti pengecualian eksekusi DDL atau DML), DTS melaporkan kesalahan dan segera mulai melakukan operasi percobaan ulang terus-menerus. Durasi percobaan ulang default adalah 10 menit. Anda juga dapat menyesuaikan durasi percobaan ulang dalam rentang 1 hingga 1.440 menit. Kami menyarankan agar Anda mengaturnya minimal 10 menit. Jika operasi terkait berhasil dalam durasi percobaan ulang yang ditetapkan, tugas sinkronisasi akan dilanjutkan secara otomatis. Jika tidak, tugas tersebut gagal.
PentingNilai untuk Retry Time for Other Issues harus lebih kecil daripada nilai untuk Retry Time for Failed Connections.
Enable Throttling for Full Data Synchronization
Selama tahap sinkronisasi penuh, DTS mengonsumsi sumber daya baca dan tulis dari database sumber dan tujuan, yang dapat meningkatkan beban database. Untuk mengurangi beban pada database sumber dan tujuan, Anda dapat mengatur batas laju untuk tugas sinkronisasi penuh dengan mengonfigurasi parameter Queries per second (QPS) to the source database, RPS of Full Data Migration, dan Data migration speed for full migration (MB/s).
CatatanItem konfigurasi ini hanya tersedia saat Synchronization Types diatur ke Full Data Synchronization.
Anda juga dapat menyesuaikan laju sinkronisasi penuh setelah instans sinkronisasi berjalan.
Enable Throttling for Incremental Data Synchronization
Anda juga dapat mengatur batas laju untuk tugas sinkronisasi inkremental. Untuk mengurangi tekanan pada database tujuan, atur RPS of Incremental Data Synchronization dan Data synchronization speed for incremental synchronization (MB/s).
Environment Tag
Pilih label lingkungan untuk mengidentifikasi instans sesuai kebutuhan. Contoh ini tidak memerlukan pemilihan.
Configure ETL
Pilih apakah akan mengaktifkan fitur ekstrak, transformasi, muat (ETL). Untuk informasi selengkapnya, lihat Apa itu ETL? Nilai yang valid:
-
Yes: Mengaktifkan fitur ETL. Masukkan pernyataan pemrosesan data di editor kode. Untuk informasi selengkapnya, lihat Konfigurasi ETL dalam tugas migrasi data atau sinkronisasi data.
-
No: Menonaktifkan fitur ETL.
Monitoring and Alerting
Tentukan apakah akan mengonfigurasi peringatan. Jika sinkronisasi gagal atau latensi melebihi ambang batas yang ditentukan, notifikasi akan dikirim ke kontak peringatan.
No: Tidak ada peringatan yang dikonfigurasi.
Yes: Konfigurasikan peringatan dengan mengatur ambang batas peringatan dan menentukan pemberitahuan peringatan. Untuk informasi selengkapnya, lihat Konfigurasi pemantauan peringatan selama konfigurasi tugas.
Simpan tugas dan jalankan pemeriksaan awal.
Untuk melihat parameter API untuk mengonfigurasi instans ini, arahkan kursor ke tombol Next: Save Task Settings and Precheck dan klik Preview OpenAPI parameters di gelembung.
Jika Anda telah selesai melihat parameter API, klik Next: Save Task Settings and Precheck di bagian bawah halaman.
CatatanSebelum pekerjaan sinkronisasi dimulai, DTS menjalankan pemeriksaan awal. Pekerjaan hanya dapat dimulai setelah semua item pemeriksaan awal lulus.
Jika pemeriksaan awal gagal, klik View Details untuk item yang gagal. Perbaiki masalah sesuai petunjuk, lalu jalankan pemeriksaan awal lagi.
Jika pemeriksaan awal mengembalikan peringatan:
Jika item pemeriksaan gagal dan tidak dapat diabaikan, klik View Details di sebelah item tersebut. Ikuti petunjuk untuk memperbaiki masalah, lalu jalankan pemeriksaan awal lagi.
Untuk item pemeriksaan yang dapat diabaikan, Anda dapat mengklik Confirm Alert Details, Ignore, OK, dan Precheck Again secara berurutan untuk melewati peringatan dan menjalankan kembali pemeriksaan awal. Jika Anda memilih untuk mengabaikan item peringatan, hal ini dapat menyebabkan masalah seperti ketidakkonsistenan data dan menimbulkan risiko bagi bisnis Anda.
Beli instans.
Saat Success Rate mencapai 100%, klik Next: Purchase Instance.
Di halaman Purchase, pilih metode penagihan dan spesifikasi link untuk instans sinkronisasi data. Tabel berikut menjelaskan parameter-parameter ini secara detail.
Kategori
Parameter
Deskripsi
New Instance Class
Billing Method
Langganan: Anda membayar saat membuat instans. Ini cocok untuk kebutuhan jangka panjang dan lebih hemat biaya dibandingkan bayar sesuai penggunaan. Semakin lama durasi langganan, semakin tinggi diskonnya.
Bayar sesuai penggunaan: Anda dikenai biaya per jam. Ini cocok untuk kebutuhan jangka pendek. Anda dapat melepas instans segera setelah digunakan untuk menghemat biaya.
Resource Group Configuration
Kelompok sumber daya tempat instans tersebut berada. Default-nya adalah kelompok sumber daya default. Untuk informasi selengkapnya, lihat Apa itu Resource Management?.
Link Specification
DTS menyediakan spesifikasi sinkronisasi dengan tingkat kinerja berbeda. Spesifikasi link sinkronisasi memengaruhi laju sinkronisasi. Anda dapat memilih spesifikasi berdasarkan skenario bisnis Anda. Untuk informasi selengkapnya, lihat Spesifikasi link sinkronisasi data.
Subscription Duration
Dalam mode langganan, pilih durasi dan jumlah untuk instans langganan. Anda dapat memilih langganan bulanan dari 1 hingga 9 bulan, atau langganan tahunan selama 1, 2, 3, atau 5 tahun.
CatatanOpsi ini hanya tersedia saat metode penagihan adalah Subscription.
Setelah menyelesaikan konfigurasi, baca dan pilih Data Transmission Service (Pay-as-you-go) Service Terms.
Klik Buy and Start. Di kotak dialog OK, klik OK.
Anda dapat melihat progres tugas di halaman Data Synchronization.
Informasi pemetaan
Di area Selected Objects, arahkan kursor ke nama topik tujuan (pada level tabel).
Klik Edit di sebelah nama topik tujuan.
Di kotak dialog Edit Table yang muncul, konfigurasikan informasi pemetaan.
CatatanPada level skema, kotak dialognya adalah Edit Schema, yang mendukung lebih sedikit parameter yang dapat dikonfigurasi. Pada level tabel, kotak dialognya adalah Edit Table.
Jika granularitas objek sinkronisasi bukan seluruh skema, Anda tidak dapat memodifikasi Name of target Topic dan Number of Partitions di kotak dialog Edit Schema.
Konfigurasi
Deskripsi
Name of target Topic
Nama topik tujuan untuk menyinkronkan tabel sumber. Secara default, ini adalah Topic yang dipilih di Destination Database selama langkah Configurations for Source and Destination Databases.
PentingSaat database tujuan adalah instans Alibaba Cloud Message Queue for Apache Kafka, nama topik yang Anda masukkan harus ada di instans Kafka tujuan. Jika tidak, sinkronisasi data akan gagal. Saat database tujuan adalah database Kafka yang dikelola sendiri dan instans sinkronisasi mencakup tugas skema dan tabel, DTS akan mencoba membuat topik yang Anda masukkan di database tujuan.
Jika Anda memodifikasi Name of target Topic, data akan ditulis ke topik yang Anda masukkan.
Filter Conditions
Untuk informasi selengkapnya, lihat Setel kondisi filter.
Number of Partitions
Jumlah partisi untuk menulis data ke topik tujuan.
Partition Key
Saat Policy for Shipping Data to Kafka Partitions diatur ke Ship Data to Separate Partitions Based on Hash Values of Primary Keys, konfigurasikan parameter ini untuk menentukan satu atau beberapa kolom sebagai Partition Key untuk perhitungan hash. DTS mengirimkan baris yang berbeda ke partisi di topik tujuan berdasarkan nilai hash yang dihitung. Jika tidak, strategi pengiriman ini tidak berlaku selama penulisan inkremental.
CatatanAnda dapat memilih Partition Key hanya di kotak dialog Edit Table.
Klik OK.
FAQ
Apakah saya dapat memodifikasi Kafka Data Compression Format?
Ya, Anda bisa. Anda dapat menggunakan fitur Modify Sync Objects.
Apakah saya dapat memodifikasi Message acknowledgement mechanism?
Ya, Anda bisa. Anda dapat menggunakan fitur Modify Sync Objects.
