Topik ini menjelaskan cara menggunakan Data Transmission Service (DTS) untuk menyinkronkan data dari PolarDB-X 1.0 ke Elasticsearch.
Prasyarat
-
Instans PolarDB-X 1.0 sumber harus menggunakan RDS MySQL sebagai tipe penyimpanannya, termasuk instans RDS for MySQL kustom dan instans RDS for MySQL standalone. PolarDB for MySQL tidak didukung.
-
Anda telah membuat instans Elasticsearch tujuan. Untuk informasi selengkapnya, lihat Buat Instans Alibaba Cloud Elasticsearch.
-
Ruang penyimpanan instans Elasticsearch tujuan harus lebih besar daripada instans PolarDB-X 1.0 sumber.
Catatan Penting
|
Tipe |
Deskripsi |
|
Batasan database sumber |
|
|
Batasan lainnya |
|
|
Catatan lainnya |
DTS secara berkala memperbarui tabel `dts_health_check`.`ha_health_check` di database sumber untuk memajukan offset log biner. |
Penagihan
Tipe sinkronisasi | Harga |
Sinkronisasi skema dan sinkronisasi data penuh | Gratis. |
Sinkronisasi data inkremental | Dikenai biaya. Untuk informasi selengkapnya, lihat Ikhtisar penagihan. |
Operasi SQL yang Didukung untuk Sinkronisasi Inkremental
|
Tipe Operasi |
Operasi SQL |
|
DML |
INSERT, UPDATE, DELETE Catatan
Pernyataan UPDATE tidak dapat digunakan untuk menghapus bidang. |
Izin Akun Database
|
Database |
Izin yang Diperlukan |
Cara Membuat Akun dan Memberikan Izin |
|
Instans PolarDB-X 1.0 sumber |
Izin baca pada objek sinkronisasi. |
|
|
Instans Elasticsearch tujuan |
Akun database harus memiliki izin baca dan tulis. Akun default adalah elastic. |
|
Pemetaan tipe data
Karena database sumber dan instans Elasticsearch mendukung tipe data yang berbeda, tipe data tidak selalu dapat dipetakan secara langsung. Selama sinkronisasi skema awal, DTS memetakan tipe data berdasarkan tipe yang didukung oleh instans Elasticsearch tujuan. Untuk informasi selengkapnya, lihat Pemetaan tipe data untuk sinkronisasi skema awal.
CatatanDTS tidak mengatur parameter
mappingdalamdynamicselama migrasi skema. Perilaku parameter ini bergantung pada pengaturan instans Elasticsearch Anda. Jika data sumber Anda dalam format JSON, pastikan nilai untuk kunci yang sama memiliki tipe data yang sama di semua baris dalam tabel. Jika tidak, DTS mungkin melaporkan kesalahan sinkronisasi. Untuk informasi selengkapnya, lihat dynamic.Tabel berikut menjelaskan pemetaan antara Elasticsearch dan database relasional.
Elasticsearch
Database relasional
Indeks
Database
Type
Tabel
Dokumen
Baris
Bidang
Kolom
Mapping
Skema database
Prosedur
Buka halaman daftar tugas sinkronisasi di wilayah tujuan dengan salah satu metode berikut:
Dari Konsol DTS
Masuk ke Konsol Data Transmission Service (DTS).
Di panel navigasi sebelah kiri, klik Data Synchronization.
Di pojok kiri atas halaman, pilih wilayah tempat instans sinkronisasi berada.
Dari Konsol DMS
CatatanOperasi aktual dapat berbeda tergantung pada mode dan tata letak Konsol DMS. Untuk informasi selengkapnya, lihat Mode sederhana dan Sesuaikan tata letak dan gaya antarmuka DMS.
Masuk ke Data Management (DMS).
Di bilah menu atas, pilih .
Di sebelah kanan Data Synchronization Tasks, pilih wilayah tempat instans sinkronisasi berada.
Klik Create Task untuk membuka halaman konfigurasi tugas.
-
Konfigurasikan database sumber dan tujuan.
Kategori
Konfigurasi
Deskripsi
Tidak ada
Task Name
DTS secara otomatis menghasilkan nama tugas. Kami menyarankan Anda menentukan nama deskriptif agar mudah diidentifikasi. Nama tersebut tidak harus unik.
Source Database
Select Existing Connection
Untuk menggunakan instans database yang telah ditambahkan ke sistem (baru dibuat atau disimpan), pilih instans database dari daftar drop-down. Informasi database akan dikonfigurasi secara otomatis.
CatatanDi Konsol DMS, item konfigurasi ini bernama Select a DMS database instance..
Jika Anda belum menambahkan instans database ke sistem, atau tidak perlu menggunakan instans yang sudah ditambahkan, konfigurasikan manual informasi database berikut.
Database Type
Pilih PolarDB-X 1.0.
Access Method
Pilih Alibaba Cloud Instance.
Instance Region
Pilih wilayah tempat instans PolarDB-X 1.0 sumber berada.
Replicate Data Across Alibaba Cloud Accounts
Contoh ini menggunakan Akun Alibaba Cloud yang sama untuk sumber dan tujuan. Pilih No.
Instance ID
Pilih ID instans instans PolarDB-X 1.0 sumber.
Database Account
Masukkan akun database untuk instans PolarDB-X 1.0 sumber.
Database Password
Masukkan kata sandi yang sesuai dengan akun database.
Destination Database
Select Existing Connection
Untuk menggunakan instans database yang telah ditambahkan ke sistem (baru dibuat atau disimpan), pilih instans database dari daftar drop-down. Informasi database akan dikonfigurasi secara otomatis.
CatatanDi Konsol DMS, item konfigurasi ini bernama Select a DMS database instance..
Jika Anda belum menambahkan instans database ke sistem, atau tidak perlu menggunakan instans yang sudah ditambahkan, konfigurasikan manual informasi database berikut.
Database Type
Pilih Elasticsearch.
Access Method
Pilih Alibaba Cloud Instance.
Instance Region
Pilih wilayah tempat instans Elasticsearch tujuan berada.
Type
Pilih Cluster Edition atau Serverless sesuai kebutuhan.
Instance ID
Pilih ID instans instans Elasticsearch tujuan.
Database Account
Masukkan akun yang digunakan untuk menghubungkan ke instans Elasticsearch tujuan. Ini adalah username yang Anda masukkan saat membuat instans Elasticsearch. Akun default adalah elastic.
Database Password
Masukkan kata sandi yang sesuai dengan akun database.
Encryption
Pilih HTTP atau HTTPS sesuai kebutuhan.
Setelah menyelesaikan konfigurasi, klik Test Connectivity and Proceed di bagian bawah halaman.
CatatanPastikan blok CIDR alamat IP server DTS telah ditambahkan ke pengaturan keamanan database sumber dan tujuan untuk mengizinkan akses dari server DTS. Hal ini dapat dilakukan secara otomatis atau manual. Untuk informasi selengkapnya, lihat Tambahkan blok CIDR alamat IP server DTS ke daftar putih.
Jika database sumber atau tujuan adalah database yang dikelola sendiri (di mana Access Method bukan Alibaba Cloud Instance), Anda juga harus mengklik Test Connectivity di kotak dialog CIDR Blocks of DTS Servers.
-
Konfigurasikan objek tugas.
-
Di halaman Configure Objects, konfigurasikan objek yang akan disinkronkan.
Konfigurasi
Deskripsi
Synchronization Types
Incremental Data Synchronization dipilih. Secara default, Anda juga harus memilih Schema Synchronization dan Full Data Synchronization. Setelah pemeriksaan awal selesai, DTS melakukan sinkronisasi data penuh objek yang dipilih dari instans sumber ke kluster tujuan. Ini berfungsi sebagai data garis dasar untuk sinkronisasi data inkremental berikutnya.
Processing Mode of Conflicting Tables
-
Precheck and Report Errors: Memeriksa apakah indeks dengan nama yang sama ada di database tujuan. Jika tidak ada indeks tersebut, pemeriksaan berhasil. Jika indeks yang cocok ada, pemeriksaan awal melaporkan kesalahan dan pekerjaan sinkronisasi tidak dimulai.
CatatanJika Anda tidak dapat menghapus atau mengganti nama indeks yang bertentangan di database tujuan, Anda dapat mengatur nama objek sinkronisasi di instans tujuan untuk menghindari konflik penamaan.
-
Ignore Errors and Proceed: Melewati pemeriksaan untuk indeks yang memiliki nama yang sama di database tujuan.
PeringatanMemilih Ignore Errors and Proceed dapat menyebabkan inkonsistensi data dan membahayakan bisnis Anda. Misalnya:
-
Jika struktur mapping cocok, catatan dengan nilai kunci utama yang sama seperti di database sumber dipertahankan di database tujuan selama inisialisasi. Selama sinkronisasi inkremental, catatan ini akan ditimpa.
-
Jika struktur mapping tidak cocok, inisialisasi mungkin gagal, hanya beberapa kolom yang disinkronkan, atau sinkronisasi gagal sepenuhnya.
-
Index Name
-
Pilih Table Name untuk membuat indeks di instans Elasticsearch tujuan yang memiliki nama yang sama dengan tabel.
-
Pilih Database Name_Table Name untuk membuat indeks di instans Elasticsearch tujuan. Nama indeks dihasilkan dengan menggabungkan nama database, garis bawah (_), dan nama tabel.
CatatanPemetaan nama indeks berlaku untuk semua tabel.
Capitalization of Object Names in Destination Instance
Anda dapat mengonfigurasi kebijakan sensitivitas huruf besar/kecil untuk nama objek database, tabel, dan kolom yang disinkronkan ke instans tujuan. Secara default, DTS default policy dipilih. Anda juga dapat memilih untuk menggunakan kebijakan default database sumber dan tujuan. Untuk informasi selengkapnya, lihat Kebijakan sensitivitas huruf besar/kecil untuk nama objek tujuan.
Source Objects
Di kotak Source Objects, pilih objek yang akan disinkronkan, lalu klik
untuk memindahkannya ke kotak Selected Objects.CatatanKami menyarankan Anda memilih tabel sebagai objek sinkronisasi. Jika Anda memilih seluruh database, perubahan untuk menambah atau menghapus tabel di database tersebut tidak akan disinkronkan ke database tujuan.
Selected Objects
Untuk mengganti nama satu objek sinkronisasi di instans tujuan, klik kanan objek di kotak Selected Objects. Untuk informasi selengkapnya tentang mengganti nama objek, lihat Memetakan satu database, tabel, atau kolom.
Untuk mengubah nama beberapa objek sinkronisasi di instans tujuan secara batch, klik Batch Edit di pojok kanan atas kotak Selected Objects. Untuk informasi selengkapnya, lihat Memetakan database, tabel, dan kolom secara batch.
Catatan-
Hanya garis bawah (_) yang diizinkan sebagai karakter khusus dalam nama indeks dan tipe.
-
Untuk memfilter data menggunakan klausa WHERE, klik kanan tabel yang akan disinkronkan di kotak Selected Objects. Kotak dialog akan muncul tempat Anda dapat mengatur kondisi filter. Untuk informasi selengkapnya, lihat Mengatur Kondisi Filter.
-
Menggunakan fitur pemetaan nama objek dapat menyebabkan kegagalan sinkronisasi untuk objek lain yang bergantung pada objek yang dipetakan.
-
-
Klik Next: Advanced Settings untuk mengonfigurasi parameter lanjutan.
Konfigurasi
Deskripsi
Dedicated Cluster for Task Scheduling
Secara default, DTS menjadwalkan tugas pada kluster bersama, dan Anda tidak perlu memilih kluster. Untuk kinerja yang lebih stabil, Anda dapat membeli kluster khusus untuk menjalankan tugas sinkronisasi DTS. Untuk informasi selengkapnya, lihat Apa itu kluster khusus DTS?.
Retry Time for Failed Connections
Setelah tugas sinkronisasi dimulai, jika koneksi ke database sumber atau tujuan gagal, DTS melaporkan kesalahan dan segera mulai mencoba menghubungkan kembali. Durasi percobaan ulang default adalah 720 menit. Anda juga dapat menentukan durasi percobaan ulang kustom dari 10 hingga 1.440 menit. Kami menyarankan Anda mengatur durasi minimal 30 menit. Jika DTS berhasil terhubung kembali ke database dalam durasi yang ditentukan, tugas sinkronisasi akan dilanjutkan secara otomatis. Jika tidak, tugas akan gagal.
CatatanJika Anda memiliki beberapa instans DTS (misalnya, Instans A dan Instans B) yang berbagi sumber atau tujuan yang sama, dan Anda mengatur waktu percobaan ulang jaringan menjadi 30 menit untuk Instans A dan 60 menit untuk Instans B, durasi yang lebih pendek yaitu 30 menit akan digunakan untuk keduanya.
Karena DTS mengenakan biaya untuk waktu proses tugas selama periode percobaan ulang koneksi, kami menyarankan Anda menyesuaikan durasi percobaan ulang berdasarkan kebutuhan bisnis Anda atau segera melepaskan instans DTS setelah instans database sumber dan tujuan dilepas.
Retry Time for Other Issues
Setelah tugas sinkronisasi dimulai, jika terjadi masalah non-konektivitas lainnya pada database sumber atau tujuan (seperti pengecualian eksekusi DDL atau DML), DTS melaporkan kesalahan dan segera mulai melakukan operasi percobaan ulang terus-menerus. Durasi percobaan ulang default adalah 10 menit. Anda juga dapat menyesuaikan durasi percobaan ulang dalam rentang 1 hingga 1.440 menit. Kami menyarankan Anda mengaturnya minimal 10 menit. Jika operasi terkait berhasil dalam durasi percobaan ulang yang ditetapkan, tugas sinkronisasi akan dilanjutkan secara otomatis. Jika tidak, tugas akan gagal.
PentingNilai untuk Retry Time for Other Issues harus lebih kecil daripada Retry Time for Failed Connections.
Enable Throttling for Full Data Synchronization
Selama tahap sinkronisasi penuh, DTS mengonsumsi sumber daya baca dan tulis dari database sumber dan tujuan, yang dapat meningkatkan beban database. Untuk mengurangi beban pada database sumber dan tujuan, Anda dapat mengatur batas laju untuk tugas sinkronisasi penuh dengan mengonfigurasi parameter Queries per second (QPS) to the source database, RPS of Full Data Migration, dan Data migration speed for full migration (MB/s).
CatatanItem konfigurasi ini hanya tersedia ketika Synchronization Types diatur ke Full Data Synchronization.
Anda juga dapat menyesuaikan laju sinkronisasi penuh setelah instans sinkronisasi berjalan.
Enable Throttling for Incremental Data Synchronization
Anda juga dapat mengatur batas laju untuk tugas sinkronisasi inkremental. Untuk mengurangi tekanan pada database tujuan, atur RPS of Incremental Data Synchronization dan Data synchronization speed for incremental synchronization (MB/s).
Environment Tag
Pilih tag lingkungan untuk mengidentifikasi instans.
Shard Configuration
Atur jumlah shard utama dan shard replika untuk indeks, berdasarkan konfigurasi shard maksimum di instans Elasticsearch tujuan.
String Index
Cara string diindeks di instans Elasticsearch tujuan.
-
analyzed: Analisis string sebelum diindeks. Anda juga harus memilih alat analisis. Untuk informasi selengkapnya tentang alat analisis, lihat Analyzers.
-
not analyzed: Indeks nilai mentah tanpa melakukan analisis.
-
no: Anda dapat memilih untuk tidak mengindeks string tersebut.
Time Zone
Saat DTS menyinkronkan data tipe waktu (seperti DATETIME atau TIMESTAMP) ke instans Elasticsearch tujuan, pilih zona waktu yang akan digunakan.
CatatanJika data tipe waktu di instans tujuan tidak boleh menyertakan zona waktu, atur tipe dokumen (type) untuk data tersebut di instans tujuan terlebih dahulu.
DOCID
Secara default, DOCID adalah kunci utama tabel. Jika tabel tidak memiliki kunci utama, DOCID adalah kolom ID yang dihasilkan otomatis oleh instans Elasticsearch.
Configure ETL
Pilih apakah akan mengaktifkan fitur ekstrak, transformasi, muat (ETL). Untuk informasi selengkapnya, lihat Apa itu ETL?. Nilai yang valid:
-
Yes: Mengaktifkan fitur ETL. Masukkan pernyataan pemrosesan data di editor kode. Untuk informasi selengkapnya, lihat Konfigurasikan ETL dalam tugas migrasi data atau sinkronisasi data.
-
No: Menonaktifkan fitur ETL.
Monitoring and Alerting
Tentukan apakah akan mengonfigurasi peringatan. Jika sinkronisasi gagal atau latensi melebihi ambang batas yang ditentukan, notifikasi akan dikirim ke kontak peringatan.
No: Tidak ada peringatan yang dikonfigurasi.
Yes: Konfigurasikan peringatan dengan mengatur ambang batas peringatan dan menentukan pemberitahuan peringatan. Untuk informasi selengkapnya, lihat Konfigurasikan pemantauan peringatan selama konfigurasi tugas.
-
Setelah menyelesaikan konfigurasi di atas, klik Next: Configure Database and Table Fields di bagian bawah halaman untuk mengatur strategi _routing dan nilai _id untuk tabel yang akan disinkronkan di instans Elasticsearch tujuan.
Tipe
Deskripsi
Set _routing
Mengonfigurasi _routing mengarahkan dokumen ke shard tertentu di instans Elasticsearch tujuan. Untuk informasi selengkapnya, lihat _routing.
-
Pilih Yes untuk menentukan kolom kustom untuk routing.
-
Pilih No untuk melakukan routing menggunakan _id.
CatatanJika instans Elasticsearch tujuan menjalankan versi 7.x, pilih No.
_routing Column
Pilih kolom yang akan digunakan untuk routing.
CatatanParameter ini hanya diperlukan ketika Set _routing diatur ke Yes.
Value of _id
Pilih kolom yang akan digunakan sebagai ID dokumen.
-
-
Simpan tugas dan jalankan pemeriksaan awal.
Untuk melihat parameter API untuk mengonfigurasi instans ini, arahkan kursor ke tombol Next: Save Task Settings and Precheck dan klik Preview OpenAPI parameters di gelembung.
Jika Anda telah selesai melihat parameter API, klik Next: Save Task Settings and Precheck di bagian bawah halaman.
CatatanSebelum pekerjaan sinkronisasi dimulai, DTS menjalankan pemeriksaan awal. Pekerjaan hanya dapat dimulai setelah semua item pemeriksaan awal lulus.
Jika pemeriksaan awal gagal, klik View Details untuk item yang gagal. Perbaiki masalah sesuai petunjuk, lalu jalankan kembali pemeriksaan awal.
Jika pemeriksaan awal mengembalikan peringatan:
Jika item pemeriksaan gagal dan tidak dapat diabaikan, klik View Details di sebelah item tersebut. Ikuti petunjuk untuk memperbaiki masalah, lalu jalankan kembali pemeriksaan awal.
Untuk item pemeriksaan yang dapat diabaikan, Anda dapat mengklik Confirm Alert Details, Ignore, OK, dan Precheck Again secara berurutan untuk melewati peringatan dan menjalankan kembali pemeriksaan awal. Jika Anda memilih untuk mengabaikan item peringatan, hal ini dapat menyebabkan masalah seperti inkonsistensi data dan menimbulkan risiko bagi bisnis Anda.
-
Beli instans.
Ketika Success Rate mencapai 100%, klik Next: Purchase Instance.
Di halaman Purchase, pilih metode penagihan dan spesifikasi tautan untuk instans sinkronisasi data. Tabel berikut menjelaskan parameter-parameter ini secara rinci.
Kategori
Parameter
Deskripsi
New Instance Class
Billing Method
Subscription: Anda membayar saat membuat instans. Ini cocok untuk kebutuhan jangka panjang dan lebih hemat biaya dibandingkan pay-as-you-go. Semakin lama durasi langganan, semakin tinggi diskonnya.
Pay-as-you-go: Anda dikenai biaya per jam. Ini cocok untuk kebutuhan jangka pendek. Anda dapat melepaskan instans segera setelah digunakan untuk menghemat biaya.
Resource Group Configuration
Kelompok sumber daya tempat instans tersebut berada. Default-nya adalah kelompok sumber daya default. Untuk informasi selengkapnya, lihat Apa itu Resource Management?.
Link Specification
DTS menyediakan spesifikasi sinkronisasi dengan tingkat kinerja yang berbeda. Spesifikasi tautan sinkronisasi memengaruhi laju sinkronisasi. Anda dapat memilih spesifikasi berdasarkan skenario bisnis Anda. Untuk informasi selengkapnya, lihat Spesifikasi tautan sinkronisasi data.
Subscription Duration
Dalam mode subscription, pilih durasi dan jumlah untuk instans langganan. Anda dapat memilih langganan bulanan dari 1 hingga 9 bulan, atau langganan tahunan selama 1, 2, 3, atau 5 tahun.
CatatanOpsi ini hanya tersedia ketika metode penagihan adalah Subscription.
Setelah menyelesaikan konfigurasi, baca dan pilih Data Transmission Service (Pay-as-you-go) Service Terms.
Klik Buy and Start. Di kotak dialog OK, klik OK.
Anda dapat melihat progres tugas di halaman Data Synchronization.