Topik ini menjelaskan cara menggunakan Data Transmission Service (DTS) untuk menyinkronkan data dari kluster PolarDB for MySQL ke instans Elasticsearch.
Prasyarat
Anda telah membuat instans Elasticsearch di wilayah tujuan. Kapasitas storage space instans ini harus lebih besar daripada kluster sumber PolarDB for MySQL. Untuk informasi selengkapnya, lihat Buat instans Alibaba Cloud Elasticsearch.
-
Untuk versi database sumber dan tujuan yang didukung, lihat Ikhtisar sinkronisasi.
-
Spesifikasi berbeda dari instans Elasticsearch mendukung kapasitas penyimpanan yang berbeda.
Catatan penting
|
Tipe |
Deskripsi |
|
Batasan database sumber |
|
|
Batasan lainnya |
|
|
Catatan lainnya |
DTS secara berkala mengeksekusi perintah CREATE DATABASE IF NOT EXISTS `test` pada database sumber untuk memajukan offset log biner. |
Penagihan
Tipe sinkronisasi | Harga |
Sinkronisasi skema dan sinkronisasi data penuh | Gratis. |
Sinkronisasi data inkremental | Dikenai biaya. Untuk informasi selengkapnya, lihat Ikhtisar penagihan. |
Operasi SQL yang didukung
|
Tipe Operasi |
Operasi SQL |
|
DML |
INSERT, UPDATE, DELETE Catatan
Pernyataan UPDATE tidak dapat digunakan untuk menghapus field. |
Izin akun database
|
Database |
Izin yang diperlukan |
Cara membuat dan memberikan izin |
|
Kluster sumber PolarDB for MySQL |
Izin baca pada objek yang akan disinkronkan. |
Lihat Buat akun dan Ubah izin akun. |
|
Instans tujuan Elasticsearch |
Nama login (default: elastic) dan password yang dikonfigurasi saat membuat instans Elasticsearch. |
|
Pemetaan tipe data
Karena database sumber dan instans Elasticsearch mendukung tipe data yang berbeda, tipe data tidak selalu dapat dipetakan secara langsung. Selama sinkronisasi skema awal, DTS memetakan tipe data berdasarkan tipe yang didukung oleh instans Elasticsearch tujuan. Untuk informasi selengkapnya, lihat Pemetaan tipe data untuk sinkronisasi skema awal.
CatatanDTS tidak mengatur parameter
mappingdalamdynamicselama migrasi skema. Perilaku parameter ini bergantung pada pengaturan instans Elasticsearch Anda. Jika data sumber Anda dalam format JSON, pastikan bahwa nilai untuk key yang sama memiliki tipe data yang sama di seluruh baris dalam suatu tabel. Jika tidak, DTS dapat melaporkan error sinkronisasi. Untuk informasi selengkapnya, lihat dynamic.Tabel berikut menjelaskan pemetaan antara Elasticsearch dan database relasional.
Elasticsearch
Database relasional
Index
Database
Type
Tabel
Document
Baris
Field
Kolom
Mapping
Skema database
Prosedur
Buka halaman daftar tugas sinkronisasi di wilayah tujuan. Anda dapat menggunakan salah satu dari dua metode berikut:
Dari Konsol DTS
Masuk ke Konsol Data Transmission Service (DTS).
Di panel navigasi sebelah kiri, klik Data Synchronization.
Di pojok kiri atas halaman, pilih wilayah tempat instans sinkronisasi berada.
Dari Konsol DMS
CatatanOperasi aktual dapat berbeda tergantung pada mode dan tata letak Konsol DMS. Untuk informasi selengkapnya, lihat Mode sederhana dan Sesuaikan tata letak dan gaya antarmuka DMS.
Masuk ke Data Management (DMS).
Di bilah menu atas, pilih .
Di sebelah kanan Data Synchronization Tasks, pilih wilayah tempat instans sinkronisasi berada.
Klik Create Task untuk membuka halaman konfigurasi tugas.
-
Konfigurasikan database sumber dan tujuan.
Kategori
Konfigurasi
Deskripsi
Tidak ada
Task Name
DTS secara otomatis menghasilkan nama tugas. Kami menyarankan agar Anda menentukan nama deskriptif agar mudah diidentifikasi. Nama ini tidak harus unik.
Source Database
Select Existing Connection
Untuk menggunakan instans database yang telah ditambahkan ke sistem (baru dibuat atau disimpan), pilih instans database dari daftar drop-down. Informasi database akan dikonfigurasi secara otomatis.
CatatanDi Konsol DMS, item konfigurasi ini bernama Select a DMS database instance..
Jika Anda belum menambahkan instans database ke sistem, atau tidak perlu menggunakan instans yang sudah ditambahkan, konfigurasikan manual informasi database berikut.
Database Type
Pilih PolarDB for MySQL.
Access Method
Pilih Alibaba Cloud Instance.
Instance Region
Pilih wilayah tempat kluster sumber PolarDB for MySQL berada.
Replicate Data Across Alibaba Cloud Accounts
Contoh ini menggunakan instans database yang dimiliki oleh Akun Alibaba Cloud saat ini. Pilih No.
PolarDB Cluster ID
Pilih ID kluster sumber PolarDB for MySQL.
Database Account
Masukkan akun database untuk kluster sumber PolarDB for MySQL. Untuk persyaratan izin, lihat Izin akun database.
Database Password
Masukkan password yang sesuai dengan akun database tersebut.
Encryption
Pilih sesuai kebutuhan. Untuk informasi selengkapnya tentang enkripsi SSL, lihat Konfigurasikan enkripsi SSL.
Destination Database
Select Existing Connection
Untuk menggunakan instans database yang telah ditambahkan ke sistem (baru dibuat atau disimpan), pilih instans database dari daftar drop-down. Informasi database akan dikonfigurasi secara otomatis.
CatatanDi Konsol DMS, item konfigurasi ini bernama Select a DMS database instance..
Jika Anda belum menambahkan instans database ke sistem, atau tidak perlu menggunakan instans yang sudah ditambahkan, konfigurasikan manual informasi database berikut.
Database Type
Pilih Elasticsearch.
Access Method
Pilih Alibaba Cloud Instance.
Instance Region
Pilih wilayah tempat instans tujuan Elasticsearch berada.
Type
Pilih Cluster atau Serverless sesuai kebutuhan.
Instance ID
Pilih ID instans tujuan Elasticsearch.
Database Account
Masukkan nama login default elastic untuk instans Elasticsearch.
Database Password
Masukkan password yang sesuai dengan akun database tersebut.
Encryption
Pilih HTTP atau HTTPS sesuai kebutuhan.
Setelah menyelesaikan konfigurasi, klik Test Connectivity and Proceed di bagian bawah halaman.
CatatanPastikan blok CIDR alamat IP server DTS telah ditambahkan ke pengaturan keamanan database sumber dan tujuan untuk mengizinkan akses dari server DTS. Hal ini dapat dilakukan secara otomatis atau manual. Untuk informasi selengkapnya, lihat Tambahkan blok CIDR alamat IP server DTS ke daftar putih.
Jika database sumber atau tujuan adalah database yang dikelola sendiri (di mana Access Method bukan Alibaba Cloud Instance), Anda juga harus mengklik Test Connectivity di kotak dialog CIDR Blocks of DTS Servers.
-
Konfigurasikan objek tugas.
-
Di halaman Configure Objects, konfigurasikan objek yang akan disinkronkan.
Konfigurasi
Deskripsi
Synchronization Types
Incremental Data Synchronization dipilih. Secara default, Anda juga harus memilih Schema Synchronization dan Full Data Synchronization. Setelah pemeriksaan awal selesai, DTS melakukan sinkronisasi data penuh objek yang dipilih dari instans sumber ke kluster tujuan. Ini berfungsi sebagai data garis dasar untuk sinkronisasi data inkremental berikutnya.
Index Name
Jika Anda memilih Table Name, nama indeks yang dibuat di instans tujuan Elasticsearch akan sama dengan nama tabel.
Jika Anda memilih Database Name_Table Name, nama indeks yang dibuat di instans tujuan Elasticsearch merupakan gabungan dari nama database, garis bawah (_), dan nama tabel.
CatatanKonfigurasi pemetaan nama indeks berlaku untuk semua tabel.
Processing Mode of Conflicting Tables
Precheck and Report Errors: Memeriksa apakah tabel dengan nama yang sama sudah ada di database tujuan. Jika tidak ada tabel dengan nama yang sama, pemeriksaan awal lolos. Jika ada tabel dengan nama yang sama, pemeriksaan awal gagal dan tugas sinkronisasi data tidak dimulai.
CatatanJika Anda tidak dapat menghapus atau mengganti nama tabel dengan nama yang sama di database tujuan, Anda dapat memetakannya ke nama tabel yang berbeda. Untuk informasi selengkapnya, lihat Petakan nama tabel dan kolom.
Ignore Errors and Proceed: Melewati pemeriksaan nama tabel duplikat di database tujuan.
PeringatanMemilih Ignore Errors and Proceed dapat menyebabkan inkonsistensi data dan membahayakan bisnis Anda. Misalnya:
Jika skema tabel sama dan suatu record di database tujuan memiliki nilai primary key atau unique key yang sama dengan record di database sumber:
Selama sinkronisasi penuh, DTS mempertahankan record di kluster tujuan. Record yang sesuai dari database sumber tidak disinkronkan.
Selama sinkronisasi inkremental, record dari database sumber menimpa record di database tujuan.
Jika skema tabel berbeda, sinkronisasi data awal dapat gagal. Hal ini dapat menyebabkan hanya data sebagian kolom yang disinkronkan atau kegagalan sinkronisasi total. Lakukan dengan hati-hati.
Capitalization of Object Names in Destination Instance
Anda dapat mengonfigurasi kebijakan case sensitivity untuk nama objek database, tabel, dan kolom yang disinkronkan ke instans tujuan. Secara default, DTS default policy dipilih. Anda juga dapat memilih untuk menggunakan kebijakan default database sumber dan tujuan. Untuk informasi selengkapnya, lihat Kebijakan case sensitivity untuk nama objek tujuan.
Source Objects
Di kotak Source Objects, klik objek yang akan disinkronkan, lalu klik
untuk memindahkannya ke kotak Selected Objects.CatatanAnda dapat memilih objek pada level database atau tabel.
Selected Objects
Untuk mengubah nama indeks, nama tipe, nama field, atau kondisi filter untuk suatu tabel di instans Elasticsearch tujuan, klik kanan nama tabel di area Selected Objects. Untuk informasi selengkapnya, lihat Petakan nama database dan kolom tabel dan Atur kondisi filter.
CatatanHanya garis bawah (_) yang diizinkan sebagai karakter khusus dalam nama indeks dan tipe.
-
Klik Next: Advanced Settings untuk mengonfigurasi parameter lanjutan.
Konfigurasi
Deskripsi
Dedicated Cluster for Task Scheduling
Secara default, DTS menjadwalkan tugas pada kluster bersama, dan Anda tidak perlu memilih kluster. Untuk kinerja yang lebih stabil, Anda dapat membeli kluster khusus untuk menjalankan tugas sinkronisasi DTS. Untuk informasi selengkapnya, lihat Apa itu kluster khusus DTS?.
Retry Time for Failed Connections
Setelah tugas sinkronisasi dimulai, jika koneksi ke database sumber atau tujuan gagal, DTS melaporkan error dan segera mulai mencoba menghubungkan kembali. Durasi percobaan ulang default adalah 720 menit. Anda juga dapat menentukan durasi kustom antara 10 hingga 1.440 menit. Kami menyarankan agar Anda mengatur durasi minimal 30 menit. Jika DTS berhasil terhubung kembali ke database dalam durasi yang ditentukan, tugas sinkronisasi akan dilanjutkan secara otomatis. Jika tidak, tugas gagal.
CatatanJika Anda memiliki beberapa instans DTS (misalnya, Instans A dan Instans B) yang berbagi sumber atau tujuan yang sama, dan Anda mengatur waktu percobaan ulang jaringan menjadi 30 menit untuk Instans A dan 60 menit untuk Instans B, durasi yang lebih pendek yaitu 30 menit akan digunakan untuk keduanya.
Karena DTS mengenakan biaya berdasarkan waktu proses tugas selama periode percobaan ulang koneksi, kami menyarankan agar Anda menyesuaikan durasi percobaan ulang sesuai kebutuhan bisnis atau segera melepaskan instans DTS setelah instans database sumber dan tujuan dilepas.
Retry Time for Other Issues
Setelah tugas sinkronisasi dimulai, jika terjadi masalah non-konektivitas lainnya pada database sumber atau tujuan (seperti exception eksekusi DDL atau DML), DTS melaporkan error dan segera mulai melakukan operasi percobaan ulang terus-menerus. Durasi percobaan ulang default adalah 10 menit. Anda juga dapat menyesuaikan durasi percobaan ulang dalam rentang 1 hingga 1.440 menit. Kami menyarankan agar Anda mengaturnya minimal 10 menit. Jika operasi terkait berhasil dalam durasi percobaan ulang yang ditetapkan, tugas sinkronisasi akan dilanjutkan secara otomatis. Jika tidak, tugas gagal.
PentingNilai Retry Time for Other Issues harus lebih kecil daripada Retry Time for Failed Connections.
Enable Throttling for Full Data Synchronization
Selama tahap sinkronisasi penuh, DTS mengonsumsi sumber daya baca dan tulis dari database sumber dan tujuan, yang dapat meningkatkan beban database. Untuk mengurangi beban pada database sumber dan tujuan, Anda dapat mengatur batas laju untuk tugas sinkronisasi penuh dengan mengonfigurasi parameter Queries per second (QPS) to the source database, RPS of Full Data Migration, dan Data migration speed for full migration (MB/s).
CatatanItem konfigurasi ini hanya tersedia ketika Synchronization Types diatur ke Full Data Synchronization.
Anda juga dapat menyesuaikan laju sinkronisasi penuh setelah instans sinkronisasi berjalan.
Enable Throttling for Incremental Data Synchronization
Anda juga dapat mengatur batas laju untuk tugas sinkronisasi inkremental. Untuk mengurangi tekanan pada database tujuan, atur RPS of Incremental Data Synchronization dan Data synchronization speed for incremental synchronization (MB/s).
Environment Tag
Pilih label lingkungan untuk mengidentifikasi instans sesuai kebutuhan. Contoh ini tidak memerlukannya.
Shard Configuration
Atur jumlah shard primer dan shard replika untuk indeks, berdasarkan konfigurasi shard maksimum di instans tujuan Elasticsearch.
String Index
Cara string diindeks di instans tujuan Elasticsearch.
-
analyzed: Analisis string terlebih dahulu, lalu indeks. Anda juga harus memilih alat analisis. Untuk jenis dan fungsi alat analisis, lihat Analyzers.
-
not analyzed: Indeks nilai mentah secara langsung tanpa analisis.
-
no: Jangan indeks string tersebut.
Time Zone
Saat menyinkronkan tipe data DATETIME atau TIMESTAMP ke instans tujuan Elasticsearch, pilih zona waktu yang akan digunakan.
CatatanJika informasi zona waktu tidak diperlukan untuk tipe data ini di instans tujuan, pra-konfigurasikan tipe dokumen (type) untuk data ini di instans tujuan.
DOCID
Tidak perlu konfigurasi. DOCID secara default menggunakan primary key tabel. Jika tidak ada primary key, DOCID adalah kolom ID yang di-generate otomatis oleh Elasticsearch.
Whether to delete SQL operations on heartbeat tables of forward and reverse tasks
Pilih apakah akan menulis informasi SQL heartbeat ke database sumber saat instans DTS berjalan.
Yes: Informasi SQL heartbeat tidak ditulis ke database sumber. Hal ini dapat menyebabkan instans DTS melaporkan delay.
No: Menulis informasi SQL heartbeat ke database sumber. Hal ini dapat mengganggu fitur seperti backup fisik dan cloning database sumber.
Configure ETL
Pilih apakah akan mengaktifkan fitur ekstrak, transformasi, muat (ETL). Untuk informasi selengkapnya, lihat Apa itu ETL? Nilai yang valid:
-
Yes: Mengaktifkan fitur ETL. Masukkan pernyataan pemrosesan data di editor kode. Untuk informasi selengkapnya, lihat Konfigurasikan ETL dalam tugas migrasi data atau sinkronisasi data.
-
No: Menonaktifkan fitur ETL.
Monitoring and Alerting
Tentukan apakah akan mengonfigurasi peringatan. Jika sinkronisasi gagal atau latensi melebihi ambang batas yang ditentukan, notifikasi akan dikirim ke kontak peringatan.
No: Tidak ada peringatan yang dikonfigurasi.
Yes: Konfigurasikan peringatan dengan mengatur ambang batas peringatan dan menentukan pemberitahuan peringatan. Untuk informasi selengkapnya, lihat Konfigurasikan pemantauan peringatan selama konfigurasi tugas.
-
Setelah menyelesaikan konfigurasi di atas, klik Next: Configure Database and Table Fields untuk mengatur strategi _routing dan nilai _id untuk tabel di instans tujuan Elasticsearch.
CatatanAnda dapat memilih Definition Status sebagai All untuk melakukan perubahan.
Tipe
Deskripsi
Set _routing
Mengonfigurasi _routing mengarahkan dokumen ke shard tertentu di instans Elasticsearch tujuan. Untuk informasi selengkapnya, lihat _routing.
-
Pilih Yes untuk menentukan kolom kustom untuk routing.
-
Pilih No untuk melakukan routing menggunakan _id.
CatatanJika instans Elasticsearch tujuan adalah versi 7.x, pilih No.
_routing Column
Pilih kolom yang akan digunakan untuk routing.
CatatanParameter ini hanya diperlukan ketika Set _routing diatur ke Yes.
Value of _id
Pilih kolom yang akan digunakan sebagai ID dokumen.
-
-
Simpan tugas dan jalankan pemeriksaan awal.
Untuk melihat parameter API untuk mengonfigurasi instans ini, arahkan kursor ke tombol Next: Save Task Settings and Precheck dan klik Preview OpenAPI parameters di dalam bubble.
Jika Anda telah selesai melihat parameter API, klik Next: Save Task Settings and Precheck di bagian bawah halaman.
CatatanSebelum pekerjaan sinkronisasi dimulai, DTS menjalankan pemeriksaan awal. Pekerjaan hanya dapat dimulai setelah semua item pemeriksaan awal lolos.
Jika pemeriksaan awal gagal, klik View Details untuk item yang gagal. Perbaiki masalah sesuai petunjuk, lalu jalankan kembali pemeriksaan awal.
Jika pemeriksaan awal mengembalikan peringatan:
Jika item pemeriksaan gagal dan tidak dapat diabaikan, klik View Details di sebelah item tersebut. Ikuti petunjuk untuk memperbaiki masalah, lalu jalankan kembali pemeriksaan awal.
Untuk item pemeriksaan yang dapat diabaikan, Anda dapat mengklik Confirm Alert Details, Ignore, OK, dan Precheck Again secara berurutan untuk melewati peringatan dan menjalankan kembali pemeriksaan awal. Jika Anda memilih untuk mengabaikan item peringatan, hal ini dapat menyebabkan masalah seperti inkonsistensi data dan menimbulkan risiko bagi bisnis Anda.
-
Beli instans.
Ketika Success Rate mencapai 100%, klik Next: Purchase Instance.
Di halaman Purchase, pilih metode penagihan dan spesifikasi link untuk instans sinkronisasi data. Tabel berikut menjelaskan parameter-parameter ini secara rinci.
Kategori
Parameter
Deskripsi
New Instance Class
Billing Method
Subscription: Anda membayar saat membuat instans. Cocok untuk kebutuhan jangka panjang dan lebih hemat biaya dibandingkan bayar sesuai penggunaan. Semakin lama durasi langganan, semakin tinggi diskonnya.
Pay-as-you-go: Anda dikenai biaya per jam. Cocok untuk kebutuhan jangka pendek. Anda dapat melepaskan instans segera setelah digunakan untuk menghemat biaya.
Resource Group Configuration
Kelompok sumber daya tempat instans tersebut berada. Default-nya adalah kelompok sumber daya default. Untuk informasi selengkapnya, lihat Apa itu Resource Management?.
Link Specification
DTS menyediakan spesifikasi sinkronisasi dengan tingkat kinerja berbeda. Spesifikasi link sinkronisasi memengaruhi laju sinkronisasi. Anda dapat memilih spesifikasi berdasarkan skenario bisnis Anda. Untuk informasi selengkapnya, lihat Spesifikasi link sinkronisasi data.
Subscription Duration
Dalam mode subscription, pilih durasi dan jumlah untuk instans langganan. Anda dapat memilih langganan bulanan dari 1 hingga 9 bulan, atau langganan tahunan selama 1, 2, 3, atau 5 tahun.
CatatanOpsi ini hanya tersedia ketika metode penagihan adalah Subscription.
Setelah menyelesaikan konfigurasi, baca dan pilih Data Transmission Service (Pay-as-you-go) Service Terms.
Klik Buy and Start. Di kotak dialog OK, klik OK.
Anda dapat melihat progres tugas di halaman Data Synchronization.