Gunakan Lindorm Tunnel Service (LTS) untuk memigrasikan data yang ada dan menyinkronkan data secara real-time dari kluster HBase yang dikelola sendiri atau ApsaraDB for HBase ke LindormTable. Topik ini menjelaskan cara memigrasikan dan menyinkronkan data dari kluster HBase.
Skenario
Migrasi data dari kluster HBase yang dikelola sendiri ke Lindorm.
Migrasi data lintas wilayah. Sebagai contoh, Anda dapat memigrasikan data dari pusat data di wilayah China (Qingdao) ke pusat data di wilayah China (Beijing).
Distribusi beban kerja. Sebagai contoh, Anda dapat memigrasikan sebagian bisnis Anda ke kluster baru.
Fitur dan manfaat
Fitur yang didukung
Data dapat dimigrasikan dari kluster HBase V1.x dan V2.x ke Lindorm tanpa gangguan pada bisnis.
Mendukung migrasi skema tabel, sinkronisasi data real-time, dan migrasi data penuh.
Mendukung migrasi berdasarkan database, namespace, dan tabel.
Mendukung penggantian nama tabel selama migrasi.
Rentang waktu, rentang kunci baris, dan kolom dapat ditentukan selama migrasi.
Operasi API didukung untuk membuat tugas migrasi.
Manfaat
Bisnis tidak terganggu selama migrasi. Baik data historis maupun data tambahan real-time dapat dimigrasikan dalam satu tugas migrasi.
Selama migrasi, kluster HBase tujuan yang dikelola sendiri tidak berinteraksi dengan kluster HBase sumber. Kluster tujuan hanya membaca data dari HDFS kluster sumber, meminimalkan dampak pada bisnis online yang berjalan di kluster sumber.
Dibandingkan dengan migrasi data di lapisan API, replikasi data di lapisan file membantu mengurangi lebih dari 50% penggunaan data dan meningkatkan efisiensi.
Setiap node dapat memigrasikan data dengan laju hingga 150 MB/s untuk memenuhi persyaratan stabilitas migrasi data. Anda dapat menambahkan node untuk penskalaan horizontal guna memigrasikan data dalam ukuran terabyte atau petabyte.
LTS menerapkan mekanisme ulang yang kuat untuk merespons kesalahan. LTS memantau kecepatan dan kemajuan tugas secara real-time serta menghasilkan peringatan ketika tugas gagal.
LTS secara otomatis menyinkronkan skema untuk memastikan konsistensi antar partisi.
Batasan
Data tidak dapat dimigrasikan ke kluster HBase yang dikelola sendiri.
Kluster HBase dengan Kerberos diaktifkan tidak didukung.
Kluster ApsaraDB for HBase dengan satu node tidak didukung.
Kluster ApsaraDB for HBase yang diterapkan di jaringan klasik tidak didukung karena masalah kompatibilitas jaringan.
Data tidak dapat dimigrasikan atau disinkronkan ke instance mandiri Lindorm.
LTS menerapkan mode asinkron untuk menyinkronkan data tambahan berdasarkan write-ahead logging (WAL). Data yang diimpor menggunakan bulk loading dan data yang tidak ditulis ke file WAL tidak disinkronkan.
Indeks pencarian tidak dapat dimigrasikan.
Catatan penggunaan
Sebelum memigrasikan data, pastikan kapasitas HDFS kluster tujuan mencukupi untuk mencegah data menghabiskan kapasitas selama migrasi.
Sebelum mengirimkan tugas sinkronisasi tambahan, kami sarankan menetapkan periode retensi log untuk kluster sumber lebih dari 12 jam untuk memberi waktu bagi LTS menangani kesalahan sinkronisasi tambahan. Modifikasi nilai parameter hbase.master.logcleaner.ttl di file konfigurasi
hbase-site.xmluntuk menetapkan periode retensi log. Setelah modifikasi, mulai ulang kluster sumber. Satuan parameter hbase.master.logcleaner.ttl adalah ms. Contohnya, jika parameterhbase.master.logcleaner.ttldiatur menjadi 43200000, periode retensi log yang ditentukan adalah 12 jam.Tidak perlu membuat tabel secara manual di kluster tujuan. LTS akan secara otomatis membuat tabel dan region sesuai dengan kluster sumber. Skema partisi tabel yang dibuat secara manual mungkin berbeda dari tabel sumber, yang dapat menyebabkan tabel sering terpecah atau dikompres setelah proses migrasi selesai. Jika tabel menyimpan sejumlah besar data, proses ini mungkin memakan waktu lama.
Jika tabel sumber memiliki coprocessor, pastikan kluster tujuan berisi file JAR yang sesuai dari coprocessor saat membuat tabel tujuan.
Jika data log tidak dikonsumsi setelah mengaktifkan fitur sinkronisasi tambahan, data log dipertahankan selama 48 jam secara default. Setelah periode tersebut berakhir, langganan secara otomatis dibatalkan dan data yang tersimpan secara otomatis dihapus.
Prasyarat
Jaringan antara kluster sumber, kluster tujuan, dan LTS harus terhubung.
Sumber data HBase dan Lindorm telah ditambahkan. Untuk informasi lebih lanjut, lihat Tambahkan Sumber Data HBase dan Tambahkan Sumber Data LindormTable.
Buat tugas
Masuk ke LTS. Untuk informasi lebih lanjut, lihat Masuk ke Antarmuka Web LTS.
Di panel navigasi di sebelah kiri, pilih .
Konfigurasikan parameter lalu klik create.
Di bidang job name(optional), masukkan nama tugas. Nama tugas hanya dapat berisi huruf dan angka. Anda dapat tidak menentukan nama tugas; dalam hal ini, ID tugas digunakan sebagai nama tugas.
Konfigurasikan parameter Source Cluster dan Target Cluster sesuai petunjuk.
Pilih operasi yang ingin Anda lakukan.
migration table schema: Membuat tabel di kluster tujuan. Tabel-tabel ini memiliki skema dan informasi partisi yang sama dengan tabel sumber. Jika sebuah tabel sudah ada di kluster tujuan, data di tabel ini tidak dimigrasikan.
real time data replication: Menyinkronkan data tambahan dari kluster sumber secara real-time.
history data migration: Memigrasikan semua file secara fisik.
Masukkan informasi yang diperlukan di bidang table mapping dan advance configuration. Bidang advance configuration dapat dibiarkan tidak ditentukan.
Klik create.
Lihat detail tugas
Di panel navigasi di sebelah kiri, pilih untuk melihat tugas yang Anda buat.
Di halaman yang muncul, klik nama tugas yang ingin Anda lihat. Di halaman yang muncul, lihat status eksekusi tugas.
Lakukan pergantian
Tunggu hingga tugas migrasi penuh selesai. Latensi sinkronisasi tambahan serendah beberapa detik atau ratusan milidetik.
Aktifkan pengambilan sampel dan verifikasi data LTS. Saat mengambil sampel dan memverifikasi tabel besar, pastikan rasio pengambilan sampel sesuai untuk mencegah bisnis online terpengaruh.
Verifikasi bisnis Anda.
Lakukan pergantian pada bisnis Anda.
FAQ
Mengapa data dalam tugas gagal dikonsumsi?
Kluster LTS dilepaskan sementara tugas masih berjalan, tugas sinkronisasi ditangguhkan, atau tugas diblokir secara abnormal.
Apa yang harus saya lakukan jika tugas migrasi data gagal?
Tugas migrasi data mungkin gagal karena faktor-faktor seperti koneksi jaringan yang tidak stabil atau konflik layanan. LTS dilengkapi dengan mekanisme ulang, yang memungkinkan sistem secara otomatis mencoba ulang tugas setelah kegagalan. Jika masalah tetap ada, hubungi dukungan teknis Lindorm (ID DingTalk: s0s3eg3).