ApsaraDB for SelectDB mendukung migrasi data Hive melalui Catalog, X2Doris, DataWorks, dan OSS Load. Pilih metode yang sesuai berdasarkan volume data dan skenario bisnis Anda.
Pilih metode
Tabel berikut membandingkan metode migrasi yang tersedia untuk membantu Anda memilih metode yang paling tepat:
|
Metode |
Skenario |
Rekomendasi |
Prosedur |
|
Catalog |
Data disimpan di platform Alibaba Cloud. Catatan
Ini mencakup skenario seperti kluster Alibaba Cloud EMR. |
|
|
|
OSS Load |
Data tidak disimpan di platform Alibaba Cloud. |
Tidak ada biaya traffic migrasi. Catatan
OSS Load mentransfer data dari Object Storage Service (OSS) ke SelectDB melalui jaringan internal, sehingga menghindari biaya traffic. |
|
|
DataWorks |
Data Anda dikelola oleh DataWorks, atau Anda menggunakan DataWorks sebagai platform pengembangan data Anda. |
Menyediakan antarmuka visual yang simple dan mudah digunakan. |
Panduan migrasi data inkremental
Di lingkungan produksi, data Hive umumnya mencakup data offline dan data inkremental. Salah satu alasan utama memigrasikan data Hive ke SelectDB adalah untuk mempercepat kueri dengan mereplikasi data ke gudang data. Untuk data inkremental, pertimbangkan metode berikut:
-
Tulis data ke SelectDB secara paralel saat menghasilkan data Hive.
-
Jadwalkan pekerjaan periodik untuk membaca data partisi dari Hive dan menuliskannya ke SelectDB.
Referensi
Untuk informasi lebih lanjut tentang Hive, lihat Hive data source.