Anda dapat menggunakan DataWorks Data Integration untuk menyinkronkan data lengkap dan tambahan di Tablestore ke Object Storage Service. Dengan cara ini, data Tablestore dicadangkan dan Anda dapat menggunakannya dalam OSS.
Cara kerjanya
Fitur sinkronisasi offline DataWorks Data Integration mengabstraksikan proses sinkronisasi antara sumber data dan tujuan menjadi Plugin Reader untuk membaca data dari sumber dan Plugin Writer untuk menulis data ke tujuan. Ini memungkinkan Anda mendefinisikan sumber data dan tujuan serta menggunakannya bersama dengan parameter penjadwalan DataWorks untuk menyinkronkan data lengkap atau tambahan dari sumber ke tujuan.
Untuk menyinkronkan data Tablestore ke OSS, Anda harus mengonfigurasi Plugin Reader terkait Tablestore dan Plugin Writer terkait OSS untuk tugas sinkronisasi offline. Berikut adalah catatan penggunaan plugin tersebut.
Plugin Reader Terkait Tablestore
Plugin Reader yang diperlukan bervariasi berdasarkan mode sinkronisasi data yang digunakan. Tabel berikut menjelaskan pemetaan antara mode sinkronisasi dan Plugin Reader terkait Tablestore.
Mode sinkronisasi
Plugin Reader terkait Tablestore
Deskripsi Plugin
Ekspor penuh
Tablestore Reader
Plugin ini digunakan untuk membaca data dari tabel Tablestore. Anda dapat menentukan rentang data yang ingin diekstraksi untuk melakukan ekstraksi tambahan. Untuk informasi lebih lanjut, lihat Sumber data Tablestore.
Sinkronisasi tambahan
OTSStream Reader
Plugin ini digunakan untuk mengekspor data dalam tabel Tablestore dalam mode tambahan. Untuk informasi lebih lanjut, lihat Sumber data Tablestore Stream.
Plugin Writer Terkait OSS
DataWorks menggunakan Plugin Writer terkait OSS untuk menulis data ke OSS, baik dalam mode ekspor penuh maupun sinkronisasi tambahan. Untuk informasi lebih lanjut, lihat Sumber Data OSS.
Mode sinkronisasi
Anda dapat mengonfigurasi filter data dan menggunakan parameter penjadwalan dalam tugas sinkronisasi offline untuk menentukan apakah akan menyinkronkan data lengkap atau tambahan. Tabel berikut menjelaskan mode sinkronisasi.
Mode sinkronisasi | Deskripsi |
Ekspor penuh | Dalam mode ini, data lengkap di Tablestore diekspor ke OSS sekaligus. Jika Anda menggunakan mode ini, Anda hanya perlu menjalankan tugas sinkronisasi offline satu kali. Anda tidak perlu mengonfigurasi parameter penjadwalan untuk tugas sinkronisasi offline. |
Sinkronisasi tambahan | Dalam mode ini, data baru dan dimodifikasi di Tablestore secara berkala disinkronkan ke OSS. Jika Anda menggunakan mode ini, Anda perlu mengonfigurasi parameter penjadwalan untuk tugas sinkronisasi offline. Dengan cara ini, data tambahan secara berkala disinkronkan. |
Skenario
Anda perlu mencadangkan data Tablestore dengan biaya lebih rendah atau ingin mengekspor data Tablestore sebagai file ke perangkat lokal.
Prosedur
Prosedur bervariasi berdasarkan mode sinkronisasi yang digunakan. Gunakan prosedur spesifik untuk mode sinkronisasi Anda. Untuk informasi lebih lanjut, lihat Ekspor Data Lengkap dari Tablestore ke OSS dan Sinkronkan Data Tambahan ke OSS.
Prosedur ekspor penuh
Tabel berikut menjelaskan langkah-langkah utama dalam mode ekspor penuh.
Langkah | Operasi | Deskripsi |
1 | Tambahkan sumber data | Langkah ini dilakukan untuk menentukan informasi instance tentang tabel dari mana Anda ingin menyinkronkan data. Sumber data adalah Tablestore. |
2 | Tambahkan tujuan | Langkah ini dilakukan untuk menentukan informasi tentang Bucket OSS ke mana Anda ingin menyinkronkan data. Tujuannya adalah OSS. |
3 | Buat node tugas offline | Node tugas offline diperlukan untuk operasi sinkronisasi offline. Anda perlu membuat node tugas offline untuk setiap operasi sinkronisasi. |
4 | Konfigurasikan dan mulai tugas sinkronisasi offline | DataWorks Data Integration menyediakan mode wizard dan mode skrip untuk mengonfigurasi tugas sinkronisasi offline. Pilih mode berdasarkan kebutuhan bisnis Anda.
|
5 | Verifikasi hasil migrasi | Setelah Anda mengekspor data, Anda dapat melihat data yang diimpor di konsol OSS. |
Prosedur sinkronisasi tambahan
Tabel berikut menjelaskan langkah-langkah utama dalam mode sinkronisasi tambahan.
Langkah | Operasi | Deskripsi |
1 | Tambahkan sumber data | Langkah ini dilakukan untuk menentukan informasi instance tentang tabel dari mana Anda ingin menyinkronkan data. Sumber data adalah Tablestore. Jika sumber data Tablestore yang ada memenuhi kebutuhan bisnis Anda, lewati langkah ini. |
2 | Tambahkan tujuan | Langkah ini dilakukan untuk menentukan informasi tentang Bucket OSS ke mana Anda ingin menyinkronkan data. Tujuannya adalah OSS. Jika sumber data OSS yang ada memenuhi kebutuhan bisnis Anda, lewati langkah ini. |
3 | Buat node tugas offline | Node tugas offline diperlukan untuk operasi sinkronisasi offline. Anda perlu membuat node tugas offline untuk setiap operasi sinkronisasi. |
4 | Konfigurasikan dan mulai tugas sinkronisasi offline | DataWorks Data Integration menyediakan mode wizard dan mode skrip untuk mengonfigurasi tugas sinkronisasi offline. Pilih mode berdasarkan kebutuhan bisnis Anda.
|
5 | Konfigurasikan parameter penjadwalan | Langkah ini dilakukan untuk mengonfigurasi waktu eksekusi, properti rerun, dan dependensi penjadwalan tugas sinkronisasi sehingga tugas sinkronisasi dapat dieksekusi secara berkala. |
6 | Debug kode dan kirimkan tugas | Setelah debugging berhasil, kirimkan tugas sinkronisasi offline ke server sehingga tugas dapat dieksekusi secara berkala berdasarkan properti penjadwalan. |
7 | Lihat hasil eksekusi tugas | Anda dapat melihat status tugas yang sedang berjalan di konsol DataWorks dan melihat hasil sinkronisasi data di konsol OSS. |
Aturan penagihan
Ketika Anda menyinkronkan data dari Tablestore ke OSS, Anda dikenakan biaya oleh Tablestore untuk membaca data berdasarkan jumlah unit kapasitas (CUs) yang dikonsumsi. Biaya dibebankan secara terpisah untuk CUs baca metered dan CUs baca reserved. Jenis instance yang diakses menentukan apakah CUs baca metered atau reserved dikonsumsi. Untuk informasi lebih lanjut, lihat Ikhtisar Penagihan.
CatatanUntuk informasi lebih lanjut tentang jenis instance dan CUs, lihat Instance dan Throughput Baca dan Tulis.
Setelah data disinkronkan ke OSS, Anda dikenakan biaya oleh OSS untuk penyimpanan file berdasarkan penggunaan penyimpanan dan durasi. Jika Anda mengunduh objek dari OSS ke perangkat lokal, Anda dikenakan biaya oleh OSS untuk jumlah permintaan API GET dan lalu lintas keluar Internet. Untuk informasi lebih lanjut, lihat Ikhtisar Penagihan OSS.