全部产品
Search
文档中心

Tablestore:Sinkronkan data dari Tablestore ke OSS

更新时间:Jul 02, 2025

Anda dapat menggunakan DataWorks Data Integration untuk menyinkronkan data lengkap dan tambahan di Tablestore ke Object Storage Service. Dengan cara ini, data Tablestore dicadangkan dan Anda dapat menggunakannya dalam OSS.

Cara kerjanya

Fitur sinkronisasi offline DataWorks Data Integration mengabstraksikan proses sinkronisasi antara sumber data dan tujuan menjadi Plugin Reader untuk membaca data dari sumber dan Plugin Writer untuk menulis data ke tujuan. Ini memungkinkan Anda mendefinisikan sumber data dan tujuan serta menggunakannya bersama dengan parameter penjadwalan DataWorks untuk menyinkronkan data lengkap atau tambahan dari sumber ke tujuan.

Untuk menyinkronkan data Tablestore ke OSS, Anda harus mengonfigurasi Plugin Reader terkait Tablestore dan Plugin Writer terkait OSS untuk tugas sinkronisasi offline. Berikut adalah catatan penggunaan plugin tersebut.

  • Plugin Reader Terkait Tablestore

    Plugin Reader yang diperlukan bervariasi berdasarkan mode sinkronisasi data yang digunakan. Tabel berikut menjelaskan pemetaan antara mode sinkronisasi dan Plugin Reader terkait Tablestore.

    Mode sinkronisasi

    Plugin Reader terkait Tablestore

    Deskripsi Plugin

    Ekspor penuh

    Tablestore Reader

    Plugin ini digunakan untuk membaca data dari tabel Tablestore. Anda dapat menentukan rentang data yang ingin diekstraksi untuk melakukan ekstraksi tambahan. Untuk informasi lebih lanjut, lihat Sumber data Tablestore.

    Sinkronisasi tambahan

    OTSStream Reader

    Plugin ini digunakan untuk mengekspor data dalam tabel Tablestore dalam mode tambahan. Untuk informasi lebih lanjut, lihat Sumber data Tablestore Stream.

  • Plugin Writer Terkait OSS

    DataWorks menggunakan Plugin Writer terkait OSS untuk menulis data ke OSS, baik dalam mode ekspor penuh maupun sinkronisasi tambahan. Untuk informasi lebih lanjut, lihat Sumber Data OSS.

Mode sinkronisasi

Anda dapat mengonfigurasi filter data dan menggunakan parameter penjadwalan dalam tugas sinkronisasi offline untuk menentukan apakah akan menyinkronkan data lengkap atau tambahan. Tabel berikut menjelaskan mode sinkronisasi.

Mode sinkronisasi

Deskripsi

Ekspor penuh

Dalam mode ini, data lengkap di Tablestore diekspor ke OSS sekaligus.

Jika Anda menggunakan mode ini, Anda hanya perlu menjalankan tugas sinkronisasi offline satu kali. Anda tidak perlu mengonfigurasi parameter penjadwalan untuk tugas sinkronisasi offline.

Sinkronisasi tambahan

Dalam mode ini, data baru dan dimodifikasi di Tablestore secara berkala disinkronkan ke OSS.

Jika Anda menggunakan mode ini, Anda perlu mengonfigurasi parameter penjadwalan untuk tugas sinkronisasi offline. Dengan cara ini, data tambahan secara berkala disinkronkan.

Skenario

Anda perlu mencadangkan data Tablestore dengan biaya lebih rendah atau ingin mengekspor data Tablestore sebagai file ke perangkat lokal.

Prosedur

Prosedur bervariasi berdasarkan mode sinkronisasi yang digunakan. Gunakan prosedur spesifik untuk mode sinkronisasi Anda. Untuk informasi lebih lanjut, lihat Ekspor Data Lengkap dari Tablestore ke OSS dan Sinkronkan Data Tambahan ke OSS.

Prosedur ekspor penuh

Tabel berikut menjelaskan langkah-langkah utama dalam mode ekspor penuh.

Langkah

Operasi

Deskripsi

1

Tambahkan sumber data

Langkah ini dilakukan untuk menentukan informasi instance tentang tabel dari mana Anda ingin menyinkronkan data. Sumber data adalah Tablestore.

2

Tambahkan tujuan

Langkah ini dilakukan untuk menentukan informasi tentang Bucket OSS ke mana Anda ingin menyinkronkan data. Tujuannya adalah OSS.

3

Buat node tugas offline

Node tugas offline diperlukan untuk operasi sinkronisasi offline. Anda perlu membuat node tugas offline untuk setiap operasi sinkronisasi.

4

Konfigurasikan dan mulai tugas sinkronisasi offline

DataWorks Data Integration menyediakan mode wizard dan mode skrip untuk mengonfigurasi tugas sinkronisasi offline. Pilih mode berdasarkan kebutuhan bisnis Anda.

  • Mode wizard: Anda dapat mengonfigurasi tugas sinkronisasi data pada antarmuka pengguna grafis. Mode ini mudah digunakan tetapi hanya menyediakan fitur terbatas.

  • Mode skrip: Anda dapat menulis skrip JSON untuk sinkronisasi data untuk menyelesaikan pengembangan sinkronisasi data. Mode ini cocok untuk pengguna tingkat lanjut dan menghasilkan biaya pembelajaran yang tinggi. Mode ini mendukung fitur canggih untuk memfasilitasi konfigurasi yang fleksibel dan halus.

5

Verifikasi hasil migrasi

Setelah Anda mengekspor data, Anda dapat melihat data yang diimpor di konsol OSS.

Prosedur sinkronisasi tambahan

Tabel berikut menjelaskan langkah-langkah utama dalam mode sinkronisasi tambahan.

Langkah

Operasi

Deskripsi

1

Tambahkan sumber data

Langkah ini dilakukan untuk menentukan informasi instance tentang tabel dari mana Anda ingin menyinkronkan data. Sumber data adalah Tablestore.

Jika sumber data Tablestore yang ada memenuhi kebutuhan bisnis Anda, lewati langkah ini.

2

Tambahkan tujuan

Langkah ini dilakukan untuk menentukan informasi tentang Bucket OSS ke mana Anda ingin menyinkronkan data. Tujuannya adalah OSS.

Jika sumber data OSS yang ada memenuhi kebutuhan bisnis Anda, lewati langkah ini.

3

Buat node tugas offline

Node tugas offline diperlukan untuk operasi sinkronisasi offline. Anda perlu membuat node tugas offline untuk setiap operasi sinkronisasi.

4

Konfigurasikan dan mulai tugas sinkronisasi offline

DataWorks Data Integration menyediakan mode wizard dan mode skrip untuk mengonfigurasi tugas sinkronisasi offline. Pilih mode berdasarkan kebutuhan bisnis Anda.

  • Mode wizard: Anda dapat mengonfigurasi tugas sinkronisasi data pada antarmuka pengguna grafis. Mode ini mudah digunakan tetapi hanya menyediakan fitur terbatas.

  • Mode skrip: Anda dapat menulis skrip JSON untuk sinkronisasi data untuk menyelesaikan pengembangan sinkronisasi data. Mode ini cocok untuk pengguna tingkat lanjut dan menghasilkan biaya pembelajaran yang tinggi. Mode ini mendukung fitur canggih untuk memfasilitasi konfigurasi yang fleksibel dan halus.

5

Konfigurasikan parameter penjadwalan

Langkah ini dilakukan untuk mengonfigurasi waktu eksekusi, properti rerun, dan dependensi penjadwalan tugas sinkronisasi sehingga tugas sinkronisasi dapat dieksekusi secara berkala.

6

Debug kode dan kirimkan tugas

Setelah debugging berhasil, kirimkan tugas sinkronisasi offline ke server sehingga tugas dapat dieksekusi secara berkala berdasarkan properti penjadwalan.

7

Lihat hasil eksekusi tugas

Anda dapat melihat status tugas yang sedang berjalan di konsol DataWorks dan melihat hasil sinkronisasi data di konsol OSS.

Aturan penagihan

  • Ketika Anda menyinkronkan data dari Tablestore ke OSS, Anda dikenakan biaya oleh Tablestore untuk membaca data berdasarkan jumlah unit kapasitas (CUs) yang dikonsumsi. Biaya dibebankan secara terpisah untuk CUs baca metered dan CUs baca reserved. Jenis instance yang diakses menentukan apakah CUs baca metered atau reserved dikonsumsi. Untuk informasi lebih lanjut, lihat Ikhtisar Penagihan.

    Catatan

    Untuk informasi lebih lanjut tentang jenis instance dan CUs, lihat Instance dan Throughput Baca dan Tulis.

  • Setelah data disinkronkan ke OSS, Anda dikenakan biaya oleh OSS untuk penyimpanan file berdasarkan penggunaan penyimpanan dan durasi. Jika Anda mengunduh objek dari OSS ke perangkat lokal, Anda dikenakan biaya oleh OSS untuk jumlah permintaan API GET dan lalu lintas keluar Internet. Untuk informasi lebih lanjut, lihat Ikhtisar Penagihan OSS.