Tablestore menggunakan layanan pengiriman data untuk mengirimkan data penuh atau inkremental ke Object Storage Service (OSS) secara real-time. Fitur ini memungkinkan Tablestore menyimpan data historis di OSS dengan cara yang hemat biaya sementara melaksanakan analisis offline atau semi-real-time terhadap jumlah data yang lebih besar.
Skenario
Layanan pengiriman data dapat digunakan dalam skenario berikut:
Penyimpanan Bertingkat Data Panas dan Dingin
Layanan pengiriman data digabungkan dengan fitur time to live (TTL) dari Tablestore untuk menyimpan data penuh di OSS dengan cara yang hemat biaya. Tablestore memungkinkan Anda menanyakan dan menganalisis data panas dengan latensi rendah.
Cadangan Data Penuh
Gunakan layanan pengiriman data untuk mengirimkan data penuh dari tabel di Tablestore ke Bucket OSS untuk pencadangan dan arsip.
Analisis Data Skala Besar Secara Real-Time
Gunakan layanan pengiriman data untuk mengirimkan data inkremental dari Tablestore ke OSS secara real-time (setiap 2 menit). Data yang dikirimkan dipartisi berdasarkan waktu sistem dan disimpan dalam format Parquet. Gunakan bandwidth tinggi OSS untuk membaca dan optimasi pemindaian data Parquet guna melaksanakan analisis data real-time yang efisien.
Fitur
Layanan pengiriman data memiliki fitur-fitur berikut:
Layanan pengiriman data secara otomatis menarik data penuh dan inkremental dari Tablestore. Ketika volume data mencapai ukuran tertentu, atau jika tidak ada data yang dikirimkan ke OSS dalam 2 menit, data yang ditarik dikirimkan ke OSS untuk penyimpanan permanen.
Layanan pengiriman data mendukung mode pengiriman berikut: inkremental, penuh, dan diferensial. Semua data yang dikirimkan disimpan dalam format Parquet.
Layanan pengiriman data mendukung pemantauan waktu penyelesaian pengiriman. Operasi DescribeDeliveryTask tersedia untuk mengembalikan waktu penyelesaian pengiriman data.
Manfaat
Kemudahan Penggunaan
Untuk mengirimkan data dari Tablestore ke OSS, cukup selesaikan konfigurasi sederhana di konsol Tablestore. Tugas pengiriman berjalan otomatis, kapasitas throughput diskalakan sesuai beban tanpa memerlukan pemantauan atau operasi manual, namun tetap menjamin service-level agreements (SLA).
Mode Pengiriman Lengkap
Layanan pengiriman data mendukung mode berikut: inkremental, penuh, dan diferensial. Dalam mode inkremental, tugas pengiriman beroperasi secara semi-real-time, mengambil data terbaru, menyimpannya dalam cache, dan menulisnya ke OSS setelah dua menit.
Integrasi dengan Ekosistem Komputasi
Layanan pengiriman data kompatibel dengan standar ekosistem open source dan konvensi penamaan Hive. Data yang dikirimkan disimpan dalam format Parquet. Anda dapat menggunakan E-MapReduce (EMR) untuk langsung menganalisis data yang dikirimkan ke OSS menggunakan tabel eksternal.
Pengalaman Penyimpanan dan Akses Bertingkat
Setelah data dikirimkan ke OSS, Anda dapat mengakses berbagai jenis data seperti data dalam tabel, tabel indeks, dan data yang dikirimkan ke OSS. Hal ini memenuhi kebutuhan analisis dari berbagai skenario.
Catatan penggunaan
Layanan pengiriman data tersedia di wilayah berikut: Tiongkok (Hangzhou), Tiongkok (Shanghai), Tiongkok (Beijing), Tiongkok (Zhangjiakou), dan Tiongkok (Shenzhen).
Prosedur
Buat tugas pengiriman untuk mengirimkan data dari Tablestore ke OSS. Untuk informasi lebih lanjut, lihat Memulai Cepat dan Gunakan SDK Tablestore untuk Mengirimkan Data Tablestore ke OSS.
Gunakan EMR untuk menganalisis data Tablestore yang dikirimkan ke OSS. Untuk informasi lebih lanjut, lihat Gunakan EMR.