Fitur sinkronisasi offline Data Integration menyediakan plugin Reader dan Writer. Anda dapat menentukan sumber dan tujuan data serta menggunakan parameter penjadwalan DataWorks untuk menyinkronkan data penuh atau inkremental dari database sumber ke database tujuan. Topik ini menjelaskan kemampuan sinkronisasi offline.
Kemampuan inti
Kemampuan sinkronisasi offline ditunjukkan pada gambar berikut:
Kemampuan | Deskripsi |
Sinkronisasi data antara sumber data yang berbeda | Data Integration mendukung lebih dari 50 jenis sumber data, seperti database relasional, penyimpanan tidak terstruktur, penyimpanan big data, dan antrian pesan. Anda dapat menentukan sumber dan tujuan data serta menggunakan plugin Reader dan Writer yang disediakan untuk mentransfer data antara sumber data terstruktur atau semi-terstruktur apa pun. Untuk informasi selengkapnya, lihat Sumber data yang didukung dan solusi sinkronisasi. |
Sinkronisasi data dalam lingkungan jaringan kompleks | Sinkronisasi offline mendukung sinkronisasi data untuk ApsaraDB, pusat data lokal, database yang dikelola sendiri di ECS, dan database di luar Alibaba Cloud. Sebelum mengonfigurasi sinkronisasi, pastikan konektivitas jaringan antara kelompok sumber daya dengan sumber dan tujuan. Untuk informasi selengkapnya tentang konfigurasi, lihat Solusi konektivitas jaringan. |
Skenario sinkronisasi | 1. Mode sinkronisasi yang didukung
Catatan Untuk informasi selengkapnya tentang parameter penjadwalan, lihat Skenario umum penggunaan parameter penjadwalan dalam Data Integration dan Format yang didukung untuk parameter penjadwalan. 2. Struktur sumber yang didukung
|
Metode Konfigurasi | Anda dapat mengonfigurasi tugas sinkronisasi offline Data Integration dengan cara berikut.
Catatan Untuk informasi selengkapnya tentang kemampuan konfigurasi tugas, lihat Ikhtisar fungsi. |
O&M tugas sinkronisasi offline |
|
Ikhtisar fungsi
Fitur | Deskripsi |
Sinkronisasi data penuh atau inkremental | Konfigurasikan Data Filtering dan gunakan parameter penjadwalan dalam tugas sinkronisasi offline untuk melakukan sinkronisasi data penuh atau inkremental. Konfigurasi untuk sinkronisasi inkremental bervariasi tergantung plugin. Untuk informasi selengkapnya tentang mengonfigurasi sinkronisasi data inkremental, lihat Skenario: Mengonfigurasi tugas sinkronisasi offline inkremental. |
Pemetaan bidang | Buat aturan pemetaan antar bidang untuk menulis data sumber ke bidang tujuan yang sesuai. Pastikan tipe data bidang sumber dan tujuan kompatibel selama konfigurasi.
|
Kontrol batas laju pekerjaan |
|
Eksekusi tugas terdistribusi | Sumber data yang mendukung eksekusi terdistribusi dapat menggunakan teknologi segmentasi tugas untuk mendistribusikan tugas sinkronisasi ke beberapa node guna eksekusi bersamaan. Hal ini memungkinkan kecepatan sinkronisasi meningkat secara linear seiring ukuran kluster, sehingga mengatasi hambatan kinerja single-node. Pola ini sangat berguna untuk skenario sinkronisasi ber-throughput tinggi dan latensi rendah. Pola ini juga secara efisien menjadwalkan sumber daya kluster yang menganggur, sehingga meningkatkan pemanfaatan perangkat keras secara signifikan. |
Kebijakan data kotor | Data kotor mengacu pada catatan yang gagal ditulis ke tujuan karena pengecualian, seperti konflik tipe atau pelanggaran batasan. Sinkronisasi offline mendukung penentuan kebijakan data kotor. Anda dapat menentukan jumlah catatan data kotor yang dapat ditoleransi dan dampaknya terhadap tugas.
|
Zona waktu | Jika sumber dan tujuan berada di zona waktu berbeda, atur zona waktu sumber untuk melakukan konversi zona waktu selama sinkronisasi. |
Pemrosesan data cerdas | DataWorks mendukung kemampuan pemrosesan data selama sinkronisasi data. Hal ini memungkinkan Anda mentransformasi dan memproses data sumber sebelum menulisnya ke tujuan: Penggantian string: Tugas sinkronisasi offline di DataWorks memiliki fitur penggantian string bawaan. Fitur ini memungkinkan Anda melakukan transformasi data ringan selama transfer data tanpa menyimpan data atau memerlukan langkah ekstrak, transformasi, dan muat (ETL) tambahan. Pemrosesan berbantuan AI: Selama sinkronisasi data, Anda dapat mengintegrasikan model AI besar untuk melakukan analisis semantik, sentimen, dan lainnya pada bahasa alami dari sumber. Hasil yang diproses kemudian ditulis langsung ke tabel tujuan. Vektorisasi data: Mengekstrak data sumber, membuat penyematan vektor, dan menulisnya ke database vektor. |
Operasi lainnya
Untuk informasi selengkapnya tentang cara membuat tugas, lihat: