Fitur sinkronisasi data DataHub
Fitur sinkronisasi data DataHub menyediakan kemampuan sebagai sumber data (data source) dan sink. Fitur ini memungkinkan Anda menyinkronkan data dari suatu topik ke produk Alibaba Cloud lainnya secara real-time/near real-time untuk memfasilitasi pertukaran data antar layanan. Saat ini, layanan yang didukung meliputi MaxCompute (sebelumnya ODPS), AnalyticDB for MySQL (ADS), ApsaraDB RDS, Tablestore, Object Storage Service (OSS), Elasticsearch, dan Function Compute. Anda cukup menulis data ke DataHub sekali, lalu mengonfigurasi sinkronisasi data agar data tersebut dapat digunakan di seluruh layanan cloud yang didukung, sehingga membentuk alur data end-to-end.
Layanan Alibaba Cloud yang didukung oleh DataHub
Catatan:
Untuk MaxCompute: Sinkronisasi terjadi setiap 5 menit atau ketika ukuran batch mencapai 64 MB.
Untuk Tablestore, OSS, Elasticsearch, Function Compute, dan Hologres: Sinkronisasi terjadi setiap 20 detik atau ketika ukuran batch mencapai 4 MB.
Untuk MySQL, RDS, dan ADS 3.0: Sinkronisasi terjadi setiap 20 detik atau ketika ukuran batch mencapai 512 KB.
Layanan tujuan | Jenis topik yang didukung | Ketepatan waktu | Mendukung VPC |
MaxCompute | TUPLE / BLOB | Near real time, dengan latensi hingga 5 menit | Tidak |
AnalyticDB for MySQL | TUPLE | Real time | Tidak |
ApsaraDB RDS | TUPLE | Real time | Ya |
Tablestore | TUPLE | Real time | Tidak |
Object Storage Service (OSS) | TUPLE / BLOB | Real time | Tidak |
Elasticsearch | TUPLE | Real time | Ya |
Function Compute | TUPLE / BLOB | Real time | Tidak |
Hologres | TUPLE | Real time | Tidak |
Catatan penggunaan
Bila memungkinkan, sinkronkan data antar layanan Alibaba Cloud dalam wilayah (region) yang sama untuk menghindari masalah konektivitas jaringan lintas wilayah dan mengurangi latensi jaringan.
Karena adanya isolasi jaringan Alibaba Cloud, gunakan hanya titik akhir internal (classic network) dari layanan tujuan saat mengonfigurasi endpoint. Titik akhir publik tidak didukung.
Sinkronisasi data DataHub menggunakan semantik at-least-once. Dalam kasus langka—seperti kegagalan jaringan atau layanan—catatan duplikat mungkin muncul di tujuan. Lakukan deduplikasi data sesuai kebutuhan.
Saat Anda membuat tugas sinkronisasi, DataHub secara otomatis membuat ID subscription untuk melacak offset baca dari topik DataHub. Jangan ubah ID subscription ini.
Hanya pemilik atau pembuat topik DataHub yang dapat membuat konektor (tugas sinkronisasi).
Anda dapat membuat hingga dua tugas sinkronisasi per jenis sinkronisasi.
Daftar putih IP
Daftar putih IP berubah seiring waktu dan tidak tetap. Jika Anda masih melihat error "'xxx' is not in whitelist" setelah menambahkan alamat IP yang tercantum di sini, kirimkan tiket untuk mendapatkan daftar putih IP terbaru.
Wilayah | Daftar putih jaringan klasik | Daftar putih VPC |
China (Hangzhou) | 10.130.203.0/24 10.130.208.0/24 10.130.210.0/24 10.130.213.0/24 10.186.213.0/24 10.32.103.0/24 10.32.104.0/24 10.32.177.0/24 10.32.94.0/24 10.32.95.0/24 10.32.96.0/24 10.32.97.0/24 10.32.98.0/24 10.32.99.0/24 10.5.35.0/24 11.115.89.0/24 11.194.216.0/24 11.194.217.0/24 11.194.247.0/24 11.194.248.0/24 11.197.14.0/24 11.223.199.0/24 | 100.104.191.0/24 |
China (Shanghai) | 11.199.218.0/24 11.199.219.0/24 26.76.154.0/24 26.76.155.0/24 | 100.104.136.0/24 |
China (Beijing) | 11.204.155.0/24 11.204.158.0/24 11.204.161.0/24 11.204.162.0/24 11.218.245.0/24 11.220.203.0/24 11.220.204.0/24 11.220.216.0/24 11.220.217.0/24 11.220.237.0/24 11.220.238.0/24 11.220.240.0/24 11.220.242.0/24 11.223.107.0/24 | 100.104.33.0/24 |
China (Shenzhen) | 10.58.213.0/24 10.58.219.0/24 11.114.243.0/24 26.41.109.0/24 26.41.119.0/24 26.74.38.0/24 | 100.104.55.0/24 |
Asia Pacific SE 1 (Singapura) | 11.112.208.0/24 11.195.209.0/24 11.197.63.0/24 26.53.11.0/24 26.59.42.0/24 26.77.111.0/24 26.79.102.0/24 26.79.92.0/24 | 100.104.163.0/24 |
Alibaba Gov Cloud (Beijing) | 11.199.246.0/24 11.199.247.0/24 | 100.104.254.0/24 |
China (Zhangjiakou) | 10.2.165.0/24 10.93.87.0/24 11.113.55.0/24 11.114.126.0/24 11.196.52.0/24 11.196.53.0/24 11.207.155.0/24 11.57.215.0/24 | 100.104.195.0/24 |
Asia-Pacific Southeast 3 (Kuala Lumpur, Malaysia) | 11.204.39.0/24 11.204.40.0/24 11.204.41.0/24 11.48.249.0/24 11.48.250.0/24 | 100.104.13.0/24 |
China (Hong Kong) | 11.119.176.0/24 26.49.143.0/24 26.49.144.0/24 26.53.105.0/24 26.53.112.0/24 26.55.135.0/24 26.73.76.0/24 | 100.104.166.0/24 |
Finance Cloud (Shanghai) | 10.0.4.0/24 10.0.5.0/24 10.130.163.0/24 11.197.111.0/24 11.197.120.0/24 | 100.104.220.0/24 |
Europe Central 1 (Frankfurt) | 10.250.235.0/24 10.254.223.0/24 10.254.224.0/24 10.71.0.0/24 11.195.132.0/24 26.78.19.0/24 | 100.104.100.0/24 |
US (Silicon Valley) | 11.199.218.0/24 11.199.219.0/24 26.76.154.0/24 26.76.155.0/24 | 100.104.235.0/24 |
Daftar putih layanan
MaxCompute mendukung daftar putih IP tingkat proyek. Jika Anda mengaktifkan daftar putih IP, DataHub tidak dapat menyinkronkan data ke MaxCompute. Untuk mengatasi hal ini, MaxCompute menyediakan daftar putih layanan. Tambahkan nama layanan DataHub ke daftar putih layanan MaxCompute agar sinkronisasi data berhasil.
Nama layanan DataHub saat ini adalah DataHub. Anda dapat mengonfigurasinya menggunakan SDK atau odpscmd.
Contoh berikut menunjukkan cara mengonfigurasi SDK:
public static void setServiceName() throws OdpsException {
String endpoint = "";
String project = "";
String accessId = "";
String accessKey = "";
Account account = new AliyunAccount(accessId, accessKey);
Odps odps = new Odps(account);
odps.setEndpoint(endpoint);
odps.setDefaultProject(project);
Map<String, String> prop = new HashMap<>();
// Tambahkan nama layanan DataHub ke daftar putih layanan MaxCompute.
// Pisahkan beberapa nama dengan koma. Setiap pembaruan akan menimpa pengaturan sebelumnya.
prop.put("odps.security.ip.whitelist.services", "DataHub");
Group group = new Groups(odps).get("groupName");
group.updateProject(project, null, null, prop);
// Verifikasi pengaturan daftar putih layanan saat ini.
prop = odps.projects().get(project).getAllProperties();
System.out.println("daftar layanan saat ini: " + prop.get("odps.security.ip.whitelist.services"));
}Untuk pengaturan odpscmd, lihat contoh berikut.
Jalankan odpscmd, lalu masukkan perintah berikut.
setproject odps.security.ip.whitelist.services=DataHub;Setelah konfigurasi selesai, Anda dapat memverifikasi keberhasilannya dengan cara berikut.
setproject;
## Jika output mencakup odps.security.ip.whitelist.services=DataHub, pengaturan berhasil.