DataWorks menyediakan node perbandingan data yang memungkinkan Anda membandingkan data antar tabel dengan berbagai cara. Node ini dapat digunakan dalam alur kerja untuk mengembangkan tugas.
Pengenalan Node
Node perbandingan data mendukung integrasi data serta perbandingan antar tabel. Mereka juga mendukung ruang lingkup dan metrik perbandingan kustom, memungkinkan analisis data yang lebih komprehensif.
Keterbatasan
Hanya kelompok sumber daya Serverless yang didukung. Untuk informasi lebih lanjut tentang cara menambahkan dan menggunakan kelompok sumber daya Serverless, lihat Tambah dan gunakan kelompok sumber daya Serverless.
I. Buat node perbandingan data
Buka halaman Workspaces di Konsol DataWorks. Di bilah navigasi atas, pilih Wilayah yang diinginkan. Temukan ruang kerja yang diinginkan dan pilih di kolom Actions.
Di panel navigasi sebelah kiri, klik
untuk mengakses Pengembangan Data. Di sebelah kanan Project Directory, klik
dan pilih . Ikuti petunjuk antarmuka untuk memasukkan jalur node dan nama untuk menyelesaikan pembuatan node.
II. Konfigurasikan node perbandingan data
1. Konfigurasikan informasi tabel perbandingan
Node perbandingan data hanya memerlukan konfigurasi sederhana dari informasi tabel perbandingan untuk membandingkan data dari sumber data yang berbeda. Detail konfigurasi adalah sebagai berikut:
Parameter | Deskripsi |
Resource Group | Pilih kelompok sumber daya yang ada dari daftar drop-down. |
Task Resource Usage | Jumlah unit komputasi (CUs) yang dialokasikan untuk menjalankan node perbandingan data. Anda dapat mengonfigurasi parameter ini sesuai kebutuhan. |
Data Source Type | Pilih jenis sumber data tempat tabel sumber dan tujuan masing-masing termasuk. |
Data Source Name | Pilih sumber data tempat tabel sumber dan tujuan masing-masing termasuk. |
Connectivity | Setelah konfigurasi selesai, klik Test untuk memeriksa apakah sumber data terhubung ke kelompok sumber daya. |
Table Name | Pilih tabel sumber dan tujuan yang akan dibandingkan dari daftar drop-down. |
Where Filter | Masukkan kondisi WHERE untuk menyaring data di tabel sumber dan tujuan. Catatan
|
Shard Key | Tentukan kolom di tabel sumber sebagai kunci shard. Kami sarankan Anda menggunakan kunci utama atau kolom terindeks sebagai kunci shard. |
2. Konfigurasikan aturan perbandingan
Aturan perbandingan dapat diatur untuk Metric-based Comparison atau Full-text Comparison, memungkinkan Anda membandingkan sumber data dan target menggunakan aturan perbandingan yang berbeda.
Perbandingan berbasis metrik
Perbandingan teks penuh
3. Konfigurasi penjadwalan
Setelah menyelesaikan konfigurasi aturan, Anda dapat mengklik Scheduling Configuration di sebelah kanan halaman untuk mengonfigurasi penjadwalan untuk node perbandingan data. Untuk detail konfigurasi, lihat Konfigurasikan penjadwalan untuk sebuah node.
III. Penyebaran dan operasi
1. Terapkan node perbandingan data
Setelah tugas pada node perbandingan data dikonfigurasi, Anda harus mengirimkan dan menyebarkan node tersebut. Setelah Anda mengirimkan dan menyebarkan node, sistem akan menjalankan node secara berkala berdasarkan konfigurasi penjadwalan.
Klik ikon
di bilah alat atas untuk menyimpan node.Klik ikon
di bilah alat atas untuk menyebarkan node.
Untuk detail operasi dalam menyebarkan node, lihat Sebarkan sebuah node atau alur kerja.
2. Operasikan node perbandingan data
Setelah node perbandingan data berhasil disebarkan, Anda dapat melakukan operasi pada node di Pusat Operasi. Untuk informasi lebih lanjut, lihat Pusat Operasi.
3. Lihat laporan validasi data
Anda dapat melihat laporan validasi data di log eksekusi tugas melalui metode berikut:
Lihat di Pusat Operasi:
Klik tombol
di pojok kiri atas halaman dan pilih untuk masuk ke Pusat Operasi.Di panel navigasi kiri Pusat Operasi, klik untuk melihat instansi yang dihasilkan oleh node perbandingan data. Klik kolom Operation dengan nama More dan pilih View Running Log.
Di halaman log, klik tab Data Comparison untuk melihat.
Lihat di tab Log:
Jika Anda hanya menjalankan node perbandingan data di halaman Pengembangan Data, Anda dapat mengklik tautan yang ditunjukkan pada gambar di bawah ini di halaman Pengembangan Data, yang akan mengarahkan Anda ke halaman laporan validasi data.

