Node perbandingan data DataWorks memungkinkan Anda membandingkan data antar tabel yang berbeda dengan berbagai cara. Node ini dapat digunakan dalam alur kerja. Topik ini menjelaskan cara menggunakan node perbandingan data untuk mengembangkan suatu tugas.
Pengenalan node
Node perbandingan data tidak hanya digunakan untuk integrasi data, tetapi juga mendukung perbandingan data antar tabel. Anda dapat menentukan rentang dan metrik perbandingan kustom untuk perbandingan data yang lebih fleksibel.
Batasan
Node perbandingan data hanya mendukung kelompok sumber daya arsitektur tanpa server. Untuk informasi selengkapnya tentang kelompok sumber daya arsitektur tanpa server, lihat Manajemen kelompok sumber daya.
Prosedur
Langkah 1: Membuat node perbandingan data
Buka halaman DataStudio.
Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih Wilayah yang diinginkan. Di panel navigasi sebelah kiri, pilih . Pada halaman yang muncul, pilih ruang kerja yang diinginkan dari daftar drop-down, lalu klik Go to Data Development.
Klik ikon
dan pilih .Ikuti petunjuk di layar untuk menentukan path dan nama node.
Langkah 2: Mengonfigurasi node perbandingan data
Mengonfigurasi informasi tabel untuk perbandingan
Anda dapat membandingkan data tabel dari sumber data yang berbeda dengan mengonfigurasi informasi dasar tabel tersebut. Tabel berikut menjelaskan parameter-parameternya.
Parameter | Deskripsi |
Resource Group | Pilih kelompok sumber daya yang sudah ada dari daftar drop-down. |
Task Resource Usage | Sesuaikan jumlah sumber daya yang dikonsumsi oleh node perbandingan data saat dijalankan. |
Data Source Type | Pilih jenis sumber data untuk tabel sumber dan tabel tujuan yang ingin Anda bandingkan. |
Data Source Name | Pilih sumber data untuk tabel sumber dan tabel tujuan yang ingin Anda bandingkan. |
Connectivity | Setelah menyelesaikan konfigurasi, klik Test untuk memeriksa apakah sumber data terhubung ke kelompok sumber daya. |
Table Name | Pilih tabel sumber dan tabel tujuan dari daftar drop-down. |
WHERE Filter | Filter data pada tabel sumber dan tabel tujuan yang ingin Anda bandingkan. |
Shard Key | Konfigurasikan kunci shard untuk tabel sumber. Kunci shard adalah kolom yang digunakan untuk mempartisi data. Disarankan untuk menggunakan kunci primer atau kolom terindeks sebagai kunci shard. |
Mengonfigurasi aturan perbandingan
Anda dapat mengonfigurasi aturan Metric-based Comparison atau Full-text Comparison untuk membandingkan data sumber dengan data tujuan.
Konfigurasi penjadwalan
Setelah mengonfigurasi aturan, Anda dapat mengonfigurasi properti penjadwalan untuk node perbandingan data. Untuk informasi selengkapnya, lihat Konfigurasi penjadwalan node.
Langkah 3: Men-deploy dan memelihara node
Men-deploy node perbandingan data
Setelah mengonfigurasi tugas node, Anda harus melakukan commit dan deploy. Setelah tugas di-commit dan di-deploy, tugas tersebut akan berjalan secara berkala berdasarkan konfigurasi penjadwalan.
Klik ikon
di bilah alat untuk menyimpan node.Klik ikon
di bilah alat untuk melakukan commit node.Pada kotak dialog Commit, masukkan Change Description. Jika diperlukan, pilih apakah akan melakukan tinjauan kode dan pengujian asap setelah node di-commit.
CatatanAnda harus mengatur properti Rerun dan Parent Nodes untuk node sebelum dapat melakukan commit.
Tinjauan kode membantu mengontrol kualitas kode tugas Anda. Ini mencegah kesalahan tugas yang dapat terjadi jika kode yang salah dipublikasikan ke lingkungan produksi tanpa ditinjau. Jika Anda mengaktifkan tinjauan kode, kode yang di-commit harus disetujui oleh peninjau sebelum dapat di-deploy. Untuk informasi selengkapnya, lihat Tinjauan kode.
Untuk memastikan tugas node terjadwal berjalan sesuai harapan, kami sarankan Anda melakukan pengujian asap pada tugas sebelum men-deploy-nya. Untuk informasi selengkapnya, lihat Pengujian asap.
Jika Anda menggunakan ruang kerja dalam mode standar, Anda juga harus mengklik Deploy di pojok kanan atas halaman pengeditan node setelah tugas di-commit. Ini akan mempublikasikan tugas ke lingkungan produksi. Untuk informasi selengkapnya, lihat Men-deploy tugas.
Memelihara node perbandingan data
Setelah node perbandingan data di-deploy, Anda dapat melakukan operasi dan pemeliharaan (O&M) pada node tersebut di Pusat Operasi. Untuk informasi selengkapnya, lihat Pusat Operasi.
Menampilkan laporan validasi data
Anda dapat melihat laporan validasi data di log eksekusi tugas. Anda dapat melihat laporan dengan cara berikut:
Lihat di Pusat Operasi:
Klik ikon
dan pilih untuk membuka Pusat Operasi.Di panel navigasi kiri Pusat Operasi, pilih untuk melihat instans yang dihasilkan untuk node perbandingan data. Di kolom Operation, klik More lalu pilih View Runtime Log.
Di halaman log, klik tab Data Comparison untuk melihat laporan.
Lihat di log waktu proses:
Jika Anda menjalankan node perbandingan data dari halaman Data Development, Anda dapat mengklik tautan di log waktu proses, seperti yang ditunjukkan pada gambar berikut, untuk membuka halaman laporan validasi data.

