Node Perbandingan Data DataWorks memungkinkan Anda membandingkan data antar tabel dengan berbagai metode dan menambahkannya ke alur kerja. Dokumen ini menjelaskan cara membuat tugas menggunakan node ini.
Ikhtisar
Node Perbandingan Data mendukung perbandingan langsung antar tabel, tidak hanya yang terdapat dalam integrasi data. Anda dapat menyesuaikan cakupan perbandingan dan menentukan metrik kustom untuk analisis data yang lebih fleksibel.
Batasan
Node ini hanya mendukung kelompok sumber daya Serverless. Untuk informasi selengkapnya tentang penggunaan kelompok sumber daya Serverless, lihat Use a Serverless resource group.
Langkah 1: Buat node perbandingan data
Buka halaman Workspaces di Konsol DataWorks. Pada bilah navigasi atas, pilih Wilayah yang diinginkan. Temukan ruang kerja yang dituju, lalu pilih di kolom Actions.
Pada panel navigasi di sebelah kiri, klik
untuk membuka Data Development. Di sebelah kanan Project Directory, klik
dan pilih . Ikuti petunjuk di layar untuk memasukkan path dan nama node guna membuatnya.
Langkah 2: Konfigurasikan node perbandingan data
1. Konfigurasikan informasi tabel
Anda dapat mengonfigurasi node Perbandingan Data dengan menentukan tabel-tabel yang akan dibandingkan. Tabel berikut menjelaskan parameter-parameternya.
Parameter | Deskripsi |
Resource Group | Pilih Resource Group yang sudah ada dari daftar drop-down. |
Task resource usage | Sesuaikan jumlah sumber daya yang dikonsumsi oleh node Perbandingan Data saat dijalankan. |
Data Source Type | Pilih tipe sumber data untuk tabel Source dan Destination yang ingin Anda bandingkan. |
Data Source Name | Pilih sumber data untuk tabel Source dan Destination. |
Connectivity | Setelah dikonfigurasi, klik Test untuk memverifikasi koneksi ke Resource Group. |
Table name | Pilih tabel Source dan Destination yang akan dibandingkan dari daftar drop-down. Catatan Untuk Sumber data MaxCompute, Anda juga dapat memilih skema. |
Where filter | Filter data pada tabel Source dan Destination untuk perbandingan. Catatan
|
Shard Key | Konfigurasikan Shard Key untuk tabel Source. Node ini menggunakan kolom tersebut untuk memisahkan data. Disarankan menggunakan primary key atau kolom yang memiliki indeks sebagai Shard Key. |
2. Konfigurasikan aturan perbandingan
Anda dapat memilih antara Metric-based Comparison atau Full-text Comparison untuk membandingkan data antara tabel Source dan Destination.
Perbandingan metrik
Perbandingan teks lengkap
3. Konfigurasi penjadwalan
Setelah mengonfigurasi aturan, klik Scheduling Configuration di sisi kanan halaman untuk mengatur properti penjadwalan node. Untuk informasi selengkapnya, lihat Node scheduling configuration.
Langkah 3: Menerapkan dan Memelihara
1. Deploy node
Setelah mengonfigurasi node, commit dan deploy node tersebut. Setelah dideploy, node akan berjalan secara berkala sesuai konfigurasi penjadwalannya.
Klik ikon
di bilah alat atas untuk Save node.Klik ikon
di bilah alat atas untuk Deploy node.
Untuk petunjuk detail tentang deployment node, lihat Deploy a node or workflow.
2. Pertahankan node
Setelah node Perbandingan Data dideploy, Anda dapat melakukan tugas O&M terhadapnya di Operation Center. Untuk informasi selengkapnya, lihat Operation Center.
3. Lihat laporan validasi
Anda dapat melihat laporan validasi data di log eksekusi tugas. Anda dapat mengaksesnya dengan cara berikut:
Di Operation Center:
Di pojok kiri atas, klik ikon
dan navigasikan ke .Di panel navigasi kiri Operation Center, pilih . Temukan instans untuk node Perbandingan Data Anda, klik More di kolom Operation, lalu pilih View Running Log.
Di halaman log, klik tab Data Comparison untuk melihat laporan.
Dari log eksekusi:
Saat Anda menjalankan node Perbandingan Data dari halaman Data Development, klik tautan di log eksekusi, seperti yang ditunjukkan pada gambar, untuk membuka laporan validasi data.

