Fitur alur data di DataWorks memungkinkan Anda mengekstrak informasi Watermark dari file data yang bocor untuk mengidentifikasi Pemilik yang mungkin bertanggung jawab atas kebocoran tersebut. Topik ini menjelaskan cara membuat dan menggunakan task alur data guna menemukan Pemilik yang bertanggung jawab.
Prasyarat
Aturan deteksi data (data detection rule) telah dibuat. Untuk informasi selengkapnya, lihat Konfigurasikan aturan deteksi data dan jalankan task deteksi.
Fitur data watermark harus diaktifkan pada data detection rule target. Untuk informasi selengkapnya, lihat Buat aturan penyamaran data.
Informasi latar belakang
Di DataWorks, Anda dapat menggunakan modul Data Masking dalam Data Security Guard untuk mengaktifkan fitur data watermark pada suatu data detection rule. Setelah diaktifkan, DataWorks secara otomatis menghasilkan Watermark untuk semua operasi—seperti kueri dan unduhan—pada data yang sesuai dengan aturan tersebut. Watermark tersebut mencatat perilaku akses pengguna dan secara unik mengidentifikasi setiap akses. Jika terjadi kebocoran data, Anda dapat menggunakan fitur alur data untuk mengekstrak Watermark dari data yang bocor guna mengidentifikasi Pemilik yang berpotensi bertanggung jawab.
Batasan
DataWorks hanya mendukung alur data untuk file CSV berukuran kurang dari 200 MB.
Hanya pengguna dengan role security administrator yang dapat menggunakan fitur alur data.
DataWorks hanya menyediakan alur data untuk operasi akses data yang terjadi setelah fitur data watermark diaktifkan.
CatatanSebagai contoh, jika Anda melakukan kueri pada Tabel A sebelum fitur data watermark diaktifkan, fitur data lineage tidak dapat melacak operasi kueri tersebut. Operasi tersebut tetap tidak dapat dilacak meskipun Anda kemudian mengaktifkan fitur data watermark dan memulai task alur data untuk file data tersebut.
Buat dan jalankan task alur data
Di panel navigasi kiri, klik Data Traceability untuk membuka halaman Data Traceability.
Buat task alur data.
Klik tombol Create Data Lineage Task.
Di kotak dialog Lineage Task, klik Upload File untuk mengunggah file objek guna pelacakan alur data.
CatatanDataWorks hanya mendukung alur data untuk file CSV berukuran kurang dari 200 MB.
Anda dapat mengekspor atau mengunduh file data dari DataWorks ke komputer Anda, lalu mengunggahnya untuk task alur data. Anda juga dapat menyimpan data dari sistem eksternal sebagai file CSV dan mengunggah file tersebut.
Setelah file objek diunggah, Anda dapat Replace atau Download file tersebut.

Klik Start Lineage untuk memulai task alur data.
CatatanTask alur data mungkin memerlukan waktu untuk diselesaikan.
Lihat sumber kebocoran yang mungkin
Di halaman Data Lineage, Anda dapat melihat Lineage Date dan Lineage File untuk semua task alur data yang telah selesai. Anda juga dapat memeriksa detail alur data suatu task untuk mengidentifikasi sumber kebocoran data yang potensial.

Semua task alur data diurutkan berdasarkan Lineage Date dari terbaru ke terlama, sehingga memudahkan pencarian task tertentu.
Anda dapat mencari task alur data berdasarkan nama file-nya. Pencarian mendukung pencocokan fuzzy. Setelah Anda memasukkan kata kunci, semua task alur data yang mengandung kata kunci tersebut akan ditampilkan.
Klik ikon
di kolom Actions pada task alur data target untuk melihat detail alur datanya. Anda dapat mengidentifikasi Pemilik yang paling mungkin bertanggung jawab atas kebocoran data berdasarkan nilai Likelihood, Operation Time, dan Operation Command dari analisis DataWorks.
FAQ
Jika task alur data selesai tetapi menampilkan No Result untuk Possible Leak Source, berikut adalah kemungkinan penyebab dan solusinya:
Penyebab 1: Volume data dalam file tidak mencukupi, sehingga informasi Watermark tidak dapat dikembalikan.
Solusi: Fitur data watermark memerlukan data yang cukup untuk menghasilkan Watermark yang andal, guna memastikan task alur data dapat secara akurat mengembalikan Watermark dan mengidentifikasi Pemilik yang bertanggung jawab atas kebocoran. Gunakan file yang berisi lebih dari 500 entri data unik untuk pelacakan alur data.
Penyebab 2: Data yang bocor bukan milik penyewa Anda.
Solusi: Pastikan sumber data tersebut dan verifikasi bahwa data yang Anda lacak memang milik penyewa Anda.
Penyebab 3: File untuk pelacakan alur data tidak mengandung informasi Watermark.
Solusi:
Periksa apakah fitur data watermark telah diaktifkan untuk file objek tersebut. DataWorks hanya mendukung alur data untuk operasi akses data yang dilakukan setelah fitur data watermark diaktifkan. Untuk melihat dan mengaktifkan fitur data watermark, lihat Buat aturan penyamaran data.
File yang Anda lacak tidak terlibat dalam kebocoran data tersebut. Kebocoran mungkin disebabkan oleh operasi yang dilakukan di sistem eksternal lainnya.