DataWorks dapat menghasilkan pustaka sampel dari file sampel yang Anda unggah. Pustaka tersebut kemudian dapat dikonfigurasi sebagai aturan identifikasi data sensitif. Jika data target berisi entri dari pustaka sampel, data tersebut akan diidentifikasi sebagai sesuai. Fitur ini umumnya digunakan untuk mengidentifikasi data yang dapat dienumerasi, seperti nama karyawan dan alamat pengguna. Topik ini menjelaskan cara membuat dan mengelola pustaka sampel.
Batasan
Anda hanya dapat mengunggah file teks .txt dalam format UTF-8 dengan ukuran maksimal 500 KB. Setiap entri data dalam file sampel harus berada pada baris terpisah.
Sebuah sensitive data identification rule hanya dapat mengidentifikasi satu jenis data. Oleh karena itu, setiap pustaka sampel harus hanya berisi satu jenis data. Untuk mengidentifikasi beberapa jenis data, Anda harus mengonfigurasi pustaka sampel terpisah untuk masing-masing jenis. Misalnya, untuk mengidentifikasi nama karyawan dan alamat rumah, Anda harus mengonfigurasi satu pustaka sampel untuk nama dan pustaka lain untuk alamat rumah.
Buat pustaka sampel
Buka Data Security Guard.
Masuk ke Konsol DataWorks. Pada bilah navigasi atas, pilih Wilayah yang diinginkan. Di panel navigasi sebelah kiri, pilih . Pada halaman yang muncul, klik Go to Security Center.
Di panel navigasi sebelah kiri, klik untuk membuka halaman Data Security Guard.
CatatanJika Akun Alibaba Cloud Anda telah diberikan izin yang diperlukan, Anda dapat langsung mengakses halaman Data Security Guard.
Jika Akun Alibaba Cloud Anda belum diberikan izin yang diperlukan, Anda akan diarahkan ke halaman otorisasi Data Security Guard. Anda hanya dapat menggunakan fitur-fitur Data Security Guard setelah Akun Alibaba Cloud Anda diberikan izin yang diperlukan.
Di panel navigasi sebelah kiri, pilih untuk membuka halaman Sensitive Data Identification.
Buat pustaka sampel.
Pada tab Sample Data Management, klik Create Sample Library.
Pada kotak dialog Create Sample Library, tentukan nama untuk pustaka sampel dan unggah file sampel.
Anda hanya dapat mengunggah file teks
.txtdalam formatUTF-8dengan ukuran maksimal 500 KB. Setiap entri data dalam file sampel harus berada pada baris terpisah.CatatanSebuah sensitive data identification rule hanya dapat mengidentifikasi satu jenis data. Oleh karena itu, setiap pustaka sampel harus hanya berisi satu jenis data. Untuk mengidentifikasi beberapa jenis data, Anda harus mengonfigurasi pustaka sampel terpisah untuk masing-masing jenis. Misalnya, untuk mengidentifikasi nama karyawan dan alamat rumah, Anda harus mengonfigurasi satu pustaka sampel untuk nama dan pustaka lain untuk alamat rumah.
Klik Save untuk membuat pustaka sampel.
Setelah membuat pustaka sampel, Anda dapat mengonfigurasikannya sebagai aturan identifikasi data sensitif. Aturan ini akan mencocokkan data target yang berisi data dari pustaka sampel. Untuk informasi selengkapnya tentang penggunaan pustaka sampel dalam sensitive data identification rule, lihat Konfigurasikan aturan identifikasi data sensitif dan jalankan tugas identifikasi.
Kelola pustaka sampel
Pada halaman Sample Data Management, Anda juga dapat melakukan operasi berikut pada pustaka sampel yang sudah ada:
Anda dapat melihat jumlah sampel dan aturan identifikasi data sensitif yang terkait untuk setiap pustaka sampel. Untuk melihat detail pustaka sampel, temukan pustaka tersebut lalu klik ikon
pada kolom Actions.Untuk memodifikasi file pustaka sampel, klik ikon
pada kolom Actions dari pustaka sampel target untuk mengganti file sampel yang ada.Untuk menghapus pustaka sampel, klik ikon
pada kolom Actions pustaka tersebut.CatatanAnda tidak dapat menghapus pustaka sampel jika pustaka tersebut sedang dirujuk oleh aturan identifikasi data sensitif. Anda dapat melihat aturan identifikasi data sensitif yang terkait dalam daftar pustaka sampel. Kemudian, buka halaman konfigurasi aturan tersebut dan hapus referensi ke pustaka sampel. Setelah referensi dihapus, Anda dapat menghapus pustaka tersebut. Untuk informasi selengkapnya tentang konfigurasi sensitive data identification rule, lihat Konfigurasikan aturan identifikasi data sensitif dan jalankan tugas identifikasi.