全部产品
Search
文档中心

Data Management:Prinsip fitur klasifikasi dan grading

更新时间:Jul 02, 2025

Fitur klasifikasi dan grading yang disediakan oleh Data Management (DMS) dapat mendeteksi data sensitif dari database, secara otomatis menandai kolom yang memenuhi kondisi aturan identifikasi dengan kategori data yang sesuai, serta menampilkan kolom sensitif dalam hasil identifikasi. Fitur ini juga melindungi kolom dengan tingkat sensitivitas tinggi. Topik ini menjelaskan prinsip fitur klasifikasi dan grading DMS.

Cara kerjanya

Fitur klasifikasi dan grading DMS diimplementasikan melalui pemindaian berbasis model identifikasi pada lapisan bawah dan pemindaian berbasis klasifikasi serta grading pada lapisan atas. Saat fitur ini digunakan, DMS pertama-tama menggunakan model identifikasi untuk memindai kolom dan data tabel. Kemudian, DMS memindai kolom tabel menggunakan aturan klasifikasi dan grading. Pemindaian berbasis model identifikasi dapat mengidentifikasi kategori data seperti nama atau waktu. Pemindaian berbasis klasifikasi dan grading bekerja berdasarkan hasil identifikasi dari model identifikasi. Anda dapat menggunakan template klasifikasi dan grading terkait instance untuk mengklasifikasikan dan memberi peringkat kolom. Selama proses ini, tingkat keamanan dan algoritma masking data diatur secara otomatis untuk kolom tersebut.

Pemindaian berbasis model identifikasi dan pemindaian berbasis klasifikasi serta grading bersifat independen satu sama lain.

Pemindaian berbasis model identifikasi

Pemindaian berbasis model identifikasi mendukung dua metode identifikasi berikut:

Identifikasi konten data (cocokkan ekspresi reguler)

Dalam metode identifikasi ini, model identifikasi mengklasifikasikan kolom berdasarkan isi kolom. Sebagai contoh, jika sebuah model identifikasi bernama Kartu Identitas dan sebuah kolom memenuhi kondisi algoritma kartu identitas, maka kolom tersebut ditandai oleh model identifikasi ini dengan kategori data Kartu Identitas.

Selama identifikasi konten data, DMS secara acak mengambil sampel sebagian data dari kolom untuk identifikasi guna memastikan efisiensi identifikasi. Jika jumlah data yang memenuhi persyaratan model identifikasi dalam data sampel lebih besar daripada ambang batas tertentu, DMS menentukan bahwa kategori data kolom ini adalah Kartu Identitas.

Identifikasi metadata

Dalam metode identifikasi ini, model identifikasi mengklasifikasikan kolom berdasarkan nama kolom. Sebagai contoh, model identifikasi Kartu Identitas bawaan DMS mengidentifikasi kolom bernama id_card dalam tabel, dan kolom tersebut ditandai dengan kategori data Kartu Identitas.

Hasil identifikasi

Setiap kolom mungkin sesuai dengan beberapa hasil identifikasi. Sebagai contoh, kolom yang berisi nomor ponsel dapat diidentifikasi oleh model identifikasi Nomor Ponsel dan model identifikasi kustom yang aturan identifikasinya adalah 11 digit. DMS menyimpan hingga tiga hasil identifikasi untuk sebuah kolom.

Catatan
  • DMS menyediakan berbagai model identifikasi bawaan. Anda juga dapat membuat model identifikasi kustom. Model identifikasi kustom hanya mendukung identifikasi konten data.

  • Anda dapat mengaktifkan atau menonaktifkan model identifikasi. Secara default, setelah Anda membuat model identifikasi, model tersebut diaktifkan. Hanya model identifikasi yang diaktifkan yang dapat digunakan oleh DMS untuk identifikasi.

Pemindaian berbasis klasifikasi dan grading

Dalam pemindaian berbasis klasifikasi dan grading, DMS mencocokkan kolom yang akan dipindai dengan aturan klasifikasi satu per satu. Jika sebuah kolom memenuhi kondisi aturan klasifikasi, kolom tersebut ditandai dengan kategori data yang sesuai.

Prinsip

DMS menyaring semua aturan klasifikasi yang diaktifkan dalam template klasifikasi dan grading, kemudian menggunakan setiap aturan klasifikasi untuk identifikasi dalam tiga langkah berikut:

  1. Tentukan apakah aturan klasifikasi berisi model identifikasi yang sesuai dengan kolom berdasarkan hasil pemindaian model identifikasi.

    Sebagai contoh, jika model identifikasi yang sesuai dengan kolom adalah model identifikasi A dan model identifikasi B, dan model identifikasi yang ditentukan untuk aturan klasifikasi adalah model identifikasi B dan model identifikasi C, DMS mengidentifikasi irisan dari model identifikasi tersebut, yaitu model identifikasi B. Dalam hal ini, DMS juga menentukan bahwa aturan klasifikasi ini berisi model identifikasi kolom, dan melanjutkan dengan aturan klasifikasi berikutnya untuk identifikasi. Jika aturan klasifikasi tidak berisi model identifikasi kolom, identifikasi gagal dan DMS melanjutkan dengan aturan klasifikasi berikutnya untuk identifikasi.

  2. Tentukan ruang lingkup identifikasi berdasarkan metadata kolom, termasuk nama database, nama tabel, nama kolom, dan deskripsi kolom.

    Dalam langkah ini, DMS menentukan apakah data kolom berada dalam ruang lingkup identifikasi yang ditentukan untuk aturan klasifikasi. Jika data kolom berada dalam ruang lingkup identifikasi yang ditentukan untuk aturan klasifikasi, kategori data yang sesuai disimpan dalam hasil klasifikasi kolom dan DMS melanjutkan dengan aturan klasifikasi berikutnya untuk identifikasi.

  3. Tandai kolom dengan kategori data.

    Setelah semua aturan klasifikasi digunakan untuk identifikasi, jika kolom memenuhi kondisi hanya satu aturan klasifikasi, kolom tersebut ditandai dengan kategori data yang sesuai. Jika kolom memenuhi kondisi beberapa aturan klasifikasi, DMS mengurutkan aturan klasifikasi berdasarkan tingkat keamanannya dalam urutan menaik, lalu menandai kolom dengan kategori data yang sesuai dengan aturan klasifikasi yang memiliki tingkat keamanan tertinggi.

Gambar berikut menunjukkan cara fitur klasifikasi dan grading memindai satu kolom.

Parameter terkait aturan identifikasi

Sebelum Anda melakukan pemindaian berbasis klasifikasi dan grading, Anda dapat membuat aturan identifikasi kustom untuk template klasifikasi dan grading. Bagian berikut menjelaskan parameter yang dapat Anda konfigurasikan saat membuat aturan identifikasi.

image.png

  • Tingkat Keamanan: tingkat keamanan kolom. Anda dapat mengatur parameter ini berdasarkan kebutuhan bisnis Anda. Tingkat keamanan yang lebih tinggi menunjukkan bahwa kolom lebih sensitif dan penting. Untuk informasi lebih lanjut, lihat Tingkat Sensitivitas Kolom.

  • Model Identifikasi: model identifikasi dasar yang ingin Anda gunakan untuk aturan identifikasi ini. Anda dapat memilih beberapa model identifikasi. Hubungan logis di antara model yang dipilih adalah ATAU. Sebagai contoh, jika sebuah kolom cocok dengan salah satu model identifikasi yang dipilih, kolom tersebut terdeteksi oleh aturan identifikasi ini.

  • Ruang Lingkup Identifikasi: Anda dapat mengatur parameter ini untuk memfilter metadata. Nilai valid adalah DAN dan ATAU. Jika Anda memilih DAN, kolom yang metadata-nya memenuhi kondisi semua ruang lingkup yang ditentukan akan dideteksi. Jika Anda memilih ATAU, kolom yang metadata-nya memenuhi kondisi salah satu ruang lingkup yang ditentukan akan dideteksi.

Referensi