Fitur klasifikasi dan grading yang disediakan oleh Data Management (DMS) dapat mendeteksi data sensitif dari database, secara otomatis menandai kolom yang memenuhi kondisi aturan identifikasi dengan kategori data yang sesuai, serta menampilkan kolom sensitif dalam hasil identifikasi. Fitur ini juga melindungi kolom dengan tingkat sensitivitas tinggi. Topik ini menjelaskan prinsip fitur klasifikasi dan grading DMS.
Cara kerjanya
Fitur klasifikasi dan grading DMS diimplementasikan melalui pemindaian berbasis model identifikasi pada lapisan bawah dan pemindaian berbasis klasifikasi serta grading pada lapisan atas. Saat fitur ini digunakan, DMS pertama-tama menggunakan model identifikasi untuk memindai kolom dan data tabel. Kemudian, DMS memindai kolom tabel menggunakan aturan klasifikasi dan grading. Pemindaian berbasis model identifikasi dapat mengidentifikasi kategori data seperti nama atau waktu. Pemindaian berbasis klasifikasi dan grading bekerja berdasarkan hasil identifikasi dari model identifikasi. Anda dapat menggunakan template klasifikasi dan grading terkait instance untuk mengklasifikasikan dan memberi peringkat kolom. Selama proses ini, tingkat keamanan dan algoritma masking data diatur secara otomatis untuk kolom tersebut.
Pemindaian berbasis model identifikasi dan pemindaian berbasis klasifikasi serta grading bersifat independen satu sama lain.
Pemindaian berbasis model identifikasi
Pemindaian berbasis model identifikasi mendukung dua metode identifikasi berikut:
Identifikasi konten data (cocokkan ekspresi reguler)
Dalam metode identifikasi ini, model identifikasi mengklasifikasikan kolom berdasarkan isi kolom. Sebagai contoh, jika sebuah model identifikasi bernama Kartu Identitas dan sebuah kolom memenuhi kondisi algoritma kartu identitas, maka kolom tersebut ditandai oleh model identifikasi ini dengan kategori data Kartu Identitas.
Selama identifikasi konten data, DMS secara acak mengambil sampel sebagian data dari kolom untuk identifikasi guna memastikan efisiensi identifikasi. Jika jumlah data yang memenuhi persyaratan model identifikasi dalam data sampel lebih besar daripada ambang batas tertentu, DMS menentukan bahwa kategori data kolom ini adalah Kartu Identitas.
Identifikasi metadata
Dalam metode identifikasi ini, model identifikasi mengklasifikasikan kolom berdasarkan nama kolom. Sebagai contoh, model identifikasi Kartu Identitas bawaan DMS mengidentifikasi kolom bernama id_card dalam tabel, dan kolom tersebut ditandai dengan kategori data Kartu Identitas.
Hasil identifikasi
Setiap kolom mungkin sesuai dengan beberapa hasil identifikasi. Sebagai contoh, kolom yang berisi nomor ponsel dapat diidentifikasi oleh model identifikasi Nomor Ponsel dan model identifikasi kustom yang aturan identifikasinya adalah 11 digit. DMS menyimpan hingga tiga hasil identifikasi untuk sebuah kolom.
DMS menyediakan berbagai model identifikasi bawaan. Anda juga dapat membuat model identifikasi kustom. Model identifikasi kustom hanya mendukung identifikasi konten data.
Anda dapat mengaktifkan atau menonaktifkan model identifikasi. Secara default, setelah Anda membuat model identifikasi, model tersebut diaktifkan. Hanya model identifikasi yang diaktifkan yang dapat digunakan oleh DMS untuk identifikasi.
Pemindaian berbasis klasifikasi dan grading
Dalam pemindaian berbasis klasifikasi dan grading, DMS mencocokkan kolom yang akan dipindai dengan aturan klasifikasi satu per satu. Jika sebuah kolom memenuhi kondisi aturan klasifikasi, kolom tersebut ditandai dengan kategori data yang sesuai.
Prinsip
DMS menyaring semua aturan klasifikasi yang diaktifkan dalam template klasifikasi dan grading, kemudian menggunakan setiap aturan klasifikasi untuk identifikasi dalam tiga langkah berikut:
Tentukan apakah aturan klasifikasi berisi model identifikasi yang sesuai dengan kolom berdasarkan hasil pemindaian model identifikasi.
Sebagai contoh, jika model identifikasi yang sesuai dengan kolom adalah model identifikasi A dan model identifikasi B, dan model identifikasi yang ditentukan untuk aturan klasifikasi adalah model identifikasi B dan model identifikasi C, DMS mengidentifikasi irisan dari model identifikasi tersebut, yaitu model identifikasi B. Dalam hal ini, DMS juga menentukan bahwa aturan klasifikasi ini berisi model identifikasi kolom, dan melanjutkan dengan aturan klasifikasi berikutnya untuk identifikasi. Jika aturan klasifikasi tidak berisi model identifikasi kolom, identifikasi gagal dan DMS melanjutkan dengan aturan klasifikasi berikutnya untuk identifikasi.
Tentukan ruang lingkup identifikasi berdasarkan metadata kolom, termasuk nama database, nama tabel, nama kolom, dan deskripsi kolom.
Dalam langkah ini, DMS menentukan apakah data kolom berada dalam ruang lingkup identifikasi yang ditentukan untuk aturan klasifikasi. Jika data kolom berada dalam ruang lingkup identifikasi yang ditentukan untuk aturan klasifikasi, kategori data yang sesuai disimpan dalam hasil klasifikasi kolom dan DMS melanjutkan dengan aturan klasifikasi berikutnya untuk identifikasi.
Tandai kolom dengan kategori data.
Setelah semua aturan klasifikasi digunakan untuk identifikasi, jika kolom memenuhi kondisi hanya satu aturan klasifikasi, kolom tersebut ditandai dengan kategori data yang sesuai. Jika kolom memenuhi kondisi beberapa aturan klasifikasi, DMS mengurutkan aturan klasifikasi berdasarkan tingkat keamanannya dalam urutan menaik, lalu menandai kolom dengan kategori data yang sesuai dengan aturan klasifikasi yang memiliki tingkat keamanan tertinggi.
Gambar berikut menunjukkan cara fitur klasifikasi dan grading memindai satu kolom.
