DataWorks mendukung berbagai skenario penyamaran data. Topik ini menjelaskan cara memilih skenario, membuat aturan penyamaran data, dan melakukan kueri terhadap data yang telah disamarkan di DataWorks.
Latar Belakang
DataWorks menyediakan dua jenis penyamaran data: statis dan dinamis.
Penyembunyian data dinamis mencakup skenario seperti Data development / Data map display desensitization, Data analysis and display desensitization, Layer masking of the MaxCompute engine, dan Hologres layer masking.
Penyembunyian data statis digunakan untuk skenario integrasi data.
Aturan penyamaran data secara default tidak aktif saat dibuat. Anda harus mengaktifkannya secara manual agar penyamaran data diterapkan secara otomatis pada skenario terkait.
Untuk informasi selengkapnya tentang cara mengaktifkan atau menonaktifkan aturan penyamaran data, lihat Aktifkan atau nonaktifkan aturan penyamaran data.
Untuk informasi selengkapnya tentang skenario penyamaran data, lihat Skenario penyamaran data.
Prasyarat
(Opsional, hanya untuk penyamaran data dinamis) Konfigurasikan aturan deteksi data sensitif sesuai kebutuhan. Hal ini memungkinkan Anda mengaitkan bidang yang perlu disamarkan saat membuat aturan penyamaran data. Untuk informasi selengkapnya, lihat Aturan deteksi data sensitif.
(Opsional, hanya untuk penyamaran data dinamis) Anda dapat menggunakan daftar putih untuk mengizinkan pengguna tertentu melihat data mentah dalam periode tertentu. Untuk melakukannya, Anda harus menambahkan pengguna tersebut ke dalam kelompok pengguna. Untuk informasi selengkapnya, lihat Konfigurasi kelompok pengguna.
(Opsional, hanya untuk penyamaran data di lapisan mesin MaxCompute) Untuk mengonfigurasi penyamaran data di lapisan mesin MaxCompute, Anda harus menambahkan alamat IP Penjaga Keamanan Data ke daftar putih jaringan MaxCompute. Hal ini memungkinkan Anda memanggil fungsi penyamaran data untuk menyamarkan data sensitif dalam hasil kueri yang diperoleh dari sumber selain DataWorks, seperti client command line MaxCompute (odpscmd) atau Logview. Untuk informasi selengkapnya, lihat Contoh: Gunakan penyamaran data tingkat dasar di E-MapReduce.
Kontrol akses
Izin untuk mengonfigurasi aturan penyamaran data (buat, edit, dan hapus):
Tenant administrators dan tenant security administrators dapat mengelola aturan penyamaran data di semua skenario.
Workspace administrators dan workspace security administrators hanya dapat mengelola aturan penyamaran data pada skenario tempat mereka memiliki izin.
Izin untuk mengonfigurasi daftar putih (buat, edit, dan hapus):
Tenant administrators and tenant security administrators dapat mengelola daftar putih di semua skenario.
Workspace administrators dan workspace security administrators hanya dapat mengelola daftar putih pada skenario tempat mereka memiliki izin.
Anda harus memiliki izin role yang sesuai untuk melakukan operasi ini. Untuk informasi selengkapnya tentang otorisasi, lihat Kelola izin pada modul tingkat ruang kerja dan Kelola izin pada modul tingkat global.
Titik masuk konfigurasi aturan penyamaran data
Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi sebelah kiri, pilih . Pada halaman yang muncul, klik Go to Security Center.
Di panel navigasi sebelah kiri, klik untuk membuka halaman Data Security Guard.
CatatanJika Akun Alibaba Cloud Anda telah diberikan izin yang diperlukan, Anda dapat langsung mengakses halaman Penjaga Keamanan Data.
Jika Akun Alibaba Cloud Anda belum diberikan izin yang diperlukan, Anda akan diarahkan ke halaman otorisasi Penjaga Keamanan Data. Anda hanya dapat menggunakan fitur Penjaga Keamanan Data setelah akun Anda diberikan izin yang sesuai.
Di panel navigasi sebelah kiri, klik .
Di panel navigasi sebelah kiri, pilih skenario penyamaran data, lalu klik Masking Rule di sebelah kanan untuk membuat aturan pada skenario tersebut.
Penyamaran data dinamis: Konfigurasi aturan serupa di semua skenario penyamaran data dinamis. Topik ini menggunakan skenario penyamaran data tampilan di Pengembangan Data dan Peta Data sebagai contoh untuk menjelaskan langkah-langkah konfigurasi utama. Anda dapat memilih skenario penyamaran data sesuai kebutuhan. Untuk informasi selengkapnya, lihat Buat aturan penyamaran data dinamis: Penyamaran data tampilan di skenario Pengembangan Data dan Peta Data.
Penyamaran data statis: Untuk informasi selengkapnya, lihat Buat aturan penyamaran data statis: Penyamaran data statis di skenario Integrasi Data.
Buat aturan penyamaran data dinamis: Penyamaran data tampilan di skenario Pengembangan Data dan Peta Data
Pilih skenario penyamaran data.
Pada halaman Data Masking Management, di bagian Masking Scene, pilih . Lalu, klik + Masking Rule di sebelah kanan.
Buat aturan penyamaran data.
Pada dialog Create Data Masking Rule, konfigurasikan parameter aturan.

Pilih tipe bidang sensitif dan tentukan nama aturan.
Parameter
Deskripsi
Sensitive Field Type
Pilih tipe bidang yang akan disamarkan.
Anda dapat memilih tipe bidang sensitif bawaan atau tipe bidang sensitif kustom yang telah Anda tambahkan dalam deteksi data sensitif. Untuk informasi selengkapnya tentang cara menambahkan tipe bidang sensitif, lihat Aturan deteksi data sensitif.
Jika Anda telah membuat aturan penyamaran data untuk skenario yang sama, DataWorks akan menyaring tipe bidang sensitif yang telah dipilih untuk mencegah adanya aturan yang tidak konsisten untuk bidang sensitif yang sama dalam skenario yang sama.
Data Masking Rule Name
Secara default, nilai ini sama dengan Sensitive Field Type. Anda juga dapat menentukan nama kustom. Nama aturan harus unik.
Konfigurasikan skenario penyamaran data.
Pilih skenario tempat aturan ini berlaku. Secara default, skenario yang Anda pilih di Langkah 1 digunakan. Anda dapat mengubah skenario atau menambahkan skenario lain sesuai kebutuhan.
Konfigurasikan metode penyamaran data.
DataWorks mendukung beberapa metode, seperti Pseudonym, Masking out, HASH, Characters to replace, Range transform, Integer, dan Empty. Anda dapat memilih metode sesuai kebutuhan.
Pseudonym
Metode ini mengganti nilai dengan nilai tersamar yang memiliki karakteristik yang sama, sehingga format data tetap terjaga. Parameter berikut tersedia.
Parameter
Deskripsi
(Opsional) Data watermark
Watermark membantu melacak sumber data. Jika terjadi kebocoran data, Anda dapat mengidentifikasi sumber potensial kebocoran tersebut. Aktifkan atau nonaktifkan Data watermark sesuai kebutuhan.
CatatanHanya DataWorks Edisi Perusahaan yang mendukung fitur data watermark.
Masking characteristic value
Nilai karakteristik yang berbeda menghasilkan kebijakan penyamaran yang berbeda. Artinya, data sumber yang sama menghasilkan hasil penyamaran yang berbeda untuk nilai karakteristik yang berbeda. Jika nilai karakteristiknya sama, data sumber yang sama selalu menghasilkan hasil penyamaran yang sama.
Sebagai contoh, jika data mentah adalah a123:
Jika nilai karakteristik diatur ke 0, data disamarkan menjadi b124.
Jika nilai karakteristik diatur ke 1, data disamarkan menjadi c234.
Nilai default adalah 5. Rentang nilainya adalah 0 hingga 9.
Substitution character set
Jika Sensitive field type yang Anda pilih bukan tipe bawaan, Anda harus mengonfigurasi Substitution character set. Karakter dalam data sumber yang cocok dengan set ini akan diganti dengan karakter lain dari tipe yang sama.
Sebagai contoh, jika data sensitif sebelum penyamaran terdiri dari angka 0 hingga 3 dan huruf a hingga d, data yang telah disamarkan juga akan terdiri dari angka dan huruf dalam rentang tersebut.
CatatanKarakter dalam set diganti dengan karakter dari rentang yang sama. Set karakter mendukung huruf kapital, huruf kecil, dan angka. Pisahkan beberapa karakter dengan koma (,). Karakter Tionghoa tidak didukung. Jika data yang akan disamarkan tidak cocok dengan set karakter, data tersebut tidak akan disamarkan.
Masking out
Metode ini menyembunyikan sebagian informasi dengan mengganti karakter pada posisi tertentu dengan tanda bintang (*). Saat menggunakan metode ini, Anda harus memilih mode penyamaran. DataWorks menyediakan beberapa mode penyamaran bawaan dan mendukung mode kustom.
Parameter (pilih salah satu)
Deskripsi
Recommended method
Pilih metode penyamaran yang direkomendasikan dari daftar drop-down. Metode yang tersedia bervariasi tergantung pada bidang yang akan disamarkan.
DataWorks menyediakan tiga metode bawaan. They include Show only the first and last characters, Show only the first three and last two characters, and Show only the first three and last four characters. Pilih metode dari daftar drop-down sesuai kebutuhan.
Custom
Ini memberikan cara yang lebih fleksibel untuk mengonfigurasi penyamaran. Konfigurasikan segmen dari kiri ke kanan dan tentukan apakah setiap segmen akan disamarkan serta jumlah karakter yang akan disamarkan (atau tidak disamarkan). Anda dapat menambahkan hingga 10 segmen. Anda harus memiliki setidaknya satu segmen, dan tepat satu segmen harus diatur sebagai Remaining characters.
Sebagai contoh, samarkan 3 karakter pertama dan biarkan sisa karakter tidak disamarkan.
HASH
Saat menggunakan enkripsi HASH untuk penyamaran data, Anda harus mengonfigurasi parameter berikut.
Parameter
Deskripsi
Data watermark
Watermark membantu melacak sumber data. Jika terjadi kebocoran data, Anda dapat mengidentifikasi sumber potensial kebocoran tersebut. Aktifkan atau nonaktifkan Data watermark sesuai kebutuhan.
CatatanHanya DataWorks Edisi Perusahaan yang mendukung fitur data watermark.
Encryption algorithm
Mencakup MD5, SHA256, SHA512, dan SM3.
Salt Value
Tentukan nilai salt untuk algoritma enkripsi. Nilai default adalah 5. Rentang nilainya adalah 0 hingga 9.
CatatanSalt adalah string spesifik yang disisipkan ke dalam data. Dalam kriptografi, menyisipkan string spesifik pada posisi tetap dalam password menghasilkan hash yang berbeda dari hash password aslinya. Proses ini disebut salting.
Characters to replace
Character to replace mengganti karakter pada posisi tertentu berdasarkan metode substitusi yang Anda pilih. Parameter berikut tersedia.
Parameter
Deskripsi
(Wajib) Substitution position
Dari daftar drop-down, Anda dapat memilih Substitute all, Substitute first 3 characters, atau Substitute last 4 characters. Anda juga dapat memilih Custom untuk menentukan posisi substitusi kustom.
Jika Anda memilih Custom, Anda dapat menentukan segmen dari kiri ke kanan dan mengonfigurasi jumlah karakter yang akan disubstitusi serta metode substitusi untuk setiap segmen. Anda dapat menambahkan hingga 10 segmen. Anda harus memiliki setidaknya satu segmen, dan tepat satu segmen harus diatur sebagai Remaining characters.
(Wajib) Substitution method
Mencakup Random substitution, Sample value substitution, dan Static field substitution.
Random substitution: Mengganti karakter pada posisi yang ditentukan secara acak. Jumlah karakter tetap sama setelah substitusi.
Sample value substitution: Pilih pustaka sampel. Karakter pada posisi yang ditentukan akan diganti dengan nilai dari pustaka sampel yang dipilih.
Static field substitution: Pada kotak teks Substitution value, masukkan karakter yang akan digunakan untuk substitusi. Nilai dapat terdiri dari 1 hingga 100 karakter dan tidak boleh mengandung karakter null. Karakter pada posisi yang ditentukan akan diganti dengan nilai ini.
Range transform
Range transform digunakan untuk menyamarkan data numerik. Metode ini mengganti nilai dalam rentang numerik tertentu dengan nilai tetap. Anda dapat menentukan hingga 10 rentang.
Parameter
Deskripsi
Original value range [m,n)
Rentang numerik data mentah. Nilai harus lebih besar atau sama dengan 0 dan dapat memiliki hingga dua tempat desimal.
Masked Value
Nilai setelah penyamaran. Nilai harus lebih besar atau sama dengan 0 dan dapat memiliki hingga dua tempat desimal.
Integer
Integer hanya digunakan untuk menyamarkan data numerik.
Parameter
Description
Raw data type
Hanya tipe numerik yang didukung.
Decimal places to keep
Rentang nilainya adalah 0 hingga 5. Bagian yang tersisa dibulatkan. Misalnya, jika nilai aslinya adalah 3,1415 dan Anda menyimpan 2 tempat desimal, nilai yang dimasking menjadi 3,14.
Empty
Penyamaran Empty mengatur bidang sensitif yang bersangkutan menjadi string kosong.
Verifikasi hasil penyamaran.
Masukkan data mentah contoh (0 hingga 100 karakter) pada kotak teks Sample data. Klik Verify. Hasil penyamaran akan ditampilkan pada bidang Data Masking effect.
Klik Save atau Save and Apply untuk membuat aturan penyamaran data.
Setelah Anda membuat aturan:
Pada skenario penyamaran data dinamis, Anda dapat mengonfigurasi daftar putih untuk aturan tersebut. Pengguna dalam daftar putih dapat melakukan kueri data mentah dalam periode tertentu. Untuk informasi selengkapnya tentang cara menambahkan daftar putih, lihat Konfigurasi daftar putih untuk aturan penyamaran data (hanya penyamaran data dinamis).
Secara default, aturan penyamaran data tidak aktif setelah dibuat. Anda harus mengaktifkan aturan tersebut secara manual agar dapat diterapkan pada skenario yang sesuai. Untuk informasi selengkapnya tentang cara mengubah status aturan, lihat Aktifkan atau nonaktifkan aturan penyamaran data.
Buat aturan penyamaran data statis: Penyamaran data statis di skenario Integrasi Data
Pada halaman Data Masking Management, di bawah Masking Scene, pilih dan klik + Masking Rule di sebelah kanan.
Buat aturan penyamaran data.
Pada dialog Create Data Masking Rule, konfigurasikan parameter aturan.

Pilih tipe data sensitif dan tentukan nama aturan.
Parameter
Deskripsi
Sensitive Data Type
Existing: Pilih tipe data sensitif yang sudah ada (bawaan atau kustom).
New type: Masukkan nama untuk tipe data sensitif baru. Nama harus unik dan tidak boleh sama dengan tipe yang sudah ada.
CatatanTipe data sensitif bawaan meliputi: Nomor ponsel, Nomor KTP, Nomor kartu bank, Email_Built-in, IP, Nomor plat kendaraan, Kode pos, Nomor telepon rumah, Alamat MAC, Alamat, Nama, Nama perusahaan, Etnis, Zodiak, Jenis kelamin, dan Kewarganegaraan.
Data Masking Rule Name
Secara default, nilai ini sama dengan Sensitive Data Type. Anda juga dapat menentukan nama kustom. Nama aturan harus unik.
Konfigurasikan metode penyamaran data.
DataWorks mendukung tiga metode: Pseudonym, Hash, dan Mask out. Anda dapat memilih metode yang sesuai.
Pseudonym
Metode ini mengganti nilai dengan nilai tersamar yang memiliki karakteristik yang sama, sehingga format data tetap terjaga. Pseudonimisasi hanya didukung untuk beberapa bidang yang sudah ada.
Jika Sensitive data type yang dipilih adalah tipe bawaan (seperti Mobile Phone Number, ID Card Number, Bank Card Number, Email_Built-in, IP, License Plate Number, Postal Code, Landline Number, MAC Address, Address, Name, atau Company Name), Anda harus mengonfigurasi Security domain.
Security domain: Nilainya adalah bilangan bulat dari 0 hingga 9. Domain keamanan yang berbeda menggunakan kebijakan penyamaran yang berbeda, sehingga data sumber yang sama menghasilkan hasil penyamaran yang berbeda di domain keamanan yang berbeda. Sebagai contoh, jika data mentah adalah a123, data tersebut disamarkan menjadi b124 di domain keamanan 0, tetapi disamarkan menjadi c234 di domain keamanan 1. Dalam domain keamanan yang sama, data sumber yang sama selalu disamarkan menjadi hasil yang sama.
Jika Sensitive data type yang dipilih bukan tipe bawaan, Anda perlu mengonfigurasi Substitution character set.
Substitution character set: Karakter dalam data sumber yang cocok dengan set ini akan diganti dengan karakter lain dari tipe yang sama. Set karakter mendukung huruf kapital, huruf kecil, dan angka. Gunakan koma (,) untuk memisahkan beberapa karakter. Karakter Tionghoa tidak didukung. Jika data yang akan disamarkan tidak mengandung karakter dari set ini, data tersebut tidak akan disamarkan. Sebagai contoh, jika set karakter substitusi terdiri dari angka 0 hingga 3 dan huruf a hingga d, angka yang cocok dalam data sumber akan diganti dengan angka lain dari 0 hingga 3, dan huruf yang cocok akan diganti dengan huruf lain dari a hingga d.
Hash
Metode Hash mengenkripsi data mentah menjadi nilai dengan panjang tetap dan mengharuskan Anda memilih Security domain.
Security domain: Nilainya adalah bilangan bulat dari 0 hingga 9. Setiap domain keamanan menggunakan kebijakan penyamaran yang berbeda. Artinya, untuk data sumber yang sama, hasil penyamaran bervariasi tergantung pada domain keamanan. Namun, dalam domain keamanan yang sama, data sumber yang sama selalu menghasilkan hasil penyamaran yang sama.
Sebagai contoh, jika data mentah adalah a123:
Jika domain keamanan diatur ke 0, data disamarkan menjadi b124.
Jika domain keamanan diatur ke 1, data disamarkan menjadi c234.
Mask out
Metode Mask out menyembunyikan sebagian informasi dengan mengganti karakter tertentu dengan tanda bintang (*). Metode ini mengharuskan Anda memilih mode penyamaran. DataWorks menyediakan beberapa mode penyamaran bawaan dan mendukung mode kustom.
Recommended method: Untuk beberapa bidang, Anda dapat memilih metode penyamaran yang direkomendasikan dari daftar drop-down. Metode yang tersedia bervariasi tergantung pada bidang yang dipilih. DataWorks menyediakan tiga metode bawaan: Show only the first and last characters, Show only the first three and last two characters, and Show only the first three and last four characters. Anda dapat memilih metode yang Anda butuhkan. Untuk beberapa bidang, hanya metode default yang dapat dipilih.
Custom: Opsi ini memberikan cara fleksibel untuk mengonfigurasi penyamaran. Anda dapat menentukan hingga 10 segmen dari kiri ke kanan. Untuk setiap segmen, Anda dapat menentukan apakah akan menerapkan penyamaran dan jumlah karakter yang akan disamarkan atau dibiarkan tidak disamarkan. Anda harus mengonfigurasi setidaknya satu segmen, dan tepat satu segmen harus diatur sebagai Remaining characters.
Contoh 1: Samarkan 3 karakter pertama dan biarkan sisa karakter tidak disamarkan.
Contoh 2: Samarkan 3 karakter terakhir dan biarkan sisa karakter tidak disamarkan.
Verifikasi hasil penyamaran.
Pada kotak teks Sample data, masukkan data mentah contoh (0 hingga 100 karakter) dan klik Verify. Hasil penyamaran akan ditampilkan pada bidang Data Masking effect.
Klik OK untuk membuat aturan penyamaran data.
Setelah Anda membuat aturan:
Secara default, aturan penyamaran data tidak aktif setelah dibuat. Anda harus mengaktifkan aturan tersebut secara manual agar dapat diterapkan pada skenario yang sesuai. Untuk informasi selengkapnya tentang cara mengubah status aturan, lihat Aktifkan atau nonaktifkan aturan penyamaran data.
Setelah membuat aturan penyamaran data untuk integrasi data, Anda dapat menggunakan aturan tersebut saat membuat tugas sinkronisasi real-time untuk tabel tunggal. Untuk informasi selengkapnya, lihat Konfigurasi penyamaran data.
Konfigurasi daftar putih untuk aturan penyamaran data (hanya penyamaran data dinamis)
Pada skenario penyamaran data dinamis, Anda dapat mengonfigurasi daftar putih untuk aturan penyamaran data. Setelah aturan diaktifkan, pengguna dalam daftar putih tidak terpengaruh oleh aturan tersebut dalam periode tertentu dan dapat melihat data mentah yang tidak disamarkan.
Sebelum membuat daftar putih, Anda harus menambahkan pengguna ke dalam kelompok pengguna. Untuk informasi selengkapnya, lihat Konfigurasi kelompok pengguna.
Untuk menambahkan daftar putih, lakukan langkah-langkah berikut:
Pada halaman Data Masking Management, klik Configure Whitelist.
Di pojok kanan atas, klik Whitelist.
Pada dialog Create Whitelist, Anda dapat mengonfigurasi parameter.
CatatanKonfigurasi daftar putih tidak didukung dalam skenario Hologres layer masking atau Static desensitization of data integration.
Setelah Anda menetapkan periode efektif untuk daftar putih, data sensitif yang memenuhi kondisi daftar putih tidak akan disamarkan selama periode tersebut.

Parameter-parameter tersebut adalah sebagai berikut.
Parameter
Deskripsi
Sensitive Field Type
Anda hanya dapat memilih tipe bidang sensitif yang aktif dalam skenario penyamaran data yang saat ini dipilih.
User Group Range
Pilih kelompok pengguna yang telah dikonfigurasi. Anda dapat memilih hingga 50 kelompok pengguna. Setelah menambahkan kelompok pengguna ke daftar putih, akun dalam kelompok tersebut dapat mengambil data asli yang tidak disamarkan. Untuk informasi selengkapnya tentang cara mengonfigurasi kelompok pengguna, lihat Konfigurasi kelompok pengguna.
Effective Time
Tentukan periode efektif untuk daftar putih. Anda dapat memilih periode jangka pendek atau permanen. Opsi jangka pendek meliputi 30, 90, 180, dan 365 hari, atau periode kustom. Untuk periode kustom, Anda dapat memilih hari ini atau rentang waktu di masa depan.
Jika pengguna melakukan kueri informasi sensitif di luar periode efektif daftar putih, data tersebut akan disamarkan.
CatatanJika Anda memilih periode jangka pendek, data tidak akan disamarkan mulai dari waktu saat ini hingga jumlah hari yang ditentukan berlalu.
Klik Save untuk menyimpan konfigurasi daftar putih.
Aktifkan atau nonaktifkan aturan penyamaran data
Pada halaman Data Masking Rule, temukan aturan tersebut dan klik sakelar Status untuk mengaturnya ke Enable atau Disable.
Setelah status diatur, Anda dapat mengedit atau menghapus aturan tersebut, atau melihat detailnya.
Anda tidak dapat Delete atau Edit aturan desensitisasi saat berada dalam status Enable. Untuk melakukannya, Anda harus terlebih dahulu mengubah statusnya menjadi Disable. Sebelum mengubah status, Anda harus memeriksa apakah aturan tersebut digunakan oleh tugas apa pun dan menghubungi administrator keamanan untuk konfirmasi.
Saat aturan berstatus Disable, Anda dapat mengedit atau menghapusnya, tetapi tidak dapat mengubah Sensitive data type atau Data masking rule name-nya.
Setelah melakukan perubahan, ubah kembali statusnya menjadi Enable. Hal ini memungkinkan tugas yang menggunakan aturan ini untuk melanjutkan penyamaran data.
Contoh penerapan aturan penyamaran data
Contoh: Gunakan penyamaran data tingkat dasar di E-MapReduce
Setelah membuat aturan penyamaran data untuk integrasi data, Anda dapat menggunakan aturan tersebut saat membuat tugas sinkronisasi real-time untuk tabel tunggal. Untuk informasi selengkapnya, lihat Konfigurasi penyamaran data.