Anda dapat menggunakan fitur penyamaran data statis dari Data Security Center (DSC) untuk menyamarkan data sensitif dalam file TXT terstruktur, CSV, XLSX, dan XLS. File sumber berada di Bucket OSS, dan file yang telah disamarkan disimpan ke Bucket OSS tujuan. Proses ini memungkinkan berbagi data secara aman.
Ikhtisar Solusi
Contoh data yang telah disamarkan:
Data sebelum penyamaran | Data setelah penyamaran | ||||
Nama | Nomor telepon | Nomor kartu identitas | Nama | Nomor telepon | Nomor kartu identitas |
Zhang San San | 1390000**** | 111222190002309000 | Zhang** | 139****1234 | 111###########9000 |
Li Si Si | 13900001111 | 150802202207214000 | Li** | 139****1111 | 150###########4000 |
Wang Wu Wu | 13900002222 | 120105195001066000 | Wang** | 139****2222 | 120###########6000 |
Proses penyamaran data ini terdiri dari empat langkah:
Buat Bucket OSS dan unggah file: Buat Bucket OSS sumber dan Bucket OSS tujuan. Unggah file tabular yang berisi data sensitif ke Bucket OSS sumber.
Hubungkan Bucket OSS ke DSC: Berikan otorisasi DSC untuk mengakses Bucket OSS. Ini memungkinkan DSC membaca dan menulis ke Bucket OSS.
Tambahkan tugas penyamaran data: Buat tugas penyamaran data. Konfigurasikan algoritma dan aturan penyamaran untuk bidang sensitif dalam file sumber. Juga, tentukan lokasi penyimpanan untuk file yang telah disamarkan.
Mulai tugas penyamaran data: Mulai tugas untuk menyamarkan data sensitif dalam file sumber. File yang telah disamarkan kemudian disimpan ke Bucket OSS tujuan.
Prasyarat
Anda telah membeli instans Data Security Center dan memberikan akses Data Security Center ke sumber daya Alibaba Cloud lainnya.
Fitur penyamaran data hanya tersedia di instans Perusahaan Data Security Center. Oleh karena itu, Anda harus membeli Enterprise Edition. Contoh ini berfokus pada penyamaran data untuk file OSS. Anda hanya perlu mengaktifkan layanan OSS Data Management dan memilih kapasitas perlindungan minimum OSS Data Volume. Anda dapat menonaktifkan layanan Database Management dan Value-added Modules.
Anda telah mengaktifkan Object Storage Service.
Langkah 1: Buat Bucket OSS dan unggah file
1.1. Buat Bucket OSS sumber dan Bucket OSS tujuan
Di halaman Daftar Bucket konsol OSS, klik Create Bucket.
Di panel Create Bucket, konfigurasikan parameter yang diperlukan dan biarkan pengaturan default untuk parameter lainnya. Kemudian, klik Create. Bucket ini akan berfungsi sebagai bucket OSS sumber.

Ulangi langkah-langkah ini untuk membuat Bucket OSS lainnya untuk digunakan sebagai Bucket OSS tujuan.
1.2. Unggah file tabular ke Bucket OSS sumber
Di halaman Daftar Bucket konsol OSS, klik nama Bucket OSS sumber.
Di halaman Files, klik Upload File.
Klik Scan Files dan pilih file lokal. Contoh ini menggunakan file userdata.csv, yang berisi informasi sensitif seperti nama, nomor telepon, dan nomor kartu identitas. Lalu, klik Upload File dan tunggu hingga unggahan selesai.

Langkah 2: Hubungkan file Bucket OSS ke DSC
Masuk ke konsol Data Security Center.
Di panel navigasi di sebelah kiri, pilih Asset Center.
Di halaman Asset Center, di area Unstructured Data di sebelah kiri, klik OSS lalu klik Asset Authorization Management.
Di halaman Asset Authorization Management, klik Sync Assets.
Setelah aset disinkronkan, temukan Bucket OSS yang baru dibuat dan klik Authorize di kolom Actions.
Langkah 3: Tambahkan tugas penyamaran data
Di halaman Penyamaran Data di konsol Data Security Center, klik Add Data Masking Task dan ikuti petunjuk di layar untuk mengonfigurasi tugas.
3.1. Konfigurasikan file sumber untuk penyamaran data
Masukkan nama untuk tugas. Atur sumber penyamaran data ke file sensitif userdata.csv di Bucket OSS sumber. File contoh dalam topik ini adalah file csv dengan baris header. Atur pemisah kolom menjadi koma.

3.2. Konfigurasikan aturan penyamaran untuk bidang sensitif
Di halaman Masking Algorithm, header dari userdata.csv diisi secara otomatis. Dalam contoh ini, Redaction diterapkan pada bidang nama, nomor telepon, dan nomor kartu identitas.
Aktifkan penyamaran data untuk setiap bidang dan pilih Redaction.

Di sebelah Redaction, klik View and Modify Parameters. Konfigurasikan aturan algoritma dan klik Save. Contoh ini menggunakan aturan penyamaran berikut:

Nama: Masker dengan
*. Pertahankan karakter pertama.Nomor telepon: Masker dengan
*. Masker karakter dari posisi ke-4 hingga ke-7.Nomor kartu identitas: Masker dengan
#. Pertahankan 3 karakter pertama dan 4 karakter terakhir.
3.3. Konfigurasikan lokasi penyimpanan untuk file yang telah disamarkan
Sumber data OSS tidak mendukung watermark. Konfigurasikan tugas untuk menyimpan file yang telah disamarkan langsung di Bucket tujuan. Dalam contoh ini, file disimpan sebagai set hasil. Anda dapat menyesuaikan nama file. Ekstensi file harus berupa csv, xls, atau txt.

3.4. Konfigurasikan metode pemicu untuk tugas penyamaran data
Untuk tugas penyamaran data file OSS, hanya pengaturan Task Trigger Method yang berlaku. Semua pengaturan parameter lainnya diabaikan.
Atur Task Trigger Method ke Manual Only.

Klik Submit.
Langkah 4: Mulai tugas penyembunyian data
4.1. Jalankan tugas
Di halaman Static Data Masking, klik tab Task Configuration. Temukan tugas penyamaran data baru dan klik Start di kolom Actions.

Di tab Static Data Masking, klik subtab Task Status. Tunggu hingga kemajuan tugas mencapai 100% dan statusnya adalah Succeeded.

4.2. Verifikasi hasil penyamaran
Pergi ke halaman Daftar Bucket di konsol OSS. Klik nama Bucket tujuan. Di daftar file, temukan file yang telah disamarkan. Nama file dalam format
<object_file_name>_<task_running_time>.<file_type>. Sebagai contoh, dalam nama fileusernews_20240808150643.csv,20240808150643menunjukkan bahwa tugas berjalan pada 15:06:43 tanggal 8 Agustus 2024. Klik Download untuk mengambil file.
Setelah unduhan selesai, buka file untuk memverifikasi bahwa bidang nama, nomor telepon, dan nomor kartu identitas berisi data yang telah disamarkan.

Rangkuman
Anda dapat menyamarkan data mentah yang disimpan di Bucket OSS dan menyimpan data yang telah disamarkan ke Bucket OSS tujuan untuk dibagikan. Setelah penyamaran data, jika data yang dibagikan bocor, konten sensitif tidak terpapar. Ini mengurangi risiko penyalahgunaan data dan pelanggaran privasi. Data yang telah disamarkan dapat digunakan untuk skenario seperti analitik data, pelatihan model, dan berbagi laporan bisnis tanpa mengekspos informasi pribadi.
Pemilihan fleksibel algoritma penyembunyian
Penyamaran data dilakukan berdasarkan algoritma penyamaran dan aturan yang sesuai. DSC mendukung berbagai algoritma, seperti hashing, redaction, substitution, rounding, encryption, dekripsi data, dan shuffling. Setiap algoritma menyediakan beberapa metode untuk mengonfigurasi aturan. Anda dapat memilih algoritma yang berbeda untuk memenuhi kebutuhan skenario bisnis yang berbeda.

Tingkatkan efisiensi konfigurasi aturan penyamaran
DSC juga menyediakan fitur templat penyamaran data. Anda dapat mengelompokkan algoritma penyamaran yang sering digunakan untuk skenario tertentu ke dalam templat. Saat Anda mengonfigurasi aturan penyamaran data statis, Anda dapat menerapkan templat yang ada untuk meningkatkan efisiensi konfigurasi.
Untuk informasi lebih lanjut, lihat Konfigurasikan template dan algoritma penyembunyian data.
Tugas penyembunyian data terjadwal
Tugas penyamaran data dapat dijadwalkan untuk berjalan pada interval tertentu, seperti setiap jam, harian, mingguan, atau bulanan. Ini memastikan bahwa data yang diperbarui segera disamarkan dan siap digunakan.
