使用Data Security Center (DSC)的靜態脫敏,對當前帳號下源OSS Bucket中的結構化TXT、CSV、XLSX和XLS格式檔案中的敏感性資料進行脫敏,然後將脫敏後的檔案儲存到當前帳號下的目標OSS Bucket,實現資料的安全共用。
方案概覽
脫敏後資料樣本:
脫敏前的資料 | 脫敏後的資料 | ||||
姓名 | 手機號 | 社會安全號碼碼 | 姓名 | 手機號 | 社會安全號碼碼 |
張三三 | 1390000**** | 111222190002309000 | 張** | 139****1234 | 111###########9000 |
李四四 | 13900001111 | 150802202207214000 | 李** | 139****1111 | 150###########4000 |
王五五 | 13900002222 | 120105195001066000 | 王** | 139****2222 | 120###########6000 |
要實現以上資料脫敏效果,只需4步:
建立OSS Bucket並上傳檔案:建立源OSS Bucket和目標OSS Bucket,並上傳包含敏感性資料的表格檔案到源OSS Bucket。
將OSS Bucket檔案接入DSC:DSC授權接入OSS Bucket,確保DSC能對OSS Bucket進行讀取和寫入操作。
新增脫敏任務:建立脫敏任務,配置源檔案中敏感欄位的脫敏演算法及對應脫敏規則,以及脫敏後檔案的儲存位置等。
啟動脫敏任務:啟動任務,對源OSS Bucket中表格檔案中的敏感性資料進行脫敏,然後將脫敏後的檔案儲存到目標OSS Bucket。
前提條件
當前帳號已購買資料資訊安全中心執行個體並授權資料資訊安全中心訪問其他阿里雲資源。
因資料資訊安全中心服務僅企業版執行個體支援資料脫敏功能,所以必須購買資料資訊安全中心的企業版,本樣本針對OSS檔案資料脫敏,僅需開啟OSS資料管理服務,選擇最低標準的OSS體量,對於資料庫管理和增值模組服務可以全部關閉。
當前帳號已開通Object Storage Service。
步驟一:建立OSS Bucket並上傳檔案
1.1 建立源OSS Bucket和目標OSS Bucket
在Object Storage Service控制台的Bucket列表頁面,單擊建立Bucket。
在建立 Bucket面板,配置如下參數,其他參數採用預設配置,然後單擊完成建立。該OSS Bucket作為源OSS Bucket使用。

重複以上操作步驟,再建立一個OSS Bucket作為目標OSS Bucket使用。
1.2 上傳表格檔案到源OSS Bucket
在Object Storage Service控制台的Bucket列表頁面的Bucket列表,單擊源OSS Bucket名稱。
在檔案清單頁面,單擊上傳檔案。
單擊掃描檔案,選擇本地檔案(本文上傳樣本檔案userdata.csv中包含姓名、手機號和社會安全號碼碼的敏感資訊),然後單擊上傳檔案,等待檔案上傳成功。

步驟二:將OSS Bucket檔案接入DSC
登入資料資訊安全中心控制台。
在左側導覽列,選擇资产中心。
在资产中心頁面左側非結構化資料地區單擊OSS,並單擊資產授權管理。
在資產授權管理,單擊資產同步。
資產同步完成後,找到新建立的OSS Bucket,在操作列單擊授權。
步驟三:新增脫敏任務
在資料資訊安全中心的資料脫敏頁面,單擊新增脫敏任務。根據頁面導航,完成資料脫敏任務配置。
3.1 配置脫敏的源檔案
輸入任務名稱後,配置脫敏源為源OSS Bucket中敏感檔案userdata.csv,對於csv類型的檔案,需要指定資料行分隔符號為逗號,本文樣本檔案表格包含標題列。

3.2 配置敏感欄位的脫敏規則
在脫敏演算法導航頁中自動匹配展示userdata.csv中標題列欄位,本樣本對姓名、手機號和社會安全號碼碼進行遮蓋脫敏。
分別開啟對應欄位的脫敏開關,選擇遮蓋脫敏。

單擊遮蓋脫敏後的參數查看和修改,配置演算法規則,單擊儲存。本樣本配置以下脫敏規則:

姓名:使用
*遮蓋,保留前1後0。手機號:使用
*遮蓋,遮蓋自4至7。社會安全號碼碼:使用
#遮蓋,保留前3後4。
3.3 配置脫敏後檔案的儲存位置
OSS資料來源不支援添加浮水印,直接配置脫敏後檔案到目標Bucket中儲存,本樣本選擇結果集形式儲存,檔案名稱可以自訂,檔案類型必須為csv、xls或txt。

3.4 配置脫敏任務的觸發方式
目前針對OSS檔案脫敏任務,僅支援任務觸發方式生效,其他參數配置均無效。
配置任務觸發方式為僅人工。

單擊提交。
步驟四:啟動脫敏任務
4.1 執行任務
在靜態脫敏頁簽的任務配置頁簽,單擊新建立的脫敏任務操作列的啟動,執行脫敏任務。

在靜態脫敏頁簽,單擊任務狀態子頁簽,等待脫敏任務的執行進度為100%和狀態為執行成功。

4.2 檢驗脫敏結果
前往Object Storage Service控制台的Bucket列表頁面,單擊目標Bucket名稱,在檔案清單中找到脫敏後的檔案,檔案名稱格式為
<目標檔案名稱>_<脫敏任務的執行時間>.<檔案類型>。例如usernews_20240808150643.csv,其中20240808150643表示任務執行時間為2024年08月08日的15:06:43。您可以單擊下載擷取該檔案。
下載完成後,開啟該檔案,可以看到姓名、手機號、社會安全號碼碼已顯示為脫敏後的資料。

總結
對於儲存在OSS Bucket中未經處理資料,可以脫敏後儲存到目標OSS Bucket再共用使用。資料脫敏後,即使共用資料遭泄露,也不會直接暴露敏感內容,降低了資料濫用和隱私侵犯的風險。脫敏後的資料可以在不泄露個人隱私的前提下,用於資料分析、模型訓練、業務報告分享等情境。
靈活選擇脫敏演算法
資料脫敏主要依賴脫敏演算法及其規則,DSC支援的脫敏演算法包括雜湊脫敏、遮蓋脫敏、替換脫敏、變換脫敏、加密脫敏、資料解密和洗牌脫敏,每個脫敏演算法都具備多種規則配置方法,在實際業務需求中可以選擇不同脫敏演算法應用到不同的業務情境中。

提升脫敏規則配置效率
DSC還支援脫敏模板功能,可以將相同應用情境中使用頻率較高的脫敏演算法配置在同一個脫敏模板中,並在配置靜態脫敏規則時使用已有模板,提高配置脫敏規則的效率。
更多內容,請參見配置脫敏模板和演算法。
定時脫敏任務
資料脫敏任務支援按照每小時、每天、每月或每周的某個時間點定時觸發,以保障更新的資料能及時被脫敏使用。
