識別規則用於識別Dataphin內的敏感性資料。您可以對安全要求比較高的業務資料配置識別規則,協助您及時識別敏感性資料。本文為您介紹如何建立及管理識別規則。
使用限制
識別規則自動掃描預設不會自動掃描視圖對象,您可以在規則回合組態中開啟掃描視圖;也可以手動添加或大量匯入視圖的識別結果。
許可權說明
安全性系統管理員和具有識別規則-管理許可權的自訂全域角色支援建立及管理識別規則。
僅支援管理自己作為規則負責人的規則,包括編輯、刪除、重設、測試、轉交和手動運行識別規則以及修改識別規則的生效狀態。
建立識別規則
在Dataphin首頁,在頂部功能表列選擇治理 > 資料安全。
在左側導覽列選擇資料識別 > 識別規則,在識別規則頁面,單擊建立識別規則按鈕。
在建立識別規則對話方塊中,配置參數。
參數
描述
基礎配置
識別規則名稱
識別規則的名稱。命名規則如下:
包含中文、字母、數字、底線(_)。
不能超過12個字元。
識別規則說明
自訂識別規則備忘資訊。不超過128個字元。
資料分類分級
資料分類
可通過資料分類目錄圈選資料分類,支援選擇全部分類、指定目錄下所有分類以及指定資料分類。
全部分類:指當前租戶下所有生效的資料分類。
指定目錄下所有分類:指定目錄及其子目錄下所有生效的資料分類。
指定資料分類:根據上級目錄篩選目前的目錄及其子目錄下所有生效的資料分類,如需增加資料分類,可單擊新增一組分類添加多個目錄。
說明當計算引擎為StarRocks且欄位類型為HLL(HyperLoglog)時,暫不支援按內容識別。
掃描範圍
掃描範圍
識別方式支援且、或兩種方式。
識別類型包括資料板塊、專案和資料表。
識別條件支援全部、屬於、不屬於、包含、不包含、正則(大小寫相容)、Regex。
全部:即選擇了當前Dataphin內的全部範圍。
屬於/不屬於:選擇多個具體的資源。
包含/不包含:關鍵詞匹配,如匹配使用者資訊表,輸入user_info。
正則(大小寫相容):在輸入框中輸入Regex。例如,如果您需要匹配所有名稱中帶有test的內容,則Regex定義為
.*test.*,同時進行掃描結果的大小寫相容處理。Regex:在輸入框中輸入Regex。例如您需要匹配所有名稱中帶有test,則Regex定義為
.*test.*。
說明掃描範圍的規則不超過5條,關係不超過2層。
資料板塊和專案選擇不超過100個對象。
單擊確定,完成識別規則建立。
完成識別規則建立後,在識別規則列表中產生一條新的識別規則,且識別規則的生效狀態預設是開啟的,次日開始按照規則回合組態中設定的定時調度時間自動掃描資料。
識別規則列表
識別規則列表為您展示識別規則的名稱、資料分類、負責人、更新時間及是否生效資訊。您可以單擊說明按鈕,查看識別規則、資料抽樣、識別結果及識別管理的介紹說明。
您可以根據識別規則名稱的關鍵字進行快捷搜尋,也可以根據資料分類、負責人、僅看我的進行精確篩選。
您可以對目標識別規則執行如下操作。
操作
描述
是否生效
開啟或關閉是否生效列下的開關,開啟後,識別規則根據規則回合組態的定時掃描調度時間以及即時掃描開關執行並產生執行記錄;關閉後,您可根據業務情況選擇需執行的規則範圍手動觸發。
說明規則置為不生效後,不會影響之前已產生的識別結果。
重設
單擊操作列下的重設或單擊底部的重設,重設後,系統將針對已選規則識別範圍內的資料,先清空已有的打標結果,再重新執行一次識別,作為最新的識別結果。
查看詳情
單擊操作列下的查看詳情,可查看識別規則的配置詳情。
編輯
單擊操作列下的編輯,支援修改識別規則資訊。
手動運行
僅生效狀態的識別規則支援操作。單擊操作列下的更多表徵圖,選擇手動運行或單擊底部的手動運行,針對所選的識別規則進行手動運行。若開啟基於血緣自動繼承配置,可根據血緣關係產生自動繼承識別結果。開啟後,具體說明詳情請參見基於血緣繼承說明。
特殊的,批量手動運行識別規則時,無論識別規則是否生效均可手動運行,支援的規則執行範圍為全部規則(含未生效規則)和僅生效規則。
複製
單擊操作列下的複製,支援快速複製識別規則,相當於複製。
轉交
單擊操作列下的更多表徵圖,選擇轉交或單擊底部的轉交,轉交識別規則負責人,選擇需要轉交的新負責人後,單擊確定。識別規則僅支援轉交給安全性系統管理員。
刪除
單擊操作列下的更多表徵圖,選擇刪除或單擊底部的刪除,刪除規則後,已產生的識別結果不受影響,將會對應用本規則的所有識別資料的分類分級打標進行刪除,相關打標刪除操作,次日生效。
測試
單擊底部的測試,您可選擇需測試的專案或資料表,測試將會對抽取的範例資料進行分類分級及規則打標,最多選擇10個專案或10張表。
測試完成後,您可以單擊查看測試結果查看結果詳情。
說明測試對抽取的範例資料僅作結果展示,不實際打標。
測試回合也會進行資料掃描和計算,將消耗計算資源,建議精確設定測試範圍;基於所選的範圍的規則個數和複雜度,執行進度會有所不同,請耐心等待。
測試僅用於判斷單條識別規則是否能識別出敏感性資料,實際執行會對多個合格規則進行判斷並按照優先順序最終確定一個識別規則,因此測試打標結果可能和實際的規則打標結果不一致。
手動觸發識別規則
在識別規則頁面,單擊手動規則掃描,進入手動規則掃描對話方塊。
在手動規則掃描對話方塊,配置參數。
參數
描述
掃描範圍
支援通過全庫掃描、專案掃描或表掃描來圈選識別規則的掃描範圍。
全庫掃描:適用於需要立即執行Dataphin內所有識別規則進行掃描資料的情境。
專案掃描:選擇需要掃描的專案。適用於需要立即執行特定專案下的所有識別規則進行掃描資料的情境。
表掃描:選擇該專案下需要掃描的資料表,不超過10張資料表。適用於需要立即執行特定專案下的資料表所有識別規則進行資料掃描的情境。
規則執行範圍
支援通過僅生效規則、全部規則(含未生效規則)來圈選識別規則的執行範圍。
僅生效規則:指Dataphin內所有執行狀態為生效的識別規則。
全部規則(含未生效規則):指Dataphin內所有識別規則(不論識別規則是否生效)。
說明需要先在自動繼承配置中開啟自動繼承,並選中規則運行觸發情境,詳情請參見自動繼承配置。
選中後,手動掃描識別規則時,下遊會根據欄位血緣關係自動繼承直接上遊欄位的敏感等級,協助您更完善地覆蓋掃描範圍,並提升關聯資料識別結果一致性;若未選中,則不執列欄位血緣自動繼承識別結果。
開啟自動繼承掃描時,會擴大掃描範圍,造成額外的計算資源消耗,請根據業務實際情況合理配置。
單擊確定,即可觸發對已選資產對象進行掃描。
您可以前往運行記錄查看,根據您選擇的掃描資料的大小,掃描資料進程會有所不同,請您耐心等待。
後續步驟
您可以在運行記錄列表查看識別規則掃描到的敏感性資料,詳情請參見管理識別結果。