系統根據已配置的識別規則和血緣繼承配置自動產生識別結果,此外,您也可以手動指定識別結果或通過Excel批量上傳識別結果,本文為您介紹如何添加及管理識別結果。
使用限制
資料來源表不支援基於規則或基於血緣繼承自動掃描產生自動識別結果,您可以手動添加或大量匯入資料來源表的識別結果。
許可權說明
安全性系統管理員和具有識別結果-管理許可權的自訂全域角色支援添加及管理所有識別結果。
專案系統管理員支援管理自己所負責專案下的表的識別結果,包括建立、編輯識別結果、開啟或關閉生效狀態及鎖定識別規則。
資料表負責人支援管理自己作為表的負責人的識別結果,包括編輯識別結果、開啟或關閉生效狀態及鎖定識別規則。
識別方式說明
自動掃描:根據規則回合組態中設定的定時掃描調度時間和即時掃描開關執行並產生識別結果。
手動添加:支援將識別結果大量匯入到Dataphin中。
基於血緣自動繼承:下遊欄位根據不同的繼承情境及繼承規則自動繼承直接上遊欄位識別結果。
手動添加識別結果
在Dataphin首頁的頂部功能表列,選擇治理 > 資料安全。
在左側導覽列選擇資料識別 > 識別結果,在識別結果頁面,單擊手動添加按鈕。
在手動添加頁面,配置參數。
參數
描述
添加策略
去重策略
針對本次上傳和線上已有識別記錄重複時的處理策略,支援覆蓋已有識別結果、僅覆蓋已有自動識別結果、保留已有識別結果不更新三種策略。
覆蓋已有識別結果:當新增欄位與線上欄位一致時,使用本次打標結果並標記為手動指定。
僅覆蓋已有自動識別結果:當新增欄位與線上欄位一致,並且線上識別結果未鎖定時,使用本次打標結果並標記為手動指定。
保留已有識別結果不更新:當新增欄位與線上欄位一致時,保留線上的打標,本次打標不生效。
已添加記錄
按表添加:單擊按表添加按鈕,在按表添加對話方塊中,配置參數,單擊確定,完成添加。
資料表:支援選擇不超過200張資料表。專案系統管理員支援選擇自己所負責專案下的所有資料表;板塊架構師支援選擇自己所負責板塊下的所有資料表;表負責人可選擇自己是負責人的資料表。
僅智能研發版支援篩選。您可以單擊篩選表徵圖,根據所屬板塊/專案/資料來源和表類型篩選資料表。
表欄位:根據資料表選擇欄位,支援選擇不超過200個欄位。
配置統一分類:預設關閉,開啟後可為所選欄位統一添加資料分類,您可以在已添加記錄列表中進行修改。
搜尋:可根據表的名稱、描述(僅資料來源表支援該條件)快速搜尋添加的資料表。
已添加記錄列表:為您展示資料表、表欄位、資料分類、資料分級、脫敏生效狀態資訊,您可以對資料表、表欄位、資料分類、生效狀態進行修改,同時您可以在操作列下進行在此表下繼續配置欄位識別規則和刪除操作。
生效狀態:生效狀態配置後立即生效。開啟後,識別結果會進入後續的展示、統計、脫敏等使用流程;關閉後當前欄位的識別結果不會生效。
在此表下繼續配置欄位識別規則:可在當前表下新增欄位並配置資料分類。
刪除:刪除當前添加的資料表。
大量操作:支援對添加的資料表批量執行更改資料分類、修改生效狀態、刪除操作。
資訊配置確定無誤後,單擊上傳,完成手動添加識別結果。
管理識別結果清單
識別結果清單為您展示已添加的識別結果,包括表名稱、欄位、資產來源、資料分類、資料分級、脫敏生效狀態和識別方式等資訊。
資產來源:Dataphin表展示所屬專案和板塊資訊;資料來源表展示所屬Database/Schema和資料來源資訊。
您可以根據不同條件對不同的資產對象進行尋找,此外,您也可以按照資料分類關鍵詞搜尋該分類對應的所有識別結果。
Dataphin表:您可以按照表、欄位、所屬專案/板塊的關鍵字進行快捷搜尋。也可根據資料分類(或未指定分類)、資料分級、資料板塊、專案、脫敏生效狀態、鎖定狀態、識別方式進行精確篩選。
資料來源表:您可以按照表、Database/Schema、表描述的關鍵字進行快捷搜尋。也可根據資料分類(或未指定分類)、資料分級、資料來源、脫敏生效狀態、鎖定狀態、識別方式進行精確篩選。
您可以對目標識別結果執行如下操作。
操作
描述
開啟/關閉脫敏生效狀態
脫敏生效狀態用於管理當前識別結果是否被脫敏策略覆蓋。單擊脫敏生效狀態列下的開關或單擊底部的更多-脫敏生效/脫敏失效,可以開啟或關閉生效狀態,配置後立即生效。開啟後,系統將根據脫敏規則和預設脫敏策略,對欄位進行脫敏;關閉後,即使當前識別結果被脫敏規則命中,也不會被脫敏,但是依舊會產生對應的識別記錄並根據匹配度仲裁和分配對應的許可權審批次程序。
識別結果推薦提示
如果當前欄位的識別記錄中存在比當前生效的識別結果匹配度更高的識別結果,會展示推薦標籤。您可以單擊資料分類名稱後的推薦或者單擊操作列下的查看識別詳情進入欄位識別詳情對話方塊,查看系統推薦的更合適的識別結果,並根據業務需求決策是否需要使用推薦的識別結果。
查看識別詳情
為您展示欄位識別詳情的基本資料、生效結果以及識別記錄。
基本資料:為您展示表名稱、欄位名稱、範例資料(需開啟資料採樣開關)資訊。
生效結果:為您展示當前欄位生效的資料分類及對應的資料分級、識別方式、優先順序、實際匹配度、分類修改時間和更新時間資訊。您可以對識別結果執行指定資料分類(未配置資料分類支援)、編輯識別結果(已配置資料分類支援)操作。
資料分級:為您展示當前最新的分級配置,您可以查看仲裁時刻的分級結果,判斷是否需要進行修改。
優先順序:為您展示當前最新的優先順序配置,您可以查看仲裁時刻的優先順序結果,判斷是否需要進行修改。優先順序1為最進階,同級規則,更新時間較新者生效。
指定資料分類:若當前生效結果為自動繼承的結果,且繼承策略為僅繼承分級,不繼承分類,則可能出現生效結果未指定資料分類的情況,此時建議您指定資料分類,否則可能無法命中脫敏規則。在指定資料分類對話方塊,選擇資料分類,您也可直接使用系統推薦的資料分類。
說明指定分類的資料分級需要與當前生效的資料分級相同,否則無法直接指定,可通過編輯識別結果修改資料分類。
編輯識別結果:支援修改生效的識別結果。操作詳情請參見編輯識別結果。
識別記錄:為您展示資料分類、資料分級、識別方式、優先順序、實際匹配度、分類修改時間和更新時間資訊。
若當前欄位的識別記錄中存在比當前生效識別結果匹配度更高的識別結果,則資料分類名稱左上方會帶有推薦標識,您可單擊右上方的一鍵修改,指定為生效識別結果。
識別結果生效優先順序說明:
自動識別的結果,掃描規則按照規則優先順序從高到低為:資料分類優先順序>資料分級>更新時間>匹配度>資料分類修改時間,檢測出更合適的資料分類時,會進行提示。
自動繼承的識別結果,掃描規則按照資料分級的最高等級繼承,則優先順序最高;若有多個資料分級相同但資料分類不同,則按照資料分類優先順序>識別記錄的更新時間>分類修改時間,檢測出更合適的資料分類,則會進行提示。
資料分級:為您展示當前最新的分級配置,您可以查看仲裁時刻的分級結果,判斷是否需要進行修改。
優先順序:為您展示當前最新的優先順序配置,您可以查看仲裁時刻的優先順序結果,判斷是否需要進行修改。優先順序1為最進階,同級規則,更新時間較新者生效。
指定為生效結果:若將當前識別記錄中的資料分類指定為生效結果,則識別方式將改為手動指定,且不受後續自動識別結果的影響。
編輯識別結果
單擊操作列下的編輯或單擊底部的編輯,修改識別結果。支援自動識別/繼承和手動指定兩種形式。
自動識別/繼承:選擇自動識別/繼承後,若當前欄位已有手動指定的識別結果將被刪除,並將打標結果修改為匹配度更高的自動識別或自動繼承的結果,後續若出現更高匹配度的識別結果,當前欄位的識別結果將會變更。
說明批量修改為自動識別時,由於資料來源表暫不支援自動識別,系統將自動跳過不修改。
手動指定:選擇手動指定後,將鎖定當前選擇的資料分類,同時列表上自動加鎖,不會被其他自動識別或自動繼承的結果覆蓋。您也可以直接使用系統推薦的資料分類。
同步修改為脫敏生效:選中後,將當前識別結果指定為生效結果,且將脫敏生效狀態開啟。
鎖定當前識別結果
單擊操作列下的鎖定或單擊底部的鎖定,鎖定識別結果。僅當前生效方式為自動識別/自動繼承且有指定分類的結果支援鎖定。鎖定後,將產生一條和當前結果一致的手動指定識別記錄作為生效結果,並且不受後續自動識別、自動繼承結果影響。
刪除識別結果
單擊操作列下的刪除或單擊底部的更多-刪除,刪除識別結果,刪除後,將同步刪除識別結果對應的所有識別記錄,您可以將不正確的識別結果進行修改或修改識別規則重新掃描產生識別結果。
大量匯入識別結果
在識別結果頁面,單擊大量匯入按鈕,進入大量匯入識別結果對話方塊。
在大量匯入識別結果對話方塊中,配置參數。
參數
說明
資產類型
選擇需匯入識別結果的資產類型,支援Dataphin表和資料來源表。
模板下載
若沒有模板,可單擊檔案名稱下載.xlsx檔案,系統將根據資產類型下載不同的模板;若已有模板,可直接執行上傳檔案並開始校正。
設定檔
根據不同資產類型上傳對應的模板,資料來源表需先採集相關資產。一次僅可上傳一個檔案。
僅支援上傳.xlsx檔案,單個Excel上傳不超過1000行。
檔案大小不超過10M。
填寫模板時,請參照模板說明進行填寫。
Dataphin表全名:物理表請填寫專案名.表名;邏輯表請填寫板塊名.表名。
資料來源表全名:請填寫指定資料來源下的db/schema.表名。
僅支援新增或修改有系統管理權限的識別結果。
安全性系統管理員和具有識別結果-管理許可權的自訂全域角色可以上傳所有表,專案系統管理員僅可上傳自己所負責專案下的表;表負責人僅可上傳自己負責的表。
檔案上傳後,系統將根據上傳檔案的規範進行校正,校正成功後,單擊開始校正,對本次匯入的檔案根據不同資產類型進行不同校正。
Dataphin表:校正本次匯入的表全名、欄位名、分類目錄/資料分類是否為空白、列順序是否正常。
資料來源表:校正本次匯入的資料來源名稱、資料來源環境、表全名、欄位名、分類目錄/資料分類是否為空白、列順序是否正常。
校正當前操作人是否具有識別結果管理的許可權。
校正通過後會自動進入匯入結果頁面。
參數
描述
相容策略
針對本次上傳與線上已有記錄衝突時的處理策略,支援選擇重複記錄處理和脫敏生效狀態兩種相容策略。
重複記錄處理:針對本次上傳欄位的識別結果與線上已有欄位的識別結果重複時的處理策略,支援覆蓋線上所有識別結果、覆蓋線上所有未被鎖定識別結果和保留線上已有識別結果,跳過不更新。
覆蓋線上所有識別結果:當新增欄位與線上欄位一致時,使用本次打標結果覆蓋已產生的識別結果(包括自動識別和手動指定產生的結果),並標記為手動指定。
覆蓋線上所有未被鎖定識別結果:當新增欄位與線上欄位一致,並且線上識別方式為自動識別,使用本次打標結果覆蓋已產生的識別結果並標記為手動指定;不覆蓋生效方式為手動指定的識別結果。
保留線上已有識別結果,跳過不更新:當新增欄位與線上欄位一致時,保留線上的打標,本次打標不生效。
脫敏生效狀態:針對本次上傳的識別結果或線上已有的識別結果存在失效的脫敏生效狀態時,支援選擇將線上的更新結果保留已有配置,新增結果統一為生效或者將新增和更新統一置為生效。
說明系統無法將失效狀態的欄位基於分類分級進行脫敏,依舊會產生對應的識別記錄並根據匹配度仲裁和分配對應的許可權審批次程序。
校正結果
支援查看檔案上傳中校正通過、校正異常、重複記錄的資訊。
校正通過:為您展示檔案上傳通過的記錄,包括記錄在原始檔案中對應行號、表、欄位、資料分類、資料分級資訊。
校正異常:為您展示檔案校正不通過的異常記錄,並自動添加異常提示列,您可根據異常提示修改後重新匯入。
重複記錄:為您展示本次上傳內容重複及與線上已有的成功的識別結果重複的記錄,包括記錄在原始檔案中對應的行號、表、欄位、資料分類(匯入)、資料分類(線上)和重複提示資訊。
可單擊下載校正記錄按鈕,將對應的校正記錄下載成Excel檔案。
單擊開始匯入,完成識別結果的匯入。
匯入完成後,若您想快速查看匯入結果,可關閉檔案上傳配置彈框,關閉彈框不會終止上傳任務的執行。您可以在識別結果清單,單擊大量操作記錄,查看匯入的記錄。
查看匯入歷史
在識別結果頁面,單擊大量匯入後的下拉式箭頭,選擇大量操作記錄,進入匯入歷史面板。
在匯入歷史面板,查看識別結果的歷史匯入記錄。