識別特徵基於欄位的資料內容、中繼資料屬性,結合屬於、Regex、包含、不包含等運算條件對資料特徵進行表達,從而智能推薦相關的資料分類分級或資料標準。Dataphin內建了多種識別特徵運算式,如手機號、社會安全號碼等。此外,您也可以自訂識別特徵。本文為您介紹如何建立及管理識別特徵。
前提條件
開通X-資料安全,才能使用智能產生識別特徵功能。
許可權說明
超級管理員、資料標準管理員、安全性系統管理員和具有識別特徵-管理許可權的自訂全域角色支援建立及管理識別特徵。
識別特徵介紹
識別特徵可以同時用於智能推薦資料標準映射關係與欄位的分類分級打標結果。特徵掃描配置將同時影響標準模組的落標映射規則與安全模組的識別規則運行,請結合兩個模組的使用情境合理配置,以減少語義衝突、資源浪費等問題的產生。
建立識別特徵
在Dataphin首頁的頂部功能表列,選擇治理 > 資料安全。
在左側導覽列選擇通用配置 > 識別特徵,在識別特徵頁面,單擊建立特徵按鈕。
在添加特徵對話方塊中,配置參數。
參數
描述
特徵名稱
請填寫識別特徵的名稱,名稱唯一,最多輸入128字元。
特徵條件
支援選擇按內容掃描、按欄位名稱掃描、按欄位描述掃描、按資料類型掃描。
按內容掃描:根據採樣讀取目標欄位資料內容進行識別和判斷。
正則(大小寫相容):在輸入框中輸入Regex。例如,如果您需要匹配所有名稱中帶有test,則Regex定義為
.*test.*,同時進行掃描結果的大小寫相容處理。Regex:在輸入框中輸入Regex。例如,如果您需要匹配所有名稱中帶有test,則Regex定義為
.*test.*。識別閾值:只有內容匹配率超過識別閾值,該規則才會被認為是有效識別,進入該欄位的識別結果中進行比較。
按欄位名稱掃描:根據中繼資料中的欄位名稱進行掃描判斷。
正則(大小寫相容):在輸入框中輸入Regex。例如,如果您需要匹配所有名稱中帶有test,則Regex定義為
.*test.*,同時進行掃描結果的大小寫相容處理。Regex:在輸入框中輸入Regex。例如,如果您需要匹配所有名稱中帶有test,則Regex定義為
.*test.*。包含/不包含:關鍵詞匹配,如匹配使用者資訊表,輸入user_info。
按欄位描述掃描:根據中繼資料中的欄位描述進行掃描判斷。
正則(大小寫相容):在輸入框中輸入Regex。例如,如果您需要匹配所有名稱中帶有test,則Regex定義為
.*test.*,同時進行掃描結果的大小寫相容處理。Regex:在輸入框中輸入Regex。例如您需要匹配所有名稱中帶有test,則Regex定義為
.*test.*。包含/不包含:關鍵詞匹配,如匹配使用者資訊表,輸入user_info。
按資料類型掃描:根據中繼資料中的欄位的資料類型進行掃描判斷。
屬於:支援選擇的資料類型包括tinyint、smallint、mediumint、int、bigint、decimal、bit、date、datetime、timestamp、varchar、text、json、string;若無所需資料類型,您可以自訂輸入資料類型。
正則(大小寫相容):在輸入框中輸入Regex。例如,如果您需要匹配帶有int的資料類型,則Regex定義為
.*int*,同時進行掃描結果的大小寫相容處理。Regex:在輸入框中輸入Regex。例如,如果您需要匹配帶有int的資料類型,則Regex定義為
.*int.*。包含/不包含:關鍵詞匹配,如匹配數實值型別的資料類型,輸入int。
說明至少配置一條規則。如需添加規則,請單擊+添加規則按鈕。
最多配置10條規則,且最多配置2層關係。
過濾條件之間的關係可配置為且、或。
描述
請填寫識別特徵相關使用情境的描述。不超過1000個字元。
單擊確定,完成識別特徵添加。
管理識別特徵
在識別特徵頁面,為您展示識別特徵的名稱、描述、類型、最新動向人以及最新動向時間資訊。
(可選)您可以根據識別特徵的名稱搜尋目標識別特徵,也可以根據識別特徵的類型篩選目標識別特徵。
您可以對目標識別特徵執行如下操作。
操作
描述
查看
支援查看識別特徵的配置資訊。
編輯
支援修改自訂識別特徵的內容,修改後,引用當前識別特徵的相關識別任務會同步更新,請及時同步相關業務人員。
複製
支援快捷複製已建立識別特徵的配置資訊用於建立識別特徵。
刪除
支援刪除自訂識別特徵,刪除後,當前識別特徵會從已經引用的相關識別任務中自動刪除,請謹慎操作。
後續步驟
智能產生
Dataphin支援基於阿里雲百鍊平台、X-資料安全,根據輸入的特徵名稱,智能產生可表達特徵資料內容的Regex和可能的欄位名稱,快速推薦特徵運算式及解釋,降低配置成本並提升分類分級識別準確度。
在識別特徵頁面,單擊建立特徵按鈕。
在添加特徵對話方塊中,填寫名稱後,再單擊智能產生。
識別特徵的名稱唯一,最多輸入128字元。僅填寫特徵名稱後,支援單擊智能產生。
在智能產生識別特徵條件及描述地區,系統將為您產生當前識別特徵的條件資訊,您可以修改已產生的資訊。若確認全部資訊無誤,單擊應用,快捷填充資訊至添加特徵對話方塊。
參數
描述
特徵條件
根據識別特徵的名稱智能產生特徵條件。
描述
根據每條規則整合後智能產生描述,不超過1000個字元。
您可以對智能產生的資訊執行如下操作。
重試:重建特徵條件資訊。
棄用:不使用此次智能產生推薦的特徵條件資訊,可在對話方塊中進行配置。
終止:停止正在產生中的特徵條件資訊,可在對話方塊中進行配置。
單擊確定,完成識別特徵添加。
若未應用智能產生的識別特徵,直接單擊確定,需在智能產生結果未儲存對話方塊中,選擇應用智能產生特徵條件及描述或棄用智能產生結果後,再單擊確定。