検出機能は、所属、正規表現、包含、除外などの操作を通じて、フィールドおよびメタデータプロパティ内のデータ特性を識別します。 これらの機能は、データ分類と標準のインテリジェントな推奨を促進します。 Dataphin には、電話番号や ID 番号などのエンティティ用に事前定義された検出機能式が含まれており、カスタム機能の作成も可能です。 このトピックでは、検出機能の作成と管理のプロセスについて説明します。
前提条件
検出機能のインテリジェント生成機能を使用するには、X-Data Security をアクティブ化する必要があります。
権限の説明
スーパー管理者、データ標準管理者、セキュリティ管理者、および[機能]-[管理] 権限を持つカスタムグローバルロールは、検出機能を作成および管理できます。
検出機能の概要
検出機能は、データ標準マッピングとフィールド分類タグ付けのインテリジェントな推奨に役立ちます。 機能スキャンの構成は、標準モジュールのマッピングルールとセキュリティモジュールの検出ルールの両方に影響します。 両方のモジュールの使用シナリオを考慮して、セマンティックの競合やリソースの浪費を避けるために、これらの設定を慎重に構成してください。
検出機能の作成
Dataphin ホームページの上部のメニューバーから、[管理] > [データセキュリティ] に移動します。
左側のナビゲーションウィンドウで、[一般構成] > [機能] に移動します。 [機能] ページで、[機能の作成] ボタンをクリックします。
[機能の追加] ダイアログボックスで、必要なパラメーターを設定します。
パラメーター
説明
機能名
検出機能の名前を入力してください。 名前は一意である必要があり、最大 128 文字まで含めることができます。
機能条件
[コンテンツでスキャン]、[フィールド名でスキャン]、[フィールドの説明でスキャン]、[データ型でスキャン] の選択をサポートします。
コンテンツでスキャン: ターゲットフィールドのデータコンテンツをサンプリングおよび読み取って、識別および判断します。
正規表現 (大文字と小文字を区別しない): 入力ボックスに正規表現を入力します。 たとえば、test を含むすべての名前に一致させる必要がある場合、正規表現は
.*test.*
として定義され、スキャン結果はケースの互換性のために処理されます。正規表現: 入力ボックスに正規表現を入力します。 たとえば、test を含むすべての名前に一致させる必要がある場合、正規表現は
.*test.*
として定義されます。検出しきい値: コンテンツの一致率が検出しきい値を超えた場合にのみ、ルールは有効な検出と見なされ、比較のためにフィールドの検出結果に入力されます。
フィールド名でスキャン: メタデータのフィールド名に基づいてスキャンおよび判断します。
正規表現 (大文字と小文字を区別しない): 入力ボックスに正規表現を入力します。 たとえば、test を含むすべての名前に一致させる必要がある場合、正規表現は
.*test.*
として定義され、スキャン結果はケースの互換性のために処理されます。正規表現: 入力ボックスに正規表現を入力します。 たとえば、test を含むすべての名前に一致させる必要がある場合、正規表現は
.*test.*
として定義されます。含める/除外する: キーワードマッチング。 たとえば、ユーザー情報テーブルに一致させるには、user_info と入力します。
フィールドの説明でスキャン: メタデータのフィールドの説明に基づいてスキャンおよび判断します。
正規表現 (大文字と小文字を区別しない): 入力ボックスに正規表現を入力します。 たとえば、test を含むすべての名前に一致させる必要がある場合、正規表現は
.*test.*
として定義され、スキャン結果はケースの互換性のために処理されます。正規表現: 入力ボックスに正規表現を入力します。 たとえば、test を含むすべての名前に一致させる必要がある場合、正規表現は
.*test.*
として定義されます。含める/除外する: キーワードマッチング。 たとえば、ユーザー情報テーブルに一致させるには、user_info と入力します。
データ型でスキャン: メタデータのフィールドのデータ型に基づいてスキャンおよび判断します。
所属: サポートされているデータ型には、tinyint、smallint、mediumint、int、bigint、decimal、bit、date、datetime、timestamp、varchar、text、json、string が含まれます。 必要なデータ型が使用できない場合は、入力データ型をカスタマイズできます。
正規表現 (大文字と小文字を区別しない): 入力ボックスに正規表現を入力します。 たとえば、int を含むデータ型に一致させる必要がある場合、正規表現は
.*int*
として定義され、スキャン結果はケースの互換性のために処理されます。正規表現: 入力ボックスに正規表現を入力します。 たとえば、int を含むデータ型に一致させる必要がある場合、正規表現は
.*int.*
として定義されます。含める/除外する: キーワードマッチング。 たとえば、数値データ型に一致させるには、int と入力します。
説明少なくとも 1 つのルールを構成する必要があります。 ルールを追加するには、[+ルールを追加] ボタンをクリックします。
最大 10 個のルールを構成でき、最大 2 レベルの関係を構成できます。
フィルター条件間の関係は、and または or として構成できます。
説明
検出機能に関連する使用シナリオの説明を入力してください。 1000 文字以内。
[確認] をクリックして、検出機能の作成を完了します。
検出機能の管理
[機能] ページには、各検出機能の名前、説明、タイプ、最終更新者、最終更新時刻などの詳細が表示されます。
(オプション) 必要に応じて、名前で特定の検出機能を検索するか、タイプでフィルタリングします。
選択した検出機能では、次の操作を実行できます。
操作
説明
表示
検出機能の構成情報の表示をサポートします。
編集
カスタム検出機能のコンテンツの変更をサポートします。 変更後、現在の検出機能を参照する関連検出タスクは同期的に更新されます。 関連するビジネス担当者と適時に同期してください。
複製
新しい検出機能を作成するために、既存の検出機能の構成情報をすばやくコピーすることをサポートします。
削除
カスタム検出機能の削除をサポートします。 削除後、現在の検出機能は、それを参照していた関連検出タスクから自動的に削除されます。 慎重に行ってください。
次の手順
検出機能を構成したら、それをデータ分類に関連付けて、フィールド分類とタグ付けのインテリジェントな推奨を促進できます。 詳細については、「データ分類の作成と管理」をご参照ください。
システムは、事前定義された機能に基づいて、検出ルールスキャンと系列自動継承スキャンの際に、分類とグレードを自動的に提案します。 詳細については、「検出ルールの作成と管理」をご参照ください。
インテリジェント生成
Dataphin は、Alibaba Cloud Model Studio と X-Data Security を使用したインテリジェント生成をサポートしています。 入力された機能名に基づいて、機能データコンテンツと潜在的なフィールド名を正確に表す正規表現を自動的に生成し、機能式と説明を迅速に推奨します。 これにより、構成コストが削減され、分類とグレーディング検出の精度が向上します。
[機能] ページで、[機能の作成] ボタンをクリックします。
[機能の追加] ダイアログボックスで、名前を入力し、[インテリジェント生成] をクリックします。
検出機能名は一意である必要があり、最大 128 文字まで含めることができます。 機能名を入力したら、[インテリジェント生成] をクリックできます。
システムは、[検知機能の条件と説明のインテリジェント生成] セクションに、現在の検知機能の条件情報を生成します。この情報を編集できます。確認後、[適用] をクリックすると、[機能の追加] ダイアログボックスに自動的に入力されます。
パラメーター
説明
機能条件
検出機能の名前に基づいて機能条件をインテリジェントに生成します。
説明
各ルールの統合に基づいて説明をインテリジェントに生成します。1000 文字以内。
インテリジェントに生成された情報に対して、次の操作を実行できます。
[再試行] をクリックして、機能条件情報を再生成します。
推奨される機能条件情報を使用しない場合は、[廃止] を選択します。 その後、ダイアログボックスで手動で構成できます。
[停止] を選択して、機能条件情報の生成を停止します。 その後、ダイアログボックスで手動で構成できます。
[確認] をクリックして、検出機能を追加します。
インテリジェントに生成された検出機能を適用しない場合は、[確認] をクリックします。 [インテリジェント生成の結果は保存されませんでした] ダイアログボックスで、[インテリジェント生成の機能条件と説明を適用] または [インテリジェント生成の結果を廃止] を選択し、[確認] をクリックします。