Dataphin における正確な分類のためのデータ識別結果設定方法 - Dataphin

システムは、構成されたルールと系列継承設定に基づいて識別結果を自動的に生成します。識別結果を手動で指定したり、Excel 経由でバッチアップロードしたりすることもできます。このトピックでは、識別結果を追加および管理する方法について説明します。

制限事項

データソーステーブルは、ルールまたは系列継承に基づいて識別結果を生成するための自動スキャンをサポートしていません。これらのテーブルの識別結果を手動で追加またはバッチインポートできます。

権限の説明

セキュリティ管理者と、[分類結果]-[管理] 権限を持つカスタムグローバルロールは、すべての識別結果を追加および管理できます。
プロジェクト管理者は、プロジェクト内のテーブルの識別結果を管理できます。これには、識別結果の作成と編集、有効ステータスの有効化または無効化、識別ルールのロックが含まれます。
データテーブルの所有者は、それぞれのテーブルの識別結果を管理できます。これには、識別結果の編集、有効ステータスの有効化または無効化、識別ルールのロックが含まれます。

識別方法の説明

自動スキャン: 構成内のスケジュールされたスキャン時間とリアルタイムスキャン設定に基づいて識別結果を生成します。
手動追加: Dataphin に識別結果をバッチインポートできます。
系列に基づく自動継承: 子孫フィールドは、さまざまな継承シナリオとルールに従って、直接の上流フィールドから識別結果を自動的に継承します。

識別結果を手動で追加する

Dataphin ホームページで、トップメニューバーから [管理] > [データセキュリティ] に移動します。
左側のナビゲーションウィンドウで、[データ識別] > [分類結果] を選択します。[分類結果] ページで、[手動追加] ボタンをクリックします。

[手動追加] ページで、パラメーターを構成します。

パラメーター

説明

追加ポリシー

重複削除ポリシー

このアップロードと既存のオンライン識別レコード間の重複を処理するためのポリシー。[既存の識別結果を上書きする]、[既存の自動識別結果のみを上書きする]、[既存の識別結果を更新せずに保持する] の 3 つのポリシーをサポートしています。

[既存の識別結果を上書きする]: 新しいフィールドがオンラインフィールドと一致する場合、このタグ付け結果を使用して、手動で指定されたものとしてマークします。
[既存の自動識別結果のみを上書きする]: 新しいフィールドがオンラインフィールドと一致し、オンライン識別結果がロックされていない場合、このタグ付け結果を使用して、手動で指定されたものとしてマークします。
[既存の識別結果を更新せずに保持する]: 新しいフィールドがオンラインフィールドと一致する場合、オンラインタグ付けを保持し、このタグ付けは有効になりません。

追加されたレコード

[テーブル別に追加]: [テーブル別に追加] ボタンをクリックします。[テーブル別に追加] ダイアログボックスで、パラメーターを構成し、[OK] をクリックして追加を完了します。
- [データテーブル]: 最大 200 のデータテーブルを選択できます。プロジェクト管理者は、担当プロジェクト下のすべてのデータテーブルを選択できます。セクションアーキテクトは、担当セクション下のすべてのデータテーブルを選択できます。テーブル所有者は、担当するデータテーブルを選択できます。
  Intelligent R&D Edition のみフィルタリングをサポートしています。[フィルター] アイコンをクリックして、セクション/プロジェクト/データソースとテーブルタイプに基づいてデータテーブルをフィルタリングできます。フィルター
- [テーブルフィールド]: データテーブルに基づいてフィールドを選択します。最大 200 のフィールドをサポートしています。
- [統一分類を構成する]: デフォルトでは無効になっています。有効にすると、選択したフィールドに統一データ分類を追加できます。これは、追加されたレコードリストで変更できます。
検索: テーブル名と説明に基づいて、追加されたデータテーブルをすばやく検索します (データソーステーブルでのみサポートされています)。
追加されたレコードリスト: データテーブル、テーブルフィールド、データ分類、データグレーディング、および非感作有効ステータスに関する情報を表示します。データテーブル、テーブルフィールド、データ分類、および有効ステータスを変更できます。また、[このテーブルの下のフィールド識別ルールを引き続き構成する] 操作と [削除] 操作を [操作] 列の下で実行することもできます。
- [有効ステータス]: 構成後すぐに有効になります。有効にすると、識別結果は後続の表示、統計、非感作、およびその他の使用プロセスに入ります。無効にすると、現在のフィールドの識別結果は有効になりません。
- [このテーブルの下のフィールド識別ルールを引き続き構成する]: 現在のテーブルの下に新しいフィールドを追加し、データ分類を構成します。
- [削除]: 現在追加されているデータテーブルを削除します。
バッチ操作: [データ分類の変更] のバッチ実行、[有効ステータス] の変更、および [削除] 操作の追加されたデータテーブルに対するバッチ実行をサポートしています。

情報が正しいことを確認したら、[アップロード] をクリックして、識別結果の手動追加を完了します。

識別結果リストを管理する

識別結果リストには、追加された識別結果が表示されます。これには、テーブル名、フィールド、アセットソース、データ分類、データグレーディング、非感作有効ステータス、および識別方法が含まれます。
アセットソース: Dataphin テーブルには、プロジェクトとセクションの情報が表示されます。データソーステーブルには、データベース/スキーマとデータソースの詳細が表示されます。
さまざまな基準を使用して、さまざまなアセットオブジェクトを検索できます。さらに、データ分類キーワードを使用して、分類に関連付けられているすべての識別結果を見つけることができます。
- Dataphin テーブル: テーブル、フィールド、およびプロジェクト/セクションのキーワードでクイック検索できます。データ分類 (または未指定の分類)、データグレーディング、データセクション、プロジェクト、非感作有効ステータス、ロックステータス、および識別方法に基づいて正確なフィルタリングが可能です。
- データソーステーブル: テーブル、データベース/スキーマ、およびテーブルの説明キーワードでクイック検索できます。データ分類 (または未指定の分類)、データグレーディング、データソース、非感作有効ステータス、ロックステータス、および識別方法に基づいて正確なフィルタリングが可能です。

ターゲットの識別結果に対してさまざまな操作を実行できます。

操作	説明
非感作有効ステータスの有効化/無効化	非感作有効ステータスは、現在の識別結果が非感作ポリシーの対象となるかどうかを管理するために使用されます。非感作有効ステータス列の下にあるスイッチをクリックするか、下部にある [詳細]-[非感作有効]/[非感作無効] をクリックして、有効ステータスを有効または無効にします。構成はすぐに有効になります。有効にすると、システムは非感作ルールとデフォルトの非感作ポリシーに基づいてフィールドを非感作します。無効にすると、現在の識別結果が非感作ルールにヒットしても、非感作されません。ただし、対応する識別レコードは引き続き生成され、対応する権限承認プロセスは一致度に基づいて調整および割り当てられます。
識別結果の推奨プロンプト	現在のフィールドの識別レコードに、現在の有効な識別結果よりも一致度が高い識別結果がある場合、[推奨] タグが表示されます。データ分類名の後にある [推奨] をクリックするか、[操作] 列の [識別詳細の表示] をクリックして、フィールド識別詳細ダイアログボックスに入ります。システムが推奨するより適切な識別結果を表示し、ビジネスニーズに基づいて推奨される識別結果を使用するかどうかを決定します。
[識別詳細の表示]	フィールド識別詳細の基本情報、有効な結果、および識別レコードを表示します。基本情報: テーブル名、フィールド名、およびサンプルデータを表示します。サンプルデータを表示するには、データサンプリングスイッチを有効にする必要があります。 [有効な結果]: 現在のフィールドの有効なデータ分類と対応するデータグレーディング、識別方法、優先度、実際の一致度、分類変更時刻、および更新時刻情報を表示します。[データ分類を指定] (未構成のデータ分類をサポート) 操作と [識別結果を編集] (構成済みのデータ分類をサポート) 操作を実行できます。データグレーディング: 最新のグレーディング構成を表示します。調整時のグレーディング結果を表示して、変更が必要かどうかを判断できます。優先度: 最新の優先度構成を表示します。調整時の優先度結果を表示して、変更が必要かどうかを判断できます。優先度 1 が最上位レベルです。同じレベルのルールの場合、更新時刻が新しい方が有効になります。 [データ分類を指定]: 現在の有効な結果が自動的に継承された結果であり、継承ポリシーがグレーディングのみを継承し、分類を継承しない場合、有効な結果でデータ分類が指定されていない場合があります。この場合、データ分類を指定することをお勧めします。そうしないと、非感作ルールにヒットしない可能性があります。[データ分類を指定] ダイアログボックスで、データ分類を選択します。システムが推奨するデータ分類を直接使用することもできます。説明指定された分類のデータグレーディングは、現在の有効なデータグレーディングと同じである必要があります。そうでない場合、直接指定することはできません。識別結果を編集することで、データ分類を変更できます。 [識別結果を編集]: 有効な識別結果の変更をサポートしています。操作の詳細については、識別結果を編集するをご参照ください。 [分類レコード]: データ分類、データグレーディング、識別方法、優先度、実際の一致度、分類変更時刻、および更新時刻情報を表示します。現在のフィールドの識別レコードに、現在の有効な識別結果よりも一致度が高い識別結果がある場合、データ分類名の左上に推奨マークが表示されます。右上隅にある [ワンクリック変更] をクリックして、有効な識別結果として指定できます。識別結果の有効な優先度の説明: 自動的に識別された結果の場合、スキャンルールは、データ分類の優先度 > データグレーディング > 更新時刻 > 一致度 > データ分類の変更時刻の順に優先されます。より適切なデータ分類が検出されると、プロンプトが表示されます。自動的に継承された識別結果の場合、スキャンルールは、最上位レベルのデータグレーディング継承に従います。これは最優先されます。同じレベルでデータ分類が異なるデータグレーディングが複数ある場合、優先度は、データ分類の優先度 > 識別レコードの更新時刻 > 分類変更時刻の順になります。より適切なデータ分類が検出されると、プロンプトが表示されます。データグレーディング: 最新のグレーディング構成を表示します。調整時のグレーディング結果を表示して、変更が必要かどうかを判断できます。優先度: 最新の優先度構成を表示します。調整時の優先度結果を表示して、変更が必要かどうかを判断できます。優先度 1 が最上位レベルです。同じレベルのルールの場合、更新時刻が新しい方が有効になります。 [有効な結果として指定]: 現在の識別レコードのデータ分類が有効な結果として指定されている場合、識別方法は手動で指定されたものに変更され、後続の自動識別結果の影響を受けなくなります。
[識別結果を編集]	[アクション] 列の下にある [編集] をクリックするか、下部にある [編集] をクリックして、識別結果を変更します。[自動識別/継承] および [手動] フォームをサポートしています。 [自動識別/継承]: 自動識別/継承を選択すると、現在のフィールドに手動で指定された識別結果がある場合、それらは削除され、タグ付け結果はより一致度の高い自動識別または自動継承結果に変更されます。後でより一致度の高い識別結果が表示された場合、現在のフィールドの識別結果が変更されます。説明自動識別にバッチ変更する場合、データソーステーブルは自動識別をサポートしていないため、システムは変更せずに自動的にスキップします。 [手動]: 手動で指定されたものを選択すると、現在選択されているデータ分類がロックされ、リストは自動的にロックされ、他の自動識別または自動継承結果によって上書きされるのを防ぎます。システムが推奨するデータ分類を直接使用することもできます。 [非感作有効に同期変更]: 選択すると、現在の識別結果が有効な結果として指定され、非感作有効ステータスがオンになります。
[現在の識別結果をロック]	[操作] 列の下にある [ロック] をクリックするか、下部にある [ロック] をクリックして、識別結果をロックします。現在有効な、指定された分類結果を持つ自動識別/自動継承の方法のみがロックをサポートしています。ロック後、現在の結果と一致する手動で指定された識別レコードが有効な結果として生成され、後続の自動識別または自動継承の結果による影響を受けなくなります。
[識別結果を削除]	[操作] 列の下の [削除] をクリックするか、下部の [詳細]-[削除] をクリックして、識別結果を削除します。削除後、識別結果に対応するすべての識別レコードが同期的に削除されます。誤った識別結果を修正するか、識別ルールを修正して再スキャンし、識別結果を生成できます。

識別結果をバッチインポートする

[分類結果] ページで、[バッチインポート] ボタンをクリックして、[識別結果のバッチインポート] ダイアログボックスを開きます。

[識別結果のバッチインポート] ダイアログボックスで、パラメーターを構成します。

パラメーター	説明
資産タイプ	識別結果をインポートする必要があるアセットタイプを選択します。[dataphin テーブル] と [データソーステーブル] をサポートしています。
[テンプレートのダウンロード]	テンプレートがない場合は、ファイル名をクリックして .xlsx ファイルをダウンロードします。システムは、アセットタイプに基づいて異なるテンプレートをダウンロードします。テンプレートがある場合は、ファイルを直接アップロードして検証を開始できます。
設定ファイル	異なるアセットタイプに基づいて対応するテンプレートをアップロードします。データソーステーブルは、最初に関連アセットを収集する必要があります。一度にアップロードできるファイルは 1 つだけです。 .xlsx ファイルのみがサポートされています。1 回の Excel アップロードは 1000 行を超えてはなりません。ファイルサイズは 10 MB を超えてはなりません。テンプレートに入力する際は、テンプレートの指示を参照してください。 Dataphin テーブルのフルネーム: 物理テーブルの場合は、プロジェクト名.テーブル名を入力します。論理テーブルの場合は、セクション名.テーブル名を入力します。データソーステーブルのフルネーム: 指定されたデータソースの下に db/schema.table name を入力します。管理権限を持つ識別結果の追加または変更のみをサポートしています。セキュリティ管理者と [分類結果]-[管理] 権限を持つカスタムグローバルロールは、すべてのテーブルをアップロードできます。プロジェクト管理者は、担当プロジェクト下のテーブルのみをアップロードできます。テーブル所有者は、担当するテーブルのみをアップロードできます。

ファイルがアップロードされると、システムはアップロードされたファイルの仕様に従って検証します。検証に成功したら、[検証開始]をクリックして、アセットのタイプに応じて、インポートされたファイルに対してさまざまなチェックを実行します。
- Dataphin テーブル: インポートされたテーブルのフルネーム、フィールド名、分類ディレクトリ/データ分類が空でないことを確認し、列順序の正しさを検証します。
- データソーステーブル: データソース名、環境、完全なテーブル名、フィールド名、分類ディレクトリ/データ分類に欠落しているエントリがないかを確認し、列順序が正しいことを確認します。
- 現在のオペレーターが識別結果に必要な管理権限を持っていることを確認します。

検証に成功すると、インポート結果ページが自動的に開きます。

パラメーター

説明

互換性ポリシー

このアップロードと既存のオンラインレコード間の競合を処理するためのポリシー。[重複レコードの処理] と [非感作有効ステータス] を 2 つの互換ポリシーとして選択できます。

[重複レコードの処理]: アップロードされたフィールドの識別結果と既存のオンラインフィールド間の重複を処理するためのポリシー。すべてのオンライン識別結果の上書き、すべてのロックされていないオンライン識別結果の上書き、および既存のオンライン識別結果の保持 (更新せずにスキップ) をサポートしています。
- [すべてのオンライン識別結果を上書きする]: 新しいフィールドがオンラインフィールドと一致する場合、このタグ付け結果を使用して、生成された識別結果 (自動的に識別された結果と手動で指定された結果を含む) を上書きし、手動で指定されたものとしてマークします。
- [すべてのロックされていないオンライン識別結果を上書きする]: 新しいフィールドがオンラインフィールドと一致し、オンライン識別方法が自動識別の場合、このタグ付け結果を使用して、生成された識別結果を上書きし、手動で指定されたものとしてマークします。有効な方法が手動で指定されている識別結果は上書きしません。
- [既存のオンライン識別結果を保持し、更新せずにスキップする]: 新しいフィールドがオンラインフィールドと一致する場合、オンラインタグ付けを保持し、このタグ付けは有効になりません。
[非感作有効ステータス]: アップロードされた識別結果または既存のオンライン識別結果に無効な非感作有効ステータスがある場合、オンラインで更新された結果の既存の構成を保持するか、新しい結果を有効に統一するか、新しい結果と更新された結果を有効に統一するかを選択できます。
説明
システムは、分類とグレーディングに基づいて無効なステータスを持つフィールドを非感作できません。対応する識別レコードは引き続き生成され、対応する権限承認プロセスは一致度に基づいて調整および割り当てられます。

[検証結果]

ファイルのアップロード中に検証に合格したレコード、検証例外、および重複レコードに関する情報を表示できます。

検証に合格: ファイルのアップロードに合格したレコードを表示します。元のファイルの対応する行番号、テーブル、フィールド、データ分類、およびデータグレーディング情報が含まれます。
検証例外: ファイル検証に失敗した例外レコードを表示し、自動的に[例外プロンプト]列を追加します。例外プロンプトに基づいて変更して再インポートできます。
重複レコード: このアップロードとオンラインですでに成功している識別結果の重複コンテンツのレコードを表示します。元のファイルの対応する行番号、テーブル、フィールド、データ分類 (インポート)、データ分類 (オンライン)、および重複プロンプト情報が含まれます。
[検証レコードをダウンロード] ボタンをクリックして、対応する検証レコードを Excel ファイルとしてダウンロードできます。

[インポート開始] をクリックして、インポートプロセスを完了します。
インポートが完了したら、ファイルアップロード構成ダイアログボックスを閉じて結果をすばやく確認できます。この操作によって、アップロードタスクの実行が停止することはありません。インポート履歴を表示するには、識別結果リストのバッチ操作レコードをクリックするだけです。

インポート履歴を表示する

[分類結果] ページで、バッチインポートの横にあるドロップダウン矢印をクリックし、[バッチ操作レコード] を選択して、[インポート履歴] パネルにアクセスします。
[インポート履歴] パネルで、識別結果の履歴インポートレコードを表示できます。