データトレーシングは、漏洩したデータファイルからウォーターマーク情報を抽出し、組織がデータ漏洩の可能性に関する重要な詳細 (責任者や漏洩時間など) を特定するのに役立ちます。この機能は包括的な追跡機能を提供し、データ漏洩発生後に迅速かつ効果的な対策を講じることを可能にします。これにより、潜在的な脅威を軽減し、組織のデータセキュリティとコンプライアンスを向上させます。このトピックでは、データトレーシング機能とその使用方法について説明します。
データトレーシングのワークフロー
データトレーシング機能を使用すると、漏洩したファイルを分析してデータ漏洩の原因を特定し、特定のオペレーターと操作を識別できます。この機能が動作するには、以下の相互に関連する3つの前提条件を満たす必要があります。
条件1:データが機密データとして識別されること
これは、すべての保護機能とトレーシング機能の基盤です。まず、 で関連データを機密データとして識別する必要があります。
これを行うには:
user_phoneなどの対象のデータフィールドが、検出タスクによってスキャンされ、'電話番号' などの特定の データの型 で正常にマークされることを確認してください。
詳細については、「データ分類とグレーディング」をご参照ください。
条件2:データが転送中にマスキングされること
トレーシング機能は、すべてのデータに対して機能するわけではありません。データ転送の特定の段階でデータマスキングを適用することに大きく依存します。
実行方法: モジュールで、「電話番号」のデータの型に対するマスキングルールを構成し、その範囲を定義するためのマスキングポリシーを構成します。
詳細については、「データマスキング」をご参照ください。
条件3:マスキングルールで電子透かしが有効になっていること
これは、トレーシングのための中核となる技術要件です。電子透かしはデフォルトでは有効になっていません。
手順:データマスキングルールを構成または編集する際に、[データウォーターマーク] オプションを明示的に有効に設定する必要があります。これにより、マスキングプロセス中に、オペレーター、時間、SQL クエリなどのトレーサビリティ情報を含む非表示のウォーターマークが、マスキングされたデータに埋め込まれるようになります。
データファイルが追跡可能であるためには、これら3つのステップをすべて完了している必要があります。たとえば、データ分析やデータ開発などのモジュールから、マスキングおよびウォーターマークが適用された CSV ファイルをクエリしてエクスポートした後、データトレーシング機能はそのファイルを正常に解析し、データ漏洩パスを追跡できます。
制限事項
対象ユーザー:この機能は、DataWorks Professional Edition または Enterprise Edition のユーザーが利用できます。また、セキュリティセンターで DataWorks の新しいデータセキュリティ機能を有効にする必要があります。
サポート対象リージョン:中国 (杭州)、中国 (上海)、中国 (北京)、中国 (張家口)、中国 (ウランチャブ)、中国 (深セン)、中国 (成都)、中国 (香港)、日本 (東京)、シンガポール、インドネシア (ジャカルタ)。
サポート対象のコンピュートエンジン:MaxCompute および Hologres。
前提条件
使用する Alibaba Cloud アカウントまたは RAM ユーザーは、次のいずれかの条件を満たす必要があります。
Alibaba Cloud アカウントまたは RAM ユーザーに AliyunDataWorksFullAccess ポリシーがアタッチされている。
Alibaba Cloud アカウントまたは RAM ユーザーに DataWorks のテナントセキュリティ管理者ロールが割り当てられている。
Alibaba Cloud アカウントまたは RAM ユーザーに DataWorks のテナント管理者ロールが割り当てられている。
新規ユーザーガイドの手順を完了していること。
データトレーシングタスクの作成
DataWorks コンソールにログインします。上部のナビゲーションバーで、目的のリージョンを選択します。左側のナビゲーションウィンドウで、 を選択します。表示されたページで、[セキュリティセンターへ移動] をクリックします。
左側のナビゲーションウィンドウで、 を選択します。
[データトレーシング] ページで、左上隅にある [新規タスク] をクリックして、データトレーシングタスクを作成します。
説明データトレーシングタスクは、.csv ファイルのアップロードをサポートしています。
ファイルサイズは 200 MB を超えることはできません。
ファイルには 500 件以上のデータエントリが含まれている必要があります。
表示 [データトレース] 結果
この機能は、データマスキングの構成時に電子透かしが有効にされた操作のデータのみを追跡できます。
データトレーシングタスクの [タスクステータス] が [完了] になったら、[操作] 列の [表示] をクリックして、トレーシング結果を表示します。
潜在的な漏洩元が検出された場合、次の情報が表示されます。
フィールド | 説明 |
ウォーターマーク類似度 | ウォーターマークの類似度が高いほど、この操作がデータ漏洩の原因である可能性が高くなります。 |
オペレーター | 操作に使用されたアカウント。これは、ログインアカウント、またはデータソースのデフォルトのアクセス ID として指定された RAM ユーザーまたは Alibaba Cloud アカウントの場合があります。 |
操作時間 | 操作が発生した時間。 |
プロジェクト | アクセスされたプロジェクトまたはデータベースの名前。 |
振る舞い | 操作のタイプ。操作が SQL 文の場合、完全な文をコピーできます。 |
データトレーシングタスクの削除
[アクション] 列から単一のデータトレーシングタスクを削除するか、複数のタスクを選択してバッチで削除できます。タスクが削除されると、そのトレーシングファイルをダウンロードしたり、結果を表示したりすることはできなくなります。