Data Security Center (DSC) の静的データマスキング機能を使用して、構造化された TXT、CSV、XLSX、および XLS ファイル内の機密データをマスクできます。ソースファイルは OSS バケットにあり、マスクされたファイルは宛先の OSS バケットに保存されます。このプロセスにより、安全なデータ共有が可能になります。
ソリューション概要
マスクされたデータの例:
マスキング前のデータ | マスキング後のデータ | ||||
名前 | 電話番号 | ID カード番号 | 名前 | 電話番号 | ID カード番号 |
Zhang San San | 1390000**** | 111222190002309000 | Zhang** | 139****1234 | 111###########9000 |
Li Si Si | 13900001111 | 150802202207214000 | Li** | 139****1111 | 150###########4000 |
Wang Wu Wu | 13900002222 | 120105195001066000 | Wang** | 139****2222 | 120###########6000 |
このデータマスキングプロセスは 4 つのステップで構成されます:
OSS バケットの作成とファイルのアップロード: ソース OSS バケットと宛先 OSS バケットを作成します。機密データを含む表形式ファイルをソース OSS バケットにアップロードします。
OSS バケットを DSC に接続する: OSS バケットにアクセスするための権限を DSC に付与します。これにより、DSC は OSS バケットからの読み取りと書き込みが可能になります。
データマスキングタスクの追加: データマスキングタスクを作成します。ソースファイル内の機密フィールドのマスキングアルゴリズムとルールを構成します。また、マスクされたファイルの保存場所を指定します。
データマスキングタスクの開始: タスクを開始して、ソースファイル内の機密データをマスクします。マスクされたファイルは、宛先の OSS バケットに保存されます。
前提条件
Data Security Center インスタンスを購入し、Data Security Center に他の Alibaba Cloud リソースへのアクセスを許可していること。
データマスキング機能は、Data Security Center の Enterprise インスタンスでのみ利用できます。したがって、[Enterprise Edition] を購入する必要があります。この例では、OSS ファイルのデータマスキングに焦点を当てています。[OSS Data Management] サービスを有効にし、最小の [OSS Data Volume] を選択するだけで済みます。[Database Management] および [Value-added Modules] サービスは無効にできます。
ステップ 1: OSS バケットの作成とファイルのアップロード
1.1. ソース OSS バケットと宛先 OSS バケットの作成
OSS コンソールの [バケットリスト] ページで、[バケットの作成] をクリックします。
[バケットの作成] パネルで、必須パラメーターを構成し、他のパラメーターはデフォルト設定のままにします。次に、[作成] をクリックします。このバケットは、ソース OSS バケットとして機能します。

これらの手順を繰り返して、宛先 OSS バケットとして使用する別の OSS バケットを作成します。
1.2. 表形式ファイルをソース OSS バケットにアップロードする
OSS コンソールの [バケットリスト] ページで、ソース OSS バケットの名前をクリックします。
[ファイル] ページで、[ファイルのアップロード] をクリックします。
[ファイルの参照] をクリックして、ローカルファイルを選択します。この例では、名前、電話番号、ID カード番号などの機密情報を含む userdata.csv ファイルを使用します。次に、[ファイルのアップロード] をクリックし、アップロードが完了するまで待ちます。

ステップ 2: OSS バケットファイルを DSC に接続する
Data Security Center コンソールにログオンします。
左側のナビゲーションウィンドウで、Asset Center を選択します。
Asset Center ページの左側の Unstructured Data エリアで、OSS をクリックし、次に [アセット権限管理] をクリックします。
[アセット権限管理] ページで、[アセットの同期] をクリックします。
アセットが同期されたら、新しく作成した OSS バケットを見つけ、[操作] 列の [権限付与] をクリックします。
ステップ 3: データマスキングタスクの追加
Data Security Center コンソールの [データマスキング] ページで、[データマスキングタスクの追加] をクリックし、画面の指示に従ってタスクを構成します。
3.1. データマスキングのソースファイルを設定する
タスクの名前を入力します。データマスキングソースを、ソース OSS バケット内の機密ファイル userdata.csv に設定します。このトピックのサンプルファイルは、ヘッダー行を持つ csv ファイルです。列区切り文字をカンマに設定します。

3.2. 機密フィールドのマスキングルールを設定する
[マスキングアルゴリズム] ページでは、userdata.csv のヘッダーが自動的に入力されます。この例では、名前、電話番号、ID カード番号のフィールドに [墨消し] が適用されます。
各フィールドのデータマスキングを有効にし、[墨消し] を選択します。

[墨消し] の横にある [パラメーターの表示と変更] をクリックします。アルゴリズムルールを構成し、[保存] をクリックします。この例では、次のマスキングルールを使用します:

名前:
*でマスクします。最初の文字を保持します。電話番号:
*でマスクします。4 番目から 7 番目の文字をマスクします。ID カード番号:
#でマスクします。最初の 3 文字と最後の 4 文字を保持します。
3.3. マスクされたファイルの保存場所を設定する
OSS データソースはウォーターマークをサポートしていません。マスクされたファイルを宛先バケットに直接保存するようにタスクを構成します。この例では、ファイルは 結果セット として保存されます。ファイル名はカスタマイズできます。ファイル拡張子は csv、xls、または txt である必要があります。

3.4. データマスキングタスクのトリガーメソッドを設定する
OSS ファイルのデータマスキングタスクでは、[タスクトリガーメソッド] 設定のみが適用されます。他のすべてのパラメーター設定は無視されます。
[タスクトリガーメソッド] を [手動のみ] に設定します。

[送信] をクリックします。
ステップ 4: データマスキングタスクの開始
4.1. タスクの実行
[静的データマスキング] ページで、[タスク構成] タブをクリックします。新しいデータマスキングタスクを見つけ、[操作] 列の [開始] をクリックします。

[静的データマスキング] タブで、[タスクステータス] サブタブをクリックします。タスクの進捗が [100%] になり、ステータスが [成功] になるまで待ちます。

4.2. マスキング結果の確認
OSS コンソールの [バケットリスト] ページに移動します。宛先バケットの名前をクリックします。ファイルリストで、マスクされたファイルを見つけます。ファイル名は
<object_file_name>_<task_running_time>.<file_type>の形式です。たとえば、ファイル名usernews_20240808150643.csvの20240808150643は、タスクが 2024 年 8 月 8 日 15:06:43 に実行されたことを示します。[ダウンロード] をクリックしてファイルを取得します。
ダウンロードが完了したら、ファイルを開き、名前、電話番号、ID カード番号のフィールドにマスクされたデータが含まれていることを確認します。

まとめ
OSS バケットに保存されている生データをマスクし、マスクされたデータを共有のために宛先 OSS バケットに保存できます。データマスキング後、共有データが漏洩した場合でも、機密コンテンツは公開されません。これにより、データの不正使用やプライバシー侵害のリスクが軽減されます。マスクされたデータは、個人情報を公開することなく、データ分析、モデルトレーニング、ビジネスレポートの共有などのシナリオに使用できます。
マスキングアルゴリズムの柔軟な選択
データマスキングは、マスキングアルゴリズムとそれに対応するルールに基づいて実行されます。DSC は、ハッシュ、墨消し、置換、丸め、暗号化、データ復号、シャッフルなど、さまざまなアルゴリズムをサポートしています。各アルゴリズムは、ルールを構成するための複数のメソッドを提供します。さまざまなビジネスシナリオのニーズに合わせて、異なるアルゴリズムを選択できます。

マスキングルール構成の効率向上
DSC は、データマスキングテンプレート機能も提供しています。特定のシナリオで頻繁に使用されるマスキングアルゴリズムをテンプレートにグループ化できます。静的データマスキングルールを構成する際に、既存のテンプレートを適用して構成効率を向上させることができます。
詳細については、「データマスキングテンプレートとアルゴリズムを構成する」をご参照ください。
スケジュールされたデータマスキングタスク
データマスキングタスクは、時間単位、日単位、週単位、月単位など、特定の間隔で実行するようにスケジュールできます。これにより、更新されたデータが迅速にマスクされ、使用できる状態になります。
