データ資産ガバナンス(旧称データガバナンスセンター)は、ガバナンスプランに基づいて、データストレージ、タスクコンピューティング、コード開発、データ品質、セキュリティの各側面で処理が必要な問題を検出できます。 データ資産ガバナンスは、データガバナンスの有効性を評価するためのヘルススコアを提供し、グローバル、ワークスペース、個人の各側面からガバナンスレポートとガバナンス問題のリーダーボードを提供することで、ガバナンス結果を可視化します。 これにより、ガバナンス目標を効率的に達成できます。 データ資産ガバナンスは、ビジネス資産管理、資産分析、タスクのリソース消費の詳細、コスト見積もりなどの機能も提供し、さまざまなリソースの使用状況の詳細をより深く理解するのに役立ちます。
制限事項
エディション
DataWorks Enterprise Edition 以上でのみ、データ資産ガバナンスがサポートされています。 DataWorks のエディションについては、「DataWorks エディション間の違い」をご参照ください。 DataWorks のアクティブ化方法については、「購入ガイド」をご参照ください。
リージョン
データ資産ガバナンスは、中国(杭州)、中国(上海)、中国(北京)、中国(張家口)、中国(深圳)、中国(成都)、中国(香港)、シンガポール、マレーシア(クアラルンプール)、インドネシア(ジャカルタ)、ドイツ(フランクフルト)、米国(シリコンバレー)、米国(バージニア)の各リージョンでご利用いただけます。
権限
次の表は、各ロールがデータ資産ガバナンスで持つ権限を示しています。
ロール
権限
参照資料
テナントレベルのデータガバナンス管理者
テナントレベルのデータガバナンス管理者は、[グローバル] ディメンションからガバナンスレポート、ガバナンスの問題、チェックイベントを表示し、関連する修正操作を実行できます。
ユーザーに権限を付与する方法については、「グローバルレベルのサービスに対する権限の管理」トピックの テナントレベルのロールの管理 セクションをご参照ください。
データガバナンス管理者の権限の詳細については、「組み込みのワークスペースレベルのロールの権限」トピックの データガバナンス セクションをご参照ください。
ワークスペース管理者
ワークスペース管理者は、[ワークスペース] ディメンションからガバナンスレポートを表示できます。 ワークスペースディメンションからワークスペースのガバナンスレポートを表示するには、ワークスペースの管理者である必要があります。
ユーザーに権限を付与する方法については、「ワークスペースレベルのサービスに対する権限の管理」トピックの RAM ユーザーをワークスペースにメンバーとして追加し、メンバーにロールを割り当てる セクションをご参照ください。
ガバナンスレポートの表示方法については、「データガバナンス結果の表示」トピックの ガバナンスレポートの表示 セクションをご参照ください。
ワークスペースレベルのデータガバナンス管理者
ワークスペースレベルのデータガバナンス管理者は、ロールが属するワークスペースのデータガバナンスコンテンツを表示および管理できます。
説明このロールには、グローバルディメンションからリージョン内のすべてのワークスペースのデータガバナンス状況を表示したり、グローバルレベルでチェック項目を有効にするなどのグローバルガバナンス操作を管理したりする権限はありません。 RAM ユーザーにグローバルガバナンス操作を実行させたい場合は、テナントレベルでデータガバナンス管理者ロールを RAM ユーザーに割り当てます。 詳細については、テナントレベルのデータガバナンス管理者ロール をご参照ください。
ユーザーに権限を付与する方法については、「ワークスペースレベルのサービスに対する権限の管理」トピックの RAM ユーザーをワークスペースにメンバーとして追加し、メンバーにロールを割り当てる セクションをご参照ください。
ワークスペースレベルのデータガバナンス管理者ロールでサポートされている機能については、「組み込みのワークスペースレベルのロールの権限」トピックの データガバナンス セクションをご参照ください。
一般ユーザー
一般ユーザーは、データ資産ガバナンスで検出された問題を処理する担当者です。 一般ユーザーは、個人ディメンションからチェックイベントとガバナンスの問題を表示し、修正操作を実行できます。 テナントのワークスペースで検出された問題に対して修正操作を実行するには、ワークスペースにメンバーとして追加されている必要があります。
説明デフォルトでは、[aliyundataworksfullaccess] ポリシーがアタッチされている Alibaba Cloud アカウントと RAM ユーザーを除き、他のすべてのユーザーはテナント内の一般ユーザーです。
ユーザーに権限を付与する方法については、「ワークスペースレベルのサービスに対する権限の管理」トピックの RAM ユーザーをワークスペースにメンバーとして追加し、メンバーにロールを割り当てる セクションをご参照ください。
[aliyundataworksfullaccess] ポリシーがアタッチされている Alibaba Cloud アカウントと RAM ユーザーのみが、データ資産ガバナンスのすべての機能を使用できます。 RAM ユーザーとしてデータ資産ガバナンスのすべての機能を使用するには、必要な権限を申請する必要があります。 詳細については、「RAM ユーザーの準備」トピックの DataWorks で操作を実行するための権限を RAM ユーザーに付与する セクションをご参照ください。
データソース
MaxCompute、E-MapReduce(EMR)、および Hologres データソースのみがデータ資産ガバナンスをサポートしています。
説明データ資産ガバナンスで Hologres データソースを使用するには、まずデータマップで Hologres のメタデータを収集する必要があります。 詳細については、「メタデータ収集」をご参照ください。
Hologres データソースは、中国(北京)、中国(上海)、中国(杭州)、中国(深圳)の各リージョンでのみデータ資産ガバナンスでサポートされています。
データガバナンスロジック
データ資産ガバナンスは、データ開発タスクがコミットおよびデプロイされる前に、チェック項目に基づいてチェックイベントを検出します。 データ資産ガバナンスは、タスクがコミットおよびデプロイされた後に、ガバナンス項目に基づいてガバナンスの問題を検出します。 これにより、データに関連するイベントと問題を包括的に処理できます。 項目のチェックがタスクに対してトリガーされ、タスクがチェックに失敗した場合、イベントが生成されます。 重大なイベントは、後続のデータ開発プロセスをブロックする可能性があります。 データ資産ガバナンスでイベントを表示および処理できます。 イベントが処理され、タスクがチェックに合格すると、後続のデータ開発プロセスに進むことができます。 次の図は、データガバナンスのロジックを示しています。
DataWorks は、標準モードと基本モードのワークスペースを提供します。 タスク開発プロセスは、ワークスペースモードによって異なります。 このトピックでは、標準モードのワークスペースを使用してタスクを開発する方法を示します。 実際のタスク開発プロセスは、ワークスペースのモードによって異なります。 異なるモードのワークスペースでの一般的な開発プロセスの詳細については、「DataStudio」をご参照ください。
チェック項目に基づいてチェックを実行します。
チェック項目は、タスクがコミットおよびデプロイされる前に、チェック項目に対する違反についてデータをチェックするために使用されます。 タスクをコミットおよびデプロイする前に、タスク開発に指定したチェック項目を使用して、タスクがチェック項目に違反しているかどうかを確認できます。 システムがタスクがチェック項目に違反していることを検出した場合、後続のタスク開発プロセスをブロックするためにチェックイベントが生成されます。 チェックイベントに関連する問題を処理できます。 これにより、タスク開発プロセスを期待どおりに実行できます。
ガバナンス項目に基づいてチェックを実行します。
ガバナンス項目は、タスクがコミットおよびデプロイされた後に、タスクを管理および統制するために使用されます。 タスクがコミットおよびデプロイされた後、データ資産ガバナンスで [グローバル]、[個人]、または [ワークスペース] ディメンションからガバナンスの問題を表示できます。 データガバナンスエンジニアは、検出されたガバナンスの問題を処理し、データガバナンスの目標を達成するためにできるだけ早く対策を講じることができます。
データガバナンスプロセス
ガバナンスタツールの設定。
ガバナンスプランテンプレートを有効にし、カスタム項目を設定します。
操作
説明
参照資料
カスタムチェック項目の設定
テンプレートで提供されているチェック項目がビジネス要件を満たしていない場合は、ビジネス要件に基づいてカスタムチェック項目を設定できます。
登録済みカスタム拡張機能のチェック項目を作成します。
DataWorks では、カスタム拡張機能のデータ資産ガバナンスでチェック項目を作成することもできます。 このようなチェック項目を作成すると、データ資産ガバナンスはカスタム拡張機能によってトリガーされたチェックイベントを検出します。
チェック項目を無効にします。
ガバナンスプランテンプレートにワークスペースに不要なチェック項目が含まれている場合は、このワークスペースのチェック項目を無効にできます。 チェック項目を無効にすると、データ資産ガバナンスは、指定されたワークスペースでチェック項目によってトリガーされたチェックイベントを検出しなくなります。
カスタムガバナンス項目の設定
ガバナンスプランテンプレートにワークスペースに不要なガバナンス項目が含まれている場合は、指定されたワークスペースでガバナンス項目を無効にするルールを作成できます。 ガバナンス項目を無効にすると、データ資産ガバナンスは、指定されたワークスペースでガバナンス項目に基づいてガバナンスの問題を検出しなくなります。 検出されたガバナンスの問題は、[ガバナンスの問題] タブに表示されません。
説明オプションのガバナンス項目のみ無効にできます。 必須のガバナンス項目を無効にしたり、ガバナンス項目を作成したりすることはできません。
オプション。 ガバナンスユニットを設定します。
DataWorks では、ビジネス要件に基づいてガバナンスユニットを作成することにより、複数のワークスペースでデータガバナンスを一元的に実行できます。 その後、ガバナンスユニット内のワークスペースの全体的なヘルススコア、ガバナンスの問題、チェックイベントの統計情報を表示できます。 ガバナンスユニットの作成と管理方法の詳細については、「ガバナンスユニットの設定」をご参照ください。
オプション。 問題通知方法を設定します。
システムメッセージ、メール、DingTalk グループメッセージ、Webhook URL を使用して、検出された問題を指定された担当者に通知するようにシステムを設定する場合は、問題通知方法を設定できます。 これにより、指定された担当者はできるだけ早く問題を表示および処理できます。 詳細については、「通知設定の設定」をご参照ください。
チェックを開始し、検出されたガバナンスの問題を処理します。
データがコミットおよびデプロイされる前に、チェック項目に対する違反についてデータをチェックします。
DataWorks は、チェック項目に基づいてチェックを実行します。 データがコミットおよびデプロイされる前に、DataWorks はチェック項目に基づいてデータをチェックします。 データがチェック項目に違反している場合、チェックイベントが生成されます。 その後、チェックイベントを表示および処理できます。 詳細については、「チェックイベントの処理」をご参照ください。
タスクデプロイ後にチェックを実行します。
DataWorks は、ガバナンス項目に基づいてガバナンスの問題を検出します。 データがコミットおよびデプロイされた後、DataWorks はガバナンス項目に基づいてガバナンスの問題を検出します。 その後、ガバナンスの問題を表示および処理できます。 詳細については、「チェックイベントの処理」をご参照ください。
アセット 360 チェックを実行します。
アセット 360 機能を使用して、指定されたタスクとテーブルのガバナンスの問題を検出、表示、および処理できます。 詳細については、「アセット 360」をご参照ください。
マテリアライズドビューの自動ガバナンスを実行します。
データ資産ガバナンスは、自動ガバナンスとインテリジェントな推奨事項に基づいてマテリアライズドビューをサポートしています。 これは、多数の類似したサブクエリを頻繁に処理する必要があるビッグデータコンピューティングタスクのためのインテリジェントで自動化されたソリューションです。 詳細については、「マテリアライズドビュー」をご参照ください。
このプロセスで無効な問題が検出された場合は、問題をホワイトリストに追加するか、無効な問題が検出された関連するタスクまたはテーブルをアンデプロイできます。 詳細については、「無効なガバナンスの問題をホワイトリストに追加する」および「グレースフルアンデプロイ」をご参照ください。
分析ディメンションを選択します。
使用シナリオに基づく: DataWorks は、データ生成、データ使用、データ管理などの複数のディメンションを提供し、データガバナンスの有効性を分析し、データを効率的に統制するのに役立ちます。
リソースの合理的な使用に基づく: DataWorks は、リソース消費量とタスク実行ステータス、MaxCompute テーブルの数とストレージステータス、リソース使用状況の概要と詳細に関する統計情報を提供します。 データ開発者と管理者は、ワークスペースの全体的なリソース状況を表示および分析し、統計に基づいてリソースを合理的に使用できます。 資産分析の詳細については、「資産分析」をご参照ください。
ガバナンス結果を表示します。
ガバナンスの問題を処理した後、左側のナビゲーションペインで を選択して [ワークベンチ] ページに移動し、さまざまな側面から実行した操作のガバナンス結果を表示できます。 ガバナンス結果を分析して、頻繁に発生するガバナンスの問題の側面とタイプを特定できます。 これにより、ガバナンスの問題を処理し、データガバナンスの目標を達成するための対策を講じるのに役立ちます。
Data Asset Governance は、ヘルス評価モデルを使用して、ガバナンス項目に基づいてヘルススコアを計算します。ガバナンスレポートとガバナンスリーダーボードでヘルススコアを表示して、ガバナンス結果を確認できます。ヘルススコアが高いほど、ガバナンス結果が良好であることを示します。ヘルススコアの詳細については、「概要」トピックのデータガバナンスセンターセクションをご参照ください。
定量的評価:ヘルススコア
ヘルススコアは、本番、送信、管理プロセスにおけるデータ資産のユーザー行動、データ機能、タスクタイプに関連するメタデータに基づいて計算されます。 データ処理や機械学習などのテクノロジーを使用して、ヘルススコアを計算します。 データ資産のヘルススコアは、個人またはワークスペースの側面から表示できます。 データ資産ガバナンスは、さまざまなメタデータに基づいて、ストレージ、コンピューティング、R&D、品質、セキュリティの各側面でヘルススコアを提供します。
ヘルススコアの範囲は 0 ~ 100 です。スコアが高いほど、データ資産が健全であることを示します。 これにより、安全、効率的、かつ安定した方法でデータを使用できるようになり、データ生成とビジネス運用が保証されます。 データ資産ガバナンスは、組み込みのヘルス評価モデルを使用して、アカウントのデータガバナンスの有効性を定量的に評価し、全体的なヘルススコアと各ガバナンスディメンションのヘルススコアを生成します。 ヘルススコアが高いほど、ガバナンスの有効性が高いことを示します。 次の表は、評価グレードと各グレードのヘルススコアの範囲を示しています。
優:[90, 100]
良:[75, 90)
可:[60, 75)
改善が必要:[30, 60)
不可:[0,30)
用語
チェック項目:チェック項目は、データ生成プロセスに作用するアクティブなガバナンスメカニズムです。 チェック項目を使用して、タスクを開始したり、タスクをデプロイしたりする前に、フルテーブルスキャンやスケジューリング依存関係の欠落などの潜在的な問題を特定するために、タスクをチェックできます。 チェック項目に違反するコンテンツが検出されると、システムはチェックイベントを生成し、コンテンツをインターセプトして処理します。 チェック項目は、データ開発プロセスを制限および管理し、データ処理の標準化と正規化を保証するのに役立ちます。
ガバナンス項目:ガバナンス項目は、DataWorks がデータガバナンス中にデータ資産で最適化または解決が必要な問題(R&D 仕様への違反、データ品質の問題、セキュリティコンプライアンス、リソース使用率など)を検出するために使用されます。 ガバナンス項目は、必須ガバナンス項目とオプションガバナンス項目に分類されます。 デフォルトでは、必須ガバナンス項目はグローバルに有効になっており、無効にすることはできません。 ビジネス要件に基づいてオプションガバナンス項目を有効にできます。 たとえば、ガバナンス項目を使用して、[タスクの実行時間が長すぎる]、[連続エラーノード]、または [リーフノードにアクセスできない] を検出できます。
ガバナンスの問題:ガバナンスの問題は、指定されたガバナンス項目に基づいて DataWorks によって検出され、処理されるのを待っています。
ガバナンスユニット:ガバナンスユニットは、1 つ以上のワークスペースで構成されます。 ガバナンスユニット内のワークスペースの全体的なヘルススコア、ガバナンスの問題、チェックイベントの統計情報を表示できます。
ガバナンスプラン:データ資産ガバナンスは、さまざまなガバナンスシナリオに対応するガバナンスプランテンプレートを提供し、特定の期間内に事前に決定されたガバナンス目標を達成することに重点を置いています。 ガバナンスプランテンプレートを使用すると、関連性の高いガバナンス項目とチェック項目をすばやく特定し、最適化できるオブジェクトを特定できます。 これにより、ガバナンス所有者はデータガバナンスの有効性を綿密に監視でき、チームは定量的評価を実行することでガバナンス目標を効率的に達成できます。
ナレッジベース:ナレッジベースは、データ資産ガバナンスの組み込みチェック項目とガバナンス項目の定義を提供し、データガバナンスエンジニアがデータガバナンス中に発生する問題をすばやく特定して理解するのに役立ちます。 ナレッジベースは問題の解決策を提供し、データガバナンスの効率を向上させるための操作ガイダンスも提供します。