DataWorks OpenData は、DataWorks プラットフォーム向けに、一元化、統一化され、使いやすいメタデータコレクションを提供します。複雑な構成を必要とせず、MaxCompute のパッケージビュー権限付与を通じて、標準化され追跡可能なメタデータを迅速に取得できます。このデータには、テーブル、タスクノードとインスタンス、ワークスペース、メンバー、プロジェクト、Data Quality、データ資産など、さまざまなオブジェクトの詳細なメタデータが含まれており、データガバナンスと分析をサポートします。
利用シーン
DataWorks OpenData は、以前の 招待制の OpenData をアップグレードした一般公開版です。コマンドラインの使用が必要だった以前のバージョンとは異なり、新しいバージョンではビジュアルインターフェイスが提供されています。このインターフェイスにより、メタデータをより直感的かつ効率的に使用および管理できます。
DataWorks プラットフォームでは、OpenData を次のような用途で利用できます。
データインベントリ:ワークスペースやオーナーによって管理されているテーブルやタスクなどのデータオブジェクトに関する統計情報を取得します。また、データ構造、ソース、更新頻度、依存関係を理解して、データのブラックボックス化を解消できます。
エンドツーエンドのリネージ追跡:テーブルやデータリネージなどのメタデータを使用して、特定のテーブルの上流および下流のリネージパスに対してカスタムクエリを実行します。これにより、ソースデータから下流のアプリケーションまでのデータフロー全体を追跡し、問題を迅速に特定したり、影響範囲を分析したりできます。
カスタムメタデータ分析:既存の OpenAPI を使用することに加えて、SQL を使用してメタデータに直接アクセスし、分析できます。これにより、分析プロセスが簡素化され、データガバナンスのライフサイクルが短縮されます。
前提条件
DataWorks ワークスペースが作成され、MaxCompute コンピューティングリソースにバインドされていること。
制限事項
エディション要件:DataWorks Enterprise Edition 以降のバージョンのみがサポートされています。他のエディションはサポートされていません。
権限の制限:DataWorks OpenData をインストールおよびアンインストールできるのは、テナントのオーナー、テナントの管理者、データガバナンスの管理者、または
DataWorksFullAccess権限を持つ Resource Access Management (RAM) ユーザーのみです。権限付与の制限:メタデータビューの権限付与は MaxCompute を通じてのみ可能です。他のリソースタイプはサポートされていません。
データ更新のレイテンシー:メタデータは T+1 のレイテンシーで更新されます。つまり、前日のメタデータをクエリできます。
OpenData の管理
このセクションでは、DataWorks OpenData の表示、インストール、および使用方法について説明します。
OpenData の表示
OpenData のさまざまなパッケージのメタデータとシナリオを理解するために、次の情報を表示できます。これにより、必要に応じてパッケージを選択して使用できます。
DataWorks コンソールにログインします。上部のナビゲーションバーで、目的のリージョンを選択します。左側のナビゲーションウィンドウで、を選択します。表示されたページで、[データマップへ移動]をクリックします。
データマップページの左側のナビゲーションウィンドウで、
アイコンをクリックしてデータカタログページに移動します。カタログリストで、[DataWorks OpenData] をクリックして [DataWorks OpenData] ページを開きます。
[パッケージリスト] タブに切り替えます。 パッケージの [詳細] をクリックします。 [テーブルリスト] タブで、パッケージ内のメタデータテーブルとその説明を表示できます。
MetaData と Examples メタデータの違い:
パッケージ名
OpenData
シナリオ
MetaData
テーブルスキーマ、フィールドの説明、データリネージなどのテーブル情報。
タスク実行ステータスや依存関係などのスケジューリングノードとインスタンス。
ワークスペース、メンバー、プロジェクトなどの管理メタデータ。
Data Quality の詳細やデータガバナンスの詳細などのメタデータ。
データ資産インベントリ、データリネージ分析、依存関係管理に使用されます。
Examples
メタデータメトリックのコレクション。
説明Examples パッケージは DataWorks によって提供され、メタデータから生成されたサンプルメトリックテーブルのコレクションが含まれています。実際のデータは必要に応じて異なり、UI に表示されるデータが優先されます。
MetaData パッケージの生データと組み合わせることで、リソース使用率分析やタスクの健全性評価など、一般的な分析シナリオを迅速に構築できます。
重要詳細については、「OpenData テーブルスキーマの詳細」をご参照ください。
メタデータテーブルの詳細を確認するには、対象テーブルの [詳細] をクリックします。 テーブル詳細ページで、[フィールド] とその [説明] を表示できます。 これにより、OpenData メタデータテーブル間の関係を理解しやすくなります。
OpenData のインストール
テナント内のすべての関連データビューをパッケージとしてインストールできます。この操作により、指定された宛先ワークスペースの MaxCompute コンピュートエンジンに権限が付与されます。
OpenData ページに移動します。 [パッケージリスト] タブで、対象のパッケージ ([MetaData] または [Examples]) を選択し、[アクション] 列の [詳細] をクリックします。
パッケージページで、使用したいパッケージをインストールします。
初回インストール: パッケージページの右上隅で[インストール]をクリックします。
インストール履歴が存在する場合:[インストール履歴] タブで、[インストール] をクリックします。

[DataWorks メタデータのインストール] ダイアログボックスで、宛先のワークスペースと権限を付与する MaxCompute プロジェクトを選択します。
説明権限を付与する MaxCompute プロジェクトは、宛先ワークスペースにバインドされているコンピュートエンジンです。
宛先ワークスペースにバインドされている MaxCompute コンピュートエンジンが [インストール済み] 状態の場合、再度インストールする必要はありません。
標準モードのワークスペースで OpenData のメタデータを使用するには、開発環境と本番環境にバインドされている MaxCompute コンピュートエンジンをインストールして権限を付与することを推奨します。
インストールに関する注意事項を読み、確認チェックボックスを選択し、[インストールの確認] をクリックします。インストールが成功すると、[インストール履歴] タブで新しいインストールレコードを表示できます。
宛先ワークスペースの MaxCompute コンピュートエンジンで他のパッケージのメタデータを使用するには、上記の手順に従ってインストールし、権限を付与します。
OpenData の使用
OpenData を宛先ワークスペースの MaxCompute コンピュートエンジンにインストールした後、MaxCompute コンピュートエンジンを使用して、データ開発またはデータ分析モジュールで権限が付与されたメタデータビューに直接アクセスできます。
データマップページの左側のナビゲーションウィンドウで、
アイコンをクリックしてデータカタログページに移動します。カタログリストで、[MaxCompute] をクリックし、次に u_meta で始まり、リージョン名で終わるパッケージをクリックします。

詳細ページで、 または を選択します。対応するモジュールにリダイレクトされ、承認されたメタデータビューをクエリして使用できます。
DataStudio での使用:
DataStudio の上部のメニューバーで、OpenData がインストールされているリージョンとワークスペースに切り替えます。
MaxCompute ノードを作成します。ノード編集ページで、OpenData を使用してタスクを開発できます。
次のサンプルコードを使用して、インストールが成功したかどうかを検証およびテストできます。
SELECT dt ,COUNT(*) AS database_count FROM u_meta_hangzhou.databases GROUP BY dt ORDER BY dt ASC LIMIT 32 ;重要コードをテストするときは、権限が付与された MaxCompute コンピュートエンジンを使用する必要があります。
u_meta_hangzhouを、ご利用の [MaxCompute] データカタログのパッケージ名に置き換えます。 パッケージ名は、プレフィックスの u_meta とサフィックスのリージョン名で構成されます。
データ分析での使用:
データ分析の SQL クエリページに移動すると、システムによってサンプルメタデータ分析スクリプトが提供されます。要件に基づいてスクリプトを変更できます。
SQL クエリページの右上隅にある
アイコンをクリックし、権限が付与されたワークスペースを選択し、MaxCompute コンピュートエンジンをバインドしたときにシステムによって生成されたものと同じ名前のデータソースをバインドします。その後、データ分析で権限が付与されたメタデータをクエリできます。説明サンプル スクリプトを実行する前に、
REPLACE_WITH_WORKSPACE_IDパラメーターをクエリ対象のワークスペースの ID に置き換えてください。そうしないと、エラーが報告されます。ワークスペース ID の取得方法については、「ワークスペースの構成」をご参照ください。
OpenData のアンインストール
OpenData を使用する必要がなくなった場合、またはワークスペース内の MaxCompute プロジェクトの権限付与を取り消す必要がある場合は、OpenData をアンインストールできます。
データマップページの左側のナビゲーションウィンドウで、
アイコンをクリックしてデータカタログページに移動します。カタログリストで、[MaxCompute] を選択し、次に u_meta で始まり、リージョン名で終わるパッケージをクリックします。
詳細ページの [アクセス可能なプロジェクト] タブで、目的のプロジェクトを見つけ、[アクション] 列の [アンインストール] をクリックします。[DataWorks メタデータのアンインストールの確認] ダイアログボックスで、アンインストールの注意事項を読み、確認チェックボックスを選択して、[アンインストールの確認] をクリックします。
重要アンインストールすると権限が取り消され、このデータに依存するタスクが中断されます。続行する前に、アクティブな依存関係が存在しないことを確認してください。
よくある質問
Q:メタデータ更新のレイテンシーは使用にどのような影響を与えますか?
A:メタデータは T+1 のレイテンシーで生成されます。これは、前日のアクティビティを反映することを意味します。リアルタイムのメタデータについては、DataWorks OpenAPI を使用してください。
Q:インストール後に OpenData をアンインストールできますか?
A:はい、できます。アンインストールすると権限が取り消されます。中断を避けるために、これらのビューに依存するアクティブなタスクがないことを確認してください。
Q:メタデータを保護するにはどうすればよいですか?
A:MaxCompute のデータアクセス制御を使用して、機密メタデータにアクセスできるユーザーを制限できます。