メタデータセンターは、ビジネスシステムからメタデータを抽出、処理、管理する一元的なサービスです。データガバナンスを支援し、データの整理と分析を改善します。
前提条件
Dataphin は、デフォルトでリレーショナルデータベースのメタデータ収集に対応しています。ほかのデータソースタイプからメタデータを収集するには、必要な機能を購入する必要があります。
-
V5.3 より前は、一部のデータソース (AnalyticDB for MySQL 3.0、PolarDB-X (旧 DRDS)、SAP HANA、Hologres) で、収集タスクを設定する前に、メタストアテナントでメタデータセンターを初期化する必要がありました。V5.3 以降では、この要件は削除されました。
-
メタストアテナントエンジンが MaxCompute、Hadoop、または Transwarp TDH 9.3.x の場合にのみ、メタデータセンターを初期化できます。
権限
メタデータメニューにアクセスできるのは、スーパー管理者、システム管理者、またはメタデータ権限を持つグローバルカスタムロールのみです。
メタデータとは
メタデータは、データの特性 (内容、出所、形式、構造) を記述します。「データに関するデータ」とも呼ばれ、データセットの特定と所在の把握に役立ちます。また、データの整理と検索を支援し、データガバナンス、コンプライアンス、品質管理の基盤を提供します。
メタデータの種類
メタデータは用途に基づき、技術メタデータ、ビジネスメタデータ、管理メタデータの 3 種類に分類されます。
-
技術メタデータは、データモジュール、主題領域、プロジェクト、ストレージタイプ、ストレージ形式、ライフサイクルなど、データウェアハウスの技術的な詳細を格納します。Dataphin では、技術メタデータを技術資産として扱います。
-
ビジネスメタデータは、ビジネスの観点からデータウェアハウスの内容を記述します。ビジネスユーザーが深い技術知識なしでデータを理解できるセマンティックレイヤーを提供します。
-
管理メタデータは、技術メタデータとビジネスメタデータを整理、統合、ガバナンスするプロセスを対象とします。ビジネスや開発などの異なる役割のユーザーに提供され、エンタープライズのビジネスシステムとデータ分析を支援します。
メタデータセンターへのアクセス
-
Dataphin ホームページのトップナビゲーションバーで、[ガバナンス] > [メタデータ] を選択します。
-
メタデータページの左側のナビゲーションペインに、利用可能な機能が表示されます。
メインメニュー
サブメニュー
説明
メタデータ収集
収集の概要
収集タスク、データソース、収集オブジェクトタイプ、サポート対象バージョンのサマリーを表示します。サポート対象のソースには、従来型データベース (MySQL、Oracle) およびビッグデータストア (Hive、Hologres) が含まれます。
収集タスク
収集タスクは、アダプターを介してデータソースに接続し、オブジェクトのメタデータを Dataphin に収集します。さらに、組み込みのパーサーを使用して、メタデータを統一的な方法で解析、格納、表示します。
収集インスタンス
各収集インスタンスは、スケジュールに従ってタスクによって、または手動トリガーによって生成されます。
メタデータ管理
メタデータリスト
収集したメタデータをリストで表示し、さまざまな観点からクエリできます。
一般設定
ソースシステム
収集したメタデータを、ソースのビジネスシステムにマッピングします。このマッピングを使用して、リストやカタログで資産をフィルタリングしたり、ビジネスシステムリネージを表示したりできます。
サンプリング設定
データサンプリングは、ビジネスユーザーがデータ構造を理解するのに役立ち、SQL 開発にも有用です。
プロファイリングと分析
自動プロファイリングを設定して、リソース使用量を最適化します。設定項目には、テーブルスコープ、レコード保持期間、グローバルタスクの最大同時実行数、実行タイムアウト、プロファイリングパラメーターが含まれます。
メタデータ変更ログ
メタデータ変更レコードの保持範囲とバージョン数を制御して、ストレージコストを削減します。