メタデータセンターは、さまざまな業務システムからメタデータを抽出し、処理し、一元的に保存、管理することで、データガバナンスをサポートし、組織内データの組織化、取得、分析機能を強化します。
前提条件
リレーショナルデータベースのメタデータ取得はデフォルトでサポートされています。他のデータソースタイプからメタデータを収集するには、対応する機能を購入する必要があります。
v5.3 より前のバージョンでは、特定のデータソースからメタデータを収集する前に、メタデータウェアハウステナントで メタデータセンター を初期化する必要があります。これらのデータソースには、AnalyticDB for MySQL 3.0、PolarDB-X (旧 DRDS)、SAP HANA、および Hologres が含まれます。v5.3 以降のバージョンでは、この初期化なしで取得タスクを直接構成できます。
メタデータセンターの初期化構成は、メタデータウェアハウステナントのエンジンが MaxCompute、Hadoop、または Transwarp TDH 9.3.x の場合にのみ実行できます。
権限の説明
スーパー管理者、システム管理者、およびメタデータ機能の表示権限を持つグローバルカスタムロールのみが、メタデータ関連のメニューを表示できます。
メタデータの概要
メタデータとは、データの特性を記述する情報です。データの内容、ソース、形式、構造に関する詳細な説明を提供し、「データに関するデータ」と呼ばれることがよくあります。メタデータの目的は、データを理解、管理、使用しやすくすることです。ユーザーが特定のデータセットを識別して見つけるのに役立ち、データの組織化と取得をサポートします。さらに、メタデータはデータの整合性と互換性を促進し、データガバナンスコンプライアンスとデータ品質管理の基盤を提供します。組織はメタデータを通じて、データ資産を効果的に監視および分析し、より適切な意思決定支援とビジネスインサイトを得ることができます。
メタデータの分類
メタデータはその目的によって、技術メタデータ、ビジネスメタデータ、管理メタデータに分類されます。
技術メタデータは、データウェアハウスシステムの技術的な詳細に関するデータを保存し、データウェアハウスの開発と管理に使用されます。Dataphin では、技術メタデータは技術資産として表示され、データドメイン、主題領域、プロジェクト、ストレージタイプ、ストレージ形式、ライフサイクルなどの情報が表示されます。
ビジネスメタデータは、データウェアハウス内のデータをビジネスの観点から記述します。ユーザーと実際のシステムの間にセマンティックレイヤーを提供し、コンピューター技術の知識がないビジネス担当者がデータウェアハウス内のデータを理解できるようにします。
管理メタデータは、科学的かつ効果的なメカニズムを使用して、技術メタデータとビジネスメタデータを組織化、統合、管理することを伴います。関連するビジネス、開発、その他のユーザーにメタデータサービスを提供して、さまざまなビジネスシナリオの要件を満たし、企業の業務システムとデータ分析の開発およびメンテナンスプロセスをサポートします。
メタデータ入力
Dataphin ホームページの上部メニューバーで、[管理] > [メタデータ] を選択します。
メタデータページの左側のナビゲーションウィンドウに、さまざまな機能のエントリポイントが表示されます。
レベル 1 メニュー
レベル 2 メニュー
説明
メタデータ取得
収集概要
メタデータは、MySQL や Oracle などの従来のデータベース、Hive、Hologres などのビッグデータストレージなど、さまざまな収集ソースタイプをサポートしています。作成済みの収集タスク、作成済みのデータソース、収集オブジェクトタイプ、およびさまざまなデータソースタイプでサポートされているバージョンを表示できます。
収集タスク
収集アダプターを介して指定されたデータソースに接続し、ソースデータベースからオブジェクトメタデータ情報を Dataphin に収集します。収集されたメタデータは、組み込みのレゾルバーによって解析され、保存され、統一された方法で表示されます。
収集インスタンス
これらは、時間指定スケジューリングまたは手動タスク実行に基づいて収集タスクによって生成されるインスタンスタスクです。
メタデータ管理
業務システムメタデータ
収集されたメタデータ情報をリスト形式で表示し、さまざまな観点からデータをクエリできるようにします。
一般構成
業務システム
指定されたソースから収集されたメタデータが属する業務システムを構成します。これは、資産チェックリストとディレクトリでのオブジェクトフィルタリング、業務システム系列関係の表示、その他のシナリオに使用できます。
データ検出
自動的に検出できるデータテーブルの範囲を構成し、データ検出レコードの保存期間、グローバルで同時に実行できる検出タスクの最大数、検出タスクの実行タイムアウトを制御し、リソースをより効率的に使用するためのパラメーターを設定します。