データカタログは、DataWorks でアクセス可能なデータ資産をデータソースタイプ別に整理して表示します。左側にカタログツリー、右側に選択したノードの詳細が表示され、エンジン、データベース、テーブル、データセットを素早く参照できるほか、データセットの作成やオープンデータのインストールなどの操作を実行できます。
データカタログへのアクセス
-
DataWorks コンソールにログインします。 左側のナビゲーションウィンドウで、 を選択します。 表示されるページで、[データマップに移動] をクリックします。
-
左側のナビゲーションペインで、Data Map をクリックし、Data Catalog をクリックしてデータカタログページを開きます。
ページレイアウト
データカタログは、2 ペイン構成になっています:
-
左側のカタログツリー: アクセス可能なアセットがデータソースタイプ別にグループ化されて表示されます。パブリッククラウドでは、このツリーにデフォルトで [DataWorks Projects] グループ、各エンジンデータソース (MaxCompute、Hologres、DLF、Hive、MySQL など) のグループ、および [DataSet] が表示されます。テナントで PAI が有効化されている場合は、PAI カタロググループも表示されます。Open Data を有効化している場合は、ツリーの下部に [Open Data Catalog] グループが表示されます。
説明ツリーに実際に表示されるデータソースタイプは、テナントにバインドされているエンジンと、既に収集されているメタデータによって異なります。表示範囲は、テナントやワークスペースによって異なる場合があります。
-
右側の詳細パネル:左側のツリーで選択したノードに基づいてコンテンツが表示されます。データソースのルートノードを選択するとエンジンの概要が表示され、データベースまたはカタログを選択するとその配下のテーブルが表示され、テーブルまたはデータセットを選択すると対応する詳細ページが埋め込まれます (コンテンツはメタデータの詳細ページと同一です)。
一般的な操作
-
資産の参照:左側のツリーでデータソース、データベース、またはカタログノードを展開し、配下のテーブルやデータセットにドリルダウンします。テーブル名またはデータセット名をクリックすると、右側のパネルが対応する詳細に切り替わります。
-
カタログの検索:カタログツリー上部の検索ボックスを使用して、ノード名で対象オブジェクトを検索します。
-
データセットの作成: Catalogs で [DataSet] をクリックします。ワークスペースのデータセットリストが表示されたら、Create Dataset をクリックし、ウィザードに従って OSS や NAS などのデータセットを作成します。詳細については、「データセットの管理」をご参照ください。
-
オープンデータの使用:ツリーに Open Data Catalog グループが表示されている場合、利用可能なオープンデータセットを参照してインストールできます。詳細については、「オープンデータの管理」をご参照ください。