すべてのプロダクト
Search
ドキュメントセンター

DataWorks:EMR テーブルの作成

最終更新日:Jul 09, 2025

このトピックでは、E-MapReduce(EMR)テーブルを作成する方法について説明します。

背景情報

DataStudio (旧バージョン) で EMR 計算リソースを作成した後、DataWorks の [データマップ] サービスは、クラスタのメタデータを収集するクローラを作成します。 EMR 計算リソースを追加した後にデータベースが使用できない場合は、データマップページに移動し、クローラを使用してクラスタのメタデータを収集します。 詳細については、「EMR データソースからメタデータを収集する」をご参照ください。

手順

  1. [DataStudio] ページに移動します。

    DataWorks コンソール にログインします。 上部のナビゲーションバーで、目的のリージョンを選択します。 左側のナビゲーションウィンドウで、[データ開発と O&M] > [データ開発] を選択します。 表示されるページで、ドロップダウンリストから目的のワークスペースを選択し、[データ開発に移動] をクリックします。

  2. DataStudio ページで、新建 アイコンにポインタを移動し、[テーブルの作成] > [EMR] > [テーブル] を選択します。

    EMR テーブルを作成するワークフローを見つけて、[EMR] を右クリックし、[テーブルの作成] を選択することもできます。

  3. [テーブルの作成] ダイアログボックスで、パラメータを構成します。

    新建emr表

  4. [作成] をクリックします。 テーブルの構成タブが表示されます。

  5. [基本属性] セクションで、パラメータを構成します。 次の表にパラメータを示します。

    基本属性

    パラメータ

    説明

    [レベル 1 テーマ]

    テーブルが存在するレベル 1 フォルダの名前。

    説明

    レベル 1 フォルダとレベル 2 フォルダには、テーブルを簡単に管理できるように、DataWorks 内のテーブルの場所が表示されます。

    [レベル 2 テーマ]

    テーブルが存在するレベル 2 フォルダの名前。

    [テーマの作成]

    [テーマの作成] をクリックして、[フォルダ管理] タブに移動します。 フォルダ管理タブで、レベル 1 フォルダとレベル 2 フォルダを作成できます。

    [更新]

    フォルダを作成した後、[更新] をクリックします。

    [説明]

    テーブルの説明。

  6. [物理モデル設計] セクションで、パラメータを構成します。 次の表にパラメータを示します。

    物理模型

    パラメータ

    説明

    [レイヤー]

    ビジネス要件に基づいて、ドロップダウンリストからレベルと業務カテゴリを選択します。 レベルと業務カテゴリを作成するには、[レベルの作成] をクリックして [レベル管理] タブに移動し、レベルと業務カテゴリを作成します。 この操作は、ワークスペース管理者である場合にのみ実行できます。 レベルと業務カテゴリを作成した後、[更新] をクリックします。

    [物理分類]

    [パーティションタイプ]

    有効な値:[パーティションテーブル] および [非パーティションテーブル]

    [テーブルタイプ]

    有効な値:[内部テーブル] および [外部テーブル]

    [ストレージ形式を選択]

    ビジネス要件に基づいて、テーブル内のファイルのストレージ形式を選択します。

  7. [テーブル構造設計] セクションで、パラメータを構成します。 次の表にパラメータを示します。

    表结构

    パラメータ

    説明

    [フィールドを追加]

    フィールドを追加するには、[フィールドを追加] をクリックし、フィールド情報を構成して、[保存] をクリックします。

    [上に移動]

    ボタンをクリックして、テーブルのフィールド順序を調整できます。 既存のテーブルのフィールドの順序を調整する場合は、テーブルを削除し、同じ名前の別のテーブルを作成する必要があります。 実稼働環境では、既存のテーブルのフィールドの順序を調整することはできません。

    [下に移動]

    [フィールド名]

    フィールドの名前。 名前に使用できるのは、文字、数字、およびアンダースコア (_) です。

    [フィールドタイプ]

    フィールドのデータ型。 EMR は、TINYINT、SMALLINT、INT、BIGINT、FLOAT、DOUBLE、DECIMAL、VARCHAR、CHAR、STRING、BINARY、DATETIME、DATE、TIMESTAMP、BOOLEAN、ARRAY、MAP、および STRUCT のデータ型をサポートしています。

    [長さ/設定]

    フィールドの長さ制限。 フィールドに指定したデータ型で長さ制限が必要な場合は、このパラメータを構成する必要があります。

    [説明]

    フィールドの説明。

    [プライマリキー]

    フィールドがプライマリキーとして機能するかどうかを指定します。 プライマリキーは、ビジネスにとってレコードの一意性を保証するビジネスコンセプトです。 DataWorks には、プライマリキーに関する制限はありません。

    [編集]

    フィールドのこのボタンをクリックしてフィールドを編集し、[保存] をクリックできます。

    [削除]

    フィールドのこのボタンをクリックしてフィールドを削除できます。

    説明

    既存のテーブルからフィールドを削除してからテーブルをコミットする場合は、テーブルを削除し、同じ名前の別のテーブルを作成する必要があります。 実稼働環境では、この操作を実行することはできません。

    [追加]

    [物理モデル設計] セクションで [パーティションタイプ] パラメータを [パーティションテーブル] に設定した場合は、テーブルのパーティションを構成する必要があります。

    このボタンをクリックして、現在のテーブルにパーティションを追加できます。 既存のテーブルにパーティションを追加してからテーブルをコミットする場合は、テーブルを削除し、同じ名前の別のテーブルを作成する必要があります。 実稼働環境では、既存のテーブルにパーティションを追加することはできません。

  8. 上部のツールバーの 提交 アイコンをクリックして、EMR テーブルを実稼働環境にコミットします。

    標準モードのワークスペースを使用する場合は、テーブルを開発環境と実稼働環境に順番にコミットします。

    説明

    テーブルをコミットするときは、スケジューリングのリソースグループを選択する必要があります。 サーバーレスリソースグループを使用してテーブルをコミットする場合、DataWorks はテーブル作成タスクを計算エンジンに発行し、実行ログを表示します。 テーブルのコミット時にエラーが発生した場合は、実行ログを使用して問題のトラブルシューティングを行うことができます。 サーバーレスリソースグループが使用できない場合は、サーバーレスリソースグループを購入して構成できます。 詳細については、「サーバーレスリソースグループの作成と使用」をご参照ください。