このトピックでは、E-MapReduce(EMR)テーブルを作成する方法について説明します。
背景情報
DataStudio (旧バージョン) で EMR 計算リソースを作成した後、DataWorks の [データマップ] サービスは、クラスタのメタデータを収集するクローラを作成します。 EMR 計算リソースを追加した後にデータベースが使用できない場合は、データマップページに移動し、クローラを使用してクラスタのメタデータを収集します。 詳細については、「EMR データソースからメタデータを収集する」をご参照ください。
手順
[DataStudio] ページに移動します。
DataWorks コンソール にログインします。 上部のナビゲーションバーで、目的のリージョンを選択します。 左側のナビゲーションウィンドウで、 を選択します。 表示されるページで、ドロップダウンリストから目的のワークスペースを選択し、[データ開発に移動] をクリックします。
DataStudio ページで、
アイコンにポインタを移動し、 を選択します。EMR テーブルを作成するワークフローを見つけて、[EMR] を右クリックし、[テーブルの作成] を選択することもできます。
[テーブルの作成] ダイアログボックスで、パラメータを構成します。

[作成] をクリックします。 テーブルの構成タブが表示されます。
[基本属性] セクションで、パラメータを構成します。 次の表にパラメータを示します。

パラメータ
説明
[レベル 1 テーマ]
テーブルが存在するレベル 1 フォルダの名前。
説明レベル 1 フォルダとレベル 2 フォルダには、テーブルを簡単に管理できるように、DataWorks 内のテーブルの場所が表示されます。
[レベル 2 テーマ]
テーブルが存在するレベル 2 フォルダの名前。
[テーマの作成]
[テーマの作成] をクリックして、[フォルダ管理] タブに移動します。 フォルダ管理タブで、レベル 1 フォルダとレベル 2 フォルダを作成できます。
[更新]
フォルダを作成した後、[更新] をクリックします。
[説明]
テーブルの説明。
[物理モデル設計] セクションで、パラメータを構成します。 次の表にパラメータを示します。

パラメータ
説明
[レイヤー]
ビジネス要件に基づいて、ドロップダウンリストからレベルと業務カテゴリを選択します。 レベルと業務カテゴリを作成するには、[レベルの作成] をクリックして [レベル管理] タブに移動し、レベルと業務カテゴリを作成します。 この操作は、ワークスペース管理者である場合にのみ実行できます。 レベルと業務カテゴリを作成した後、[更新] をクリックします。
[物理分類]
[パーティションタイプ]
有効な値:[パーティションテーブル] および [非パーティションテーブル]。
[テーブルタイプ]
有効な値:[内部テーブル] および [外部テーブル]。
[ストレージ形式を選択]
ビジネス要件に基づいて、テーブル内のファイルのストレージ形式を選択します。
[テーブル構造設計] セクションで、パラメータを構成します。 次の表にパラメータを示します。

パラメータ
説明
[フィールドを追加]
フィールドを追加するには、[フィールドを追加] をクリックし、フィールド情報を構成して、[保存] をクリックします。
[上に移動]
ボタンをクリックして、テーブルのフィールド順序を調整できます。 既存のテーブルのフィールドの順序を調整する場合は、テーブルを削除し、同じ名前の別のテーブルを作成する必要があります。 実稼働環境では、既存のテーブルのフィールドの順序を調整することはできません。
[下に移動]
[フィールド名]
フィールドの名前。 名前に使用できるのは、文字、数字、およびアンダースコア (_) です。
[フィールドタイプ]
フィールドのデータ型。 EMR は、TINYINT、SMALLINT、INT、BIGINT、FLOAT、DOUBLE、DECIMAL、VARCHAR、CHAR、STRING、BINARY、DATETIME、DATE、TIMESTAMP、BOOLEAN、ARRAY、MAP、および STRUCT のデータ型をサポートしています。
[長さ/設定]
フィールドの長さ制限。 フィールドに指定したデータ型で長さ制限が必要な場合は、このパラメータを構成する必要があります。
[説明]
フィールドの説明。
[プライマリキー]
フィールドがプライマリキーとして機能するかどうかを指定します。 プライマリキーは、ビジネスにとってレコードの一意性を保証するビジネスコンセプトです。 DataWorks には、プライマリキーに関する制限はありません。
[編集]
フィールドのこのボタンをクリックしてフィールドを編集し、[保存] をクリックできます。
[削除]
フィールドのこのボタンをクリックしてフィールドを削除できます。
説明既存のテーブルからフィールドを削除してからテーブルをコミットする場合は、テーブルを削除し、同じ名前の別のテーブルを作成する必要があります。 実稼働環境では、この操作を実行することはできません。
[追加]
[物理モデル設計] セクションで [パーティションタイプ] パラメータを [パーティションテーブル] に設定した場合は、テーブルのパーティションを構成する必要があります。
このボタンをクリックして、現在のテーブルにパーティションを追加できます。 既存のテーブルにパーティションを追加してからテーブルをコミットする場合は、テーブルを削除し、同じ名前の別のテーブルを作成する必要があります。 実稼働環境では、既存のテーブルにパーティションを追加することはできません。
上部のツールバーの
アイコンをクリックして、EMR テーブルを実稼働環境にコミットします。標準モードのワークスペースを使用する場合は、テーブルを開発環境と実稼働環境に順番にコミットします。
説明テーブルをコミットするときは、スケジューリングのリソースグループを選択する必要があります。 サーバーレスリソースグループを使用してテーブルをコミットする場合、DataWorks はテーブル作成タスクを計算エンジンに発行し、実行ログを表示します。 テーブルのコミット時にエラーが発生した場合は、実行ログを使用して問題のトラブルシューティングを行うことができます。 サーバーレスリソースグループが使用できない場合は、サーバーレスリソースグループを購入して構成できます。 詳細については、「サーバーレスリソースグループの作成と使用」をご参照ください。