オフライン物理テーブルの作成

オフライン物理テーブルは、コンピューティングタスク開発用のテーブルの設定と管理を一元化し、開発効率を向上させます。

制限事項

テーブルで [データ標準] フィールドを設定するには、[データ標準] モジュールが必要です。
テーブルで [データ分類] および [データカテゴリ分類] フィールドを設定するには、[資産セキュリティ] モジュールが必要です。
サポートされているコンピューティングエンジンは、MaxCompute、Hadoop、Lindorm、Databricks、GaussDB(DWS)、TDH 6.x、TDH 9.3.x、および AnalyticDB for PostgreSQL です。
マルチエンジンモードでは、テーブル管理は、エンジンタイプが MaxCompute、Hadoop、AnalyticDB for PostgreSQL、GaussDB(DWS)、Databricks、Lindorm、TDH 6.x、または TDH 9.3.x のコンピューティングソースに紐付けられているプロジェクトのみをサポートします。

ステップ 1：基本情報の設定

Dataphin ホームページのトップメニューバーで、[開発] > [データ開発] を選択します。
上部メニューで、[プロジェクト] を選択します。Dev-Prod モードでは、[環境] も選択する必要があります。
左側のナビゲーションペインで、[データ処理] > [テーブル管理] を選択します。
テーブル管理リストで、アイコンをクリックし、[オフライン物理テーブル] を選択します。

[Create Physical Table] ウィザードで、次のパラメーターを設定します。必要なパラメーターは、コンピューティングエンジンによって異なります。

MaxCompute

パラメーター	説明
[テーブル名]	オフライン物理テーブルの名前を入力します。名前に使用できるのは、英字、数字、アンダースコア (_) のみで、128 文字以内にする必要があります。
[ディレクトリ]	オフライン物理テーブルのディレクトリを選択します。ディレクトリが存在しない場合は、次の手順で作成できます。ページの左側にあるコンピューティングタスクリストの上にあるアイコンをクリックして、[新しいフォルダー] ダイアログボックスを開きます。 [新規フォルダー] ダイアログボックスで、[名前] を入力し、[タイプ] を [オフライン] に設定し、必要に応じて親 [ディレクトリ] を選択します。 [OK] をクリックします。
[データドメイン] (オプション)	テーブルのデータドメインを選択します。利用可能なデータドメインがない場合は、作成できます。詳細については、「データドメインの作成」をご参照ください。
[説明] (オプション)	テーブルの簡単な説明を 1,000 文字以内で入力します。

Hadoop

パラメーター	説明
[テーブル名]	オフライン物理テーブルの名前を入力します。名前に使用できるのは、英字、数字、アンダースコア (_) のみで、128 文字以内にする必要があります。
[ディレクトリ]	オフライン物理テーブルのディレクトリを選択します。ディレクトリが存在しない場合は、次の手順で作成できます。ページ左側のコンピュートタスクリストの上部で、アイコンをクリックして、[新規フォルダー] ダイアログボックスを開きます。 [新しいフォルダー] ダイアログボックスで、[名前] を入力し、[タイプ] を [オフライン] に設定し、必要に応じて親 [ディレクトリ] を選択します。 [OK] をクリックします。
[データドメイン] (オプション)	テーブルのデータドメインを選択します。利用可能なデータドメインがない場合は、作成できます。詳細については、「データドメインの作成」をご参照ください。
[説明] (オプション)	テーブルの簡単な説明を 1,000 文字以内で入力します。
[ストレージフォーマット]	オフライン物理テーブルのストレージフォーマットを選択します。次のフォーマットをサポートしています。 hudi および delta (Delta Lake)：これらのフォーマットは、プロジェクトのコンピューティングソースで Spark SQL が有効になっている場合にのみ選択できます。現在のプロジェクトのコンピューティングソースで Spark SQL が有効になっていない場合でも、[Develop] > [Table Management] 設定のデフォルトのストレージフォーマットが hudi または delta (Delta Lake) に設定されている場合、このストレージフォーマットはデフォルトで [Engine Default (you can specify another format in the CREATE TABLE statement)] になります。 hudi を選択した場合、DDL 文のストレージフォーマット句は `using hudi` になります。delta (Delta Lake) を選択した場合、句は `using delta` になります。 Paimon Iceberg Parquet：DDL 文のストレージフォーマット句は `stored as parquet` です。 Avro：DDL 文のストレージフォーマット句は `stored as avro` です。 Rcfile：DDL 文のストレージフォーマット句は `stored as rcfile` です。 Orc：DDL 文のストレージフォーマット句は `stored as orc` です。 Textfile：DDL 文のストレージフォーマット句は `stored as textfile` です。 Sequencefile：DDL 文のストレージフォーマット句は `stored as sequencefile` です。

Lindorm

パラメーター	説明
[テーブル名]	オフライン物理テーブルの名前を入力します。名前に使用できるのは、英字、数字、アンダースコア (_) のみで、128 文字以内にする必要があります。
[ディレクトリ]	オフライン物理テーブルのディレクトリを選択します。ディレクトリが存在しない場合は、次の手順で作成できます。ページ左側の計算タスクリストの上にあるアイコンをクリックして、[新規フォルダー] ダイアログボックスを開きます。 [新規フォルダー] ダイアログボックスで、[名前] を入力し、[タイプ] を [オフライン] に設定し、必要に応じて親 [ディレクトリ] を選択します。 [OK] をクリックします。
[データドメイン] (オプション)	テーブルが属するデータドメインを選択します。利用可能なデータドメインがない場合は、作成できます。詳細については、「データドメインの作成」をご参照ください。
[説明] (オプション)	テーブルの簡単な説明を 1,000 文字以内で入力します。
[ストレージフォーマット]	オフライン物理テーブルのストレージフォーマットを選択します。デフォルトでは、このフォーマットは Develop プラットフォームのテーブル管理設定のデフォルトのストレージフォーマットと一致します。現在、次のフォーマットをサポートしています。 Engine Default (CREATE TABLE 文で上書き可能)：CREATE TABLE 文はストレージフォーマット (using または stored as) を指定しません。 Iceberg Parquet Avro Rcfile Orc Textfile Sequencefile

Databricks

パラメーター	説明
[テーブル名]	オフライン物理テーブルの名前を入力します。名前に使用できるのは、英字、数字、アンダースコア (_) のみで、128 文字以内にする必要があります。
[ディレクトリ]	オフライン物理テーブルのディレクトリを選択します。ディレクトリが存在しない場合は、次の手順で作成できます。ページ左側の計算タスクリストの上にあるアイコンをクリックすると、[新規フォルダー] ダイアログボックスが開きます。 [新しいフォルダー] ダイアログボックスで、[名前] を入力し、[タイプ] を [オフライン] に設定し、必要に応じて親として[ディレクトリ]を選択します。 [OK] をクリックします。
[データドメイン] (オプション)	テーブルのデータドメインを選択します。利用可能なデータドメインがない場合は、作成できます。詳細については、「データドメインの作成」をご参照ください。
[説明] (オプション)	テーブルの簡単な説明を 1,000 文字以内で入力します。
[ストレージフォーマット]	オフライン物理テーブルのストレージフォーマットを選択します。デフォルトでは、Develop プラットフォームのテーブル管理設定で指定されたフォーマットになります。現在、次のフォーマットをサポートしています。 Engine Default (CREATE TABLE 文で別途指定可能)：CREATE TABLE 文にはストレージフォーマット句 (using または stored as) がありません。 Avro Binaryfile Csv Delta (Delta Lake) Json Orc Parquet Text

GaussDB (DWS) および AnalyticDB for PostgreSQL

パラメーター	説明
[テーブル名]	オフライン物理テーブルの名前を入力します。名前に使用できるのは、英字、数字、アンダースコア (_) のみで、63 文字以内にする必要があります。
[ディレクトリ]	オフライン物理テーブルのディレクトリを選択します。ディレクトリが存在しない場合は、次の手順で作成できます。ページ左側の計算タスクリストの上にあるアイコンをクリックして、[新規フォルダー] ダイアログボックスを開きます。 [新しいフォルダー] ダイアログボックスで、[名前] を入力し、[タイプ] を [オフライン] に設定し、必要に応じて親 [ディレクトリ] を選択します。 [OK] をクリックします。
[データドメイン] (オプション)	プロジェクトがビジネスセグメントに関連付けられている場合にのみ、データドメインを選択できます。
[説明] (オプション)	テーブルの簡単な説明を 1,000 文字以内で入力します。

パラメーターを設定し、[次へ] をクリックします。

ステップ 2：フィールドリストの設定

コンピューティングエンジンがサポートするストレージ形式は異なります。詳細については、「テーブル管理設定」をご参照ください。フィールドリストで使用できる設定は、ストレージ形式 によって異なり、以下のとおりです。

説明

Databricks コンピューティングエンジン のオフライン物理テーブルでは、ストレージフォーマットが エンジンデフォルト (テーブル作成文で指定可能) であっても delta (Delta Lake) であっても、フィールドリストでサポートされている設定項目は同じです。

Hudi、delta (Delta Lake)、iceberg、または paimon

[フィールドリスト] 設定ページで、現在の物理テーブルのテーブルフィールド、データ型、データ分類などのスキーマ情報を設定します。

セクション	説明
① [フィールドリストの操作]	[Search]：フィールド名でフィールドを検索できます。 [Edit DDL]：現在の物理テーブルの DDL ステートメントを編集します。データフィールドの追加: [データフィールドの追加] をクリックし、新しい行に [フィールド名]、[データ型]、[説明] を入力します。ステートメントからインポート: CREATE TABLE ステートメントを使用して新しいフィールドをインポートします。 [ステートメントからインポート] をクリックします。 [ステートメントからインポート] ダイアログボックスで、ステートメントを入力し、[SQL の解析] をクリックし、解析結果から必要なフィールドを選択してから、[追加] をクリックしてインポートします。テーブルからインポート: [テーブルからインポート] をクリックし、[テーブルからインポート] ダイアログボックスでソーステーブルと必須フィールドを選択し、[追加] をクリックします。
② [フィールドリスト]	フィールド一覧には、[番号]、[フィールド名]、[データ型]、[説明]、[データ標準]、[データ分類]、[データ機密度レベル]などのフィールド詳細が表示されます。 [番号]: フィールドの連番です。新しいフィールドが追加されるたびに 1 ずつ増加します。 [フィールド名]：テーブルフィールドの名前。ルートワードの完全な名前を入力して検索すると、システムが [Governance] > [Data Standard] > [Root Word] で設定されたルートワードと自動的にマッチングします。 [データ型]： [string]、[bigint]、[double]、[timestamp]、[decimal]、[テキスト]、[数値]、[日付/時刻]、および [その他] をサポートしています。テキスト: [varchar]、[char]。数値: [int], [smallint], [tinyint], [float]。日付/時刻: [日付]。MaxCompute コンピューティングエンジンは `datetime` をサポートしています。説明 Hadoop コンピューティングエンジンは datetime をサポートしていません。その他: [ブール]、[バイナリ]。 [説明]：フィールドの説明。最大文字数：512 文字。 [データ標準]：フィールドにデータ標準を選択します。標準を作成するには、「データ標準の作成と管理」をご参照ください。 [データ分類]：フィールドのデータ分類を選択します。データ分類を作成するには、「データ分類を作成する」をご参照ください。 [データ機密度レベル]: データ分類を選択すると、システムがデータ機密度レベルを自動的に識別します。操作列でフィールドを[削除]することもできます。説明フィールドの削除は元に戻すことができません。
③ [一括操作]	複数のテーブルフィールドを選択して、次の一括操作を実行できます。 [削除]: アイコンをクリックして、選択したデータフィールドを削除します。 [ルートワード命名]: アイコンをクリックします。システムは説明フィールドをトークン化し、既存のルートワードと照合してフィールド名を推奨します。 [ルートワード命名] ダイアログボックスでは、選択したフィールドの名前を更新された値に置き換えることができます。説明推奨されるフィールド名が要件を満たさない場合は、[変更後のフィールド名] 入力ボックスで変更できます。 [リセット] をクリックして、[変更後のフィールド名] をシステムで一致したルートワードに戻します。 [データ標準]：アイコンをクリックします。システムは、フィールド名に基づいてデータ標準を推奨します。 [データ標準] ダイアログボックスで、推奨される標準をフィールドに適用できます。

フィールドを追加したら、[次へ] をクリックします。

その他のフォーマット

[フィールド一覧] 設定ページで、現在の物理テーブルのテーブルフィールド、データ型、データ分類などのスキーマ情報を設定します。

セクション	説明
① [フィールドリストの操作]	[Search]：フィールド名でフィールドを検索できます。 [Edit DDL]：現在の物理テーブルの DDL ステートメントを編集します。フィールドの追加: [フィールドの追加] をクリックし、フィールドタイプ ([データフィールド]、[パーティションフィールド]、または [日付パーティションのクイック追加]) を選択してから、新しい行に [フィールド名]、[データ型]、[説明] などの情報を入力します。 [Add Data Field]：データフィールド行を追加します。 [パーティションフィールド]：パーティションフィールド行を追加します。 [quick add date partition]：日付パーティション行を追加します。デフォルトは `ds` です。ステートメントからインポート: CREATE TABLE ステートメントを使用して、新しいフィールドをインポートします。[ステートメントからインポート] をクリックします。[ステートメントからインポート] ダイアログボックスで、ステートメントを入力し、[SQL を解析] をクリックし、解析結果から必要なフィールドを選択して、[追加] をクリックしてインポートします。テーブルからインポート: [テーブルからインポート] をクリックします。[テーブルからインポート] ダイアログボックスで、インポートするソーステーブルとフィールドを選択し、次に [追加] をクリックします。
② [フィールドリスト]	フィールドリストには、[番号]、[フィールド名]、[データ型]、[説明]、[データ標準]、[データ分類]、[データ機密度レベル] などのフィールド詳細が表示されます。 [番号]: フィールドの連番です。この番号は、新しいフィールドが追加されるたびに 1 ずつ増加します。 [フィールド名]：テーブルフィールドの名前。ルートワードの完全な名前を入力して検索すると、システムが [Governance] > [Data Standard] > [Root Word] で設定されたルートワードと自動的にマッチングします。 [データ型]: [文字列]、 [bigint]、 [double]、 [タイムスタンプ]、 [decimal]、 [テキスト]、[数値]、[日付/時刻]、および [その他] のデータ型をサポートします。テキスト: [varchar]、[char]。数値: [int]、[smallint]、[tinyint]、[float]。日付/時刻: [date]。MaxCompute コンピューティングエンジンは[datetime]をサポートしています。説明 Hadoop コンピューティングエンジンは datetime をサポートしていません。その他：[ブーリアン]、[バイナリ]。 [説明]：フィールドの説明です。最大長は 512 文字です。 [データ標準]: フィールドのデータ標準を選択します。標準を作成するには、データ標準の作成と管理をご参照ください。 [データ分類]：フィールドのデータ分類を選択します。データ分類を作成するには、「データ分類を作成する」をご参照ください。 [データ秘密度レベル]: データ分類を選択すると、システムがデータ秘密度レベルを自動的に識別します。「アクション」列では、フィールドを[削除]することもできます。説明フィールドの削除は元に戻すことができません。
③ [一括操作]	複数のテーブルフィールドを選択して、次の一括操作を実行できます。 [削除]：アイコンをクリックして、選択したデータフィールドを削除します。 [ルートワードの命名]: アイコンをクリックします。システムは description フィールドをトークン化し、既存のルートワードと照合してフィールド名を推奨します。 [ルートワードの命名] ダイアログボックスで、選択したフィールドの名前を更新された値に置き換えることができます。説明推奨フィールド名がニーズに合わない場合は、[変更後のフィールド名] 入力ボックスで変更できます。 [リセット] をクリックして、[変更後のフィールド名] をシステムが一致させたルートワードに戻します。 [データ標準]: アイコンをクリックします。システムはフィールド名に基づいてデータ標準を推奨します。[データ標準] ダイアログボックスで、推奨される標準をフィールドに適用できます。

フィールドを追加した後、[次へ] をクリックします。

GaussDB (DWS)/AnalyticDB for PostgreSQL

セクション	説明
① [フィールドリストの操作]	[Search]：フィールド名でフィールドを検索できます。 [Edit DDL]：現在の物理テーブルの DDL ステートメントを編集します。データフィールドの追加: [フィールドの追加] をクリックし、新しい行に [フィールド名]、[データ型 (長さ)]、[説明] を入力します。ステートメントからインポート: CREATE TABLE ステートメントを使用して新しいフィールドをインポートします。[ステートメントからインポート] をクリックします。[ステートメントからインポート] ダイアログボックスで、ステートメントを入力し、[SQL の解析] をクリックし、解析結果から必要なフィールドを選択し、[追加] をクリックしてインポートします。テーブルからインポート: [テーブルからインポート] をクリックします。[テーブルからインポート] ダイアログボックスで、インポートするソーステーブルとフィールドを選択し、[追加] をクリックします。
② [フィールドリスト]	フィールドリストには、[番号]、[フィールド名]、[データ型 (長さ)]、主キー、NULL 不可、[説明]、[データ標準]、[データ分類]、および [データ機密レベル] が表示されます。 [番号]: フィールドのシーケンス番号です。この番号は、新しいフィールドが追加されるたびに 1 ずつ増加します。 [フィールド名]：テーブルフィールドの名前です。ルートワードのフルネームを入力して検索すると、システムは [ガバナンス] > [データ標準] > [ルートワード] で設定されているルートワードと自動的に照合します。 [データ型 (長さ)]：以下の型から選択するか、必要な型がリストにない場合は手動で型名を入力できます。 [共通タイプ]：text、bigint (int8)、double precision (float)、timestamp without time zone、numeric (decimal) Text：character varying (varchar)、character (char)、json、xml、uuid Numeric：integer (int/int4)、smallint (int2)、real (float4)、money Date/Time：date、time without time zone、time with time zone、timestamp with time zone、interval Other：boolean、bytea、bit、bit varying (varbit) 一部のデータ型では、長さを指定する必要があります。制約は次の通りです。 character varying (varchar)：長さは 1 から 65535 の整数である必要があります。デフォルトは 512 です。 character (char)：長さは 1 から 255 の整数である必要があります。デフォルトは 255 です。 numeric (decimal)：精度は 1 から 38 の整数、スケールは 0 から 18 の整数である必要があります。デフォルトはそれぞれ 38 と 18 です。 timestamp without time zone、timestamp with time zone：精度は 0 から 6 の整数である必要があります。デフォルトは 0 です。 time without time zone、time with time zone：精度は 0 から 6 の整数である必要があります。デフォルトは 0 です。 bit：長さは 1 から 1024 の整数である必要があります。デフォルトは 8 です。 bit varying (varbit)：長さは 1 から 1024 の整数である必要があります。デフォルトは 8 です。 [主キー]：このオプションは、データ型が text、character varying (varchar)、bigint (int8)、smallint (int2)、または integer(int/int4) の場合にのみ使用できます。複数のフィールドを選択して複合主キーを作成できます。 [NULL 不可]：フィールドに NULL 値を含めることができるかどうかを指定します。 [説明]: フィールドの説明。最大長: 512 文字。 [データ標準]: フィールドのデータ標準を選択します。標準を作成するには、「データ標準の作成と管理」をご参照ください。 [データ分類]：フィールドのデータ分類を選択します。データ分類を作成するには、「データ分類を作成する」をご参照ください。 [データ機密度レベル]：データ分類を選択すると、システムが自動的にデータ機密度レベルを識別します。 [操作] 列でフィールドを [削除] することもできます。説明フィールドの削除は元に戻すことができません。
③ [一括操作]	複数のテーブルフィールドを選択して、次の一括操作を実行できます。 [削除]: アイコンをクリックして、選択したデータフィールドを削除します。 [ルートワードの命名]: アイコンをクリックします。システムが description フィールドをトークン化し、既存のルートワードと照合してフィールド名を推奨します。[ルートワードの命名] ダイアログボックスで、選択したフィールドの名前を更新された値に置き換えることができます。説明推奨されるフィールド名がニーズに合わない場合は、[変更後のフィールド名] 入力ボックスで変更できます。 [リセット] をクリックして、[変更後のフィールド名] をシステムで一致したルートワードに戻します。 [データ標準]：アイコンをクリックします。システムは、フィールド名に基づいてデータ標準を推奨します。[データ標準] ダイアログボックスでは、推奨される標準をフィールドに適用できます。

ステップ 3：ストレージ

MaxCompute コンピューティングエンジンと Hadoop コンピューティングエンジンのストレージ設定のサポートは、ストレージフォーマットによって異なり、次の表のとおりです。

Hudi

パラメーター	説明
[データ更新タイプ] (オプション)	[タイプ] には、[cow (コピーオンライト)] または [mor (マージオンリード)] を選択します。
[プライマリキーと preCombine フィールド] (オプション)	[primaryKey]：プライマリーキーを 1 つ以上選択します。フィールドリストから任意のフィールドを選択できます。複数のプライマリーキーを選択した場合、選択した順にソートされます。 [preCombineField]：pre-combine フィールドとして使用するフィールドを選択します。フィールドリストから任意のフィールドを選択できます。
[データ分散]	[パーティション] を有効化または無効化します。この機能はデフォルトでは無効になっています。パーティションを有効にする場合、フィールド一覧から [パーティション化の基準] として 1 つ以上のフィールドも選択する必要があります。説明 [Partitioned By] では、リストからすべてのフィールドを選択することはできません。
[ロケーション] (オプション)	[ロケーション] フィールドにストレージパスを入力します。このパスはグローバル変数をサポートし、512 文字までです。説明 `CREATE TABLE` ステートメントに `location` 句が含まれている場合、テーブルは外部テーブルとして作成されます。この場合、`external` キーワードは省略できます。

パラメーターを設定した後、[送信] をクリックします。[送信] ダイアログボックスで、テーブルを作成するための SQL ステートメントを確認して、[OKして送信] をクリックします。

SQL で Hudi テーブルを編集するための DDL ステートメントについては、「SQL DDL」および「スキーマ進化」をご参照ください。

説明

[Location] を空のままにした場合、CREATE TABLE ステートメントには location 句が含まれません。
Hadoop コンピューティングエンジン は Spark SQL を使用します。Lindorm コンピューティングエンジン および Databricks は、コンピューティングソースのデフォルト SQL ダイアレクトを使用します。

Delta (Delta Lake)

パラメーター	説明
[データ分散]	[Liquid Clustering]: [Liquid Clustering] を有効または無効にします。この機能はデフォルトで無効になっています。有効化する場合、フィールドリストから [Cluster By] に 1 つ以上のフィールドを選択する必要もあります。 [パーティション]: [パーティション] を有効または無効にします。この機能は、デフォルトでは無効になっています。パーティションを有効にする場合は、フィールドリストから [パーティション化の基準] として 1 つ以上のフィールドを選択する必要もあります。説明 [リキッドクラスタリング] と [Partition] を同時に有効にすることはできません。 [Partitioned By] では、リストからすべてのフィールドを選択することはできません。
[ロケーション] (オプション)	[場所] フィールドにストレージパスを入力します。グローバル変数がサポートされています。パスは 512 文字を超えることはできません。説明 `CREATE TABLE` ステートメントに `location` 句が含まれている場合、テーブルは外部テーブルとして作成されます。この場合、`external` キーワードは省略できます。

パラメーターを設定した後、[送信] をクリックします。[送信] ダイアログボックスで、テーブルを作成するための SQL 文を確認し、[OKして送信] をクリックします。

SQL で Delta テーブルを編集するための DDL ステートメントについては、「ALTER TABLE」をご参照ください。

説明

[Location] を空のままにした場合、CREATE TABLE ステートメントには location 句が含まれません。
Hadoop コンピューティングエンジン は Spark SQL を使用します。Lindorm コンピューティングエンジン および Databricks は、コンピューティングソースのデフォルト SQL ダイアレクトを使用します。

Iceberg

パラメーター

説明

[パーティション]

この機能はデフォルトで無効になっています。有効にする場合は、[パーティション化の基準] を設定する必要があります。

[パーティションキー]: フィールドリストから複数のフィールドを選択するか、手動で入力できます。複数のフィールドは、コンマ (,) で区切ります。

[ロケーション]

[場所] フィールドにストレージパスを入力します。グローバル変数がサポートされています。パスは 512 文字を超えることはできません。

説明

CREATE TABLE ステートメントに location 句が含まれている場合、テーブルは外部テーブルとして作成されます。この場合、external キーワードは省略できます。

説明

[Location] を空のままにした場合、CREATE TABLE ステートメントには location 句が含まれません。
Hadoop コンピューティングエンジン は Spark SQL を使用します。Lindorm コンピューティングエンジン は、コンピューティングソースのデフォルト SQL ダイアレクトを使用します。

Paimon

パラメーター	説明
[プライマリキー]	1 つ以上のプライマリキーを選択します。選択後、テーブルモードも設定する必要があります。
[テーブルモード]	テーブルモード (データ更新タイプ) には、[MOR]、[COW]、または [MOW] を選択します。
[パーティション]	この機能はデフォルトでは無効になっています。有効にする場合は、[パーティション分割] を設定する必要があります。 [パーティション化の基準]: フィールドリストから 1 つ以上のフィールドを選択できます。
[ロケーション]	[ロケーション] フィールドにストレージパスを入力します。グローバル変数がサポートされています。パスは 512 文字を超えることはできません。説明 `CREATE TABLE` ステートメントに `location` 句が含まれている場合、テーブルは外部テーブルとして作成されます。この場合、`external` キーワードは省略できます。

パラメーターを設定した後、[送信] をクリックします。[送信] ダイアログボックスで、テーブルを作成するための SQL ステートメントを確認し、[OKして送信] をクリックします。

説明

[Location] を空のままにした場合、CREATE TABLE ステートメントには location 句が含まれません。
現在のコンピューティングエンジンが Hadoop コンピューティングエンジン の場合、Spark SQL を使用します。

その他のストレージフォーマット

パラメーター	説明
[ストレージタイプ]	[内部テーブル] または [外部テーブル] を選択します。 [外部テーブル] を選択した場合は、[ロケーション] も設定する必要があります。
[ロケーション]	[ロケーション] フィールドにストレージパスを入力します。グローバル変数がサポートされています。パスは 512 文字を超えることはできません。

説明

現在のコンピューティングエンジンが Hadoop コンピューティングエンジン で、ストレージフォーマットが kudu の場合、Impala SQL を使用します。

MaxCompute

MaxCompute 内部テーブル

パラメーター	説明
[ストレージタイプ]	[内部テーブル] を選択します。
[トランザクションテーブル]	[はい] または [いいえ] を選択します。[はい] を選択した場合は、[プライマリキー] を設定してテーブルを Delta テーブルとして作成することもできます。
[プライマリキー] (オプション)	1 つ以上のプライマリキーを選択します。フィールドリストから任意のフィールドを選択できます。複数のプライマリキーを選択した場合、選択した順序でソートされます。
[ライフサイクル] (オプション)	テーブルの保持期間を日単位で指定します。正の整数を入力するか、プリセット値 ([7]、[14]、[30]、または [360]) を選択できます。

MaxCompute 外部テーブル

パラメーター	説明
[ストレージタイプ]	[外部テーブル] を選択します。
[ストレージフォーマット]	ストレージ形式を選択します。デフォルト値は、開発プラットフォーム - テーブル管理設定における外部テーブルのデフォルトのストレージ形式と一致します。有効な値は [parquet]、[avro]、[rcfile]、[orc]、[textfile]、および [sequencefile] です。
[ロケーション]	[ロケーション] フィールドにストレージパスを入力します。グローバル変数がサポートされています。パスは 512 文字を超えることはできません。

GaussDB (DWS)/AnalyticDB for PostgreSQL

[テーブル制約]: [制約の追加] をクリックして新しい制約行を追加します。[制約タイプ]、[制約設定]、および [遅延可能ストラテジー] を設定する必要があります。

パラメーター	説明
[制約タイプ]	[主キー]、[一意性制約]、または [チェック制約] を選択します。
[制約設定]	[Constraint Type] が [プライマリキー] に設定されている場合：次のいずれかのデータ型を持つ 1 つ以上のフィールドを選択します：`text`、`character varying (varchar)`、`bigint (int8)`、`smallint (int2)`、または `integer (int/int4)`。説明テーブルは 1 つのプライマリキー制約のみをサポートします。フィールドリストからすでにプライマリキーを選択している場合、システムが、選択したフィールドを使用して対応するテーブル制約を自動的に追加します。 [Constraint Type] が [一意性制約] に設定されている場合：1 つ以上のフィールドを選択します。フィールドリストのすべてのフィールドが選択可能です。 [Constraint Type] が [検査制約] に設定されている場合：最大 512 文字の文字列を入力します。
[遅延戦略]	[遅延不可]、[即時]、または[遅延]を選択します。デフォルト値は[遅延不可]です。説明このパラメーターは、制約タイプが [検査制約] の場合はサポートされません。

対応する制約行を削除するには、[削除] アイコンをクリックします。

[分散方式 (Distributed By)] (オプション)：
- AnalyticDB for PostgreSQL コンピューティングエンジンでは、[RANDOMLY]、[BY(<columns>)]、または [REPLICATED] を選択できます。
- GaussDB (DWS) コンピューティングエンジンでは、[REPLICATION]、[ROUNDROBIN]、または [BY HASH(<columns>)] を選択できます。[BY HASH(<columns>)] を選択した場合は、分散フィールドも選択する必要があります。フィールドリストのすべてのフィールドを選択できます。
[パーティション]: [パーティションの追加] をクリックしてパーティションフィールドを追加し、[パーティションタイプ] に基づいてパラメーターを設定します。[削除] アイコンをクリックすると、パーティションフィールドとそのすべてのパーティションデータが削除されます。
- パーティションタイプが LIST または RANGE の場合：
  - [パーティションフィールド]：パーティションフィールドを選択するか、式を手動で入力します。
    AnalyticDB for PostgreSQL コンピューティングエンジン (データベースバージョン 6.x) は、単一列パーティショニングのみをサポートします。AnalyticDB for PostgreSQL コンピューティングエンジン (データベースバージョン 7.x) および GaussDB (DWS) コンピューティングエンジンは、式をサポートします。
  - パーティション名とパーティション値：[追加] アイコンでデータパーティション行を追加し、[削除] アイコンで対応するデータパーティション行を削除します。
    説明
    コンピューティングエンジンが AnalyticDB for PostgreSQL (データベースバージョン 6.x) の場合、システムは自動的にデフォルトパーティションを追加します。このデフォルトパーティションの名前はオプションです。ただし、名前を指定しない場合は、少なくとも 1 つの他のデータパーティションを追加する必要があります。
    コンピューティングエンジンが GaussDB (DWS) の場合、少なくとも 1 つのデータパーティションを追加する必要があります。
    コンピューティングエンジンが AnalyticDB for PostgreSQL (データベースバージョン 7.x) の場合、データパーティションを追加する必要はありません。
    - [パーティション名]：英字、数字、アンダースコア (_) のみを含み、63 文字以内である必要があります。
      説明
      パーティションはそれ自体がテーブルで、完全なパーティションテーブル名のデフォルト形式は {main_table_name}_{partition_level#}_prt_{partition_name} です。
    - [パーティション値]：
      - パーティションタイプが LIST の場合：最大 512 文字の文字列を入力します。値がテキスト型 (例: text、varchar、char) の場合、一重引用符 ('') で囲む必要があります。
      - パーティションタイプが RANGE の場合: [START]、[END]、および [EVERY] を設定する必要があります。最大 512 文字の文字列を入力します。値がテキストタイプ (例: text、varchar、char) の場合、値を一重引用符 (') で囲む必要があります。
        START と END には、[含む] または [含まない] も選択する必要があります。 START のデフォルトは [含む] で、 END のデフォルトは [含まない] です。
      説明
      パーティション値は、パーティションフィールドのデータ型と互換性がある必要があります。
- パーティションタイプが HASH の場合：パーティションフィールドのみを設定する必要があります。データパーティションを設定する必要はありません。パーティションフィールドの設定は、LIST および RANGE の場合と同じです。
説明
- REPLICATED 分散方式のテーブルは、パーティショニングをサポートしません。
- コンピューティングエンジンが GaussDB (DWS) の場合、マルチレベルパーティショニングはサポートされません。
- パーティションタイプとして HASH を選択できるのは、コンピューティングエンジンが AnalyticDB for PostgreSQL (データベースバージョン 7.x) の場合のみです。

データのインポート

オフライン物理テーブルを作成した後、データをインポートできます。

テーブル管理リストで、対象のオフライン物理テーブルをクリックします。名前でテーブルを検索できます。
テーブル詳細ページで、[Import Data] をクリックして [Import Data] ダイアログボックスを開きます。

[Import Data] ダイアログボックスの [Basic configurations] ステップで、データファイルをアップロードし、インポートパラメーターを設定します。

パラメーター	説明
[Upload file]	[Select file] をクリックして、インポートするデータファイルをアップロードします。10 MB までの .txt ファイルと .csv ファイルのみがサポートされています。
[区切り文字]	データファイル内の値を区切る文字です。サポートされている区切り文字は、カンマ (,)、タブ (\t)、縦棒 (\|)、スラッシュ (/) です。カスタム区切り文字も指定できます。
[文字エンコーディング]	アップロードしたデータファイルの文字エンコーディングを選択します。サポートされているエンコーディングは、UTF-8 (BOM なし)、UTF-8 (BOM あり)、GBK、Big5、GB2312、ASCII、UTF-16 です。
[ヘッダー行]	データファイルの 1 行目に列ヘッダーが含まれている場合は、このオプションを選択します。
[ターゲットパーティション]	パーティションテーブルの場合は、[ターゲットパーティション]名を入力する必要があります。

[Next] をクリックします。
[Import Data] ステップで、フィールドマッピングを設定します。
- [マッピング]：
  - [行順マッピング]：ソース列を順序に基づいてターゲットフィールドにマッピングします。
  - [同名マッピング]：名前の一致に基づいてソース列をターゲットフィールドにマッピングします。
- [インポートファイルのデータ列]：ターゲットフィールドをソース列、NULL 値 (NULL)、または固定値にマッピングできます。
[Start Import] をクリックして、インポートプロセスを開始します。

オフライン物理テーブルの編集

オフライン物理テーブルを送信した後、そのプロパティを編集できます。

テーブル管理リストで、ターゲットのオフライン物理テーブルをクリックします。名前でテーブルを検索できます。

テーブル詳細ページで、[Edit] をクリックして [Edit Physical Table] ページを開きます。

編集できるパラメーターはストレージフォーマットによって異なります。詳細については、次の表をご参照ください。

Hudi

タブ	説明
[基本情報]	[Table Name] と [Description] のみ編集できます。パラメーター要件は、オフライン物理テーブルの作成時と同じです。
[フィールドリスト]	Hudi システムフィールドを除き、任意のフィールドの名前とデータ型を編集または削除できます。Hudi システムフィールドには次のものが含まれます： _hoodie_commit_time _hoodie_commit_seqno _hoodie_record_key _hoodie_partition_path _hoodie_file_name 説明フィールド名またはデータ型を変更する場合、またはフィールドを追加または削除する場合、エンジンの設定がこの操作をサポートしていないと、エラーが発生する可能性があります。
[ストレージ設定]	[type]、[プライマリキー]、[preCombineField]、および [Location] のみ編集できます。Location は、テーブルが外部テーブルの場合にのみ編集できます。

編集が完了したら、[Submit] をクリックします。この操作では、コンピューティングソースのデフォルト SQL が使用されます。[Submit] ダイアログボックスで、生成された SQL ステートメントを確認し、[Confirm and Submit] をクリックします。

説明

Hudi テーブルでフィールドの名前変更、削除、またはデータ型の変更を行った際にエンジンがエラーを返した場合は、エンジンサービスプロバイダーに問い合わせてエンジン設定を確認してください。

Delta (Delta Lake)

タブ	説明
[基本情報]	[Table Name] と [Description] のみ編集できます。パラメーター要件は、オフライン物理テーブルの作成時と同じです。
[フィールドリスト]	既存のフィールドを編集または削除でき、新しいフィールドを追加できます。フィールド要件は、オフライン物理テーブルの作成時と同じです。
[ストレージ設定]	データ分散リキッドクラスタリングが有効な場合は、無効にするか、[Cluster By] フィールドを再選択できます。リキッドクラスタリングと Partition がどちらも無効な場合は、リキッドクラスタリングを有効にして [Cluster By] フィールドを指定できます。リキッドクラスタリングと Partition がどちらも無効な場合は、Partition を有効にできません。 Partition が有効な場合は、リキッドクラスタリング、Partition、または [Partitioned By] を変更できません。ストレージロケーション：Location は、外部テーブルの場合にのみ編集できます。

Iceberg

タブ	説明
[基本情報]	[Table Name] と [Description] のみ編集できます。パラメーター要件は、オフライン物理テーブルの作成時と同じです。
[フィールドリスト]	フィールド名とデータ型を編集でき、フィールドを追加または削除できます。説明フィールド名またはデータ型を変更する場合、またはフィールドを追加または削除する場合、エンジンの設定がこの操作をサポートしていないと、エラーが発生する可能性があります。
[ストレージ設定]	テーブルが外部テーブルの場合にのみ、Location を編集できます。

編集が完了したら、[Submit] をクリックします。現在のコンピューティングエンジンが Hadoop コンピューティングエンジン の場合、システムは Spark SQL を使用します。現在のコンピューティングエンジンが Lindorm (compute engine) の場合、システムは コンピューティングソース のデフォルト SQL を使用します。

[Submit] ダイアログボックスで、生成された SQL ステートメントを確認し、[Confirm and Submit] をクリックします。

Paimon

タブ	説明
[基本情報]	[Table Name] と [Description] のみ編集できます。パラメーター要件は、オフライン物理テーブルの作成時と同じです。
[フィールドリスト]	フィールド名とデータ型を編集でき、フィールドを追加または削除できます。説明フィールド名またはデータ型を変更する場合、またはフィールドを追加または削除する場合、エンジンの設定がこの操作をサポートしていないと、エラーが発生する可能性があります。
[ストレージ設定]	テーブルが外部テーブルの場合にのみ、Location を編集できます。

編集が完了したら、[Submit] をクリックします。この操作では Spark SQL が使用されます。[Submit] ダイアログボックスで、生成された SQL ステートメントを確認し、[Confirm and Submit] をクリックします。

MaxCompute

MaxCompute 内部テーブル

タブ	説明
[基本情報]	[Table Name] と [Description] のみ編集できます。パラメーター要件は、オフライン物理テーブルの作成時と同じです。
[フィールドリスト]	既存のフィールドを編集または削除でき、新しいフィールドを追加できます。フィールド要件は、オフライン物理テーブルの作成時と同じです。データ型を変更すると、DDL ステートメントが生成されます。フィールドの NOT NULL チェックボックスをクリアできます。現在のテーブルが内部トランザクションテーブルの場合、プライマリキーフィールドの NOT NULL チェックボックスはクリアできません。 NOT NULL チェックボックスは、クリア (フィールドを NULL 許容にする) のみ可能で、選択はできません。
[ストレージ設定]	[ライフサイクル] を編集できます。要件は、オフライン物理テーブルの作成時と同じです。

MaxCompute 外部テーブル

タブ	説明
[基本情報]	[Table Name] と [Description] のみ編集できます。パラメーター要件は、オフライン物理テーブルの作成時と同じです。
[フィールドリスト]	既存のフィールドを編集または削除でき、新しいフィールドを追加できます。フィールド要件は、オフライン物理テーブルの作成時と同じです。データ型を変更すると、DDL ステートメントが生成されます。 NOT NULL チェックボックスは、クリア (フィールドを NULL 許容にする) のみ可能で、選択はできません。
[ストレージ設定]	[Storage Location] (Location) を編集できます。パラメーター要件は、オフライン物理テーブルの作成時と同じです。

編集が完了したら、[Submit] をクリックします。[Submit] ダイアログボックスで、生成された SQL ステートメントを確認し、[Confirm and Submit] をクリックします。

説明

変更内容に フィールドの削除 や フィールドタイプの変更 などの操作が含まれる場合は、事前に MaxCompute プロジェクトでスキーマ進化を有効にする必要があります：setproject odps.schema.evolution.enable=true;。

GaussDB (DWS)/AnalyticDB for PostgreSQL

タブ	説明
[基本情報]	[Table Name]、[サブジェクトエリア]、および [Description] のみ編集できます。パラメーター要件は、オフライン物理テーブルの作成時と同じです。
[フィールドリスト]	既存のフィールドを編集または削除でき、新しいフィールドを追加できます。フィールド要件は、オフライン物理テーブルの作成時と同じです。データ型を変更すると、DDL ステートメントが生成されます。フィールドの [NOT NULL] オプションを変更できます。ここではプライマリキーを変更できません。プライマリキーを変更する必要がある場合は、テーブルレベル制約を編集してください。
[ストレージ設定]	[テーブルレベル制約] と [分散スタイル] を編集できます。要件は、オフライン物理テーブルの作成時と同じです。パーティション情報については、[アセットインベントリ] > [Object Details] > [Fields] に移動してください。

シングルテナント・マルチエンジン

テーブルからインポート 機能を使用してフィールドリストを設定する場合、同じエンジンタイプのプロジェクトからのみテーブルをインポートできます。

次のステップ

開発モードが Dev-Prod モードの場合、オフライン物理テーブルを公開する必要があります。詳細については、「公開タスクの管理」をご参照ください。
基本モードでは、送信に成功すると、アセットカタログでオフライン物理テーブルを管理できます。詳細については、「アセットカタログ」をご参照ください。