StarRocks 3.1 以降では、Paimon カタログがサポートされています。Paimon カタログは外部カタログです。 Paimon カタログを使用して、Paimon 内のデータをクエリできます。このトピックでは、E-MapReduce(EMR)StarRocks クラスターで Paimon カタログを作成し、Paimon カタログを使用して Paimon 内のデータをクエリする方法について説明します。
前提条件
制限事項
上記のクラスターは、同じ仮想プライベートクラウド(VPC)およびゾーンにデプロイされている必要があります。
Paimon カタログの作成
構文
CREATE EXTERNAL CATALOG <catalog_name>
PROPERTIES
(
"key"="value",
...
);パラメーターの説明
catalog_name: Paimon カタログの名前。このパラメーターは必須です。名前は次の要件を満たしている必要があります。名前に使用できるのは、英字、数字、およびアンダースコア(_)です。名前は英字で始める必要があります。
名前は 1 ~ 64 文字である必要があります。
PROPERTIES: Paimon カタログのプロパティ。このパラメーターは必須です。説明StarRocks の Paimon カタログは、ネイティブ Paimon API のカタログと 1 対 1 のマッピング関係にあります。2 つのタイプのカタログの設定項目の名前と意味は同じです。
プロパティ
必須
説明
type
はい
データソースのタイプ。値を paimon に設定します。
paimon.catalog.type
はい
Paimon が使用するメタデータストレージタイプ。有効な値:
hive: Hive メタストアを使用してメタデータを保存します。filesystem: ファイルシステムを使用してメタデータを保存します。dlf: Data Lake Formation(DLF)を使用してメタデータを保存します。
paimon.catalog.warehouse
はい
ウェアハウスが存在するパス。HDFS パスと OSS パスがサポートされています。
hive.metastore.uris
いいえ
Hive Metastore の Uniform Resource Identifier(URI)。
paimon.catalog.typeをhiveに設定した場合、このパラメーターは必須です。値はthrift://<Hive メタストアの IP アドレス>:<ポート番号>の形式で指定します。デフォルトのポート番号は 9083 です。aliyun.oss.endpoint
いいえ
OSS のエンドポイント。 paimon.catalog.warehouse パラメーターの値を OSS パスに設定した場合、このパラメーターは必須です。
dlf.catalog.id
いいえ
DLF データカタログの ID。このパラメーターは、paimon.catalog.type パラメーターを dlf に設定した場合にのみ必須です。
dlf.catalog.idパラメーターを設定しない場合は、デフォルトの DLF カタログが使用されます。
例
paimon_catalog という名前の Paimon カタログを作成するには、次のステートメントを実行します。 paimon.catalog.type パラメーターは dlf に設定されています。
CREATE EXTERNAL CATALOG paimon_catalog
PROPERTIES
(
"type" = "paimon",
"paimon.catalog.type" = "dlf",
"paimon.catalog.warehouse" = "oss://<yourBucketName>/<yourPath>/",
);Paimon テーブルのデータのクエリ
データベースの特定のテーブルのデータをクエリするには、次のステートメントを実行します。
SELECT * FROM <catalog_name>.<database_name>.<table_name>;参照
Paimon の詳細については、「OpenEvent」をご参照ください。