Hive カタログは外部カタログです。 Hive カタログを使用して、Hive 内のデータをクエリできます。 このトピックでは、E-MapReduce(EMR)StarRocks クラスターで Hive カタログを作成し、Hive カタログを使用して Hive 内のデータをクエリする方法について説明します。
前提条件
制限事項
上記のクラスターは、同じ仮想プライベートクラウド(VPC)およびゾーンにデプロイする必要があります。
Hive カタログを作成する
構文
CREATE EXTERNAL CATALOG <catalog_name>
PROPERTIES
(
"key"="value",
...
);パラメーターの説明
catalog_name: Hive カタログの名前。 このパラメーターは必須です。 名前は次の要件を満たしている必要があります。名前に使用できるのは、英字、数字、およびアンダースコア(_)です。 名前の先頭は英字にする必要があります。
名前は 1 ~ 64 文字にする必要があります。
PROPERTIES: Hive カタログのプロパティ。 このパラメーターは必須です。 このパラメーターの構成は、Hive データソースで使用されるメタデータサービスによって異なります。 以下では、さまざまなメタデータサービスに対して構成できるプロパティについて説明します。プロパティ
必須
説明
typeはい
データソースのタイプ。 値を
hiveに設定します。hive.metastore.urisいいえ
Hive Metastore サービスの URI。
thrift://<Hive Metastore サービスの IP アドレス>:<ポート番号>の形式で値を指定します。 デフォルトのポート番号は 9083 です。 Data Lake Formation(DLF)を使用してメタデータを保存する場合、このパラメーターは空のままにすることができます。hive.metastore.typeいいえ
Metastore のタイプ。 デフォルトでは、このパラメーターは空のままです。 これは、Hive Metastore サービスを使用してメタデータが保存されることを示します。 DLF を使用してメタデータを保存する場合は、値を
dlfに設定します。dlf.catalog.idいいえ
データを読み取る DLF カタログの ID。 このパラメーターは、
hive.metastore.typeパラメーターをdlfに設定した場合にのみ必須です。 このパラメーターを構成しない場合は、デフォルトの DLF カタログの ID が使用されます。
例
hive_catalog という名前の Hive カタログを作成するには、次のステートメントを実行します:
CREATE EXTERNAL CATALOG hive_catalog
PROPERTIES
(
"type" = "hive",
"hive.metastore.uris" = "thrift://xx.xx.xx.xx:9083"
);Hive テーブルのデータのクエリ
次のステートメントを実行して、データベースの特定のテーブルのデータをクエリできます。
SELECT * FROM <catalog_name>.<database_name>.<table_name>;参考資料
Hive の詳細については、「Hive」をご参照ください。