E-MapReduce (EMR) クラスタを DataWorks に登録した後、ビジネス要件に基づいて EMR クラスタの Kyuubi 接続情報を構成できます。カスタムのユーザー名とパスワードのペアを使用して Kyuubi にログインし、関連するタスクを実行できます。このトピックでは、DataWorks で EMR クラスタの Kyuubi 接続情報を構成する方法について説明します。
背景情報
Apache Kyuubi は、データレイククエリエンジンに対して SQL クエリなどのクエリサービスを提供する分散型マルチテナントゲートウェイです。データレイククエリエンジンには、Spark、Flink、Trino などがあります。詳細については、「Kyuubi」をご参照ください。
前提条件
Kyuubi サービスが EMR クラスタに追加されていること。詳細については、「サービスを追加する」をご参照ください。
EMR クラスタが DataWorks の計算リソースとして関連付けられていること。詳細については、「Data Studio:EMR 計算リソースをバインドする」をご参照ください。
Kyuubi 接続情報を構成する
Kyuubi 構成ページに移動します。
SettingCenter ページに移動します。
DataWorks コンソール にログインします。上部のナビゲーションバーで、目的のリージョンを選択します。左側のナビゲーションウィンドウで、 を選択します。表示されたページで、ドロップダウンリストから目的のワークスペースを選択し、[管理センターに移動] をクリックします。
SettingCenter ページの左側のナビゲーションウィンドウで、[計算リソース] をクリックします。
目的の EMR クラスタを見つけ、 をクリックします。Kyuubi 構成 ページが表示されます。
Kyuubi 接続情報を構成します。
画面の指示に従って、ビジネス要件に基づいて「接続モード」パラメーターを設定します。
[Alibaba Cloud EMR クラスタの接続情報]:この接続モードを選択した場合、EMR クラスタの登録時に指定された [デフォルトのアクセス ID] を使用して Kyuubi にログインします。このモードはデフォルトで選択されています。
[カスタム構成情報]:この接続モードを選択した場合、カスタムのユーザー名とパスワードのペアを使用して Kyuubi にログインします。JDBC URL パラメーターの値は、
jdbc:hive2://host:port/;user=<Username for logon>;password=<Password for logon>形式です。説明[カスタム構成情報] を初めて選択すると、EMR クラスタの登録時に構成したアカウント情報に基づいて、JDBC URL パラメーターの値が自動的に入力されます。ビジネス要件に基づいて JDBC URL を変更できます。
EMR クラスタの登録時に「プロキシユーザー情報の受け渡し」を選択した場合、DataWorks で EMR タスクが実行された後、
hive.server2.proxy.userの構成情報が JDBC URL に連結されます。連結ルール:[カスタム構成情報] の JDBC URL にプレースホルダー
DATAWORKS_PROXY_USERが指定されていない場合、プラットフォームは EMR タスクの実行時にhive.server2.proxy.userの構成情報をデフォルトで JDBC URL の末尾に連結します。[カスタム構成情報] の JDBC URL にプレースホルダー
DATAWORKS_PROXY_USERが指定されている場合、プラットフォームは EMR タスクの実行時にプレースホルダーをhive.server2.proxy.userの構成情報に動的に置き換えます。
次のステップ
DataWorks で関連コンポーネント環境を構成し、データ開発操作を実行する方法については、「一般的な開発プロセス」をご参照ください。