Trino サービスを含むクラスターを作成した後、CLI を使用して Trino に接続し、簡単かつ迅速にデータをクエリできます。
前提条件
Trino サービスを含む E-MapReduce(EMR)クラスターが作成されていること。クラスターの作成方法の詳細については、「クラスターの作成」をご参照ください。
制限事項
クラスターに対して Ranger 認証と Kerberos 認証を同時に有効にすることはできません。
DataLake クラスターとカスタムクラスター
クラスターの作成時に [kerberos 認証] を有効にすると、クラスターは高セキュリティクラスターになります。有効にしない場合、クラスターは共通クラスターになります。
共通クラスター
SSH モードでクラスターにログオンします。詳細については、「クラスターへのログオン」をご参照ください。
次のコマンドを実行して Trino CLI に接続します。
説明クラスターが EMR V3.44.0 以降のマイナーバージョン、または EMR V5.10.0 以降のマイナーバージョンの場合、サービス名は Trino です。クラスターが EMR V3.44.0 または EMR V5.10.0 より前のマイナーバージョンの場合、サービス名は Presto です。
EMR V3.44.0、EMR V5.10.0、または EMR V3.44.0 もしくは EMR V5.10.0 以降のマイナーバージョン
trino --server master-1-1:9090EMR V3.44.0 または EMR V5.10.0 より前のマイナーバージョン
presto --server master-1-1:9090次のステートメントを実行してテーブルデータを表示します。
select * from <catalog>.<schema>.<table>;上記のステートメントのパラメーター:
<catalog>:接続するデータソースの名前を指定します。<schema>:使用するデータベースの名前を指定します。<table>は、データのクエリ元のテーブルの名前を指定します。たとえば、Hive のデフォルトデータベースの
testテーブルからデータをクエリする場合、select * from hive.default.test;ステートメントを実行できます。
オプション。
quit;コマンドを実行して Trino CLI を終了します。
高セキュリティクラスター
SSH モードでクラスターにログオンします。詳細については、「クラスターへのログオン」をご参照ください。
次のコマンドを実行して Trino CLI に接続します。
EMR V3.44.0、EMR V5.10.0、または EMR V3.44.0 もしくは EMR V5.10.0 以降のマイナーバージョン
trino --server https://${FQDN}:7778 \ --krb5-config-path /etc/krb5.conf \ --keystore-path /etc/emr/trino-conf/keystore \ --keystore-password ${pwd} \ --krb5-keytab-path /etc/emr/trino-conf/trino.keytab \ --krb5-principal trino/${FQDN}@${REALM} \ --krb5-remote-service-name trino \ --user trino/${FQDN} --catalog ${CATALOG}EMR V3.44.0 または EMR V5.10.0 より前のマイナーバージョン
説明クラスターが EMR V3.44.0 以降のマイナーバージョン、または EMR V5.10.0 以降のマイナーバージョンの場合、サービス名は Trino です。クラスターが EMR V3.44.0 または EMR V5.10.0 より前のマイナーバージョンの場合、サービス名は Presto です。
presto --server https://${FQDN}:7778 \ --krb5-config-path /etc/krb5.conf \ --keystore-path /etc/emr/trino-conf/keystore \ --keystore-password ${pwd} \ --krb5-keytab-path /etc/emr/trino-conf/trino.keytab \ --krb5-principal trino/${FQDN}@${REALM} \ --krb5-remote-service-name trino \ --user trino/${FQDN}パラメーター
説明
${FQDN}master-1-1 ノードの完全修飾ドメイン名(FQDN)。FQDN は、
master-1-1.c-xxxxxxx.cn-xxxxxx.emr.aliyuncs.com形式である必要があります。hostname -fコマンドを実行して FQDN を取得できます。--krb5-config-pathconfig.properties ファイルの
http.authentication.krb5.configパラメーターの値。値は/etc/krb5.confに固定されています。--keystore-pathconfig.properties ファイルの
http-server.https.keystore.pathパラメーターの値。値は/etc/emr/trino-conf/keystoreに固定されています。--keystore-passwordconfig.properties ファイルの
http-server.https.keystore.keyパラメーターの値。この例では、値は ${pwd} です。master-1-1 ノードでawk -F= '/http-server.https.keystore.key/{print $2}' ${TRINO_CONF_DIR}/config.propertiesコマンドを実行して値を取得できます。--krb5-keytab-pathconfig.properties ファイルの
http-server.authentication.krb5.keytabパラメーターの値。値は/etc/emr/trino-conf/trino.keytabに固定されています。${REALM}config.properties ファイルの
http-server.authentication.krb5.user-mapping.patternパラメーターの値。値は自分で取得する必要があります。Kerberos レルムはEMR.C-XXXXXX.COM形式です。--krb5-remote-service-nameconfig.properties ファイルの
http-server.authentication.krb5.service-nameパラメーターの値。値はtrinoに固定されています。${CATALOG}接続するデータソースの名前。たとえば、
--catalog hiveは Hive データソースを示します。次のコマンドを実行して、既存のカタログに含まれるスキーマを表示します。
show schemas;オプション。
quit;コマンドを実行して Trino CLI を終了します。
Hadoop クラスター
参照
JDBC を使用して Trino に接続し、複雑なデータのクエリ、分析、処理、またはクエリ結果を Java アプリケーションに統合できます。詳細については、「JDBC の使用」をご参照ください。