アドホッククエリを使用すると、現在のビジネスニーズに基づいてデータをカスタマイズ、実行、およびダウンロードできます。たとえば、コンピューティングタスクを開発した後、アドホッククエリを使用して、期待どおりに動作するかどうかを確認できます。このトピックでは、アドホッククエリを作成して結果をダウンロードする方法について説明します。
背景情報
アドホッククエリタスクは、プロジェクトで指定されたコンピューティングソースを利用します。Hadoop コンピューティングソースを使用する場合、Impala タスクを有効にできます。有効にすると、HIVE_SQL と IMPALA_SQL の両方のアドホッククエリタスクを作成できます。Impala はメモリベースであるため、HIVE_SQL よりも高速なクエリ応答を提供します。Dataphin では、過去のタスクのクエリコードを書き直すことなく、IMPALA_SQL と HIVE_SQL のタスクタイプを簡単に切り替えることができます。詳細については、「付録: タスクタイプを切り替える」をご参照ください。
前提条件
IMPALA_SQL アドホッククエリを作成するには、まず Hadoop コンピューティングソースで [impala タスク] を有効にする必要があります。詳細については、「Hadoop コンピューティングソースを作成する」をご参照ください。
アドホッククエリ結果をダウンロードするには、プロジェクトに必要なダウンロード権限があることを確認してください。詳細については、「プロジェクトの権限とコンピューティングソースを管理する」をご参照ください。
アドホッククエリを作成する
Dataphin ホームページの上部メニューバーから、[開発] > [データ開発] を選択します。
上部メニューバーで、[プロジェクト] を選択し、開発-本番モードの場合は [環境] も選択します。
左側のナビゲーションウィンドウで、[アドホッククエリ] を選択し、
アイコンをクリックして新しいクエリを作成します。[コンピューティングエンジン アドホッククエリ] と [データベース SQL アドホッククエリ] から選択できます。
アドホッククエリを作成する ダイアログボックスで、必要なパラメーターを構成します。
説明コンピューティングエンジンが Hadoop で、[Impala] タスクを有効にしている場合は、[HIVE_SQL アドホッククエリ] と [IMPALA_SQL アドホッククエリ] の両方を作成できます。
パラメーター
説明
[名前]
アドホッククエリの名前を入力します。
長さは 256 文字以下で、縦線 (|)、スラッシュ (/)、バックスラッシュ (\)、コロン (:)、疑問符 (?)、山かっこ (<>)、アスタリスク (*)、または引用符 (") を含めることはできません。
[説明]
アドホッククエリの簡単な説明を入力します。
[ディレクトリを選択]
タスクが保存されるディレクトリを選択します。デフォルトは [一時コード] です。
ディレクトリが作成されていない場合は、次のように [フォルダを作成] できます。
ページ左側のコンピューティングタスクリストの上にある
アイコンをクリックして、[フォルダを作成] ダイアログボックスを開きます。
[フォルダを作成] ダイアログボックスで、フォルダの [名前] を入力し、必要に応じて [ディレクトリ] の場所を選択します。
[確認] をクリックします。
[データソースタイプ]
MySQL、[Oracle]、[AnalyticDB for PostgreSQL]、[AnalyticDB for MySQL 2.0]、[AnalyticDB for MySQL 3.0]、[PostgreSQL]、[ClickHouse]、[Presto]、[StarRocks]、[Doris]、[SelectDB]、[GaussDB (DWS)] データソースタイプをサポートしています。
説明このパラメーターは、[データベース SQL アドホッククエリ] を作成する場合にのみ構成可能です。
[データソース]
アドホッククエリのデータソースを選択します。使用可能なデータソースがない場合は、[+データソースを作成] をクリックして作成できます。
説明このパラメーターは、[データベース SQL アドホッククエリ] を作成する場合にのみ構成可能です。
[確認] をクリックして、アドホッククエリファイルの作成を完了します。
プロジェクトのコンピューティングソースまたはデータベース SQL タイプに応じてクエリコードを記述します。完了したら、エディターの上部にある [実行] をクリックします。
実行後、[コンソール] で正常なクエリ結果を表示します。
結果データをダウンロードする
クエリが実行されたら、コンソールの右上隅にある アイコンをクリックして結果をダウンロードします。
完全なデータセットまたはサンプルをダウンロードできます。
完全データのダウンロード: 完全なデータセットは CSV 形式でダウンロードされ、時間がかかる場合があります。メッセージセンターまたは実行レコードで進捗状況を追跡できます。
重要データベース SQL アドホッククエリは、サンプルデータのダウンロードのみをサポートし、完全なデータセットはサポートしていません。
サンプルデータのダウンロード: サンプルデータのダウンロードの形式と実行レコードは、データダウンロード承認設定に従って設定されます。詳細については、「データダウンロード構成」をご参照ください。
仕様設定でダウンロード承認が必要な場合は、ダウンロードを進める前に [データダウンロードリクエスト] を送信する必要があります。承認されると、承認タスクを確認し、現在の実行結果を表示するか、実行レコードからデータを取得できます。詳細については、「データダウンロード承認構成」をご参照ください。
データダウンロード承認ウォーターマーク機能が有効になっている場合、ダウンロードされた Excel ファイルにウォーターマークが自動的に適用されます。データダウンロードファイルは 30日間 利用可能です。たとえば、データクエリ日が 2023-04-12 で、リクエスト日が 2023-04-13 の場合、ファイルは 2023-05-13 に有効期限切れになります。詳細については、「データダウンロード承認構成」をご参照ください。
付録: タスクタイプを切り替える
Hadoop コンピューティングソースと有効な Impala タスクを使用すると、IMPALA_SQL と HIVE_SQL のタスクタイプを切り替えることができます。
アドホッククエリリストで、目的のタスクを選択し、タスク名の横にある
アイコンをクリックして、[タイプの変更] を選択します。
[タイプの変更] ダイアログボックスで、新しいタイプを選択します。次の図は、IMPALA_SQL から HIVE_SQL タスクタイプへの切り替えを示しています。
[確認] をクリックして切り替えを完了します。