すべてのプロダクト
Search
ドキュメントセンター

Dataphin:データのクエリとダウンロード

最終更新日:Mar 06, 2025

アドホッククエリを使用すると、現在のビジネスニーズに基づいてデータをカスタマイズ、実行、およびダウンロードできます。たとえば、コンピューティングタスクを開発した後、アドホッククエリを使用して、期待どおりに動作するかどうかを確認できます。このトピックでは、アドホッククエリを作成して結果をダウンロードする方法について説明します。

背景情報

アドホッククエリタスクは、プロジェクトで指定されたコンピューティングソースを利用します。Hadoop コンピューティングソースを使用する場合、Impala タスクを有効にできます。有効にすると、HIVE_SQL と IMPALA_SQL の両方のアドホッククエリタスクを作成できます。Impala はメモリベースであるため、HIVE_SQL よりも高速なクエリ応答を提供します。Dataphin では、過去のタスクのクエリコードを書き直すことなく、IMPALA_SQL と HIVE_SQL のタスクタイプを簡単に切り替えることができます。詳細については、「付録: タスクタイプを切り替える」をご参照ください。

前提条件

IMPALA_SQL アドホッククエリを作成するには、まず Hadoop コンピューティングソースで [impala タスク] を有効にする必要があります。詳細については、「Hadoop コンピューティングソースを作成する」をご参照ください。

アドホッククエリ結果をダウンロードするには、プロジェクトに必要なダウンロード権限があることを確認してください。詳細については、「プロジェクトの権限とコンピューティングソースを管理する」をご参照ください。

アドホッククエリを作成する

  1. Dataphin ホームページの上部メニューバーから、[開発] > [データ開発] を選択します。

  2. 上部メニューバーで、[プロジェクト] を選択し、開発-本番モードの場合は [環境] も選択します。

  3. 左側のナビゲーションウィンドウで、[アドホッククエリ] を選択し、image アイコンをクリックして新しいクエリを作成します。[コンピューティングエンジン アドホッククエリ][データベース SQL アドホッククエリ] から選択できます。

  4. アドホッククエリを作成する ダイアログボックスで、必要なパラメーターを構成します。

    説明

    コンピューティングエンジンが Hadoop で、[Impala] タスクを有効にしている場合は、[HIVE_SQL アドホッククエリ][IMPALA_SQL アドホッククエリ] の両方を作成できます。

    パラメーター

    説明

    [名前]

    アドホッククエリの名前を入力します。

    長さは 256 文字以下で、縦線 (|)、スラッシュ (/)、バックスラッシュ (\)、コロン (:)、疑問符 (?)、山かっこ (<>)、アスタリスク (*)、または引用符 (") を含めることはできません。

    [説明]

    アドホッククエリの簡単な説明を入力します。

    [ディレクトリを選択]

    タスクが保存されるディレクトリを選択します。デフォルトは [一時コード] です。

    ディレクトリが作成されていない場合は、次のように [フォルダを作成] できます。

    1. ページ左側のコンピューティングタスクリストの上にある image アイコンをクリックして、[フォルダを作成] ダイアログボックスを開きます。

    2. [フォルダを作成] ダイアログボックスで、フォルダの [名前] を入力し、必要に応じて [ディレクトリ] の場所を選択します。

    3. [確認] をクリックします。

    [データソースタイプ]

    MySQL、[Oracle][AnalyticDB for PostgreSQL][AnalyticDB for MySQL 2.0][AnalyticDB for MySQL 3.0][PostgreSQL][ClickHouse][Presto][StarRocks][Doris][SelectDB][GaussDB (DWS)] データソースタイプをサポートしています

    説明

    このパラメーターは、[データベース SQL アドホッククエリ] を作成する場合にのみ構成可能です。

    [データソース]

    アドホッククエリのデータソースを選択します。使用可能なデータソースがない場合は、[+データソースを作成] をクリックして作成できます。

    説明

    このパラメーターは、[データベース SQL アドホッククエリ] を作成する場合にのみ構成可能です。

  5. [確認] をクリックして、アドホッククエリファイルの作成を完了します。

  6. プロジェクトのコンピューティングソースまたはデータベース SQL タイプに応じてクエリコードを記述します。完了したら、エディターの上部にある [実行] をクリックします。

  7. 実行後、[コンソール] で正常なクエリ結果を表示します。

結果データをダウンロードする

クエリが実行されたら、コンソールの右上隅にある image アイコンをクリックして結果をダウンロードします。

完全なデータセットまたはサンプルをダウンロードできます。

  • 完全データのダウンロード: 完全なデータセットは CSV 形式でダウンロードされ、時間がかかる場合があります。メッセージセンターまたは実行レコードで進捗状況を追跡できます。

    重要

    データベース SQL アドホッククエリは、サンプルデータのダウンロードのみをサポートし、完全なデータセットはサポートしていません。

  • サンプルデータのダウンロード: サンプルデータのダウンロードの形式と実行レコードは、データダウンロード承認設定に従って設定されます。詳細については、「データダウンロード構成」をご参照ください。

説明
  • 仕様設定でダウンロード承認が必要な場合は、ダウンロードを進める前に [データダウンロードリクエスト] を送信する必要があります。承認されると、承認タスクを確認し、現在の実行結果を表示するか、実行レコードからデータを取得できます。詳細については、「データダウンロード承認構成」をご参照ください。

  • データダウンロード承認ウォーターマーク機能が有効になっている場合、ダウンロードされた Excel ファイルにウォーターマークが自動的に適用されます。データダウンロードファイルは 30日間 利用可能です。たとえば、データクエリ日が 2023-04-12 で、リクエスト日が 2023-04-13 の場合、ファイルは 2023-05-13 に有効期限切れになります。詳細については、「データダウンロード承認構成」をご参照ください。

付録: タスクタイプを切り替える

Hadoop コンピューティングソースと有効な Impala タスクを使用すると、IMPALA_SQL と HIVE_SQL のタスクタイプを切り替えることができます。

  1. アドホッククエリリストで、目的のタスクを選択し、タスク名の横にある image アイコンをクリックして、[タイプの変更] を選択します。

  2. [タイプの変更] ダイアログボックスで、新しいタイプを選択します。次の図は、IMPALA_SQL から HIVE_SQL タスクタイプへの切り替えを示しています。image.png

  3. [確認] をクリックして切り替えを完了します。