MaxCompute、EMR Hive、Hologres などのデータソースから、SQL ステートメントを用いて素早くデータをクエリおよび分析します。本トピックでは、データソースに対する SQL クエリの実行方法について説明します。
本ドキュメントは、DataAnalysis の新バージョンに適用されます。旧バージョンについては、「SQL クエリ(旧)」をご参照ください。ナビゲーションバーから、新バージョンと旧バージョンの DataAnalysis を切り替えることができます。
サポートされるデータソース
SQL クエリは、以下のデータソースタイプをサポートしています:MaxCompute、Hologres、EMR、CDH、ADB for PostgreSQL、ADB for MySQL、ClickHouse、StarRocks、MySQL、PostgreSQL、Oracle、SQL Server、Doris、および SelectDB。
直接接続およびデータソース接続の両方をサポートするのは MaxCompute のみです。その他のすべてのデータソースタイプは、ワークスペースに追加済みのデータソースへの接続のみをサポートします。
データソースの権限
データソースの範囲
データソース 接続モード:適切な権限を持つワークスペース内のデータソースからのみデータを選択できます。ワークスペース管理者が、まず ワークスペースへの追加 を実行し、ご利用の Alibaba Cloud アカウントを データアナリスト、開発者、O&M エンジニア、または ワークスペース管理者 として設定する必要があります。
直接接続 モード:現在ログイン中の Alibaba Cloud アカウントが参加している MaxCompute プロジェクトのみを選択できます。MaxCompute プロジェクトの権限に関する詳細は、「MaxCompute のユーザーおよび権限」をご参照ください。
データソースへのアクセス権限
データソースへのアクセスには、以下の 2 種類の ID モードのいずれかを使用します。
アクセス ID モード | 説明 | サポート対象のデータソース | 権限付与 |
実行者 ID | 現在 DataWorks にログイン中の Alibaba Cloud アカウントの ID。 | MaxCompute および Hologres。 | 指定された MaxCompute プロジェクト または Hologres インスタンス の管理者に、メンバーとしてのアクセス権限を付与してもらう必要があります。 |
データソースのデフォルトアクセス ID | データソース作成時に設定されたアクセス ID。 | 本機能で サポートされるすべてのデータソース。 | 現在のアカウントがデータソースのデフォルトアクセス ID でない場合、ワークスペース管理者 権限を持つユーザーに、現在の Alibaba Cloud アカウントへの権限付与 を依頼してください。 |
MaxCompute プロジェクトで IP アドレスホワイトリストが有効になっている場合、DataAnalysis ホワイトリスト を MaxCompute プロジェクトの IP アドレスホワイトリストに追加してください。
機能へのアクセス
DataWorks データ分析コンソール にログインし、ターゲットリージョンに切り替えた後、データ分析へ移動 をクリックします。
ナビゲーションバーに 新データ分析へ移動 が表示されている場合は、これをクリックして新バージョンに切り替えます。
ナビゲーションバーに 旧データ分析に戻る が表示されている場合は、すでに新バージョンのページにいます。
SQL クエリの作成
上にマウスを合わせ、右側の をクリックします。
SQL クエリファイル用にカスタムフォルダー構造を作成するには、「新しいフォルダー」をクリックすることもできます。
SQL エディター画面で、SQL クエリ文を作成します。
重要以下の方法でも SQL 文を生成できます:
データカタログの追加 後、データカタログページで対象テーブルを検索し、右クリックして クエリ SQL の生成 を選択します。
共有ファイル フォルダーから、他者と共有された SQL クエリをコピーします。
SQL の編集後、上部の フォーマット ボタンをクリックしてコードを整形します。
SQL クエリは Copilot をサポートしています。ナビゲーションバー右上隅の Copilot アイコン (
) をクリックすると、コード生成 や コード修正 などの機能を利用でき、コード作成を支援します。また、エディター内での自動コード補完もサポートしており、作成効率を向上させます。
SQL クエリコードを作成した後、右側の 実行設定 をクリックします。SQL クエリの データソース、スクリプトパラメーター およびその他の設定を構成します。

タイプ:必要に応じて、SQL クエリの対象となる データソースタイプ を選択します。
計算リソース:SQL クエリの対象となるデータソースを構成します。MaxCompute クエリのみが直接接続およびデータソース接続をサポートします。その他のデータソースタイプは、権限を持つワークスペース内のデータソースからのみデータをクエリできます。権限に関する詳細は、「データソースの権限」をご参照ください。
スクリプトパラメーター:SQL クエリにパラメーター変数が含まれる場合、ランタイムで値を割り当てます。
重要解析に失敗した場合は、左下の「管理 > 設定」に移動し、「parsing」と入力して検索し、「DataWorks Isp コードパラメーター機能の有効化」設定項目を有効化してください。
SQL エディター ページの上部にあるツールバーで、[実行] をクリックします。[実行] ボタンの右側にあるドロップダウンアイコン
をクリックして実行モードを切り替え、シナリオに基づいてモードを選択します。実行モード
利用シーン
トリガー条件
対応エンジン
クエリモード(LIMIT 10000)
データの素早いプレビューおよびクエリロジックの検証。 少量の結果サンプルのみが必要な初期データ探索に適しています。
クエリ結果の表示行数 ≤ 10,000 行、サイズ ≤ 10 MB
制限なし
需要モード(完全データ)
分析またはエクスポート用の完全な結果セットの取得。 全データを処理・閲覧する必要がある場合、システムが自動的にこのモードを起動します。
クエリ結果の表示行数 > 10,000 行、またはサイズ > 10 MB
制限なし
一時テーブルモード
マルチステップの複雑なクエリで結果を再利用。 1 つのクエリの出力を次のクエリの入力として使用することで、開発およびデバッグ効率を向上させます。
クエリ結果の表示行数 ≤ 10,000 行、サイズ ≤ 10 MB であり、自動的に一時テーブルに書き込まれます
MaxCompute のみ
SQL 実行が完了すると、クエリ結果ページで 運用ログ、結果、および対応する SQL コンテンツを確認できます。
クエリ結果の右上隅にあるボタンをクリックすると、ページレイアウトを横並び表示と上下表示の間で切り替えることができます。
クエリ結果の可視化
クエリ結果の左側ツールバーで、
ボタンをクリックすると、結果から自動的に可視化チャートが生成されます。
チャート上部の Copilot ボタンをクリックすると、DataWorks Copilot のインテリジェントチャートおよびインサイト生成 機能を利用できます。
チャートの編集 ボタンをクリックすると、チャートスタイルを調整できます。

エクスポートおよび共有
データをローカルファイルにエクスポートしてから別のデータソースにインポートするには、Data Integration の オフライン同期タスク を使用します。この方法により、より効率的かつ安定したデータ移行および同期が実現します。
SQL クエリ結果の右側で、エクスポート をクリックします。以下のエクスポートオプションがサポートされています:
ローカルファイル:クエリ結果を CSV 形式でローカルコンピューターにダウンロードします。主なポイントは以下のとおりです:
項目
説明
ダウンロード制限
MaxCompute および EMR エンジンのみがサポートされます。詳細については、「データダウンロード制限」をご参照ください。
MaxCompute プロジェクトで データ保護メカニズム(データダウンロードを禁止)が有効になっている場合、DataAnalysis によるデータダウンロードは失敗します。
ダウンロード範囲
テーブルに表示されているデータのみ または すべてのデータ を選択できます。
テーブルに表示されているデータのみ:現在のページに表示されているデータのみをダウンロードします(デフォルト最大
10000行)。すべてのデータ:エクスポート制限内のすべてのクエリ結果をエクスポートします。
ダウンロード方法
承認ありダウンロード および 承認なしダウンロード をサポートします。
承認ありダウンロード:設定可能な Fraud Detection ルール を用いて、データダウンロード操作におけるリスクを特定できます。ダウンロード時には、データのコンプライアンスおよびセキュリティを確保するために、ダウンロード承認リクエストを提出する必要があります。
説明Fraud Detection ルールの設定および有効化は、DataWorks Enterprise Edition のみがサポートします。
承認なしダウンロード: デフォルトの方法です。ダウンロードプロセス中に権限リクエストは不要です。
Object Storage Service (OSS):クエリ結果を、CSV や Parquet などの指定フォーマットで、Alibaba Cloud Object Storage Service (OSS) バケットにエクスポートします。大量のデータ量のアーカイブや、他のクラウド製品との統合に適しています。
本機能を初めて使用する場合、DataWorks が OSS リソースにアクセスできるよう、事前に権限を付与する必要があります。[ファイルパス] のドロップダウンリストで、プロンプト内の [ワンクリック認可] リンクをクリックし、画面上の指示に従って RAM 認可を完了してください。
設定項目
説明
ファイルパス
右側のフォルダーボタンをクリックして、結果ファイルを保存する OSS バケットおよびディレクトリを選択します。
ファイル名
システムが自動的にファイル名を生成します。手動で変更することもできます。
テキスト形式
エクスポートするファイル形式を選択します。サポートされる形式には、
csv、text、orc、およびparquetがあります。区切り文字
列間のデリミタを指定します。デフォルトはカンマ (
,) です。エンコード形式
ファイルのエンコード形式を選択します(例:
UTF-8、GBK)。CU
本エクスポートタスクの計算ユニット(CU)数を構成します。デフォルト値は 1 CU です。
リソースグループ
本エクスポートタスクを実行する Serverless リソースグループを選択します。選択しない場合、データ分析 > システム管理 で設定されたデータ統合リソースグループがデフォルトで使用されます。
構成を完了したら、OK をクリックしてエクスポートタスクを開始します。タスク実行ページで、エクスポートの進行状況、運用ログ、および構成詳細を確認できます。タスクが成功した後、OSS コンソールに移動して、エクスポートされたオブジェクトファイルをローカルコンピューターにダウンロードしてください。
DingTalk Sheet:結果を DingTalk Sheet にエクスポートできます。
ワークブック/ワークブックの共有:結果をワークブックに保存して、クエリデータのさらなる 分析 に活用できます。また、ワークブック から最新の分析結果を他のユーザーと共有することもできます。