DataWorks Agent は Model Context Protocol (MCP) に基づいています。DataWorks MCP Server や Hologres MCP Server などの他のビッグデータ MCP Server に接続し、自然言語を使用して DataWorks でデータ開発、タスク O&M、データ統合などのタスクを実行します。
この機能はサードパーティクライアントを介してアクセスされます。より合理化されたエージェントエクスペリエンスについては、「DataWorks Agent」をご参照ください。
仕組み
DataWorks Agent を使用すると、インテリジェントチャットウィンドウで自然言語を使用してビッグデータ開発タスクを実行できます。エージェントは大規模言語モデル (LLM) を使用してリクエストを解析し、MCP Server の機能をインテリジェントに呼び出してタスクを実行します。
たとえば、DataWorks Agent のチャットウィンドウで「ワークスペースはいくつありますか?」と質問できます。エージェントは LLM を使用してこのリクエストを解析し、DataWorks MCP Server が提供する ListProjects ツールを呼び出します。このツールは DataWorks OpenAPI 上に構築されており、結果を取得します。より複雑なタスクの場合、LLM は MCP Server と複数回やり取りする場合があります。
DataWorks Agent は DataWorks MCP Server と統合するだけでなく、他の MCP Server への接続もサポートしています。また、Qwen、DeepSeek、OpenAI など、独自の LLM を選択することもできます。
DataWorks Agent がサポートするより多くのタスクシナリオを探索するために、次のプロンプトを試すこともできます。
範囲 | プロンプト例 |
データ開発 | [タスクのクエリ] 現在のワークスペースのプロジェクトディレクトリで、スケジューリングタイプが「一時停止」のすべての |
[タスクの名前変更] 上記で見つかったノードの名前を「invalid_node_to_delete」に変更します。複数のノードを区別するために連番を使用します。 | |
[タスクの作成] 現在のワークスペースのプロジェクトディレクトリに 5 つの | |
タスク O&M | [失敗したタスクの再実行] このワークスペースで |
[失敗したインスタンスのクエリ] 現在のワークスペースのプロジェクトで | |
[タスクの再実行プロパティの分析] これらのタスクの再実行プロパティを分析します。再実行可能な場合は、再実行します。 | |
データ統合 | [単一の MySQL テーブルを MaxCompute に同期] 現在のワークスペースに、次の設定でバッチデータ統合タスクを作成します。
|
[売上分析] 注文テーブルから今月の売上トップ 10 製品の売上トレンドを分析します。 |
制限事項
この機能は、新しいバージョンの Data Studio が有効になっているワークスペース内の 個人開発環境 でのみ利用できます。
個人開発環境を再起動した後、MCP Server を再インストールする必要があります。注意して進めてください。
課金
DataWorks Agent を使用すると、次の料金が発生します。
DataWorks OpenAPI 呼び出し料金
エージェントが MCP Server を介して DataWorks OpenAPI を呼び出す場合、OpenAPI 課金基準 に従って料金が請求されます。
LLM トークン料金
エージェントは、ユーザーの意図を解析し、自然言語応答を生成するために、構成した大規模言語モデル (LLM) (Qwen など) を呼び出します。このプロセスでは、入力および出力トークンが消費され、選択したモデルプロバイダーの料金ルールに従って課金されます。たとえば、Model Studio (Bailian) で
qwen-coder-plusモデルを使用する場合、料金は Model Studio (Bailian) 課金詳細 に基づいて計算されます。
DataWorks Agent クイックスタート
DataWorks Agent を構成した後、Cline ページ右上の
アイコンをクリックして DataWorks Agent チャットインターフェースを開き、クイック例を試します。現在のワークスペースのメンバーをクエリします。
次のプロンプトを入力します: 現在のワークスペースのメンバーをクエリします。
エージェントはステップを分解して実行します。
リクエストの解析と確認: エージェントは「現在のワークスペースのメンバーをクエリする」というリクエストを解析し、呼び出す
ListProjectMembersAPI を自動的に識別し、ターゲットワークスペース (ProjectId) など、必要なパラメーターの確認を求めます。API の呼び出しと応答の取得: 権限を付与した後、エージェントは
ListProjectMembersOpenAPI を呼び出して、ロールとアカウントタイプを含むワークスペースのメンバーの構造化されたリストを取得します。ListProjectMembersOpenAPI の詳細については、「ListProjectMembers - ワークスペースのメンバーをクエリ」をご参照ください。説明実行中、システムから関連する操作の確認や、必要な情報の提供を求められます。[承認] をクリックして続行するか、[拒否] をクリックして操作をキャンセルできます。
主要なステップの分解ロジックは、タスクの複雑さ、LLM の選択、およびモデルバージョンによって若干異なる場合があります。実際の実行フローは、セッション中のエージェントのリアルタイム解析とインタラクションによって異なります。
DataWorks Agent の構成
DataWorks Agent は、Cline などの MCP クライアント拡張機能を使用してチャットインターフェースを作成します。MCP Server 構成を介して DataWorks MCP Server や 他の Alibaba Cloud MCP Server に接続します。
DataWorks Agent の機能を強化するために、必要に応じてより多くの オープンソース MCP Server に接続できます。
前提条件
ワークスペースを作成しましたし、[Data Studio (新バージョン) を使用] を選択しました。
(オプション、RAM ユーザー向け) 開発用の RAM ユーザーを、[開発] または [ワークスペース管理者] のロールでワークスペースに追加済みです。ワークスペース管理者ロールには広範な権限があるため、割り当てる際は注意してください。メンバーの追加方法の詳細については、「ワークスペースへのメンバーの追加」をご参照ください。
Alibaba Cloud アカウントを使用している場合は、このステップをスキップできます。
個人開発環境インスタンスを作成していること。
説明個人開発環境を Virtual Private Cloud (VPC) にバインドする必要がある場合は、個人開発環境のパブリックネットワークアクセスを構成する必要があります。
ステップ 1: 個人開発環境へのアクセス
個人開発環境を開始してアクセスするには、次のステップに従います。
DataWorks コンソールでワークスペースページに移動します。上部ナビゲーションバーで目的のリージョンを選択します。目的のワークスペースを見つけ、[操作]列でを選択します。
上部ナビゲーションバーの Personal Development Environment の横にある
アイコンをクリックして、個人開発環境のインスタンスのステータスを確認し、アクセスします。インスタンスのステータスが Running: [個人開発環境] の下にある実行中のインスタンスをクリックして、環境にアクセスします。
インスタンスが別の状態にある場合: ポップアップウィンドウで Management Environment をクリックします。Personal Development Environment Instances ページで、対象のインスタンスを見つけ、Actions 列の Start をクリックします。インスタンスステータス が Running に変わるまで待ち、インスタンスをクリックして環境に入ります。
説明[個人開発環境] エリアにある
のようなアイコンは、個人開発環境に入ったことを示します。
ステップ 2: Cline のインストール
個人開発環境に入った後、DataWorks Agent を構成するには、次のステップに従います。このガイドでは Cline を例として使用します。
個人開発環境インスタンスの作成時に dataworks-mcp:py3.11-ubuntu22.04 イメージを選択した場合、エンジンのアップグレード や Cline 拡張機能のインストール は必要ありません。
エンジンのアップグレード
Cline 拡張機能のインストール
ステップ 3: LLM API キーの構成
Cline 拡張機能のインストール後、API キーを構成するには、次のステップに従います。この例では、OpenAI 互換モードを使用して Model Studio (Bailian) API に接続する方法を示します。
他のモデルに接続するには、ユーザーインターフェースに従って関連するパラメーターを構成します。
現在、[ご自身の API キーを使用] 構成メソッドのみがサポートされています。[無料で開始] メソッドはサポートされていません。
Data Studio 個人開発環境ページで、上部のナビゲーションバーの右上隅にある
アイコンをクリックして Copilot Chat を開き、
アイコンをクリックして Cline に切り替えます。Cline ページで、[独自の API キーを使用] をクリックし、次の表に示すとおりにパラメーターを設定します。
パラメーター
説明
API プロバイダー
使用する API サービスプロバイダー。[
OpenAI Compatible] を選択します。これは、OpenAI 互換インターフェースを使用して Model Studio (Bailian) API に接続することを示します。ベース URL
API サービスのベース URL。API リクエストのルートアドレスを指定します。
たとえば、Model Studio (Bailian) が提供する OpenAI 互換 API エンドポイントは
https://dashscope-intl.aliyuncs.com/compatible-mode/v1です。API キー
認証に使用されるキー。この API キーは Model Studio (Bailian) コンソール から取得できます。
モデル ID
使用するモデル。
モデルは機能とパフォーマンスが異なります。
qwen-coder-plusまたはqwen-plusを選択します。qwen-coder-plus: コード生成およびプログラミングタスクに適しています。qwen-plus: 一般的なテキスト生成および処理タスクに適しています。
下部にある[Let's Go!] ボタンをクリックして、API キーの構成を完了します。
ステップ 4: MCP Server の構成
API キーの構成後、DataWorks MCP Server に接続して構成するには、次のステップに従います。DataWorks MCP Server の詳細については、「付録: DataWorks MCP Server」をご参照ください。
Cline ページの右上隅で
アイコンをクリックすると、[MCP Servers] パネルの [Marketplace] タブに移動します。[Installed] タブに切り替えて、インストール済みの MCP Server を表示します。
「[MCP サーバーの構成]」をクリックして、
cline_mcp_settings.json構成ファイルを開きます。DataWorks は、alibabacloud-dataworks-mcp-serverのデフォルト構成を提供します。構成内容は以下のとおりです:{ "mcpServers": { "alibabacloud-dataworks-mcp-server": { "command": "npx", "args": [ "alibabacloud-dataworks-mcp-server" ], "env": { "REGION": "cn-shanghai", "ALIBABA_CLOUD_CREDENTIALS_URI": "http://localhost:7002/api/v1/credentials/0", "TOOL_CATEGORIES": "SERVER_IDE_DEFAULT" }, "disabled": false, "autoApprove": [], "timeout": 60 } } }パラメーター
説明
command
npx。これは dataworks-mcp-server が提供するコマンドです。
args
alibabacloud-dataworks-mcp-server。これは dataworks-mcp-server のコマンド引数です。
env
REGION
例では cn-shanghai。これは現在の DataWorks ワークスペースが配置されているリージョンを示します。
ALIBABA_CLOUD_CREDENTIALS_URI
Alibaba Cloud 認証情報の URI を指定します。
重要このパラメーターは DataWorks 個人開発環境でのみ有効であり、Alibaba Cloud ユーザー認証情報を取得するために使用されます。
TOOL_CATEGORIES
Toolカテゴリの許可リストを構成します。ここに OpenAPI カテゴリをコンマで区切って入力します。例:
"TOOL_CATEGORIES":"Data Source,Workspace Management,Resource Group Management,Data Map,Data Integration,Data Development (New),Operation Center,DataService,Open Platform,Data Quality,Label Management,Security Center,SERVER_IDE_DEFAULT"。説明SERVER_IDE_DEFAULTは、個人開発環境のデフォルトのToolを指します。その他のサービスカテゴリは、DataWorks - OpenAPI 概要 ページの左側のディレクトリツリーで確認できます。モデルの読み込みパフォーマンスとユーザーエクスペリエンスを向上させるために、デフォルト構成では
TOOL_CATEGORIESをSERVER_IDE_DEFAULTに設定します。すべての OpenAPI ツールを有効にするには、この構成項目を削除できます。
TOOL_NAMES
Tool名の許可リストを構成します。ここに OpenAPI 名をコンマで区切って入力します。例:
"TOOL_NAMES":"ListProjects,CreateNode,UpdateNode"。説明TOOL_NAMESは DataWorks - OpenAPI 概要 ページで確認できます。構成を保存した後、ページが読み込まれ、利用可能な Tool のリストが表示された場合、
alibabacloud-dataworks-mcp-serverは正しくインストールおよび構成されています。これでその機能を使用できます。説明この情報の読み込みに失敗した場合は、エンジンのアップグレード を実行したことを確認してください。

DataWorks Agent の機能を拡張するには、
cline_mcp_settings.jsonファイルを直接編集するか、[マーケットプレイス] から他の MCP サーバーをインストールします。たとえば、DataWorks Agent で Hologres 関連の機能を使用するには、Hologres MCP サーバー に接続できます。
よくある質問
Q: MCP Server でプリセットプロンプトを実行すると、API リクエストの応答に時間がかかりすぎます。原因と解決策は何ですか?
A: これは、古いエンジンバージョンとの互換性の問題が原因である可能性があります。エンジンのアップグレード を推奨します。
Q: モデルの応答速度が遅い場合、最適化するために何ができますか?
A: 応答パフォーマンスを向上させるには、次のことを試してください。
同時に有効化される MCP Server の数を減らして、システムリソースのオーバーヘッドを削減します。
MCP Server の構成ファイルで、
TOOL_CATEGORIESまたはTOOL_NAMESをenvパラメーター内に明示的に指定して、必要なツールセットのみを読み込むようにします。これにより、インポートされるToolsの数を削減できます。
付録: DataWorks MCP Server
MCP (Model Context Protocol) は、大規模言語モデル (LLM) に標準化されたコンテキストを提供するプロトコルです。LLM がさまざまなデータソースやツールに接続するための標準的な方法を定義し、情報をより効果的に理解および処理できるようにします。MCP クライアントは、MCP プロトコルを介してさまざまな MCP Server の機能を呼び出すことができます。
DataWorks MCP Server は、MCP Server の一種として、DataWorks OpenAPI をカプセル化し、DataWorks のビッグデータ処理機能を提供します。DataWorks MCP Server は、DataWorks MCP Server をサードパーティ製品、プログラム、またはエージェントに統合して、DataWorks 機能を迅速に呼び出すことができます。
DataWorks 個人開発環境外では、[env] パラメーターで ALIBABA_CLOUD_ACCESS_KEY_ID と ALIBABA_CLOUD_ACCESS_KEY_SECRET を構成し (こちら から取得)、ALIBABA_CLOUD_CREDENTIALS_URI 構成を削除する必要があります。
アイコンを右クリックして、[キーバインディングの設定]、