DataWorks Agent は、モデルコンテキストプロトコル (MCP) に基づいて、DataWorks MCP Server および Hologres MCP Server など、他のビッグデータエンジンのタイプの MCP サーバーに接続できます。 DataWorks Agent は、自然言語インタラクションに基づいて、DataWorks でのデータ開発、タスクの運用管理、およびデータ同期の実装に役立ちます。
機能概要
DataWorks Agent を使用すると、自然言語インタラクションに基づいて、インテリジェントな会話ウィンドウでビッグデータ開発を実装できます。 DataWorks Agent は、大規模言語モデル (LLM) を使用して要件を解析し、インテリジェントに MCP サーバーを呼び出してタスクの実行を完了します。
たとえば、DataWorks Agent の会話ウィンドウに「ワークスペースはいくつありますか」と入力できます。 DataWorks Agent は、LLM を使用して要件を解析し、WordPressDataWorks MCP Server が提供する DataWorks API 操作 オペレーションを呼び出します。このオペレーションは、 をカプセル化してクエリを実行し、結果を返します。 タスクがより複雑な場合、LLM は MCP サーバーと複数回対話します。
DataWorks Agent は DataWorks MCP Server と統合されているだけでなく、他のビッグデータエンジンのタイプの MCP サーバー にも接続できます。 ビジネス要件に基づいて、Qwen、DeepSeek、OpenAI などの LLM を選択できます。
次の表に示す質問を入力して、DataWorks Agent でサポートされているその他のタスクシナリオを体験することもできます。
適用範囲 | 質問例 |
データ開発 | [タスクのクエリ] 現在のワークスペースの [ワークスペースディレクトリ] セクションで、[スケジューリングタイプ] パラメーターが [スケジューリングを一時停止] に設定されているすべての |
[タスクの名前変更] 前のノードの名前を Invalid_Node_To_Be_Deleted に変更し、シリアル番号でノードを区別してください。 | |
[タスクの作成] 現在のワークスペースのワークスペースディレクトリセクションに、5 つの | |
タスク O&M | [失敗したタスクの再実行] |
[失敗したインスタンスのクエリ] 現在のワークスペースのプロジェクトで | |
[タスクの再実行プロパティの分析] タスクを再実行できるかどうかを確認します。 可能であれば、タスクを再実行します。 | |
データ同期 | [単一の MySQL テーブルから MaxCompute へのデータ同期] 現在のワークスペースで、単一テーブルのバッチ同期タスクを作成して、 |
[売上トレンドの分析] 注文テーブルで今月最も売れた上位 10 製品の売上トレンドを分析してください。 |
制限事項
DataWorks Agent は、個人開発環境 でのみ使用できます。
重要個人開発環境を再起動した後、MCP サーバーを再インストールする必要があります。 注意して進めてください。
DataWorks Agent は、[Data Studio のパブリックプレビューに参加] がオンになっているワークスペースでのみ使用できます。
課金
DataWorks Agent を使用すると、API オペレーション呼び出し料金 と トークンによって生成されるモデル呼び出し料金 が発生します。
DataWorks Agent を使い始める
DataWorks Agent の構成を完了 した後、CLINE ペインの右上隅にある アイコンをクリックして、DataWorks Agent の会話インターフェースに移動し、ODPS SQL タスクの作成を体験します。
次の質問を入力するだけです。 現在のワークスペースの [ワークスペースディレクトリ] セクションに 5 つの odps_sql
ノードを作成してください。 ノードの名前は、MCP_Demo
_0X の形式で付けられます。 末尾の数字 0X は、01 から始まる自動増分番号です。
DataWorks Agent は、上記の質問をステップに分解し、ステップを実行します。
システムは
CreateNode
操作を呼び出す必要があることを分析しますが、ワークスペース ID がありません。 この場合、ワークスペース ID を手動で指定する必要があります。CreateNode
操作を呼び出して、5 つの ODPS_SQL ノードを作成します。CreateNode
操作が正常に呼び出され、リクエスト ID とノード ID が返されます。ListNodes
操作を呼び出してワークスペース内のノードをクエリし、作成が成功したことを確認します。説明実行プロセス中に、確認を求められたり、特定の関連情報を取得するように求められたりすることがあります。 [承認] または [拒否] をクリックして、特定の操作に同意または拒否できます。
各実行プロセス中の主要なステップは若干異なる場合があります。 解析結果は、使用される LLM によっても異なります。
実行が完了すると、名前が MCP_Demo
で始まる 5 つの ODPS_SQL ノードが作成されます。
DataWorks Agent を構成する
DataWorks Agent は、Cline などの MCP クライアントプラグインに基づいてフロントエンドの会話ウィンドウを構築し、MCP サーバー構成に基づいて DataWorks MCP Server および他のタイプの Alibaba Cloud MCP サーバー に接続します。
ビジネス要件に基づいて、より多くの オープンソース MCP サーバー に接続して、DataWorks Agent の機能を強化できます。
前提条件
ワークスペースが作成されている こと、およびワークスペースで [Data Studio のパブリックプレビューに参加] がオンになっていること。
(RAM ユーザーを使用してタスクを開発する場合に必須) RAM ユーザーが DataWorks ワークスペースにメンバーとして追加され、[開発] または [ワークスペースマネージャー] ロールが割り当てられていること。 ワークスペースマネージャーロールには、必要以上の権限があります。 ワークスペースマネージャーロールを割り当てる場合は注意してください。 メンバーを追加する方法の詳細については、「ワークスペースメンバーを追加し、ロールを割り当てる」をご参照ください。
説明Alibaba Cloud アカウントを使用している場合は、この操作をスキップできます。
- 説明
個人開発環境インスタンスの作成時に
dataworks-mcp:py3.11-ubuntu22.04
イメージを選択した場合、基盤となるエンジンのアップグレードと Cline 拡張機能のインストールを ステップ 2: DataWorks Agent を構成する で行う必要はありません。個人開発環境を仮想プライベートクラウド (VPC) に関連付ける必要がある場合は、プライベートインターネット NAT ゲートウェイを使用して個人開発環境のインターネットアクセスを有効にする 必要があります。
ステップ 1: 個人開発環境を準備する
次の手順を実行して、個人開発環境を有効化し、アクセスできます。
DataWorks コンソールの ワークスペース ページに移動します。 上部のナビゲーションバーで、目的のリージョンを選択します。 目的のワークスペースを見つけ、[操作] 列で アクション を選択します。
アイコンをクリックして、Data Studio ページ上部のナビゲーションバーにある [個人開発環境を選択] の横にある アイコンをクリックして、個人開発環境インスタンスのステータスを確認し、個人開発環境にアクセスします。
[稼働中] 状態: 実行中の個人開発環境をクリックして、個人開発環境の [ようこそ] タブに移動します。
別の状態: [管理環境] をクリックします。[個人開発環境インスタンス] パネルで、作成したインスタンスを見つけ、[アクション] 列の [開始] をクリックします。インスタンスが [実行中] 状態になるまで待ちます。次に、[個人開発環境を選択] ドロップダウンリストからインスタンスをクリックして、個人開発環境の [ようこそ] タブに移動します。
説明のような情報が [個人開発環境を選択] ボックスに表示されている場合は、個人開発環境に正常にアクセスしています。
ステップ 2: DataWorks Agent を構成する
個人開発環境にアクセスした後、次の操作を実行して DataWorks Agent を構成できます。 この例では、Cline を使用します。
(オプション) 基盤となるエンジンのアップグレード
以前の個人開発環境を使用している場合、または個人開発環境に Cline 拡張機能を既にインストールしている場合は、次のいずれかの方法を使用して既存の基盤となるエンジンをアップグレードして拡張機能を使用できます。 アップグレード操作を既に実行している場合は、このセクションをスキップできます。
ワンクリックアップグレード: 個人開発環境にアクセスした後に基盤となるエンジンの適応アップグレードを示すメッセージが表示された場合は、[ワンクリックアップグレード] をクリックしてアップグレードを完了します。
コマンドベースのアップグレード: 下部ツールバーの左側にある アイコンをクリックして、[ターミナル] タブに移動します。 [ターミナル] タブで次のコマンドを入力し、Enter キーを押してアップグレードを実行します。
wget https://nodejs.org/dist/v20.19.0/node-v20.19.0-linux-x64.tar.xz
tar xf node-v20.19.0-linux-x64.tar.xz
mv /etc/dsw/node /etc/dsw/node14
mv node-v20.19.0-linux-x64 /etc/dsw/node
bash <(curl -s https://dataworks-notebook-${REGION}.oss-${REGION}.aliyuncs.com/public-datasets/aone-release/dwcode-server/scripts/update.sh) 0.2.169
アップグレードが完了したら、表示されるメッセージの [ウィンドウの再読み込み] をクリックして、最新の変更を適用します。
Cline 拡張機能をインストールする
次の手順を実行して、Cline 拡張機能を Agent の会話ウィンドウとして個人開発環境にインストールできます。
Data Studio ページの左側のナビゲーションペインにある
アイコンをクリックします。
[拡張機能] ペインの検索ボックスに
Cline
と入力します。下に表示される Cline 拡張機能を見つけます。
Cline 拡張機能の右下隅にある [インストール] をクリックし、インストールが完了するまで待ちます。
インストールが完了したら、Data Studio ページの左側のナビゲーションペインにある
アイコンを右クリックし、[キーバインドの構成] を選択するか、 または を選択して対応する操作を実行します。
API キーを構成する
Cline 拡張機能がインストールされたら、次の手順を実行して API キーを構成します。 この例では、OpenAI 互換モードで接続された Alibaba Cloud Model Studio API を使用します。
別のモードでモデルに接続するために構成できるパラメーターはさまざまです。
[独自の API キーを使用する] 方法のみがサポートされています。
Data Studio ページの左側のナビゲーションペインにある
アイコンをクリックします。
CLINE ペインで [独自の API キーを使用する] をクリックし、パラメーターを構成します。 次の表にパラメーターを示します。
パラメーター
説明
API プロバイダー
使用する API サービスプロバイダー。 ドロップダウンリストから
OpenAI Compatible
を選択します。 これは、OpenAI API と互換性のあるインターフェースを使用して Alibaba Cloud Model Studio API に接続することを示します。ベース URL
API サービスのベース URL。API リクエストのルートアドレスを指定するために使用されます。
たとえば、Alibaba Cloud Model Studio API によって提供され、OpenAI と互換性のある次の API 宛先アドレスを入力します:
https://dashscope.aliyuncs.com/compatible-mode/v1
。API キー
リクエストが有効であることを確認するための身分認証に使用されるキー。
Alibaba Cloud Model Studio コンソール から API キーを取得します。
モデル ID
使用するモデル。 モデルによって、機能とパフォーマンスが異なる場合があります。
qwen-coder-plus
またはqwen-plus
を選択します。 これら 2 つのオプションは、異なる事前学習済みモデルを表します。qwen-coder-plus
: コード生成とプログラミングタスクに適しています。qwen-plus
: 一般的なテキスト生成と処理タスクに適しています。
[開始] をクリックして、API キーの構成を完了します。
MCP サーバーに接続する
API キーの構成が完了したら、次の手順を実行して MCP サーバーに接続します。
CLINE ペインの右上隅にある
アイコンをクリックします。 マーケットプレイスMCP サーバー セクションの タブが表示されます。
[インストール済み] タブをクリックします。
[MCP サーバーの構成] をクリックします。 次に、右側に表示される構成タブに次の情報を入力します。 ビジネス要件に基づいて複数の MCP サーバーを構成できます。
説明DataWorks Agent で Hologres 関連の機能を使用する場合は、Hologres MCP Server に接続します。
{ "mcpServers": { "alibabacloud-dataworks-mcp-server": { "command": "npx", "args": [ "alibabacloud-dataworks-mcp-server" ], "env": { "REGION":"cn-beijing", "ALIBABA_CLOUD_CREDENTIALS_URI":"http://localhost:7002/api/v1/credentials/0" }, "disabled": false, "autoApprove": [], "timeout": 60 } } }
パラメーター
説明
command
このパラメーターを npx に設定します。これは、DataWorks MCP Server によって提供される命令メソッドを示します。
args
alibabacloud-dataworks-mcp-server と入力します。これは、DataWorks MCP Server の命令パラメーターを示します。
env
REGION
ワークスペースが存在するリージョン。 このパラメーターを ワークスペースが存在するリージョンの識別子 に設定します。
ALIBABA_CLOUD_CREDENTIALS_URI
Alibaba Cloud クレデンシャルを取得するための URI。 このパラメーターを http://localhost:7002/api/v1/credentials/0 に設定します。これは、個人開発環境によって提供されるデフォルトの URI です。
重要RAM ユーザーを使用してタスクを開発する場合は、このパラメーターを http://localhost:7002/api/v1/credentials/1 に設定する必要があります。
TOOL_CATEGORIES
tool
カテゴリ。 API 操作カテゴリを指定し、複数のカテゴリをコンマ(,)で区切ります。例:
"TOOL_CATEGORIES":"データソース,スペース管理,リソースグループ管理,データマップ,Data Integration,データ開発,オペレーションセンター,DataService Studio,オープンプラットフォーム,Data Quality,タグ管理,セキュリティセンター,SERVER_IDE_DEFAULT"
。説明SERVER_IDE_DEFAULT
は、個人開発環境のデフォルトのtool
カテゴリです。 OpenAPI ポータルの DataWorks - 概要ページの左側のナビゲーションツリーで他のカテゴリを表示できます。 カテゴリには、データソース、スペース管理、リソースグループ管理、データマップ、Data Integration、データ開発、オペレーションセンター、DataService Studio、オープンプラットフォーム、Data Quality、タグ管理、セキュリティセンターが含まれます。ツール名
tool
名。 API 操作名を指定します。 複数の名前をコンマ(,)で区切ります。例:
"TOOL_NAMES":"ListProjects,CreateNode,UpdateNode"
。説明このパラメーターの設定は、OpenAPI ポータル内の DataWorks - 概要ページで確認できます。
構成が完了したら、
Ctrl+S
を押して、MCP サーバーの構成を保存して読み込みます。[インストール済み]タブに次の図のような情報が表示されている場合は、DataWorks MCP Server がインストールされています。その後、DataWorks MCP Server を使用できます。
説明次の図のような情報が表示されない場合は、基盤となるエンジンをアップグレードしたかどうかを確認してください。
よくある質問
プリセットの質問が MCP サーバーで実行されたときに、API リクエストが長時間実行中の状態のまま応答が返されない場合は、基盤となるエンジンのバージョンが古すぎて、現在のシステムとの互換性の問題が発生している可能性があります。このような問題を解決するには、基盤となるエンジンをアップグレードする必要があります。
モデルからの応答が遅い場合は、有効になっている MCP サーバーの数を減らすか、MCP サーバーに接続するために使用される構成ファイルの
env
パラメーターにTOOL_CATEGORIES
とTOOL_NAMES
を追加して、導入されるtools
の数を減らすことができます。
付録: DataWorks MCP Server
MCP は、アプリケーションが LLM のコンテキストを提供する方法を標準化するプロトコルです。 大規模モデルをさまざまなデータソースおよびツールに接続して、効率的な情報の理解と処理を行うための標準化された方法を提供します。 MCP クライアントは、MCP に基づいてさまざまなタイプの MCP サーバーによって提供される機能を使用できます。
MCP サーバーの一種である DataWorks MCP Server は、DataWorks API 操作 をカプセル化し、DataWorks のビッグデータ処理機能を提供します。 DataWorks MCP Server をサードパーティのサービス、プログラム、またはエージェントに接続して、DataWorks 機能を迅速に使用できます。
DataWorks 個人開発環境で DataWorks MCP Server を使用しない場合は、ALIBABA_CLOUD_ACCESS_KEY_ID と ALIBABA_CLOUD_ACCESS_KEY_SECRET を env パラメーターに追加し、ALIBABA_CLOUD_CREDENTIALS_URI の設定を削除します。 ALIBABA_CLOUD_ACCESS_KEY_ID と ALIBABA_CLOUD_ACCESS_KEY_SECRET の設定は、[AccessKey] ページで取得できます。