Agent - DataWorks - Alibaba Cloud ドキュメントセンター

Agent は、自然言語によるインタラクションと、大規模言語モデルの高度な認知・計画能力を活用して、複雑なデータ統合、データ開発、データガバナンスのタスクを実行します。要件定義から結果出力までを一貫して自動化し、作業効率を大幅に向上させます。本トピックでは、Agent の主な特徴、適用範囲、およびコア機構について説明します。

概要

Agent は、専用のクライアント上で構築されています。サードパーティ製クライアントに基づく Agentとは異なり、追加のソフトウェアのインストールや複雑な設定を行わずに、関連する DataWorks モジュール内から直接利用できます。

「要件を記述するだけで結果が得られる」自然言語インタラクションにより、Agent は「要件をコードとして表現する（requirements-as-code）」開発体験を提供します。自然言語で要件を記述するだけで、データ開発などのタスクを完了でき、生産性を飛躍的に高めます。Agent のワークフローは以下のとおりです：

アクセス方法

DataWorks コンソールにログインします。左側ナビゲーションウィンドウで、データ開発と О&М > データ分析 を選択します。ご利用のワークスペースを選択し、Data Studio に移動します。
Data Studio ページの右上隅にあるアイコンをクリックして、Data Agent Chat（Ask モード）を開きます。ダイアログボックスの左下隅で、Agent モードに切り替えます。

クイックスタート

ステップ 1：Agent モードへの切り替え

Data Studio ページの右上隅にあるアイコンをクリックして、Data Agent Chat（Ask モード）を開きます。ダイアログボックスの左下隅で、Agent モードに切り替えます。

ステップ 2：Agent の選択

入力ボックス内で / をクリックするか、/ を入力すると、Agent メニューをすばやく開き、現在のタスクに最適な専用 Agent を選択できます。利用可能な Agent の種類には、Data Integration Agent、Data Map Agent、Data Development Agent、Data Governance Agent、Data O&M Agent があります。

説明

対応するプロダクトモジュール内では、DataWorks が自動的に該当する Agent を使用します。手動での選択は不要です。

ステップ 3：コンテキストの追加（任意）

ダイアログボックス内で @ を入力するか、右下隅の @ アイコンをクリックして、必要なコンテキストを選択・追加することで、Agent に豊富な背景情報を提供できます。

サポートされるコンテキストの種類は以下のとおりです：

テーブル：1 つ以上のテーブルのメタデータを参照します。
ノード／コードファイル：特定のノード内のコードを参照します。
データ収集：Data Map からのデータ収集を参照します。
ルール：現在の会話に対して、1 つ以上の品質ルールを一時的に適用します。
ローカルファイル：ローカルのドキュメントをアップロードして、背景情報を提供します。

ステップ 4：大規模言語モデルの切り替え（任意）

デフォルトでは、Agent は Auto モードで動作します。このモードでは、タスクのシナリオに応じて、Agent がインテリジェントなモデルスケジューリングと自動割り当てを実行します。また、複数のモデル間をシームレスに切り替えることも可能です。詳細については、「4. インテリジェントなモデルスケジューリング」をご参照ください。また、ダイアログボックス下部のアイコンをクリックして、他のサポート対象の大規模言語モデルから選択することもできます。

ステップ 5：会話の開始

ダイアログボックスにご要望を入力します。フォローアップ質問をしたり、追加の詳細を提供したりするなど、複数回のやり取りを通じて意図を洗練・明確化し、Agent がご要望の目的を完全に理解し、所望の結果を生成できるようにしてください。

適用範囲

大規模言語モデルの深い理解力とタスクオーケストレーション能力を活用した Agent は、データ統合、データ開発、データガバナンス、Data Map、データ O&M といった幅広いユースケースに対応します。以下に、各機能の比較を示します。

Agent のユースケース	説明
データ統合	中国語または英語などの自然言語でデータ同期要件を記述できます。システムがセマンティクスを自動解析し、対応するデータ同期タスクの構成を生成します。これには、送信元および送信先のデータソース、テーブル構造のマッピング、フィールドのフィルター条件、パーティション戦略、スケジューリングパラメーターが含まれます。
データ開発	要件分析、コード生成、ワークフロー作成、デプロイメントに至るまで、自然言語ベースの ETL 開発体験を提供します。
データ O&M	タスクインスタンスに対する包括的なヘルス評価および課題診断を提供します。依存関係チェーン、リソースレベル、過去の実行傾向、変更の影響、ログの異常、データ品質といった多角的な分析を統合し、構造化された診断レポートを自動生成します。
Data Map	データの検索および理解の効率を向上させます。AI 主導の自然言語インタラクションにより、大規模なデータセットにおいて、さまざまなシナリオにわたってメタデータを迅速に探索できます。
データガバナンス	DataWorks の Data Governance Agent は、企業が能動的なデータガバナンスから自律的なデータガバナンスへと移行するのを支援します。複雑なデータ分析や構成作業を実施する代わりに、自然言語でコマンドを発行できます。Agent はこれらのコマンドを正確なガバナンス操作に変換し、エキスパートレベルの構成を適用して、自動的に実行します。

ユースケース 1 — Data Integration Agent

説明：中国語または英語などの自然言語でデータ同期要件を記述できます。システムがセマンティクスを自動解析し、対応するデータ同期タスクの構成を生成します。これには、送信元および送信先のデータソース、テーブル構造のマッピング、フィールドのフィルター条件、パーティション戦略、スケジューリングパラメーターが含まれます。

操作手順：

ダイアログボックスで / を入力し、Data Integration Agent を選択します。
送信元、送信先、テーブル名、同期方法を含むデータ同期要件を記述します。例：「MySQL テーブル ods_user_info_d を MaxCompute テーブル ods_user_info_d に同期するオフライン同期タスクを作成します。」
Agent が要件を解析し、データソースおよびテーブルのマッピングなどの情報を自動的に補完して、データ同期ノードを作成します。
ノードが作成された後、内容を確認・修正できます。

ユースケース 2 — Data Development Agent

説明：要件分析、コード生成、ワークフロー作成、デプロイメントに至るまで、自然言語ベースの ETL 開発体験を提供します。

操作手順：

自然言語でデータ開発要件を記述し、必要に応じてコンテキストを追加します。例：「ユーザー・プロファイル分析のためのワークフローを構築します。」
Agent がタスクをノード作成、コード生成、依存関係の構成などの複数のステップに分解し、実行します。
生成されたノードのコードについては、変更内容を確認し、採用または取り消すことができます。

ユースケース 3 — Data O&M Agent

説明：タスクインスタンスに対する包括的なヘルス評価および課題診断を提供します。依存関係チェーン、リソースレベル、過去の実行傾向、変更の影響、ログの異常、データ品質といった多角的な分析を統合し、構造化された診断レポートを自動生成します。

Data O&M Agent の詳細については、「AI O&M」をご参照ください。

ユースケース 4 — Data Map Agent

説明：データの検索および理解の効率を向上させます。AI 主導の自然言語インタラクションにより、大規模なデータセットにおいて、さまざまなシナリオにわたってメタデータを迅速に探索できます。

コア機能：

自然言語検索：ビジネス意図に基づいてターゲットとなるデータをすばやく特定するために、正確なキーワードを指定せずに自然言語で質問できます。例：「ユーザー活動に関連するサマリーテーブルを検索してください。」
自動スコープ調整：会話内でスコープを指定すると、Agent がセマンティクスを自動的に理解し、そのスコープ内でのデータをすばやく特定します。例：「adm_bi プロジェクト内で、ビジネス運用に関連するテーブルを検索してください。」
データの詳細な理解：ターゲットとなるデータについてフォローアップ質問を行うことで、データリネージ、オーナー、フィールド定義などの詳細情報をすばやく取得できます。例：「@dws_bi_metric_di テーブルの直近のダウンストリーム依存関係は何ですか？そのテーブルの変更によって誰が影響を受けますか？」

ユースケース 5 — Data Governance Agent

説明：DataWorks の Data Governance Agent は、企業が能動的なデータガバナンスから自律的なデータガバナンスへと移行するのを支援します。複雑なデータ分析や構成作業を実施する代わりに、自然言語でコマンドを発行できます。Agent はこれらのコマンドを正確なガバナンス操作に変換し、エキスパートレベルの構成を適用して、自動的に実行します。

コア機能：

品質ルールの構成：自然言語を用いて、指定された主要テーブルに対する品質モニタリングルールの構成を支援します。Data Governance Agent は、指定されたテーブルのフィールド型、ビジネスセマンティクス、重要度を分析し、プライマリキーの一意性、NULL 値制約、列挙値の範囲チェックなどの適切なモニタリングルールを自動的に推奨・構成します。これにより、膨大なデータ探索や手動によるルール構成の必要がなくなります。
- 例：コアユーザーディメンションテーブルである dim_user_info に対して、品質ルールを自動生成します。
- 例：接頭辞が ods_ で始まるテーブルに対して、テーブル行数に関連する品質ルールを自動的に構成します。
品質課題のガバナンス：データガバナンスモジュールでシステムが自動的に特定した品質課題（例：「品質ルールが設定されていない頻繁にアクセスされるテーブル」や「高優先度ベースラインタスクによって生成される品質ルールが設定されていないテーブル」など）に対して、自然言語でガバナンス要件を提供できます。システムは、課題を自動的に分析・是正します。
- 例：品質ルールが設定されていない頻繁にアクセスされるテーブルを特定し、推奨・構成します。
- 例：データ品質に関する課題を解決してください。

仕組み

1. ストレージ管理

Data Development Agent は、プロジェクトディレクトリまたは個人ディレクトリのいずれかにノードおよびファイルを作成できます。適切なストレージ管理を確保するため、以下の点に注意してください。

保存場所の設定：Data Agent 設定センターで、The default storage path for generating code files を構成します。詳細については、「個人設定」をご参照ください。
競合解決メカニズム：生成されるノードの種類が現在のディレクトリのルールと一致しない場合（例：個人ディレクトリ内でデータ統合ノードの作成を要求した場合）、Agent は確認プロンプトを表示し、ユーザーの確認を待ってから処理を続行します。

2. 複雑なタスクの処理

論理が複雑な開発要件に対して、Agent はライフサイクル全体にわたってステータスフィードバックを提供します。

ToDo リスト：Agent が複雑なタスクを複数のサブステップに分解し、ToDo リストとして表示します。実行が進むにつれて、各項目のステータスが自動的に更新されます。
実行サマリー：ワークフローの終了時に、Agent がタスク全体のサマリーレポートを編集・出力します。このレポートには、完了した操作および生成されたリソースがまとめられており、レビュー作業をより効率化します。

3. トークンおよびパフォーマンス統計

タスクが完了した後、Agent は実行効率およびモデル呼び出し規模を評価するための定量的指標を提供します。

タスク持続時間の統計：システムが、現在のタスクの開始から終了までの総時間を自動的に記録・表示し、自動化プロセスの効率を評価できるようにします。
トークン消費量：インタラクション中に生成された 入力トークン および 出力トークン の数を正確にカウントします。

4. インテリジェントなモデルスケジューリング

Agent のインテリジェントなモデル割り当てメカニズムにより、基盤となるモデルを選択する必要がなく、意図駆動型の開発体験が実現します。

自動モデル割り当て（Auto モード）：デフォルトでは、Agent は Auto モードで動作します。このモードでは、Agent が開発意図を特定・分解し、異なるサブタスクを処理するのに最適なモデルを自動的に割り当てます。
動的なマルチモデル協調（Auto モード）：Auto モードでは、Agent が異なるモデル間でオーケストレーションを実行できます。タスクのリアルタイムなニーズに基づき、Agent は単一の会話内で複数のモデルを柔軟に切り替えて、複雑なタスクの各部分に最も適したモデルをマッチさせます。
手動モデル切り替え：自動化機能は利用可能ですが、特定のシナリオでは Auto モードから切り離し、タスク処理に別のモデルを明示的に指定することもできます。

参考情報

カスタム Agent 機能について学ぶには、「サードパーティ製クライアントに基づく Agent」をご参照ください。