DataWorks Copilot - DataWorks - Alibaba Cloud ドキュメントセンター

面倒なデータの単純作業はもう不要です。DataWorks には、ユーザーのニーズを理解する AI アシスタント、DataWorks Copilot が組み込まれています。DataWorks Copilot は、反復的で非効率な作業からユーザーを解放し、イノベーションやクリティカルシンキングのための貴重な時間を取り戻すために設計されています。これにより、データ開発が再びシンプルかつ効率的になります。DataWorks と深く統合されており、自然言語を使用して Copilot に以下のことを依頼できます。

コード生成：アイデアを瞬時に高品質で標準化されたコードに変換します。
タスク作成の自動化：データ開発とデータガバナンスのタスクを自動化し、ワークフローを構築します。
チームナレッジの共有：ベストプラクティスやビジネスナレッジをコンテキストとして、あらゆる対話に組み込みます。

概要

DataWorks Copilot とは

DataWorks Copilot は、インテリジェントなデータ開発とガバナンスのためのワンストッププラットフォームである DataWorks のインテリジェントアシスタントです。AI の推論能力と自然言語処理 (NLP) を活用し、開発者が自然言語のプロンプトを使って、さまざまなコード関連タスクを迅速に実行できるよう支援します。これらのタスクには、SQL および Python コードの生成、補完、リファクタリング、最適化、説明、さらにはコードのデバッグやテストケースの生成が含まれます。データ開発のためのインテリジェントエンジンとして、DataWorks Copilot はコンテキストを通じてビジネスニーズを理解します。企業固有のナレッジベースによって強化され、データ ETL やデータ分析タスクを容易に完了させるのに役立ちます。

DataWorks Copilot は、Agent、コーディングアシスタント、AI クイック操作という 3 つのコア機能を提供します。これらはさまざまな DataWorks モジュールに深く統合されており、新しいインテリジェントなデータ作業体験を提供します。

コアバリュー

効率の向上：コードの自動生成、インテリジェントなコード補完、自然言語による対話を通じて、データ開発と分析のサイクルを大幅に短縮します。
参入障壁の低減：複雑な SQL やプロダクト操作に不慣れなユーザーでも、自然言語を使用してデータ開発やガバナンスタスクを迅速に完了できます。
品質の確保：AI を活用したコードのデバッグ、コードの最適化、テストケースの生成により、コードの品質と保守性を向上させます。
ナレッジの継承：企業の標準、ビジネス定義、技術仕様をカスタムの企業ナレッジベースを通じて AI に組み込み、ナレッジの共有と活用を可能にします。

提供状況とポリシー

対象ユーザー：DataWorks Basic Edition 以上をご利用のお客様が対象です。一部の機能は、新しいバージョンの Data Studio でのみ利用可能です。
利用可能なリージョン：中国 (張家口)、中国 (北京)、中国 (ウランチャブ)、中国 (杭州)、中国 (上海)、中国 (深セン)、中国 (成都)、中国 (香港)、シンガポール、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)、日本 (東京)。
現在のフェーズ：完全パブリックプレビュー。テナント管理者または同等の権限を持つユーザーが Copilot を有効にできます。有効にするには、Copilot のエントリポイントをクリックし、DataWorks Copilot 利用規約をよくお読みの上、[参加を確認] をクリックします。確認後、その Alibaba Cloud アカウント配下のすべてのユーザーが Copilot を使用できるようになります。
課金：パブリックプレビュー期間中、DataWorks Copilot は完全に無料です。パブリックプレビュー終了後、有料サービスに移行します。
重要
DataWorks Copilot は 2026 年 4 月 1 日に商用課金を開始する予定です。具体的な課金プランは、商用開始前に公式サイトで発表されます。

クイックスタート

Copilot へのアクセス方法

以下の方法で Copilot と対話できます。

グローバルエントリポイント：DataWorks インターフェイスの右上隅にある Copilot アイコンをクリックして、Copilot チャットダイアログを開きます。
エディター内：コードベースのデータ開発ノード用のインテリジェントコードエディターで、右クリックメニューまたはキーボードショートカットから Copilot を開きます。
モジュールへの埋め込み：特定のプロダクトモジュールの機能エリアにある Copilot ロゴが付いたクイック操作ボタンを使用します。

メインインターフェイスの概要

説明

グローバルエントリポイントから、Copilot はシナリオベースの構築済みサンプル (データ同期、インテリジェントなテーブル検出、データ開発、データガバナンスなど) を提供します。対応するカードをクリックすると、そのシナリオのサンプルプロンプトが迅速に読み込まれ、簡単に使い始めることができます。

コア機能

Agent：複雑なタスクの自動化

概要

DataWorks Agent サービスは、データ開発とデータガバナンスの自動化の新時代を切り開きます。単純な Q&A を超え、複雑なタスクを自律的に完了できるインテリジェントエージェントとして機能します。

DataWorks Agent を使用すると、自然言語を使って DataWorks でのデータ開発およびガバナンス作業の一部 (データ統合、データ開発、データマップ、データガバナンスなど) を自動化できます。大規模言語モデル (LLM) の深い推論能力と計画能力を活用し、Agent はタスクを完全に理解し、ステップに分解し、実行計画を作成し、MCP Server 内の関連ツールを使用して実行を自動化します。DataWorks は、データ開発とガバナンスのためのよりインテリジェントで効率的なプロダクト体験を提供するために、DataWorks MCP Server のツールセットを継続的に拡充し、改良していきます。

主な特徴

深い理解と自律的な計画：コンテキスト認識とマルチターン対話を通じて複雑な意図を正確に特定し、タスクを複数ステップの実行可能な計画に自律的に分解します。
データ開発とガバナンスの自動化：DataWorks のコアプロダクト機能とプロセスに深く統合され、コンテキストデータを完全に接続し、組み込みの DataWorks ツールセットを含みます。

アクセス方法

Copilot チャットダイアログで、Ask モードから Agent モードに切り替えます。
タスクの種類に応じて、/ を入力して適切な Agent タイプを選択します。
プロンプトで Agent に指示を出します。

ユースケース

ユースケース 1 - Data Studio Agent

説明：要件分析、コード生成、ワークフロー生成からパブリッシングまでの完全なワークフローをカバーする、自然言語ベースの ETL 開発体験を提供します。

ユースケース 2 - Data Integration Agent

説明：データ同期のニーズを自然言語 (中国語や英語など) で直接記述できます。システムは自動的にセマンティクスを解析し、ソースと宛先のデータソースタイプ、テーブルスキーママッピング、フィールドフィルタリング条件、パーティショニング戦略、スケジューリングパラメーターなど、対応するデータ同期タスク構成をインテリジェントに生成します。

ユースケース 3 - Data Map Agent

説明：データ検出と理解の効率向上に重点を置いています。AI 駆動の自然言語対話を通じて、膨大なデータセットにまたがるさまざまなシナリオでメタデータを迅速に探索できます。

コア機能：

自然言語検索：自然言語による Q&A をサポートします。正確なキーワードがなくても、ビジネスの意図に基づいて目的のデータを迅速に見つけることができます。例：「ユーザーアクティビティに関連するサマリーテーブルを検索」
自動的な範囲調整：会話で範囲を指定することをサポートします。Agent は自動的にセマンティクスを理解し、その範囲内のデータを迅速に見つけます。例：「adm_bi プロジェクトで、ビジネス運用に関連するテーブルを検索」
詳細なデータ理解：対象データに関するフォローアップの質問をサポートし、データリネージ、オーナー、フィールド定義などの詳細情報を迅速に取得します。例：「@dws_bi_metric_di テーブルの直接の下流依存関係は何ですか？変更による影響を受けるのは誰ですか？」

ユースケース 4 - Data Governance Agent

説明: DataWorks データガバナンスエージェントは、企業のデータガバナンスをプロアクティブなモデルから自律的なモデルへとシフトさせます。複雑な分析やフォームへの入力を行う代わりに、正確なガバナンス操作に変換される自然言語コマンドを使用できます。これらの操作はエキスパートレベルのガバナンス機能で設定され、自動的に実行できます。

コア機能：

品質ルールの構成：自然言語を使用して、指定された主要テーブルの監視ルールを自動的に構成します。Data Governance Agent は、テーブルのフィールドタイプ、ビジネスセマンティクス、重要性をインテリジェントに分析し、プライマリキーの一意性、NOT NULL 制約、許容値検証など、適切な監視ルールを自動的に推奨・構成します。これにより、本来であれば広範なデータ探索とルール構成が必要な作業を効率的に完了できます。
- 例：コアユーザーディメンションテーブル dim_user_info の品質ルールを自動生成する。
- 例：ods_ で始まるテーブルのテーブル行数品質ルールを自動構成する。
品質問題の解決：データ資産ガバナンスモジュールでシステムが自動的に特定した品質問題 (「頻繁にアクセスされるが品質ルールがないテーブル」や「優先度の高いタスクによって生成されたが品質ルールがないテーブル」など) について、自然言語で直接ガバナンス要件を提供できます。システムは自動的に問題を分析し、解決します。
- 例：頻繁にアクセスされるが品質ルールがないテーブルを見つけ、それらに品質ルールを推奨・構成する。
- 例：データ品質問題の解決を手伝ってください。

ユースケース 5 - データ O&M Agent

説明：タスクインスタンスの包括的なヘルスアセスメントと問題診断を提供します。依存関係チェーン、リソースレベル、過去の実行トレンド、変更影響、ログ例外、データ品質など、複数のディメンションを分析することで、構造化された診断レポートを自動的に生成します。

データ O&M Agent の詳細については、「AI を活用した O&M」をご参照ください。

コーディングアシスタント

概要

DataWorks Copilot コーディングアシスタントは、高度な大規模言語モデルに基づいて構築されており、自然言語対話を通じて SQL/Python コードの生成、最適化、説明、テストなどのタスクを効率的に処理します。最良の結果を得るために、DataWorks のデフォルトモデル、Qwen、DeepSeek などのさまざまなモデルを自由に切り替えることができ、ETL 開発とデータ分析の効率を大幅に向上させます。

主な特徴

柔軟なモデル切り替え：デフォルトモデル、Qwen3-235B-A22B などをサポートします。
フルリンク ETL サポート：SQL と Python の両方で、コード生成、Q&A、リファクタリング、最適化、デバッグ、コメント生成、テストケース生成、説明をサポートします。
コンテキスト認識：会話の内容、コード、テーブルスキーマ、データリネージ、カスタムナレッジベースを理解します。

アクセス方法

インテリジェントコードエディター

シナリオ 1：インテリジェントなコード補完

使用方法：コードベースのノードを開発中、Copilot はコンテキスト (入力されたコードや参照されるテーブルスキーマなど) に基づいて、後続のコードスニペットをインテリジェントに予測し、推奨します。補完候補は自動的に表示され、Tab キーを押して受け入れます。

シナリオ 2：右クリックメニューのクイック操作

使用方法：インテリジェントコードエディターで、目的のコードを選択し、右クリックして表示されるメニューから [Copilot] を選択します。

Copilot チャット (Ask モード)

Ask モードは Copilot チャットのデフォルトモードであり、Q&A 形式で特定のコーディング問題を解決するのに適しています。コード生成、コードのリファクタリング、コードのデバッグ、コメント生成、コードの説明、コードの最適化、コードのテスト、コード Q&A、インテリジェントな Notebook セル生成、クイックテーブル検出を実行できます。Ask モードで Copilot チャットを使用する場合、エディターでコードを選択してリクエストのコンテキストとして使用できます。

ユースケース

ユースケース 1：ETL スクリプトの生成

説明：ビジネス要件を自然言語で表現すると、DataWorks Copilot がその自然言語コマンドを SQL または Python 文に自動的に変換します。

例：「dwd_ec_trd_create_ord_di テーブルに基づいて、2024 年 9 月 1 日から 2024 年 9 月 18 日までの各 SPU の売上、販売量、SKU 数、購入者数、販売者数を計算してください。」

ユースケース 2：コードの自動補完

説明：DataWorks Copilot のコード補完機能は、記述中の SQL をインテリジェントに補完できます。

例：コマンドは不要です。候補は自動的に生成されます。表示されたキーを押して受け入れます。

ユースケース 3：コードのリファクタリング

説明：既存のコードを自然言語で変更できます。要件を述べるだけで、DataWorks Copilot が指定されたコードをリファクタリングします。

例: 「unpivot を使用して、結果を列から行に入れ替えるように SQL を修正します。」

ユースケース 4：コードエラーの検出と修正

説明：DataWorks では、実行前にコードのエラーを事前にチェックできます。実行後にコードが失敗した場合も、ワンクリックデバッグを使用してエラーを修正できます。DataWorks Copilot はエラーを説明し、修正されたコードを提供します。

例：コードを選択し、右クリックしてクイックコマンドを選択します。

ユースケース 5：コードの説明

説明：DataWorks Copilot は指定されたコードを説明でき、これにより可読性が向上し、迅速な理解に役立ちます。

例：「この SQL を説明してください。」

ユースケース 6：コードコメントの追加

説明：DataWorks Copilot は指定されたコードのコメントを生成し、その完全性と可読性を向上させます。

例：「各フィールドにコメントを追加してください。」

ユースケース 7：SQL に関する質問への回答

説明：SQL 構文や MaxCompute 関数に関する質問を自然言語で行うことができます。DataWorks Copilot は、理解を深めるための説明と使用例を提供します。

例：「MaxCompute で mapjoin を書くにはどうすればよいですか？」

ユースケース 8：コードパフォーマンスの最適化

説明：DataWorks Copilot チャットウィンドウで、指定されたコードの SQL 最適化を開始できます。たとえば、JOIN を使用して複数のテーブルを結合するなどです。これにより、コードロジックが簡素化され、実行効率が向上し、データベースへの負荷を軽減できます。

例：コードを選択し、ダイアログボックスのクイックコマンドを使用します。

ユースケース 9：テストケースの生成

説明：DataWorks Copilot チャットウィンドウで、指定されたコードのテストケースを生成できます。DataWorks Copilot は、単体テスト、コードパフォーマンス、境界条件の検証など、複数の側面をカバーする完全なコードテストレポートを生成します。また、タスクコードの各部分が期待どおりに機能することを検証するためのテストコードも生成します。

例：「SQL テストケースを生成し、テスト手順を説明してください。」

AI クイック操作

DataWorks のデータ開発、O&M、Data Quality などのモジュールは、LLM の能力を活用して、便利でインテリジェントなプロダクト操作を提供します。これにより、開発者や企業ユーザーが DataWorks の操作を効率的に完了できるインテリジェントなプロダクト体験が提供されます。

クエリ結果の可視化

説明：DataWorks のデータ開発およびデータ分析では、DataWorks Copilot のインテリジェントチャートアシスタントを使用して、クエリ結果からワンクリックで視覚的なチャートとデータインサイトを生成できます。
アクセス方法：ノード実行または SQL クエリ結果で、可視化タブに切り替えます。

AI を活用したテーブル作成

説明：Data Studio のデータカタログでは、DataWorks Copilot のテーブル作成アシスタントを使用して、テーブル名のキーワードを入力するだけでテーブルを作成できます。また、ワンクリックでトリガーして、フィールド名と説明のインテリジェントな推奨を得ることもできます。
アクセス方法：

リリース説明の生成

説明：Data Studio では、パブリッシングプロセス中に、DataWorks Copilot のパブリッシングアシスタントを使用して、ワンクリックでリリース説明を生成し、パブリッシング効率を向上させることができます。
アクセス方法：

タスク例外の診断

説明：DataWorks オペレーションセンターのインテリジェント診断は、Qwen および DeepSeek-R1 (671B) モデルと正式に統合されました。タスクが失敗した場合、[診断を実行] をクリックします。LLM は数秒でログから重要な情報を抽出し、エラー分析と解決策の提案を提供し、エラーを修正するためのクイック操作を推奨して、O&M の自動化を支援します。
アクセス方法：オペレーションセンターページで、左側のナビゲーションウィンドウで 自動トリガーノード O&M > 自動トリガーインスタンス をクリックします。自動トリガーインスタンスページで、失敗したインスタンスをクリックし、失敗したノードを選択してから、右下隅の [診断を実行] をクリックしてタスクを診断します。

データ品質ルールの推奨

説明：Copilot をワンクリックで使用して、DataWorks の完全なメタデータに基づいて、特定のデータテーブルやビジネスシナリオに適した品質ルールを迅速に生成できます。これは、複数のデータソースタイプと多次元の品質チェックをサポートします。
アクセス方法：Data Quality ページで、左側のナビゲーションウィンドウで ルールを構成 > テーブルごとに構成 をクリックします。テーブルごとに構成ページで、ターゲットテーブルを選択し、右側の [モニターを作成] をクリックして、そのテーブルの品質ルールを構成します。

DataService API

説明：DataWorks DataService は、Copilot インテリジェントアシスタントを使用して、迅速な API カプセル化を行うことができます。ビジネス要件に基づいてワンクリックで SQL スクリプトを生成し、それを自動的に API リクエストおよびレスポンスパラメーターに解析できます。
アクセス方法：DataService Studio モジュールで、新しい API を作成し、コードエディターを選択します。

高度な機能とベストプラクティス

応答精度の向上

Copilot の応答を企業の標準やビジネスシナリオによりよく適合させるために、具体的なコンテキストを提供することを強く推奨します。

カスタムナレッジ (ルール)

説明：ルールとは、Copilot のために定義する一連のガイドライン、仕様、および背景知識です。これらは Copilot の思考と応答を導きます。
アクセス方法：Copilot チャットウィンドウで、右上隅のアイコンをクリックして、ルールの構成ページに移動します。
エンタープライズレベルと個人レベルのルール：
- エンタープライズレベルのルール：管理者によって構成され、特定の範囲に適用できます。全社的なビジネス用語、コーディング標準などを定義するのに最適です。
- 個人レベルのルール：個々のユーザーによって構成され、そのユーザーにのみ適用されます。個人のプリファレンス、頻繁に使用するコードスニペットなどを定義するのに最適です。

会話コンテキストの指定

説明：各会話で、現在のタスクに関連するコンテキストを手動で指定できます。これにより、Copilot は応答を生成する際にその情報に集中し、より正確な回答が得られます。
サポートされるコンテキストタイプ：
- テーブル：1 つ以上のテーブルのメタデータを参照します。
- ノード/コードファイル：特定のノード内のコードを参照します。
- データコレクション：データマップからのデータコレクションを参照します。
- ルール：現在の会話に 1 つ以上のルールを一時的に適用します。
- ローカルファイル：ローカルドキュメントをアップロードして背景情報として使用します。
コンテキストの参照方法：Copilot チャットの入力ボックスで、@ と入力するか、+ をクリックしてコンテキストセレクターを開き、項目を追加します。

会話の管理

会話履歴の表示

Copilot は最近の会話を自動的に保存します。

レコード範囲：過去 7 日間の会話を最大 100 件まで表示できます。
アクセス方法：Copilot チャットウィンドウの右上隅にある [履歴] をクリックします。

ベストプラクティス：タスクごとに新しいチャットを開始

個別のタスクごとに新しいチャットを開始することを強く推奨します。

理由：これにより、異なるタスクのコンテキストが互いに干渉するのを防ぎ、Copilot が現在のタスクに集中できるようになり、回答の正確性と関連性が確保されます。

よくある質問

Q：Copilot の回答が不正確であったり、期待と異なったりするのはなぜですか？
A：最も一般的な原因はコンテキストの不足です。「会話コンテキストの指定」で説明されている方法を使用して、より具体的な背景情報を提供してみてください。
Q：Ask モードと Agent モードの違いは何ですか？どのように選択すればよいですか？
A：Ask モードは、コードスニペットの生成や関数の説明など、単純な単一ステップのタスクに適しています。Agent モードは、複数のステップとさまざまなツールの使用を必要とする複雑なタスク向けに設計されています。
Q：Copilot にデフォルトで英語で返信させるにはどうすればよいですか？
A：以下のいずれかのアプローチを使用します。
- 質問する際に、Please answer in English、Respond in English、または Explain in English のような指示を明示的に追加します。
- DataWorks の英語インターフェイスに切り替えて、モデルの英語出力の一貫性と精度を向上させます。