すべてのプロダクト
Search
ドキュメントセンター

DataWorks:DataWorks Copilot

最終更新日:Dec 03, 2025

DataWorks Copilot は、面倒な手作業のデータ作業から解放するための組み込み AI アシスタントです。反復的で非効率なタスクから解放され、イノベーションやクリティカルシンキングのための時間をより多く確保できます。DataWorks に深く統合された Copilot は、データ開発を簡素化し、加速させます。自然言語の命令を使用して、Copilot で以下のことが可能です。

  • インテリジェントコーディング:アイデアを高品質で標準化されたコードに即座に変換します。

  • タスク作成の自動化:データ開発およびガバナンスタスクをインテリジェントに完了し、ワークフローを自動化します。

  • チームナレッジの集約:ベストプラクティスとビジネスナレッジを各タスクのコンテキストとして取り込みます。

I. 機能概要

DataWorks Copilot とは

DataWorks Copilot は、ワンストップのインテリジェントなデータ開発・ガバナンスプラットフォームである DataWorks のインテリジェントアシスタントです。AI 推論と自然言語処理 (NLP) を使用して、開発者が対話形式のコマンドでさまざまなコード関連の操作を迅速に実行できるよう支援します。これらの操作には、SQL または Python コードの生成、補完、リファクタリング、最適化、解説、さらにコードのデバッグやテストケースの生成が含まれます。データ開発のインテリジェントエンジンとして、Copilot はコンテキストに基づいてビジネス要件を迅速に理解します。企業固有のナレッジベースのサポートにより、DataWorks Copilot は開発者が抽出・変換・書き出し (ETL) やデータ分析タスクを簡単かつ効率的に完了できるようにします。

DataWorks Copilot には、コーディングアシスタントAgentAI クイック操作という 3 つのコア機能が含まれています。これらの機能は、さまざまな DataWorks プロダクトモジュールに深く統合され、新しいインテリジェントなデータ作業体験を提供します。

コアバリュー

  • 効率の向上:コードの自動生成、インテリジェントなコード補完、自然言語インタラクションにより、データ開発および分析サイクルを大幅に短縮します。

  • 参入障壁の低減:複雑な SQL やプロダクト操作に不慣れなユーザーでも、自然言語を使用してデータ開発およびガバナンスタスクを迅速に開始し、完了できます。

  • 品質の向上:AI を使用してコードのデバッグ、最適化、テストケースの生成を行い、コードの品質と保守性を向上させます。

  • ナレッジの継承:カスタム企業ナレッジベースを通じて、企業標準、ビジネス定義、技術標準を AI に統合し、ナレッジを継承・適用します。

提供状況とポリシー

  • 利用対象:DataWorks Basic Edition 以上をご利用のお客様。一部の機能は、Data Studio の新バージョンでのみ利用可能です。

  • 利用可能なリージョン:中国 (張家口)、中国 (北京)、中国 (ウランチャブ)、中国 (杭州)、中国 (上海)、中国 (深セン)、中国 (成都)、中国 (香港)、シンガポール、マレーシア (クアラルンプール)、インドネシア (ジャカルタ)、日本 (東京)。

  • 現在のフェーズ:完全パブリックプレビュー。参加するには、Alibaba Cloud アカウントの所有者、テナント管理者、または同等の権限を持つユーザーが Copilot をクリックし、DataWorks Copilot 利用規約をよくお読みになった上で、[参加を確認] をクリックする必要があります。確認後、その Alibaba Cloud アカウント配下のすべてのユーザーが Copilot の利用を開始できます。

  • 料金:DataWorks Copilot はパブリックプレビュー期間中は完全に無料です。パブリックプレビュー終了後は有料サービスとなります。具体的な料金モデルは別途発表されます。

II. クイックスタート

Copilot の起動方法

以下の方法で Copilot と対話できます。

  • グローバルエントリポイント:DataWorks インターフェイスの右上隅にある Copilot アイコンをクリックして、Copilot チャットダイアログボックスを開きます。

  • エディター内:コードベースのデータ開発ノード用のインテリジェントコードエディターで、右クリックメニューまたはキーボードショートカットを使用して Copilot を開くことができます。

  • モジュールへの埋め込み:特定のプロダクトモジュールの機能エリアにある Copilot アイコンが付いたクイック操作ボタンを使用できます。

メインインターフェイスの概要

image

III. コア機能の詳細

コーディングアシスタント:コーディングの効率と品質の向上

機能概要

DataWorks Copilot インテリジェントプログラミングアシスタントは、高度な大規模言語モデル (LLM) に基づいています。自然言語インタラクションを使用して、SQL または Python コードの生成、最適化、解説、テストなどのタスクを効率的に実行します。最良の結果を得るために、DataWorks のデフォルトモデル、Qwen、DeepSeek など、さまざまなモデルを自由に切り替えることができます。この機能により、ETL 開発とデータ分析の効率が大幅に向上します。

コア機能のハイライト

  • 複数モデルの切り替え:デフォルトモデル、Qwen3-235B-A22B などをサポートします。

  • フルライフサイクル ETL サポート:SQL および Python のコード生成、Q&A、リファクタリング、最適化、デバッグ、コメント付け、テストケース生成、解説をサポートします。

  • コンテキスト認識:会話内容、コード、テーブルスキーマ、データリネージ、カスタムナレッジベースなどを理解します。

機能のエントリポイント

インテリジェントコードエディター

シナリオ 1:インテリジェントなコード補完

使用方法:コードベースのノードを開発中、Copilot は入力されたコードや参照されているテーブルスキーマなどのコンテキストに基づいて、後続のコードスニペットをインテリジェントに予測し、推奨します。補完の提案は自動的に表示されます。Tab キーを押して提案を受け入れることができます。

シナリオ 2:右クリックメニューのショートカット

使用方法:インテリジェントコードエディターで、必要に応じてコードを選択し、右クリックして表示されるメニューから [Copilot] を選択します。

image

Copilot チャット (Ask モード)

Ask モードは Copilot チャットのデフォルトモードであり、質疑応答形式で特定のコーディング問題を解決するのに適しています。コード生成、コードのリファクタリング、コードのデバッグ、コメント生成、コードの解説、コードの最適化、コードテスト、コード Q&A、インテリジェントな Notebook セル生成、迅速なテーブル検出などでユーザーを支援します。Ask モードで Copilot チャットを使用する場合、エディターでコードを選択して、対象の操作にコンテキストを提供できます。

ベストプラクティスシナリオ

シナリオ 1 - ETL スクリプトの迅速な生成

説明:ビジネス要件を自然言語で記述すると、DataWorks Copilot が自動的に命令を SQL または Python 文に変換します。

:「dwd_ec_trd_create_ord_di テーブルに基づいて、2024 年 9 月 1 日から 2024 年 9 月 18 日までの各 SPU の売上、販売量、SKU 数、購入者数、販売者数を計算してください。」

シナリオ 2 - 既存のコードスニペットに基づいてコード生成を続行

説明:DataWorks Copilot のコード補完機能は、作成中の SQL をインテリジェントに補完します。

:命令は不要です。コードは自動的に生成されます。インターフェイスに表示されるキーを押して提案を受け入れます。

image

シナリオ 3 - 既存のコードのリファクタリング

説明:自然言語を使用して既存のコードを変更できます。要件を述べるだけで、DataWorks Copilot が指定されたコードをリファクタリングします。

: 「unpivot を使用して、結果を列から行に入れ替えるように SQL を修正します。」

シナリオ 4 - コード内のエラーを迅速に特定して修正

説明:DataWorks では、実行前に既存のコードのエラーを事前にチェックできます。コードの実行中にエラーが発生した場合は、ワンクリックデバッグを使用して修正することもできます。DataWorks Copilot はエラーの原因を特定し、修正されたコードを提供します。

:コードを選択し、右クリックしてクイック命令を選択します。

シナリオ 5 - コードスニペットのビジネス上の意味を解説

説明:DataWorks Copilot は、指定したコードの内容を解説できます。これにより、コードの可読性が向上し、コードを迅速に学習・理解するのに役立ちます。

:「この SQL を解説してください。」

シナリオ 6 - 既存のコードのフィールドコメントを生成

説明:DataWorks Copilot は、指定されたコードのコメントを生成でき、その完全性と可読性を向上させます。

:「各フィールドにコメントを追加してください。」

シナリオ 7 - SQL 構文または関数の使用法に関する質問に回答

説明:SQL 構文または MaxCompute 関数に関する質問を自然言語で行うことができます。DataWorks Copilot は、SQL 構文と関数をよりよく理解するのに役立つ解説と使用例を提供します。

:「MaxCompute で mapjoin を書くにはどうすればよいですか?」

シナリオ 8 - 既存のコードのパフォーマンスを最適化

説明:DataWorks Copilot チャットウィンドウで、指定したコードの SQL 最適化を開始できます。このプロセスにより、たとえば複数テーブルの JOIN を導入することで、コードロジックを簡素化できます。これにより、コードの実行効率が向上し、データベースのペイロードを削減できます。

:コードを選択し、ダイアログボックスのクイック命令を使用します。

シナリオ 9 - 既存のコードのテストケースを生成

説明:DataWorks Copilot チャットウィンドウで、指定したコードのテストケースを生成できます。DataWorks Copilot は、単体テスト、コードパフォーマンス、境界条件の検証など、複数の側面をカバーする完全なコードテストレポートを生成します。また、タスクコードの各部分が期待どおりに機能することを検証するために使用できるテストコードも生成します。

:「SQL テストケースを生成し、テスト手順を解説してください。」

Agent:複雑なタスクの自動化

機能概要

DataWorks Agent サービスは、データ開発とガバナンスを自動化の新時代へと導きます。これは単なる Q&A ツールではありません。複雑なタスクを自律的に完了できるエージェントです。

DataWorks Agent を使用すると、自然言語を使用して、Data Integration、データ開発、Data Map、データガバナンスなど、DataWorks 上のデータ開発およびデータガバナンスタスクの一部を自動化できます。大規模言語モデルの深い思考と計画能力を通じて、エージェントはユーザーのタスクを完全に理解し、ステップに分解し、実行計画を作成し、MCP Server 内の関連ツールを呼び出してタスク実行を自動化します。DataWorks は、DataWorks MCP Server のツールセットを継続的に充実させ、反復することで、ユーザーによりインテリジェントで効率的なデータ開発およびガバナンス体験を提供します。

コア機能のハイライト

  • 深い理解と自律的な計画:コンテキスト認識とマルチターン対話に基づいて複雑な意図を正確に特定し、タスクを複数ステップの実行可能な計画に自律的に分解します。

  • 自動化されたデータ開発およびガバナンスプロセス:DataWorks のコアプロダクト機能とプロセスに深く統合され、コンテキストデータを完全に接続し、組み込みの DataWorks ツールセットを含みます。

機能のエントリポイント

  1. Copilot チャットダイアログボックスで、[Ask モード] から [Agent モード] に切り替えることができます。

  2. タスクの種類に基づいて、/ を入力し、適切な Agent タイプを選択できます。

  3. 質問をすることで Agent に命令を与えることができます。

    image

ベストプラクティスシナリオ

シナリオ 1 - Data Studio Agent

説明:要件分析からコード生成、ワークフロー生成、公開まで、プロセス全体をカバーする自然言語ベースの ETL 開発体験を提供します。

シナリオ 2 - Data Map Agent

説明:データ検出と理解の効率向上に焦点を当てています。AI 駆動の自然言語インタラクションを通じて、さまざまなシナリオで膨大な量のデータにわたるメタデータを迅速に探索できます。

コア機能

  • 自然言語検索:自然言語 Q&A をサポートします。正確なキーワードを必要とせず、ビジネスの意図に基づいてターゲットデータを迅速に見つけることができます。例:「ユーザーの人気に関連する集計テーブルを検索してください。」

  • スコープの自動調整:会話でスコープを指定することをサポートします。Agent はセマンティクスを自動的に理解し、そのスコープ内のデータを迅速に見つけます。例:「adm_bi プロジェクトで、ビジネス運用に関連するテーブルを検索してください。」

  • データの深い理解:ターゲットデータに関するフォローアップの質問をサポートし、データリネージ、オーナー、フィールド定義などの詳細情報を迅速に取得します。例:「@dws_bi_metric_di テーブルの直接の下流の依存関係は何ですか?変更された場合、どのオーナーが影響を受けますか?」

シナリオ 3 - Data Governance Agent

説明:DataWorks Data Governance Agent は、企業のデータガバナンスをプロアクティブモデルから自律モデルへと推進します。データガバナンスはもはや、複雑なデータ分析や広範なフォーム構成の変更ではありません。今では、自然言語の命令を提供するだけで、それが正確なガバナンスアクションに変換されます。エキスパートレベルのガバナンス機能を使用して、自動的に実行できるガバナンス操作を設定します。

コア機能

  • 品質ルールの構成:自然言語を使用して、指定された主要テーブルの品質監視ルールを自動的に構成できます。Data Governance Agent は、指定されたテーブルのフィールドタイプ、ビジネスセマンティクス、重要性をインテリジェントに分析できます。その後、プライマリキーの一意性、非 NULL 制約、列挙値範囲チェックなど、適切な監視ルールを自動的に推奨および構成します。このプロセスは、以前は複数のデータ探索とルール構成を必要とした作業を効率的に完了します。

    • 例:コアユーザーディメンションテーブル dim_user_info の品質ルールを自動的に生成するのを手伝ってください。

    • 例:ods_ で始まるテーブルに対して、テーブルの行数に関連する品質ルールを自動的に構成してください。

  • 品質問題の管理:データ資産ガバナンスモジュールでシステムによって自動的に発見された品質問題 (「頻繁にアクセスされるテーブルに品質ルールが構成されていない」、「高ベースラインタスクによって生成されたテーブルに品質ルールが構成されていない」など) については、自然言語で直接ガバナンス要件を提供できます。システムは問題を自動的に分析し、対応するガバナンスを実行します。

    • 例:品質ルールが構成されていない頻繁にアクセスされるテーブルを見つけ、品質ルールを推奨および構成してください。

    • 例:品質ディメンションに関連する問題を解決するのを手伝ってください。

AI クイック操作:プロダクトモジュール内の操作の簡素化

Data Studio、オペレーションセンター、Data Quality などの DataWorks のモジュールは、大規模言語モデルの機能を使用して、便利でインテリジェントなプロダクト操作を提供します。この機能は、開発者や企業ユーザーにインテリジェントなプロダクト体験を提供し、DataWorks での操作を効率的に完了させることを目的としています。

クエリ結果のインテリジェントな可視化

  • 説明:DataWorks Data Studio またはデータ分析では、DataWorks Copilot インテリジェントチャートアシスタントを使用して、ワンクリックでクエリ結果からビジュアルチャートとデータインサイトを生成できます。

  • エントリポイント:ノード実行または SQL クエリ結果で、可視化タブに切り替えます。

    image

AI によるインテリジェントなテーブル作成

  • 説明:Data Studio データカタログでは、DataWorks Copilot テーブル作成アシスタントを使用して、テーブル名のキーワードを入力してテーブルを作成できます。また、ワンクリックでトリガーして、フィールド名とフィールドの説明をインテリジェントに推奨および補完することもできます。

  • エントリポイント

    image

タスク公開説明の生成

  • 説明:Data Studio では、公開フェーズ中に DataWorks Copilot 公開アシスタントを使用して、ワンクリックで公開説明を生成し、公開効率を向上させることができます。

  • エントリポイント

    image

タスク例外のインテリジェント診断

  • 説明:DataWorks オペレーションセンターのインテリジェント診断機能は、Qwen および DeepSeek-R1 (671B) モデルと統合されています。タスクが異常に実行された場合、[診断を実行] をクリックできます。大規模言語モデルは、ログから数秒でキー情報を抽出し、エラー分析と解決策の提案を提供し、エラーを修正するためのクイックアクションを推奨することで、AI が O&M を処理できるようにします。

  • エントリポイント:オペレーションセンターページの左側のナビゲーションウィンドウで、自動トリガーノード O&M > 自動トリガーインスタンス をクリックします。失敗したインスタンスをクリックし、失敗したノードを選択してから、右下隅の [診断を実行] をクリックして、タスクのインテリジェント診断を実行します。

データ品質ルールのインテリジェントな推奨

  • 説明:ユーザーはワンクリックで Copilot を開き、DataWorks の完全なメタデータに基づいて、特定のデータテーブルやビジネスシナリオに適したデータ品質ルールを迅速に生成できます。この機能は、複数のデータソースタイプと多次元の品質チェックをサポートします。

  • アクセス方法:Data Quality ページで、左側のナビゲーションウィンドウの ルールを構成 > テーブルごとに構成 をクリックします。ページで、ターゲットテーブルを選択し、右側の モニターを作成 をクリックして、テーブルの品質ルールを構成します。

    image

DataService API

  • 説明:DataWorks の DataService Studio は、Copilot インテリジェントアシスタントを使用して、迅速な API カプセル化を行うことができます。ビジネス要件に基づいてワンクリックで SQL スクリプトを生成し、スクリプトを自動的に解析して API リクエストおよびレスポンスパラメーターに変換できます。

  • エントリポイント:DataService Studio モジュールで、新しい API を作成し、コードエディターを選択します。

    image

IV. 高度な機能とベストプラクティス

回答精度の向上:Copilot に正確な「メモリ」を提供

Copilot の回答を企業の標準やビジネスシナリオにより関連性の高いものにするために、正確なナレッジを提供することを推奨します。

カスタムナレッジ (ルール)

  • 説明:ルールは、Copilot のために定義する一連の標準とバックグラウンドナレッジです。これらは Copilot の思考と回答をガイドします。

  • エントリポイント:Copilot チャットダイアログボックスの右上隅にある image アイコンをクリックして、ルール構成ページに移動します。

  • エンタープライズレベルのルールと個人レベルのルール

    • エンタープライズレベルのルール:管理者によって構成されます。有効範囲の設定をサポートします。企業レベルのビジネス用語、コーディング標準などの定義に適しています。

    • 個人レベルのルール:個々のユーザーによって構成され、そのユーザーにのみ有効です。個人のプリファレンス、頻繁に使用するコードスニペットなどの定義に適しています。

    image

会話でコンテキストを指定する

  • 説明:各会話で、現在のタスクに関連するコンテキストを手動で指定できます。これにより、Copilot は回答時にその情報に集中でき、より正確な回答が得られます。

  • サポートされるコンテキストタイプ

    • テーブル:1 つ以上のテーブルのメタデータを参照します。

    • ノード/コードファイル:特定のノードのコードを参照します。

    • データ収集:Data Map のデータ収集を参照します。

    • ルール:現在の会話で有効にする 1 つ以上のルールを一時的に指定します。

    • ローカルファイル:ローカルドキュメントをバックグラウンド情報としてアップロードします。

  • コンテキストの参照方法:Copilot チャット入力ボックスで、@ を入力するか、+ をクリックしてコンテキストセレクターを開き、コンテキストを追加します。

    image

会話の管理

対話履歴の表示

Copilot は最近の会話を自動的に記録します。

  • レコード範囲過去 7 日間の最大 100 件の会話レコードの表示をサポートします。

  • エントリポイント:Copilot チャットウィンドウの右上隅にある「履歴」をクリックします。

ベストプラクティス:タスクごとに新しい会話を開始する

独立したタスクごとに新しい会話 ([新しいチャット]) を開始することを推奨します。

  • 理由:この習慣により、異なるタスクのコンテキストが互いに干渉するのを防ぎます。これにより、Copilot は現在のタスクに集中でき、回答の正確性と関連性が確保されます。

よくある質問

  • Q:Copilot の回答が不正確であったり、期待通りでなかったりするのはなぜですか?

    A:コンテキストが不十分な可能性があります。会話でコンテキストを指定するで説明されている方法を使用して、より正確なバックグラウンド情報を Copilot に提供してみてください。

  • Q:Ask モードと Agent モードの違いは何ですか?どのように選択すればよいですか?

    A:Ask モードは、コードスニペットの生成や関数の解説など、単純な質疑応答形式のタスクに適しています。

    Agent モードは、複数のステップを必要とし、さまざまなツールが関与する複雑なタスクに適しています。