AI を活用した運用保守は DataWorks の機能であり、DataWorks Copilot を利用して、タスクインスタンスに対する包括的なヘルス評価と問題診断を提供します。依存関係チェーン、リソースレベル、過去のパフォーマンス傾向、変更による影響、ログの異常、データ品質など、複数の要素を分析することで、構造化された診断レポートを自動的に生成します。このレポートは、問題の根本原因を明らかにし、明確な解決策を提示し、ワンクリックで解決できる操作を提供します。これにより、運用保守が事後対応型から事前対応型へと移行し、効率が大幅に向上します。
機能概要
AI を活用した運用保守は、DataWorks におけるタスク運用保守のためのワンストップのインテリジェントツールであり、従来のインテリジェント運用保守機能をアップグレードしたものです。タスクの失敗、実行時間の遅延、リソース競合などの問題が発生した場合、DataWorks の AI を活用した運用保守は、タスクのライフサイクル全体を自動的に分析し、根本原因を迅速に特定して、ワンクリックの運用保守操作を含む解決策を提供します。

主な機能:
包括的な診断:未実行、待機中、実行中、完了 (成功または失敗) に至るまで、あらゆるタスクの状態をカバーします。診断範囲は、個別のインスタンス、ワークフロー、およびプロジェクト全体をサポートします。依存関係、リソース使用量、過去のパフォーマンス、ログの内容を分析することで徹底的な診断を提供し、コンテキストに応じたフォローアップ質問もサポートします。
根本原因分析:単純なエラーログにとどまらず、多次元の情報を関連付けることで根本原因を特定します。
対話型の運用保守:チャットダイアログで直接、運用保守コマンド (再実行、成功に設定、リソースグループの変更など) を発行できます。複雑な操作をワンクリックボタンに簡素化し、運用保守の効率を大幅に向上させます。
クイックスタート
このセクションでは、失敗したタスクインスタンスのトラブルシューティングという典型的な利用シーンを例に、診断プロセス全体を説明します。
診断の開始
に移動し、失敗したターゲットインスタンスを見つけます。
インスタンス名をクリックして DAG を展開します。インスタンスにカーソルを合わせ、クイック操作バーの [AI 診断] ボタンをクリックします。

AI 分析の待機
右側に DataWorks Copilot アシスタントが開き、「DataWorks Copilot is processing...」と表示されます。処理中、Copilot は分析ステップを表示し、その「思考」プロセスを理解するのに役立ちます。次の図は、典型的な診断フローを示しています。各ステップを展開して詳細を表示できます。


診断レポートの確認
数秒後、Copilot は構造化された診断レポートを返します。次のセクションに注目してください:
異常な検出結果:このセクションでは、異常を特定し、利用可能なコンテキストから根本原因を推測します。
分析プロセス:このセクションでは、AI の結論を裏付ける証拠チェーンを詳述します。
解決策と予防策:問題を修正するための具体的で実行可能な手順と、再発を防ぐための長期的な推奨事項を提供します。

解決策の実行
レポートの提案に従います。
即時操作:レポートには、問題に直接関連するクイック操作が提供されることがよくあります。たとえば、リソースグループの問題の場合、タスクのリソースグループを変更するためのショートカットが提供されることがあります。次の図に示すように、
Yesと返信すると、AI のガイドに従ってリソースグループを変更できます。

対話型操作:レポートに特定の操作が提供されていない場合は、チャットにコマンドを入力して問題を解決できます。たとえば、「タスク xxx のリソースグループを変更」と入力すると、Copilot がプロセスをガイドします。自然言語を使用することで、AI は複雑なコンテキストのリクエストを動的に理解できるため、操作が簡素化され、非構造化の運用保守シナリオに最適です。

診断レポートの内容と提案されるソリューションは、障害の原因によって異なります。提供される情報は参考用です。サポートされている O&M エージェントの操作のリストについては、「O&M 操作」をご参照ください。
注意事項
プロジェクトレベルの診断や多数のインスタンスを含む分析は、完了までに 1〜5 分かかる場合があります。
ワークスペースをまたいで依存関係を分析できます。ただし、詳細な結果を表示するには、ターゲットワークスペースのメンバーである必要があります。
AI 診断へのアクセス
DataWorks の複数のエントリーポイントから AI を活用した運用保守にアクセスできます。
グローバルエントリーポイント (Copilot)
DataWorks の任意のページで、右上の Copilot チャットを開き、Copilot をエージェントモードに切り替えて、/Data O&M を選択します:

Diagnose instance [Instance ID] と入力したり、@<Instance ID> でインスタンスを参照してコンテキストを提供したり、 のようなプロンプトでプロジェクトを診断したりできます。
グローバルエントリーポイントからは、/Data O&M エージェントを指定する必要があります。コンテキストエントリーポイントでは、デフォルトで運用保守エージェントが使用されます。
コンテキストエントリーポイント
場所 | アクセス方法 |
オペレーションセンターで、左側のナビゲーションウィンドウにある [AI を活用した運用保守] をクリックします。 | |
オペレーションセンター > インスタンスリスト | [操作] 列で、 をクリックします。これは、スケジュールされたインスタンス、テストインスタンス、およびデータバックフィルインスタンスの診断をサポートします。 |
オペレーションセンター > DAG | ノードインスタンスにカーソルを合わせ、[AI 診断] ボタンをクリックします。 |
[インスタンス実行ログ] タブ | [ログ診断] ページの上部にある [AI 診断] ボタンをクリックします。これにより、Copilot が自動的に開き、診断コマンドが送信されます。 |
[ログ診断] ページ | ページ中央のダイアログボックスで [AI 診断] を有効にし、インスタンス ID またはプロジェクト ID を入力して、診断を開始します。 |
注:元の [インテリジェント診断] ボタンは [ログ診断] に名称変更され、現在は現在のログの内容の分析に重点を置いています。
利用シーン
インスタンスレベルの問題
タイプ | コマンド例 |
タスクの失敗 |
|
実行時間の遅延 |
|
長い待機時間 |
|
依存関係によるブロッキング |
|
運用保守操作
診断レポートから、または Copilot との会話内で、ワークスペース内の単一または複数のタスクやインスタンスに対して次の操作を実行できます:
AI チャットで実行されるすべての操作は、実行前に手動でのレビューと確認が必要です。
操作 | 説明 |
インスタンスの再実行 | 現在のインスタンスを再実行します。 |
成功に設定 | インスタンスのステータスを「成功」に設定します。 |
インスタンスの一時停止/再開 | スケジューリング状態を制御します。 |
リソースグループの変更 | リソースグループを切り替えます。 |
優先度の変更 | スケジューリングの優先度を調整します。これはベースラインのスケジューリングに影響します。 |
インスタンスの更新 | インスタンスを最新のタスク構成で更新します。 |
ターゲットワークスペースで プロジェクトオーナー または 運用保守 のロールが必要です。