O&M Assistant は、Alibaba Cloud が提供する運用保守 (O&M) 分野向けのインテリジェントアシスタントです。人工知能を活用し、ランタイムの可観測性、データインサイト、インテリジェント診断、自動自己修復といった、インテリジェントな可観測性および O&M 機能を提供します。O&M Assistant は、貴社のエンタープライズアプリケーションとサービスをリアルタイムで保護します。
O&M Assistant は、Alibaba Cloud 可観測性プラットフォームのマルチソースデータ収集、ストレージ、分析能力と、UModel 可観測性データモデルを統合しています。大規模言語モデル (LLM) と マルチエージェント システムの協調アーキテクチャを採用しています。この設計により、学習曲線が急であることやデータサイロといった、従来の O&M ツールの課題を解決します。O&M Assistant は、自然言語対話から自動検査までエンドツーエンドの支援を提供し、運用保守ナレッジベースの構築と自動化をサポートします。
O&M Assistant は現在パブリックプレビュー中です。パブリックプレビュー期間中、機能とユーザーエクスペリエンスの継続的な最適化を行っていきます。
コア機能
O&M Assistant は、インテリジェントセッションとデジタル従業員という 2 つのコア機能モジュールを提供します。
インテリジェントセッション
インテリジェントセッションは、AI との自然言語での対話のための単一のエントリポイントを提供します。複雑なクエリメソッドを使用する代わりに、自然言語を使ってランタイムステータスを把握し、メトリックを分析し、イベントを診断し、エージェントに O&M タスクの実行を指示できます。
対話機能:コンテキスト認識と意図追跡を備えた、忠実度の高いマルチターン対話をサポートします。これにより、アシスタントは対話中に暗示されたり変化したりするユーザーのニーズを正確に特定できます。その結果、質問をしたり、複数回フォローアップしたり、一貫した対話を維持したりできる、自然な対話体験が実現します。
タスク実行:データ探索、異常検知、障害診断、根本原因分析など、典型的なインテリジェント分析シナリオをカバーします。ビジネスコンテキストに基づいて分析メソッドとツールチェーンを動的に呼び出し、正確で効率的なタスク実行を保証します。
結果の提示:視覚的なチャート、論理的な推論パス、構造化テキストを組み合わせた包括的な分析レポートを出力します。レポートは、「何が」起こったかを示すだけでなく、「なぜ」それが起こったのか、そして「どのように」修正するのかを説明します。視覚的なチャートは理解を助け、推論プロセスは透明であり、結論は整理されています。これにより、意思決定の効率と信頼性が大幅に向上します。
デジタル従業員 (カスタム O&M エージェント)
デジタル従業員は、O&M Assistant のカスタムエージェント機能です。これらのエージェントに対して、特定の権限と動作ルールを設定できます。従来の Q&A ボットとは異なり、デジタル従業員はビジネスシナリオに合わせて柔軟にカスタマイズできます。
複数インスタンスの並列連携:機能的に独立した複数のデジタル従業員を作成できます。各インスタンスは独自のコンテキストメモリとタスクキューを持ち、これにより異なる O&M タスクを並列で処理できます。
ロール定義:名前、職責記述、および動作制約命令セットをカスタマイズできます。これにより、エージェントを特定のビジネスロールに合わせて調整できます。
きめ細かな権限管理:各デジタル従業員の操作権限範囲を設定して、エンタープライズレベルのセキュリティおよびコンプライアンス要件を満たすことができます。
独立したセッション管理:完全な過去の対話レコードのクエリと現在のセッションコンテキスト管理を提供し、運用保守プロセスの追跡可能性を保証します。
コアな強み
O&M Assistant は、統一データプラットフォーム、UModel、従来のアルゴリズム、生成 AI を組み合わせたハイブリッド処理アーキテクチャを使用しています。このアプローチは、数値計算の精度の低さや論理的な幻覚 (ハルシネーション) といった大規模モデルの限界を効果的に克服します。
堅牢なデータ基盤
O&M Assistant は、Alibaba Cloud 可観測性プラットフォームのマルチソースデータ収集、ストレージ、分析能力の上に構築されています。これにより、エンティティ関係データ、ログ、メトリック、トレース、イベントなどのデータの大規模なリアルタイム分析が可能になります。UModel コンテキスト認識
O&M Assistant は UModel グラフモデルを使用して、リアルタイムトポロジーとメトリックの関連付けを構築します。これにより、AI に正確でリアルタイムな運用保守コンテキストが提供され、データサイロの問題が解決されます。アルゴリズムと大規模モデルの統合
前処理:O&M Assistant は、時系列異常検知、ログクラスタリング、多次元ドリルダウンなどの特徴抽出に従来のアルゴリズムを使用します。このプロセスにより、データの精度が保証されます。
推論と意思決定:大規模モデルは、アルゴリズムによって抽出された特徴と UModel トポロジーを使用して高度な論理推論を実行します。その後、根本原因分析と修正提案を生成します。
一般的なシナリオ
自然言語によるデータ探索:自然言語を基盤となるクエリ文に変換することで、データクエリの障壁を下げます。SPL や SQL を知らなくても、メトリックやログをクエリできます。
エンドツーエンドの異常診断:多次元メトリック、ログ、トレース、イベントデータを自動的に分析します。この分析を UModel トポロジーと過去の障害パターンと組み合わせることで、異常を自動的に発見します。
根本原因の自動分析:障害発生時、O&M Assistant は異常なメトリック、変更イベント、依存トポロジーを自動的に関連付けます。その後、障害の根本原因を特定し、修正提案を提供することで、障害復旧時間を短縮します。