Python プローブをインストールすると、ARMS は LLM アプリケーションの監視を開始し、概要 ページで、大規模モデル呼び出し頻度、トークン使用量、トレース数、セッション数などのメトリックを表示できるようになります。
前提条件
LLM アプリケーション用にプローブがインストールされていること。 詳細については、「参照ドキュメント」をご参照ください。
LLM アプリケーションの概要を表示する
-
上部のナビゲーションバーで、概要 をクリックします。
ダッシュボードの説明

パネル | 説明 |
モデル呼び出し数 | 指定された期間内にアプリケーションの大規模言語モデルが呼び出された回数。 |
トークン使用量 | 指定された期間内にアプリケーションのトークンが使用された回数。 |
トレース数 | 指定された期間内にアプリケーションによって生成された呼び出しチェーンの数。 |
スパン数 | 指定された期間内にアプリケーションによって生成されたスパンの数。 |
セッション数 | 指定された期間内にアプリケーションによって生成されたセッションの数。 |
ユーザー数 | 指定された期間内のアプリケーションのユーザー数。 |
操作タイプの分布 |
|
リクエストごとの平均 LLM 呼び出し数 | 1 分あたりのリクエストごとの大規模言語モデルの平均呼び出し数。 |
リクエストトレンド | LLM アプリケーションの 1 分あたりのリクエスト数のトレンドグラフ。 |
モデル呼び出しランキング | LLM アプリケーションで最も頻繁に呼び出される上位 5 つの言語モデル。 |
リクエストユーザーランキング | LLM アプリケーションで最も多くのリクエストを開始した上位 5 人のユーザー。 |
セッションのトレンド | LLM アプリケーションの 1 分あたりのセッション数のトレンドグラフ。 |