すべてのプロダクト
Search
ドキュメントセンター

Application Real-Time Monitoring Service:LLM メトリック

最終更新日:Mar 29, 2025

このトピックでは、Grafana ダッシュボードのカスタマイズに利用できる主要な大規模言語モデル (LLM) メトリックについて説明します。

共通ラベル

ディメンションの説明

ディメンションキー

サービス名

service

llm-rag-demo

サービス PID

pid

ggxw4lnjuz@0cb8619bb54****

サーバー IP アドレス

serverIp

127.0.0.1

インターフェース

rpc

query

アプリケーションソース

source

  • xtrace: アプリケーションが Managed Service for OpenTelemetry で監視されていることを示します。

  • apm: アプリケーションが Application Real-Time Monitoring Service (ARMS) で監視されていることを示します。

リクエストメトリック

説明

設計上、リクエストメトリックは、提供されたサービスや依存サービスなど、イベントトラッキングでサポートされているプロトコルと呼び出しタイプをカバーします。詳細については、「アプリケーション監視メトリック」をご参照ください。

メトリックの説明

メトリック名

測定

収集間隔(単位:秒)

単位

ディメンション

リクエストの合計

arms_$callType_requests_count

Gauge

15

なし

サービスアクセスタイプによって適用されるディメンションが異なります。詳細については、「アプリケーション監視メトリック」をご参照ください。

エラーリクエストの数

arms_$callType_requests_error_count

Gauge

15

なし

リクエスト合計時間

arms_$callType_requests_seconds

Gauge

15

低速リクエストの数

arms_$callType_requests_slow_count

Gauge

15

なし

LLM メトリック

共通ラベルに加えて、次のラベルも使用できます: modelName、spanKind、usageType。

ディメンションの説明

ディメンションキー

備考

モデル名

modelName

  • gpt-4

  • text-davinci-003

なし

操作タイプ

spanKind

LLM、CHAIN、または EMBEDDING

詳細については、「LLM アプリケーションのトレースフィールド」をご参照ください。

なし

使用タイプ

usageType

  • input

  • output

トークン関連のメトリックのみに使用可能

操作タイプ

メトリックの説明

メトリック名

測定

収集間隔(単位:分)

単位

ディメンション

LLM を呼び出すリクエストの数

genai_calls_count

Gauge

1

なし

  • modelName

  • spanKind

LLM を呼び出すレスポンスタイム

genai_calls_duration_seconds

Gauge

1

  • modelName

  • spanKind

LLM 呼び出しエラーの数

genai_calls_error_count

Gauge

1

なし

  • modelName

  • spanKind

低速な LLM 呼び出しの数

genai_calls_slow_count

Gauge

1

なし

  • modelName

  • spanKind

LLM パフォーマンス

メトリックの説明

メトリック名

測定

収集間隔(単位:分)

単位

ディメンション

LLM の最初のトークンまでの時間 (TTFT)

genai_llm_first_token_seconds

Gauge

1

  • modelName

  • spanKind

LLM 使用量

メトリックの説明

メトリック名

測定

収集間隔(単位:分)

単位

ディメンション

使用済みトークンの数

genai_llm_usage_tokens

Gauge

1

なし

  • modelName

  • spanKind

  • 使用タイプ

    • 入力

    • 出力