全部产品
Search
文档中心

Application Real-Time Monitoring Service:Metrik LLM

更新时间:Jul 06, 2025

Topik ini menjelaskan metrik utama model bahasa besar (LLM) yang dapat digunakan untuk menyesuaikan Dasbor Grafana.

Label umum

Deskripsi dimensi

Kunci dimensi

Contoh

Nama layanan

service

llm-rag-demo

PID Layanan

pid

ggxw4lnjuz@0cb8619bb54****

Alamat IP server

serverIp

127.0.0.1

Antarmuka

rpc

query

Sumber aplikasi

source

  • xtrace: menunjukkan bahwa aplikasi dipantau di Managed Service for OpenTelemetry.

  • apm: menunjukkan bahwa aplikasi dipantau di Application Real-Time Monitoring Service (ARMS).

Metrik permintaan

Catatan

Secara desain, metrik permintaan mencakup protokol dan jenis pemanggilan yang didukung oleh instrumentasi, seperti layanan yang disediakan dan bergantung. Untuk informasi lebih lanjut, lihat Metrik pemantauan aplikasi.

Deskripsi metrik

Nama metrik

Pengukuran

Interval pengumpulan (Satuan: detik)

Satuan

Dimensi

Total permintaan

arms_$callType_requests_count

Gauge

15

Tidak ada

Dimensi berbeda berlaku untuk tipe akses layanan yang berbeda. Untuk informasi lebih lanjut, lihat Metrik pemantauan aplikasi.

Jumlah permintaan error

arms_$callType_requests_error_count

Gauge

15

Tidak ada

Total durasi permintaan

arms_$callType_requests_seconds

Gauge

15

Detik

Jumlah permintaan lambat

arms_$callType_requests_slow_count

Gauge

15

Tidak ada

Metrik LLM

Selain label umum, label berikut mungkin juga digunakan: modelName, spanKind, usageType.

Deskripsi dimensi

Kunci dimensi

Contoh

Catatan

Nama model

modelName

  • gpt-4

  • text-davinci-003

Tidak ada

Tipe operasi

spanKind

LLM, CHAIN, atau EMBEDDING

Untuk informasi lebih lanjut, lihat Bidang jejak untuk aplikasi LLM.

Tidak ada

Tipe penggunaan

usageType

  • input

  • output

Hanya tersedia untuk metrik terkait token

Tipe operasi

Deskripsi metrik

Nama metrik

Pengukuran

Interval pengumpulan (Satuan: menit)

Satuan

Dimensi

Jumlah permintaan untuk memanggil LLM

genai_calls_count

Gauge

1

Tidak ada

  • modelName

  • spanKind

Durasi respons untuk memanggil LLM

genai_calls_duration_seconds

Gauge

1

Detik

  • modelName

  • spanKind

Jumlah kesalahan pemanggilan LLM

genai_calls_error_count

Gauge

1

Tidak ada

  • modelName

  • spanKind

Jumlah pemanggilan LLM yang lambat

genai_calls_slow_count

Gauge

1

Tidak ada

  • modelName

  • spanKind

Kinerja LLM

Deskripsi metrik

Nama metrik

Pengukuran

Interval pengumpulan (Satuan: menit)

Satuan

Dimensi

Waktu hingga token pertama (TTFT) untuk LLM

genai_llm_first_token_seconds

Gauge

1

Detik

  • modelName

  • spanKind

Penggunaan LLM

Deskripsi metrik

Nama metrik

Pengukuran

Interval pengumpulan (Satuan: menit)

Satuan

Dimensi

Jumlah token yang digunakan

genai_llm_usage_tokens

Gauge

1

Tidak ada

  • modelName

  • spanKind

  • usageType

    • input

    • output