Analisis Token - Application Real-Time Monitoring Service

Setelah menginstal agen ARMS untuk Python pada aplikasi Large Language Model (LLM), Application Real-Time Monitoring Service (ARMS) dapat mulai memantau aplikasi tersebut. Anda dapat melihat penggunaan token di tab Analisis Token pada halaman detail aplikasi.

Dalam aplikasi LLM, token merupakan unit dasar pemrosesan teks yang mewakili unit semantik terkecil dari input dan output LLM. Sebuah token bisa berupa kata, subkata, atau karakter, bergantung pada pemisah kata yang digunakan oleh LLM.

Prasyarat

Agen ARMS telah diinstal untuk aplikasi LLM. Untuk informasi lebih lanjut, lihat Pemantauan aplikasi LLM dan layanan inferensi di ARMS.

Pergi ke tab Analisis Token

Di bilah navigasi atas, klik tab Analisis Token.

Panel	Deskripsi
Penggunaan Token	Jumlah total token yang dikonsumsi oleh semua pemanggilan LLM dalam periode waktu tertentu.
Rata-rata token per panggilan LLM	Rata-rata jumlah token yang dikonsumsi per pemanggilan LLM.
Rata-rata token per permintaan	Rata-rata jumlah token yang dikonsumsi per permintaan pengguna.
Konsumsi Token/1m	Jumlah total token yang dikonsumsi oleh semua pemanggilan LLM per menit.
Rata-rata token per panggilan LLM/1m	Rata-rata jumlah token yang dikonsumsi per pemanggilan LLM per menit.
Rata-rata token per permintaan/1m	Rata-rata jumlah token yang dikonsumsi per permintaan pengguna per menit.
Peringkat Konsumsi Token Model (Top5)	Menampilkan 5 LLM dengan konsumsi token tertinggi, diurutkan dari tinggi ke rendah.
Peringkat Sesi Penggunaan Token (Top5)	Menampilkan 5 sesi dengan konsumsi token tertinggi, diurutkan dari tinggi ke rendah.
Peringkat Pengguna Token (Top5)	Menampilkan 5 pengguna dengan konsumsi token tertinggi, diurutkan dari tinggi ke rendah.

Application Real-Time Monitoring Service：Analisis Token

Prasyarat

Pergi ke tab Analisis Token

Referensi