全部产品
Search
文档中心

Application Real-Time Monitoring Service:Analisis Token

更新时间:Jun 27, 2025

Setelah menginstal agen ARMS untuk Python pada aplikasi Large Language Model (LLM), Application Real-Time Monitoring Service (ARMS) dapat mulai memantau aplikasi tersebut. Anda dapat melihat penggunaan token di tab Analisis Token pada halaman detail aplikasi.

Dalam aplikasi LLM, token merupakan unit dasar pemrosesan teks yang mewakili unit semantik terkecil dari input dan output LLM. Sebuah token bisa berupa kata, subkata, atau karakter, bergantung pada pemisah kata yang digunakan oleh LLM.

Prasyarat

Agen ARMS telah diinstal untuk aplikasi LLM. Untuk informasi lebih lanjut, lihat Pemantauan aplikasi LLM dan layanan inferensi di ARMS.

Pergi ke tab Analisis Token

  1. Di bilah navigasi atas, klik tab Analisis Token.

    image

    Panel

    Deskripsi

    Penggunaan Token

    Jumlah total token yang dikonsumsi oleh semua pemanggilan LLM dalam periode waktu tertentu.

    Rata-rata token per panggilan LLM

    Rata-rata jumlah token yang dikonsumsi per pemanggilan LLM.

    Rata-rata token per permintaan

    Rata-rata jumlah token yang dikonsumsi per permintaan pengguna.

    Konsumsi Token/1m

    Jumlah total token yang dikonsumsi oleh semua pemanggilan LLM per menit.

    Rata-rata token per panggilan LLM/1m

    Rata-rata jumlah token yang dikonsumsi per pemanggilan LLM per menit.

    Rata-rata token per permintaan/1m

    Rata-rata jumlah token yang dikonsumsi per permintaan pengguna per menit.

    Peringkat Konsumsi Token Model (Top5)

    Menampilkan 5 LLM dengan konsumsi token tertinggi, diurutkan dari tinggi ke rendah.

    Peringkat Sesi Penggunaan Token (Top5)

    Menampilkan 5 sesi dengan konsumsi token tertinggi, diurutkan dari tinggi ke rendah.

    Peringkat Pengguna Token (Top5)

    Menampilkan 5 pengguna dengan konsumsi token tertinggi, diurutkan dari tinggi ke rendah.

Referensi