為LLM(Large Language Model)應用安裝Python探針後,ARMS即可開始監控LLM應用,您可以在概覽頁面瞭解LLM應用的大模型調用次數、Token使用次數、Trace數、會話數等資訊。
前提條件
已為LLM應用安裝探針,具體操作,請參見LLM 大語言模型應用接入 ARMS。
查看LLM應用概覽
登入ARMS控制台,在左側導覽列選擇。
在應用列表頁面頂部選擇目標地區,然後單擊目標應用程式名稱。
在上方導覽列單擊概覽。
大盤說明

面板 | 說明 |
模型調用次數 | 應用的大語言模型在指定時間段內被調用的次數。 |
Token使用 | 應用的Token在指定時間段內被使用的次數。 |
Trace數 | 應用在指定時間段產生的調用鏈數量。 |
Span數 | 應用在指定時間段產生的Span數量。 |
會話數 | 應用在指定時間段產生的會話數量。 |
使用者數 | 應用在指定時間段內的使用者數量。 |
操作類型分布 |
|
Avg LLM call per request | 1分鐘內平均1次請求調用的大語言模型次數。 |
Request數趨勢 | LLM應用每分鐘的請求數趨勢圖。 |
模型調用排行 | LLM應用中被調用次數最多的大語言模型Top 5。 |
Request數使用者排行 | LLM應用中發起請求最多的使用者Top 5。 |
會話數趨勢 | LLM應用每分鐘的會話數趨勢圖。 |