全部產品
Search
文件中心

Cloud Monitor:模型應用

更新時間:Dec 25, 2025

CloudMonitor2.0支援接入 AI 應用,並支援在 AI 應用可觀測中查看模型應用資料。

功能體驗

阿里雲Playground提供了CloudMonitor2.0主要功能的示範環境,便於您快速瞭解及體驗CloudMonitor2.0。

  1. 請訪問 Playground Demo,預設進入工作空間。

  2. 選擇導覽列AI 應用可觀測或者在所有功能選擇AI 應用可觀測

  3. AI 應用可觀測導覽列選擇模型應用,可以查看模型應用列表。

  4. 單擊模型應用列表中目標應用程式名稱,將會提供應用詳情和拓撲功能。

模型應用

在AI 應用可觀測-模型應用中,可以看到模型應用的列表。

查詢條件

使用者可以設定查詢條件以過濾資訊。頁面預設使用了兩個條件:domain = apm,type = apm.service。當涉及到模型應用過濾時,建議您手動增加查詢條件 feature_genai = app 來過濾模型應用。

頁面配置

頁麵包括以下主要部分:

  1. 應用程式名稱:應用的名稱並支援單擊,單擊後跳轉到應用詳情頁面。

  2. 來源:應用來源,例如apm標識應用監控,xtrace標識鏈路追蹤。

  3. 語言:應用使用語言,例如python。

  4. 地區:應用所屬地區。

  5. 請求次數:應用請求次數與趨勢線。

  6. 錯誤次數:應用請求發生錯誤的次數與趨勢線。

  7. 平均延遲時間:應用請求平均延遲時間與趨勢線。

應用詳情

執行個體概覽

執行個體概覽頁面資料可按照時間進行篩選,頁面資料包括:

  • 請求數:請求總量,日同比,請求數量趨勢圖,請求數提供服務熱門排行榜。

  • 錯誤數:錯誤數總量,日同比,錯誤數趨勢圖,錯誤率,錯誤數提供服務熱門排行榜。

  • 耗時:平均耗時,日同比,耗時趨勢圖,平均耗時提供服務熱門排行榜。

  • 執行個體數:執行個體總數,日同比。

  • CPU使用方式:CPU使用峰值趨勢圖,CPU使用峰值執行個體熱門排行榜。

關聯執行個體

關聯執行個體頁面可按照時間進行篩選,頁面資料包括:

  • 應用:可以查看應用提供的介面與支援應用的執行個體,單擊介面或執行個體可查看對應介面或執行個體的可觀測資料。

  • Kubernetes:關聯的叢集列表,單擊目的地組群可查看對應可觀測資料。

  • 基礎設施:關聯的基礎設施,單擊目標基礎設施可查看對應可觀測資料。

  • Upstream/Downstream:關聯的Upstream/Downstream列表,單擊可查看對應可觀測資料。

關聯拓撲

該應用相關的上下遊拓撲網路,例圖如下:

應用概覽

應用概覽頁面可按照時間進行篩選,頁面資料包括:

  • 數量資料:模型調用次數,Token使用量,Trace數量,Span數量,會話數,使用者數,使用者請求數統計。

  • 圖表資料:操作類型分布圖,大模型平均請求響應趨勢圖,請求數趨勢圖,模型調用熱門排行榜,會話數趨勢圖。

效能分析

效能分析頁面可按照時間進行篩選,頁面資料包括:

  • 請求數:模型調用次數,日同比,模型調用次數時間趨勢圖,模型調用數熱門排行榜。

  • 錯誤數:模型調用錯誤次數,日同比,模型調用錯誤趨勢圖,模型調用錯誤排行。

  • 耗時:模型調用耗時,日同比,模型調用平均耗時趨勢,模型平均耗時排行,模型調用首包耗時。

Token分析

Token分析頁面可按照時間進行篩選,頁面資料包括:

  • Token使用量:Token使用總量,日同比,input/output消耗量趨勢圖,Token模型使用排行。

  • 會話平均Token用量:會話平均Token使用量,日同比,會話平均Token使用量趨勢圖,Token會話使用排行。

  • 請求平均Token用量:請求平均Token使用量,請求平均Token使用量趨勢圖,Token使用者使用排行。

操作分析

操作分析包含嵌入分析,檢索增強,工具調用,方法調用四類資料:

嵌入分析:

  • Embedding請求數:Embedding請求次數,日同比,Embedding請求次數時間趨勢圖,Embedding請求熱門排行榜。

  • Embedding耗時:平均耗時,日同比,耗時時間趨勢圖,耗時熱門排行榜。

  • Embedding錯誤數:Embedding錯誤總數,日同比,Embedding錯誤次數時間趨勢圖,Embedding錯誤熱門排行榜。

檢索增強:

  • 調用數:Retrieval/Rerank調用次數與日同比,Retrieval/Rerank調用數量趨勢圖。

  • 錯誤數:Retrieval/Rerank錯誤次數與日同比,Retrieval/Rerank錯誤次數趨勢圖。

  • 耗時:Retrieval/Rerank平均調用耗時與日同比,Retrieval/Rerank平均調用耗時趨勢圖。

工具調用:

  • 調用數:工具調用次數,日同比,調用數量趨勢圖,調用熱門排行榜。

  • 錯誤數:工具調用錯誤次數,日同比,調用錯誤數量趨勢圖,調用錯誤數量熱門排行榜。

  • 耗時:平均耗時,日同比,耗時趨勢圖,平均耗時熱門排行榜。

方法調用:

  • 調用數:調用次數,日同比,調用數量趨勢圖,調用熱門排行榜。

  • 錯誤數:模型調用錯誤次數,日同比,模型調用錯誤數量趨勢圖,調用錯誤數量熱門排行榜。

  • 耗時:平均耗時,日同比,耗時趨勢圖,平均耗時熱門排行榜。

調用鏈分析

調用鏈分析頁面可按照時間進行篩選,您可在此頁面通過查詢分析語句直接查詢,或使用快捷篩選協助查詢資料。頁麵包含Span列表,Trace列表,散佈圖,全鏈路彙總,全鏈路拓撲,錯/慢Trace分析等資料並支援查詢詳情與原始日誌。您也可以在頁面彙總欄選擇彙總維度來篩選您需要的資料。