CloudMonitor2.0支援接入 AI 應用,並支援在 AI 應用可觀測中查看模型應用資料。
功能體驗
阿里雲Playground提供了CloudMonitor2.0主要功能的示範環境,便於您快速瞭解及體驗CloudMonitor2.0。
請訪問 Playground Demo,預設進入工作空間。
選擇導覽列AI 應用可觀測或者在所有功能選擇AI 應用可觀測。
在AI 應用可觀測導覽列選擇模型應用,可以查看模型應用列表。
單擊模型應用列表中目標應用程式名稱,將會提供應用詳情和拓撲功能。
模型應用
在AI 應用可觀測-模型應用中,可以看到模型應用的列表。
查詢條件
使用者可以設定查詢條件以過濾資訊。頁面預設使用了兩個條件:domain = apm,type = apm.service。當涉及到模型應用過濾時,建議您手動增加查詢條件 feature_genai = app 來過濾模型應用。
頁面配置
頁麵包括以下主要部分:
應用程式名稱:應用的名稱並支援單擊,單擊後跳轉到應用詳情頁面。
來源:應用來源,例如apm標識應用監控,xtrace標識鏈路追蹤。
語言:應用使用語言,例如python。
地區:應用所屬地區。
請求次數:應用請求次數與趨勢線。
錯誤次數:應用請求發生錯誤的次數與趨勢線。
平均延遲時間:應用請求平均延遲時間與趨勢線。
應用詳情
執行個體概覽
執行個體概覽頁面資料可按照時間進行篩選,頁面資料包括:
請求數:請求總量,日同比,請求數量趨勢圖,請求數提供服務熱門排行榜。
錯誤數:錯誤數總量,日同比,錯誤數趨勢圖,錯誤率,錯誤數提供服務熱門排行榜。
耗時:平均耗時,日同比,耗時趨勢圖,平均耗時提供服務熱門排行榜。
執行個體數:執行個體總數,日同比。
CPU使用方式:CPU使用峰值趨勢圖,CPU使用峰值執行個體熱門排行榜。
關聯執行個體
關聯執行個體頁面可按照時間進行篩選,頁面資料包括:
應用:可以查看應用提供的介面與支援應用的執行個體,單擊介面或執行個體可查看對應介面或執行個體的可觀測資料。
Kubernetes:關聯的叢集列表,單擊目的地組群可查看對應可觀測資料。
基礎設施:關聯的基礎設施,單擊目標基礎設施可查看對應可觀測資料。
Upstream/Downstream:關聯的Upstream/Downstream列表,單擊可查看對應可觀測資料。
關聯拓撲
該應用相關的上下遊拓撲網路,例圖如下:
應用概覽
應用概覽頁面可按照時間進行篩選,頁面資料包括:
數量資料:模型調用次數,Token使用量,Trace數量,Span數量,會話數,使用者數,使用者請求數統計。
圖表資料:操作類型分布圖,大模型平均請求響應趨勢圖,請求數趨勢圖,模型調用熱門排行榜,會話數趨勢圖。
效能分析
效能分析頁面可按照時間進行篩選,頁面資料包括:
請求數:模型調用次數,日同比,模型調用次數時間趨勢圖,模型調用數熱門排行榜。
錯誤數:模型調用錯誤次數,日同比,模型調用錯誤趨勢圖,模型調用錯誤排行。
耗時:模型調用耗時,日同比,模型調用平均耗時趨勢,模型平均耗時排行,模型調用首包耗時。
Token分析
Token分析頁面可按照時間進行篩選,頁面資料包括:
Token使用量:Token使用總量,日同比,input/output消耗量趨勢圖,Token模型使用排行。
會話平均Token用量:會話平均Token使用量,日同比,會話平均Token使用量趨勢圖,Token會話使用排行。
請求平均Token用量:請求平均Token使用量,請求平均Token使用量趨勢圖,Token使用者使用排行。
操作分析
操作分析包含嵌入分析,檢索增強,工具調用,方法調用四類資料:
嵌入分析:
Embedding請求數:Embedding請求次數,日同比,Embedding請求次數時間趨勢圖,Embedding請求熱門排行榜。
Embedding耗時:平均耗時,日同比,耗時時間趨勢圖,耗時熱門排行榜。
Embedding錯誤數:Embedding錯誤總數,日同比,Embedding錯誤次數時間趨勢圖,Embedding錯誤熱門排行榜。
檢索增強:
調用數:Retrieval/Rerank調用次數與日同比,Retrieval/Rerank調用數量趨勢圖。
錯誤數:Retrieval/Rerank錯誤次數與日同比,Retrieval/Rerank錯誤次數趨勢圖。
耗時:Retrieval/Rerank平均調用耗時與日同比,Retrieval/Rerank平均調用耗時趨勢圖。
工具調用:
調用數:工具調用次數,日同比,調用數量趨勢圖,調用熱門排行榜。
錯誤數:工具調用錯誤次數,日同比,調用錯誤數量趨勢圖,調用錯誤數量熱門排行榜。
耗時:平均耗時,日同比,耗時趨勢圖,平均耗時熱門排行榜。
方法調用:
調用數:調用次數,日同比,調用數量趨勢圖,調用熱門排行榜。
錯誤數:模型調用錯誤次數,日同比,模型調用錯誤數量趨勢圖,調用錯誤數量熱門排行榜。
耗時:平均耗時,日同比,耗時趨勢圖,平均耗時熱門排行榜。
調用鏈分析
調用鏈分析頁面可按照時間進行篩選,您可在此頁面通過查詢分析語句直接查詢,或使用快捷篩選協助查詢資料。頁麵包含Span列表,Trace列表,散佈圖,全鏈路彙總,全鏈路拓撲,錯/慢Trace分析等資料並支援查詢詳情與原始日誌。您也可以在頁面彙總欄選擇彙總維度來篩選您需要的資料。