本文為您介紹向量檢索服務Milvus版(簡稱Milvus)與開源Milvus的常用指標。
Milvus指標
您可以在目標執行個體的監控警示頁簽查看。
叢集概覽
資源
參數
描述
統計維度
搜尋資源水位(QueryNode)
Milvus的QueryNode記憶體使用量水位。
當QueryNode的記憶體使用量率超過70%時,建議擴容。
Pod維度
寫入資源水位(DataNode/IndexNode)
Milvus的DataNode和IndexNode CPU使用水位。
當CPU使用率超過90%時,建議擴容。
Pod維度
資料
參數
描述
統計維度
Collection數量
當前Milvus叢集中建立的Collection總數,用於評估叢集規模和中繼資料管理開銷。
叢集維度
Entity數量
每個Collection中儲存的Entity總數,用於監控資料規模和效能瓶頸。
Collection維度
監控報表
Proxy
圖表名稱
圖表說明
統計維度
Search Vector Count Rate
每秒處理的向量搜尋請求數量,反映搜尋服務的輸送量。
Pod維度 + 所有Pod總和
Insert Vector Count Rate
每秒處理的向量插入請求數量,反映資料寫入的輸送量。
Pod維度
Search Latency
處理搜尋請求的P99和平均延遲,衡量搜尋服務的穩定性。
Pod維度 + 請求類型(搜尋/查詢)
Mutation Latency
處理突變操作(如插入、刪除)的P99和平均延遲,衡量資料寫入效能。
Pod維度 + 請求類型
Success Request Rate
每秒成功處理的請求數量,反映服務可用性。
Pod維度 + 函數類型(搜尋/插入等)
Faild Request Rate
每秒失敗的請求數量,用於定位異常或瓶頸。
Pod維度 + 函數類型
Query Node
圖表名稱
圖表說明
統計維度
Search Request Rate
每秒處理的搜尋請求數量,反映搜尋任務的負載。
Pod維度 + 請求類型(搜尋/查詢) + 狀態
Search Request Latency
處理搜尋請求的 P99 和平均延遲,衡量搜尋效能穩定性。
Pod維度 + 請求類型
Queryable Entity Num
已載入的可查詢/可搜尋的實體數量,反映資料可用性。
Collection維度 + 所有Pod總和
Segment Loaded Num
當前載入的Segment數量,Segment是資料分區的最小單元。
Pod維度 + Segment狀態(載入/未載入)
Data Node
圖表名稱
圖表說明
統計維度
Msg Rows Consumed Rate
每秒處理的訊息行數(僅插入/刪除),反映資料寫入輸送量。
Pod維度 + 訊息類型(插入/刪除)
Flush Data Size Rate
每秒刷寫到磁碟的資料量(僅插入/刪除),反映持久化效率。
Pod維度 + 訊息類型
Compaction Latency
執行Segment合并任務的P99和平均延遲,衡量儲存最佳化效率。
Pod維度 + 所有Pod總和
Query Coord
圖表名稱
圖表說明
統計維度
Collection Loaded Num
當前由QueryCoord管理的已載入Collection總數,反映資料服務的活躍度。
所有Pod總和
Root Coord
圖表名稱
圖表說明
統計維度
DDL Request Rate
每秒處理的DDL運算元量,反映中繼資料管理負載。
DDL狀態 + 函數名(CreateCollection/DescribeCollection等)
DDL Request Latency
處理DDL請求的P99和平均延遲,衡量中繼資料操作的穩定性。
DDL函數名維度
ID Alloc Rate
每秒分配的唯一ID數量,反映資料寫入的並發能力。
叢集維度
Index Node
圖表名稱
圖表說明
統計維度
Build Index Latency
構建向量索引的P99和平均延遲,衡量索引產生效率。
Pod維度
開源指標
組件 | 指標 | 指標說明 |
Proxy | milvus_proxy_search_vectors_count | 累計處理的向量搜尋請求總量,反映系統查詢負載。 |
milvus_proxy_insert_vectors_count | 累計處理的向量插入數量,用於評估資料寫入輸送量 | |
milvus_proxy_sq_latency | 搜尋和查詢請求的延遲。 | |
milvus_proxy_mutation_latency | 資料變更操作的延遲,衡量寫入效能。 | |
milvus_proxy_req_count | 所有類型接收請求的數量。 | |
milvus_proxy_cache_hit_count | 每次緩衝讀取操作的命中和失敗率的統計。 | |
Query Node | milvus_querynode_sq_req_count | 搜尋和查詢請求的累計數量。 |
milvus_querynode_sq_req_latency | 查詢節點的查詢請求延遲。 | |
milvus_querynode_entity_num | 每個查詢節點上可查詢和可搜尋的實體數量。 | |
milvus_querynode_segment_num | 每個查詢節點載入的Segment數量。 | |
Data Node | milvus_datanode_msg_rows_count | 資料節點消費的流訊息的行數,目前資料節點統計的流訊息僅包括插入和刪除訊息,用於評估資料輸送量。 |
milvus_datanode_flushed_data_size | 每個刷寫訊息的大小,目前資料節點統計的流訊息僅包括插入和刪除訊息,反映每次刷寫操作涉及的資料量,單位通常為位元組。 | |
milvus_datanode_unflushed_segment_num | 每個資料節點上建立的未刷寫Segment的數量。統計尚未持久化的Segment數量,過多可能導致記憶體壓力。 | |
milvus_datanode_compaction_latency | 每個資料節點執行合并任務所花費的時間。 | |
Query Coord | milvus_querycoord_collection_num | 當前被Milvus載入的集合數量。 |
Root Coord | milvus_rootcoord_ddl_req_count | 所有DDL請求的累計數量(包括CreateCollection、DescribeCollection等)。用於評估中繼資料管理負載。 |
milvus_rootcoord_ddl_req_latency | 所有類型DDL請求的延遲。反映DDL操作的回應時間,單位為毫秒。 | |
milvus_rootcoord_id_alloc_count | Root Coord分配的ID的累計數量。 | |
Index Node | milvus_indexnode_build_index_latency | 構建索引所花費的時間。 |