全部產品
Search
文件中心

Vector Retrieval Service for Milvus:查看監控指標

更新時間:Sep 24, 2025

本文為您介紹向量檢索服務Milvus版(簡稱Milvus)與開源Milvus的常用指標。

Milvus指標

您可以在目標執行個體的監控警示頁簽查看。

叢集概覽

  • 資源

    參數

    描述

    統計維度

    搜尋資源水位(QueryNode)

    Milvus的QueryNode記憶體使用量水位。

    當QueryNode的記憶體使用量率超過70%時,建議擴容。

    Pod維度

    寫入資源水位(DataNode/IndexNode)

    Milvus的DataNode和IndexNode CPU使用水位。

    當CPU使用率超過90%時,建議擴容。

    Pod維度

  • 資料

    參數

    描述

    統計維度

    Collection數量

    當前Milvus叢集中建立的Collection總數,用於評估叢集規模和中繼資料管理開銷。

    叢集維度

    Entity數量

    每個Collection中儲存的Entity總數,用於監控資料規模和效能瓶頸。

    Collection維度

監控報表

  • Proxy

    圖表名稱

    圖表說明

    統計維度

    Search Vector Count Rate

    每秒處理的向量搜尋請求數量,反映搜尋服務的輸送量。

    Pod維度 + 所有Pod總和

    Insert Vector Count Rate

    每秒處理的向量插入請求數量,反映資料寫入的輸送量。

    Pod維度

    Search Latency

    處理搜尋請求的P99和平均延遲,衡量搜尋服務的穩定性。

    Pod維度 + 請求類型(搜尋/查詢)

    Mutation Latency

    處理突變操作(如插入、刪除)的P99和平均延遲,衡量資料寫入效能。

    Pod維度 + 請求類型

    Success Request Rate

    每秒成功處理的請求數量,反映服務可用性。

    Pod維度 + 函數類型(搜尋/插入等)

    Faild Request Rate

    每秒失敗的請求數量,用於定位異常或瓶頸。

    Pod維度 + 函數類型

  • Query Node

    圖表名稱

    圖表說明

    統計維度

    Search Request Rate

    每秒處理的搜尋請求數量,反映搜尋任務的負載。

    Pod維度 + 請求類型(搜尋/查詢) + 狀態

    Search Request Latency

    處理搜尋請求的 P99 和平均延遲,衡量搜尋效能穩定性。

    Pod維度 + 請求類型

    Queryable Entity Num

    已載入的可查詢/可搜尋的實體數量,反映資料可用性。

    Collection維度 + 所有Pod總和

    Segment Loaded Num

    當前載入的Segment數量,Segment是資料分區的最小單元。

    Pod維度 + Segment狀態(載入/未載入)

  • Data Node

    圖表名稱

    圖表說明

    統計維度

    Msg Rows Consumed Rate

    每秒處理的訊息行數(僅插入/刪除),反映資料寫入輸送量。

    Pod維度 + 訊息類型(插入/刪除)

    Flush Data Size Rate

    每秒刷寫到磁碟的資料量(僅插入/刪除),反映持久化效率。

    Pod維度 + 訊息類型

    Compaction Latency

    執行Segment合并任務的P99和平均延遲,衡量儲存最佳化效率。

    Pod維度 + 所有Pod總和

  • Query Coord

    圖表名稱

    圖表說明

    統計維度

    Collection Loaded Num

    當前由QueryCoord管理的已載入Collection總數,反映資料服務的活躍度。

    所有Pod總和

  • Root Coord

    圖表名稱

    圖表說明

    統計維度

    DDL Request Rate

    每秒處理的DDL運算元量,反映中繼資料管理負載。

    DDL狀態 + 函數名(CreateCollection/DescribeCollection等)

    DDL Request Latency

    處理DDL請求的P99和平均延遲,衡量中繼資料操作的穩定性。

    DDL函數名維度

    ID Alloc Rate

    每秒分配的唯一ID數量,反映資料寫入的並發能力。

    叢集維度

  • Index Node

    圖表名稱

    圖表說明

    統計維度

    Build Index Latency

    構建向量索引的P99和平均延遲,衡量索引產生效率。

    Pod維度

開源指標

組件

指標

指標說明

Proxy

milvus_proxy_search_vectors_count

累計處理的向量搜尋請求總量,反映系統查詢負載。

milvus_proxy_insert_vectors_count

累計處理的向量插入數量,用於評估資料寫入輸送量

milvus_proxy_sq_latency

搜尋和查詢請求的延遲。

milvus_proxy_mutation_latency

資料變更操作的延遲,衡量寫入效能。

milvus_proxy_req_count

所有類型接收請求的數量。

milvus_proxy_cache_hit_count

每次緩衝讀取操作的命中和失敗率的統計。

Query Node

milvus_querynode_sq_req_count

搜尋和查詢請求的累計數量。

milvus_querynode_sq_req_latency

查詢節點的查詢請求延遲。

milvus_querynode_entity_num

每個查詢節點上可查詢和可搜尋的實體數量。

milvus_querynode_segment_num

每個查詢節點載入的Segment數量。

Data Node

milvus_datanode_msg_rows_count

資料節點消費的流訊息的行數,目前資料節點統計的流訊息僅包括插入和刪除訊息,用於評估資料輸送量

milvus_datanode_flushed_data_size

每個刷寫訊息的大小,目前資料節點統計的流訊息僅包括插入和刪除訊息,反映每次刷寫操作涉及的資料量,單位通常為位元組。

milvus_datanode_unflushed_segment_num

每個資料節點上建立的未刷寫Segment的數量。統計尚未持久化的Segment數量,過多可能導致記憶體壓力。

milvus_datanode_compaction_latency

每個資料節點執行合并任務所花費的時間。

Query Coord

milvus_querycoord_collection_num

當前被Milvus載入的集合數量。

Root Coord

milvus_rootcoord_ddl_req_count

所有DDL請求的累計數量(包括CreateCollection、DescribeCollection等)。用於評估中繼資料管理負載。

milvus_rootcoord_ddl_req_latency

所有類型DDL請求的延遲。反映DDL操作的回應時間,單位為毫秒。

milvus_rootcoord_id_alloc_count

Root Coord分配的ID的累計數量。

Index Node

milvus_indexnode_build_index_latency

構建索引所花費的時間。