向量檢索服務Milvus版(簡稱Milvus)在相關配額上存在一定的限制,建議您在實際使用之前瞭解相應的限制,以確保能夠滿足您的業務需求。本文為您介紹Milvus的相關配額限制。
限制說明
使用者與角色
分類 | 最大數量 | 描述 |
使用者 | 100 | 每個執行個體中最多可容納100個使用者。 |
角色 | 20 | 每個執行個體中最多可以建立20個自訂角色。 |
如果超過配額,將會出現以下錯誤提示:
使用者數量超限
unable to add user because the number of users has reached the limit角色數量超限
unable to create role because the number of roles has reached the limit
CU
分類 | 限制 | 描述 |
入門版 | 16 | 入門版執行個體為單節點,最大為16 vCPU。 |
標準版 | 無限制 | 標準版執行個體無限制。 |
容量
分類 | 限制 |
入門版 | 8 GB可以容納150萬個768維向量。 |
標準版 |
|
用戶端可能報錯如下:
記憶體
deny to write, reason: memory quota exhausted, please allocate more resources, req: /milvus.proto.milvus.MilvusService/Insert磁碟
deny to write, reason: disk quota exhausted, please allocate more resources, req: /milvus.proto.milvus.MilvusService/Insert
Database
分類 | 限制 | 描述 |
入門版 | 1 | 入門版執行個體最多可建立1個Database。 |
標準版 | 1024 | 標準版執行個體最多可建立1024個Database。 |
如果超過配額,系統將會返回以下錯誤提示。
exceeded the limit number of database[limit=1024]Replica
分類 | 限制 | 描述 |
入門版 | 1 | 入門版執行個體為單節點,Replica最大為1。 |
標準版 | Query Node節點數 | 標準版執行個體開啟高可用預設2,否則預設為1。 |
如果超過配額,系統將會返回以下錯誤提示。
call query coordinator LoadCollection: failed to spawn replica for collection: resource group node not enough[rg=__default_resource_group][currentNodeNum=2][expectedNodeNum=3]Collection和Partition
分類 | 限制 | 描述 |
入門版 |
| 每個QueryNode計算單元(CU)支援建立最多1,024個集合(Collection)或4,096個分區(Partition)。 |
標準版 |
如果超過配額,系統將會返回以下錯誤提示:
Collection:
exceeded the limit number of collections[dbName=my_database_2][limit=2048]。Partition:
partition number (1024) exceeds max configuration (1024), collection: customized_setup_1或failed checking constraint: sum_collections(parition*shard) exceeding the max general capacity:: general capacity exceeded[newGeneralSize=8193][generalCapacity=8192]。
相容Milvus v2.4.x的執行個體
根據您的執行個體使用的CU數量的不同,Milvus v2.4.x對每個執行個體中的Collection和Partition的建立數量有如下限制。
單個Collection的限制:每個Collection的數量上限應該在256和執行個體的CU數量之積與16,384間取最小值。
公式為
min(256 × CU數量, 16384)。執行個體層級的限制:
Collection數量上限:執行個體中最多可以建立的Collection數量為以下兩者的較小值。
公式為
min(256 × CU數量, 16384)。Partition總數量上限:執行個體中所有Collection的Partition總數量為以下兩者的較小值。
公式為
min(1024 × CU數量, 65536)。
上述兩個限制需同時滿足,即執行個體中的Collection和Partition總數量均不得超過各自的上限。
相容Milvus v2.5.x的執行個體
根據您的執行個體使用的CU數量的不同,Milvus v2.5.x對每個執行個體中的Collection和Partition的建立數量有如下限制。
單個Collection的限制:每個Collection的數量上限應該在1,024和執行個體的CU數量之積與16,384間取最小值。
公式為
min(1024 × CU數量, 16384)。執行個體層級的限制:
Collection數量上限:執行個體中最多可以建立的Collection數量為以下兩者的較小值。
公式為
min(1024 × CU數量, 16384)。Partition總數量上限:執行個體中所有Collection的Partition總數量為以下兩者的較小值。
公式為
min(4096 × CU數量, 65536)。
上述兩個限制需同時滿足,即執行個體中的Collection和Partition總數量均不得超過各自的上限。
Shard數量上限
分類 | 限制 | 描述 |
入門版 | 2 | 入門版Shard數量上限為2。 |
標準版 | 16 | 標準版Shard數量上限為16。 |
當Shard數量超過配額時,系統將會返回以下錯誤提示。
maximum shards's number should be limited to 16速率限制
執行個體中的Collection和Partition操作(包括建立、載入、釋放、刪除)還具有速率限制。
操作類型 | 限制 | 描述 |
Collection操作 | 20 QPS | 每個執行個體每秒最多允許20次請求。 |
Partition操作 | 20 QPS | 每個執行個體每秒最多允許20次請求。 |
資料操作
以下為執行個體中常見資料操作的速率限制。
Insert
Insert單個請求大小
分類
限制
描述
入門版
64 MB
單次Insert請求的資料量不得超過64 MB。
標準版
64 MB
單次Insert請求的資料量不得超過64 MB。
如果單次請求的資料量超過限制,會觸發以下錯誤。
grpc._channel._InactiveRpcError: <_InactiveRpcError of RPC that terminated with: status = StatusCode.RESOURCE_EXHAUSTED details = "grpc: received message larger than max (92658962 vs. 67108864)" debug_error_string = "UNKNOWN:Error received from peer ipv4:121.43.**.**:19530 {grpc_message:"grpc: received message larger than max (92658962 vs. 67108864)", grpc_status:8, created_time:"2025-08-02T13:23:05.22648+08:00"}" >Insert吞吐限制
分類
限制
描述
入門版
10 MB/s
最大支援每秒10 MB的資料插入輸送量。
標準版
64 MB/s
最大支援每秒64 MB的資料插入輸送量。
Upsert
每個Upsert請求/響應的速率限制如下表所示。
分類 | 限制 | 描述 |
入門版 | 10 MB/s | 每秒最多允許10 MB的資料更新輸送量。 |
標準版 | 64 MB/s | 每秒最多允許64 MB的資料更新輸送量。 |
Flush
每個執行個體的Flush請求速率上限為0.1 QPS(每秒0.1次)。不建議您進行手動調整。
分類 | 限制 | 描述 |
入門版 | 0.1 QPS | 每秒最多允許0.1次Flush請求。 |
標準版 | 0.1 QPS | 每秒最多允許0.1次Flush請求。 |
Delete Entity
每個執行個體的刪除請求速率限制如下表所示。
分類 | 限制 | 描述 |
入門版 | 0.5 MB/s | 每秒最多允許刪除0.5 MB的資料量。 |
標準版 | 0.5 MB/s | 每秒最多允許刪除0.5 MB的資料量。 |
Search
查詢向量(nq)
分類
限制
描述
入門版
10
每個搜尋請求最多允許攜帶10個查詢向量。
標準版
16384
每個搜尋請求最多允許攜帶16,384個查詢向量。
如果nq超過配額,將會出現以下錯誤提示。
nq [3000] is invalid, nq (number of search vector per search request) should be in range [1, 10], but got 3000Entity數量(topK)
分類
限制
描述
入門版
1024
每個搜尋響應最多允許返回1024個Entity。
標準版
16384
每個搜尋響應最多允許返回16,384個Entity。
如果topK超過配額,將會出現以下錯誤提示。
topk [1025] is invalid, it should be in range [1, 1024], but got 1025