全部產品
Search
文件中心

Vector Retrieval Service for Milvus:Milvus使用限制與配額

更新時間:Sep 23, 2025

向量檢索服務Milvus版(簡稱Milvus)在相關配額上存在一定的限制,建議您在實際使用之前瞭解相應的限制,以確保能夠滿足您的業務需求。本文為您介紹Milvus的相關配額限制。

限制說明

使用者與角色

分類

最大數量

描述

使用者

100

每個執行個體中最多可容納100個使用者。

角色

20

每個執行個體中最多可以建立20個自訂角色。

如果超過配額,將會出現以下錯誤提示:

  • 使用者數量超限

    unable to add user because the number of users has reached the limit
  • 角色數量超限

    unable to create role because the number of roles has reached the limit

CU

分類

限制

描述

入門版

16

入門版執行個體為單節點,最大為16 vCPU。

標準版

無限制

標準版執行個體無限制。

容量

分類

限制

入門版

8 GB可以容納150萬個768維向量。

標準版

  • 效能型CU:每8 GB可以容納150萬個768維向量。

  • 容量型CU:每8 GB可以容納500萬個768維向量。

用戶端可能報錯如下:

  • 記憶體

    deny to write, reason: memory quota exhausted, please allocate more resources, req: /milvus.proto.milvus.MilvusService/Insert
  • 磁碟

    deny to write, reason: disk quota exhausted, please allocate more resources, req: /milvus.proto.milvus.MilvusService/Insert

Database

分類

限制

描述

入門版

1

入門版執行個體最多可建立1個Database

標準版

1024

標準版執行個體最多可建立1024個Database

如果超過配額,系統將會返回以下錯誤提示。

exceeded the limit number of database[limit=1024]

Replica

分類

限制

描述

入門版

1

入門版執行個體為單節點,Replica最大為1。

標準版

Query Node節點數

標準版執行個體開啟高可用預設2,否則預設為1。

如果超過配額,系統將會返回以下錯誤提示。

call query coordinator LoadCollection: failed to spawn replica for collection: resource group node not enough[rg=__default_resource_group][currentNodeNum=2][expectedNodeNum=3]

Collection和Partition

分類

限制

描述

入門版

  • 65536個Collection

  • 65536個Partition

每個QueryNode計算單元(CU)支援建立最多1,024個集合(Collection)或4,096個分區(Partition)。

標準版

如果超過配額,系統將會返回以下錯誤提示:

  • Collection:exceeded the limit number of collections[dbName=my_database_2][limit=2048]

  • Partition:partition number (1024) exceeds max configuration (1024), collection: customized_setup_1failed checking constraint: sum_collections(parition*shard) exceeding the max general capacity:: general capacity exceeded[newGeneralSize=8193][generalCapacity=8192]

相容Milvus v2.4.x的執行個體

根據您的執行個體使用的CU數量的不同,Milvus v2.4.x對每個執行個體中的Collection和Partition的建立數量有如下限制。

  • 單個Collection的限制:每個Collection的數量上限應該在256和執行個體的CU數量之積與16,384間取最小值。

    公式為min(256 × CU數量, 16384)

  • 執行個體層級的限制:

    • Collection數量上限:執行個體中最多可以建立的Collection數量為以下兩者的較小值。

      公式為min(256 × CU數量, 16384)

    • Partition總數量上限:執行個體中所有Collection的Partition總數量為以下兩者的較小值。

      公式為min(1024 × CU數量, 65536) 。

  • 上述兩個限制需同時滿足,即執行個體中的Collection和Partition總數量均不得超過各自的上限。

相容Milvus v2.5.x的執行個體

根據您的執行個體使用的CU數量的不同,Milvus v2.5.x對每個執行個體中的Collection和Partition的建立數量有如下限制。

  • 單個Collection的限制:每個Collection的數量上限應該在1,024和執行個體的CU數量之積與16,384間取最小值。

    公式為min(1024 × CU數量, 16384)

  • 執行個體層級的限制:

    • Collection數量上限:執行個體中最多可以建立的Collection數量為以下兩者的較小值。

      公式為min(1024 × CU數量, 16384)

    • Partition總數量上限:執行個體中所有Collection的Partition總數量為以下兩者的較小值。

      公式為min(4096 × CU數量, 65536) 。

  • 上述兩個限制需同時滿足,即執行個體中的Collection和Partition總數量均不得超過各自的上限。

Shard數量上限

分類

限制

描述

入門版

2

入門版Shard數量上限為2。

標準版

16

標準版Shard數量上限為16。

當Shard數量超過配額時,系統將會返回以下錯誤提示。

maximum shards's number should be limited to 16

速率限制

執行個體中的Collection和Partition操作(包括建立、載入、釋放、刪除)還具有速率限制。

操作類型

限制

描述

Collection操作

20 QPS

每個執行個體每秒最多允許20次請求。

Partition操作

20 QPS

每個執行個體每秒最多允許20次請求。

資料操作

以下為執行個體中常見資料操作的速率限制。

Insert

  • Insert單個請求大小

    分類

    限制

    描述

    入門版

    64 MB

    單次Insert請求的資料量不得超過64 MB。

    標準版

    64 MB

    單次Insert請求的資料量不得超過64 MB。

    如果單次請求的資料量超過限制,會觸發以下錯誤。

    grpc._channel._InactiveRpcError: <_InactiveRpcError of RPC that terminated with:
    	status = StatusCode.RESOURCE_EXHAUSTED
    	details = "grpc: received message larger than max (92658962 vs. 67108864)"
    	debug_error_string = "UNKNOWN:Error received from peer ipv4:121.43.**.**:19530 {grpc_message:"grpc: received message larger than max (92658962 vs. 67108864)", grpc_status:8, created_time:"2025-08-02T13:23:05.22648+08:00"}"
    >
  • Insert吞吐限制

    分類

    限制

    描述

    入門版

    10 MB/s

    最大支援每秒10 MB的資料插入輸送量。

    標準版

    64 MB/s

    最大支援每秒64 MB的資料插入輸送量。

Upsert

每個Upsert請求/響應的速率限制如下表所示。

分類

限制

描述

入門版

10 MB/s

每秒最多允許10 MB的資料更新輸送量。

標準版

64 MB/s

每秒最多允許64 MB的資料更新輸送量。

Flush

每個執行個體的Flush請求速率上限為0.1 QPS(每秒0.1次)。不建議您進行手動調整。

分類

限制

描述

入門版

0.1 QPS

每秒最多允許0.1次Flush請求。

標準版

0.1 QPS

每秒最多允許0.1次Flush請求。

Delete Entity

每個執行個體的刪除請求速率限制如下表所示。

分類

限制

描述

入門版

0.5 MB/s

每秒最多允許刪除0.5 MB的資料量。

標準版

0.5 MB/s

每秒最多允許刪除0.5 MB的資料量。

Search

  • 查詢向量(nq)

    分類

    限制

    描述

    入門版

    10

    每個搜尋請求最多允許攜帶10個查詢向量。

    標準版

    16384

    每個搜尋請求最多允許攜帶16,384個查詢向量。

    如果nq超過配額,將會出現以下錯誤提示。

    nq [3000] is invalid, nq (number of search vector per search request) should be in range [1, 10], but got 3000
  • Entity數量(topK)

    分類

    限制

    描述

    入門版

    1024

    每個搜尋響應最多允許返回1024個Entity。

    標準版

    16384

    每個搜尋響應最多允許返回16,384個Entity。

    如果topK超過配額,將會出現以下錯誤提示。

    topk [1025] is invalid, it should be in range [1, 1024], but got 1025