全部產品
Search
文件中心

Vector Retrieval Service for Milvus:快速實現向量檢索

更新時間:Sep 24, 2025

向量檢索是實現高效相似性搜尋的關鍵技術。本文通過詳細樣本為您介紹如何快速實現向量檢索。

前提條件

  • 已在本地用戶端成功安裝了PyMilvus庫,並將其更新至當前最新版本。

    如果您尚未在本地用戶端安裝PyMilvus庫,或者需要將其更新至當前最新版本,您可以執行以下命令。

    pip install --upgrade pymilvus
  • 已建立Milvus執行個體,請參見詳情快速建立Milvus執行個體

注意事項

向量檢索服務Milvus版(簡稱Milvus)支援通過內網和公網的方式串連,在串連Milvus執行個體之前,需確保您的用戶端具備適當的網路存取權限,詳情請參見網路訪問與安全設定

操作流程

步驟一:串連Milvus執行個體

您可以使用以下代碼串連Milvus執行個體。

from pymilvus import MilvusClient

# 建立Milvus Client。
client = MilvusClient(
    uri="http://c-xxxx.milvus.aliyuncs.com:19530",  # Milvus執行個體的公網地址。
    token="<yourUsername>:<yourPassword>",  # 登入Milvus執行個體的使用者名稱和密碼。
    db_name="default"  # 待串連的資料庫名稱,本文樣本為預設的default。
)

步驟二:建立Collection

您可以通過以下代碼簡便地建立一個Collection。更多自訂參數選項,請參見管理Collections

client.create_collection(
    collection_name="demo",  # 集合的名稱。
    dimension=5  # 向量維度。
)

這段代碼除了設定Collection名稱和向量維度,還自動應用了以下配置:

  • 使用預設命名的主鍵欄位“id”和向量欄位“vector”。

  • “metric_type”屬性採用預設的COSINE度量類型。

  • 主鍵欄位“id”設定為整型,其值不會自動遞增。

  • 引入了額外的“$meta”欄位,以索引值對形式儲存那些在Schema中未定義的欄位資料。

步驟三:插入資料

Collection建立完畢後,系統會自動將其及其對應的索引載入至記憶體中,您可以使用如下代碼向該集合中插入測試資料。

插入少量資料

這段代碼插入了預定義的10個Entity,每個Entity具有固定的向量和顏色標籤。

data=[{'id': 0, 'vector': [-0.493313706583155, -0.172001225836391, 0.16825615330139554, -0.0198911518739604, -0.9756816265213708], 'color': 'green_5760'}, {'id': 1, 'vector': [0.6695699219225086, 0.49952523907354496, -0.49870548178008534, 0.8824655547230731, -0.7182693622931615], 'color': 'blue_2330'}, {'id': 2, 'vector': [-0.6057771959702387, 0.9141473782193543, 0.32053983678483466, -0.32126010092015655, 0.725222856037071], 'color': 'grey_9673'}, {'id': 3, 'vector': [0.14082089434165868, 0.9924029949938447, 0.7943279666144052, -0.7898608705081103, -0.9941425813199956], 'color': 'white_2829'}, {'id': 4, 'vector': [-0.46180540826224026, 0.33216876051895783, 0.5786699695956004, 0.8891120357625131, 0.04872530176990697], 'color': 'pink_9061'}, {'id': 5, 'vector': [-0.6097452740606673, 0.35648319550551144, -0.5699789153006387, 0.15085357921088316, -0.8817226997144627], 'color': 'pink_8525'}, {'id': 6, 'vector': [0.7843522543512762, -0.7663837586858071, -0.8681839054724569, 0.6880645348647785, -0.5151293183261791], 'color': 'green_5016'}, {'id': 7, 'vector': [-0.9967116931989293, 0.5741923070732655, -0.019126124261334976, -0.34163875885482753, -0.8189843931354175], 'color': 'brown_7434'}, {'id': 8, 'vector': [0.7347243385915765, -0.7358853080124825, -0.23737428377511716, 0.06980552357261627, -0.30613964550461437], 'color': 'blue_5059'}, {'id': 9, 'vector': [-0.21187155428455862, -0.3288541717216129, -0.32564136453418824, -0.14054963599686743, 0.5491320339870627], 'color': 'yellow_9887'}]

res = client.insert(
    collection_name="demo",
    data=data
)

插入更多資料

這段代碼使用列表推導式動態產生了大量的Entity,這些Entity的向量和顏色標籤都是在指定範圍內隨機產生的。

import random

colors = ["green", "blue", "yellow", "red", "black", "white", "purple", "pink", "orange", "brown", "grey"]
data = [ {
    "id": i, 
    "vector": [ random.uniform(-1, 1) for _ in range(5) ], 
    "color": f"{random.choice(colors)}_{str(random.randint(1000, 9999))}" 
} for i in range(1000) ]

res = client.insert(
    collection_name="demo",
    data=data[1:]
)

print(res)

步驟四:向量檢索

重要

資料插入過程採用非同步機制,這意味著在您完成資料插入操作後,系統並不會立即更新相應的搜尋索引。為確保查詢到最新插入的資料,建議您在資料插入後耐心等待數秒,待索引更新完成後再進行搜尋操作

單一向量檢索

通過提供一個查詢向量列表,您可以進行單一向量的相似性檢索。

query_vectors = [
[-0.8832567462711804, -0.2999882617491647, 0.9921295273224382, -0.272575369985379, -0.688914679645338]
]

res = client.search(
    collection_name="demo",     # 查詢collection
    data=query_vectors,                # 查詢vectors。
    limit=3,                           # 返回entities數量。
)

print(res)

批量向量檢索

對於多個查詢向量的批量檢索,只需將向量列表作為輸入參數即可。程式碼範例如下。

query_vectors = [
[0.06586461994037252, 0.7693023529849932, 0.8199991781350795, -0.6988017611187176, 0.408383847889378],
[0.8988257992203861, 0.021911711196309414, 0.19086900086430836, 0.63590610476426, -0.6713237387993141]
]

res = client.search(
    collection_name="demo",
    data=query_vectors,
    limit=3,
)

print(res)

步驟五:Filter檢索

利用Schema中定義的欄位,您可以設定過濾條件來精確限定檢索範圍,提高搜尋效率。

基於數值欄位過濾

以下樣本展示了如何根據id欄位的數值範圍進行過濾。

query_vectors = [
[-0.30932351869632435, -0.7132856078639205, 0.6006201320181415, 0.40140510356426784, -0.21223937444001328]
]

res = client.search(
    collection_name="demo",
    data=query_vectors,
    filter="3 < id < 5",  # 數值欄位範圍過濾條件。
    limit=3
)

print(res)

基於中繼資料欄位($meta)過濾

以下樣本展示了如何依據color屬性值以“green”開頭的記錄進行檢索,並指定輸出包含color欄位的檢索結果。

query_vectors = [
[0.9636568288732006, -0.5900490884830603, 0.2504591754023724, 0.7120903924474389, 0.7620604497390009]
]

res = client.search(
    collection_name="demo",
    data=query_vectors,
    filter='$meta["color"] like "green%"',  # 中繼資料欄位屬性值匹配過濾條件。
    limit=3,
    output_fields=["color"]   # 指定返回結果中包含的欄位
)

print(res)