快速實現從資料準備到向量檢索的完整應用流程,包含四個核心步驟:建立向量 Bucket、建立向量索引、上傳向量資料、執行向量檢索。
在開始之前,請確保您已完成以下準備:
開通OSS服務:已開通OSS服務。
目前支援 華南1(深圳)、華北2(北京)、華東1(杭州)、華東2(上海)、華北6(烏蘭察布)、新加坡、中國香港、印尼(雅加達)、德國(法蘭克福)、美國(矽谷)、美國(維吉尼亞)地區。
步驟一:建立向量Bucket
建立一個向量Bucket,作為儲存所有向量資料和索引的容器。
在向量Bucket頁面,單擊建立向量Bucket。
配置Bucket資訊:
向量 Bucket 名稱:為Bucket指定一個同主帳號在同地區內全域唯一的名稱。命名規則:3-32個字元,僅包含小寫字母、數字和虛線(-),且不能以虛線開頭或結尾。
地區:選擇您業務所在的地區,例如“華南1(深圳)”。
單擊確定,完成建立。
步驟二:建立向量索引
Bucket建立成功後,需要在其內部建立一個向量索引。索引定義了向量的結構(如維度)和檢索方式(如距離度量),是儲存和查詢向量資料的基礎。
在向量Bucket頁面,單擊已建立的向量Bucket名稱。
在索引列表頁面,單擊建立索引表。
配置索引參數:
索引表名稱:為索引指定一個在Bucket內唯一的名稱。命名規則:1-63個字元,由字母和數字組成,且首字母必須為英文字母。
向量資料類型:預設為
float32(32位浮點型)。向量維度:設定向量的維度大小(例如
128),範圍為1-4096。後續所有上傳到該索引的向量都必須與此維度保持一致。距離度量函數:根據業務情境選擇距離計算方式。
歐式距離:空間中兩點間的直線距離,適用于衡量數值差異。
餘弦距離:衡量兩個向量在方向上的差異,適用於文本、映像等高維語義相似性計算。
單擊確認,完成建立。
步驟三:上傳向量資料
索引準備就緒後,下一步是將向量資料上傳到指定的向量索引,以便後續進行檢索。
在索引列表中,找到您剛建立的索引,單擊其右側的查看資料。
在索引頁面,單擊向量資料插入。
配置向量資料,可以同時添加多條向量資料:
主索引值:為向量設定唯一識別碼。
向量資料:輸入向量數值數組,格式為用逗號分隔的數字。向量的維度(數值個數)必須與步驟二中設定的向量維度完全一致。
中繼資料:可添加中繼資料資訊,如類別、標題、時間戳記等,可在檢索中用作精確過濾條件。
單擊確定完成資料插入。
步驟四:執行向量檢索
完成資料準備後,整個流程的核心環節——向量檢索便可以執行了。通常,會在自己的應用程式中通過SDK調用API,執行向量檢索操作,快速定位目標資料。
以下Python SDK樣本示範了如何檢索與目標向量最相似、且type欄位不為 "comedy" 或 "documentary" 的前 10 條資料。
import argparse
import alibabacloud_oss_v2 as oss
import alibabacloud_oss_v2.vectors as oss_vectors
parser = argparse.ArgumentParser(description="vector query vectors sample")
parser.add_argument('--region', help='The region in which the bucket is located.', required=True)
parser.add_argument('--bucket', help='The name of the bucket.', required=True)
parser.add_argument('--endpoint', help='The domain names that other services can use to access OSS')
parser.add_argument('--index_name', help='The name of the vector index.', required=True)
parser.add_argument('--account_id', help='The account id.', required=True)
def main():
args = parser.parse_args()
# Loading credentials values from the environment variables
credentials_provider = oss.credentials.EnvironmentVariableCredentialsProvider()
# Using the SDK's default configuration
cfg = oss.config.load_default()
cfg.credentials_provider = credentials_provider
cfg.region = args.region
cfg.account_id = args.account_id
if args.endpoint is not None:
cfg.endpoint = args.endpoint
vector_client = oss_vectors.Client(cfg)
query_filter = {
"$and": [{
"type": {
"$nin": ["comedy", "documentary"]
}
}]
}
query_vector = {"float32": [0.1] * 128}
result = vector_client.query_vectors(oss_vectors.models.QueryVectorsRequest(
bucket=args.bucket,
index_name=args.index_name,
filter=query_filter,
query_vector=query_vector,
return_distance=True,
return_metadata=True,
top_k=10
))
print(f'status code: {result.status_code},'
f' request id: {result.request_id},'
)
if result.vectors:
for vector in result.vectors:
print(f'vector: {vector}')
if __name__ == "__main__":
main()後續步驟
向量 Bucket 的全流程操作均可通過控制台、OSS SDK、ossutil 或直接發起API調用完成。本快速入門僅展示上手最快的操作路徑,完整配置與進階用法見: