全部產品
Search
文件中心

Object Storage Service:向量Bucket快速入門

更新時間:Feb 05, 2026

快速實現從資料準備到向量檢索的完整應用流程,包含四個核心步驟:建立向量 Bucket、建立向量索引、上傳向量資料、執行向量檢索。

在開始之前,請確保您已完成以下準備:

  • 開通OSS服務:已開通OSS服務

  • 目前支援 華南1(深圳)華北2(北京)、華東1(杭州)、華東2(上海)、華北6(烏蘭察布)新加坡中國香港、印尼(雅加達)、德國(法蘭克福)、美國(矽谷)、美國(維吉尼亞)地區。

步驟一:建立向量Bucket

建立一個向量Bucket,作為儲存所有向量資料和索引的容器。

  1. 向量Bucket頁面,單擊建立向量Bucket

  2. 配置Bucket資訊:

    • 向量 Bucket 名稱:為Bucket指定一個同主帳號在同地區內全域唯一的名稱。命名規則:3-32個字元,僅包含小寫字母、數字和虛線(-),且不能以虛線開頭或結尾。

    • 地區:選擇您業務所在的地區,例如“華南1(深圳)”。

  3. 單擊確定,完成建立。

步驟二:建立向量索引

Bucket建立成功後,需要在其內部建立一個向量索引。索引定義了向量的結構(如維度)和檢索方式(如距離度量),是儲存和查詢向量資料的基礎。

  1. 向量Bucket頁面,單擊已建立的向量Bucket名稱。

  2. 索引列表頁面,單擊建立索引表

  3. 配置索引參數:

    • 索引表名稱:為索引指定一個在Bucket內唯一的名稱。命名規則:1-63個字元,由字母和數字組成,且首字母必須為英文字母。

    • 向量資料類型:預設為float32(32位浮點型)。

    • 向量維度:設定向量的維度大小(例如128),範圍為1-4096。後續所有上傳到該索引的向量都必須與此維度保持一致。

    • 距離度量函數:根據業務情境選擇距離計算方式。

      • 歐式距離:空間中兩點間的直線距離,適用于衡量數值差異。

      • 餘弦距離:衡量兩個向量在方向上的差異,適用於文本、映像等高維語義相似性計算。

  4. 單擊確認,完成建立。

步驟三:上傳向量資料

索引準備就緒後,下一步是將向量資料上傳到指定的向量索引,以便後續進行檢索。

  1. 在索引列表中,找到您剛建立的索引,單擊其右側的查看資料

  2. 在索引頁面,單擊向量資料插入

  3. 配置向量資料,可以同時添加多條向量資料:

    • 主索引值:為向量設定唯一識別碼。

    • 向量資料:輸入向量數值數組,格式為用逗號分隔的數字。向量的維度(數值個數)必須與步驟二中設定的向量維度完全一致。

    • 中繼資料:可添加中繼資料資訊,如類別、標題、時間戳記等,可在檢索中用作精確過濾條件。

  4. 單擊確定完成資料插入。

步驟四:執行向量檢索

完成資料準備後,整個流程的核心環節——向量檢索便可以執行了。通常,會在自己的應用程式中通過SDK調用API,執行向量檢索操作,快速定位目標資料。

以下Python SDK樣本示範了如何檢索與目標向量最相似、且type欄位不為 "comedy" 或 "documentary" 的前 10 條資料。

import argparse
import alibabacloud_oss_v2 as oss
import alibabacloud_oss_v2.vectors as oss_vectors

parser = argparse.ArgumentParser(description="vector query vectors sample")
parser.add_argument('--region', help='The region in which the bucket is located.', required=True)
parser.add_argument('--bucket', help='The name of the bucket.', required=True)
parser.add_argument('--endpoint', help='The domain names that other services can use to access OSS')
parser.add_argument('--index_name', help='The name of the vector index.', required=True)
parser.add_argument('--account_id', help='The account id.', required=True)

def main():
    args = parser.parse_args()

    # Loading credentials values from the environment variables
    credentials_provider = oss.credentials.EnvironmentVariableCredentialsProvider()

    # Using the SDK's default configuration
    cfg = oss.config.load_default()
    cfg.credentials_provider = credentials_provider
    cfg.region = args.region
    cfg.account_id = args.account_id
    if args.endpoint is not None:
        cfg.endpoint = args.endpoint

    vector_client = oss_vectors.Client(cfg)

    query_filter = {
        "$and": [{
            "type": {
                "$nin": ["comedy", "documentary"]
            }
        }]
    }

    query_vector = {"float32": [0.1] * 128}

    result = vector_client.query_vectors(oss_vectors.models.QueryVectorsRequest(
        bucket=args.bucket,
        index_name=args.index_name,
        filter=query_filter,
        query_vector=query_vector,
        return_distance=True,
        return_metadata=True,
        top_k=10
    ))

    print(f'status code: {result.status_code},'
          f' request id: {result.request_id},'
          )

    if result.vectors:
        for vector in result.vectors:
            print(f'vector: {vector}')


if __name__ == "__main__":
    main()

後續步驟

向量 Bucket 的全流程操作均可通過控制台、OSS SDK、ossutil 或直接發起API調用完成。本快速入門僅展示上手最快的操作路徑,完整配置與進階用法見: