全部產品
Search
文件中心

Object Storage Service:向量Bucket概述

更新時間:Feb 05, 2026

向量 Bucket 是阿里雲Object Storage Service 提供的一種專門用於儲存、查詢和管理向量資料的 Bucket 類型。具有低成本、大規模和簡單易用的特點,面向多模態檢索、知識庫、RAG、AI Agent等 AI 情境提供向量儲存和向量查詢的能力。可以將任何通過第三方服務產生的向量資料寫入向量 Bucket資料。同時,支援對海量未經處理資料與向量資料進行統一治理,對未經處理資料 Bucket 與向量 Bucket 配置相同的 Bucket Policy,或通過統一格式匯出日誌以便審計。

核心概念

  • 向量 Bucket:全新 Bucket 類型,是管理大規模向量資料的雲資源。

  • 向量 Index:可以在向量 Bucket 中建立向量 Index。向量 Index 是儲存向量資料的索引表,可以根據業務類型在同一個向量 Bucket 中建立多張向量 Index,用以儲存不同業務的向量資料。當發起檢索查詢時,會根據向量 Index 中向量資料的相似性來返回檢索結果。

  • 向量資料:通過向量模型將圖片、視頻、文檔等非結構化資料轉換成的高維數值數組,用以表徵其內容特徵。向量檢索正是根據向量資料的相似性進行檢索結果返回。可以利用任何向量化服務(如ECS、PAI、阿里雲百鍊)產生向量,並通過 OSS API、SDK 或 ossutil 工具將其寫入指定向量索引。在寫入時,還可以附加中繼資料(Metadata),用於後續的標量過濾查詢。

產品優勢

  • 低成本:向量資料已成為各類 AI 應用的必要基礎設施,正呈現爆炸式增長的趨勢。向量 Bucket 採用簡潔友好的計費模式,僅根據向量資料存放區容量和檢索掃描資料量兩個計費項目進行計費,較傳統方式的使用成本可以大幅度下降 90% 以上。

  • 大規模:OSS 向量 Bucket 採用面向大規模向量資料存放區的架構設計,可以承載海量向量資料的儲存需求。OSS 採用 Serverless 的彈性擴縮容架構,使用向量 Bucket 後,無需關心擴容問題。

  • 簡單易用:OSS 向量 Bucket 提供完整的 API、SDK和命令列工具ossutil。同時,也支援在 OSS 控制台進行管控和向量資料讀寫操作,如向量資料的檢索查詢、向量資料的添加、批量插入等。

  • 統一管理:可以為向量 Bucket 和儲存海量未經處理資料的 Bucket 通過相同的方式進行管理,如通過相同方式配置 Bucket Policy 來進行許可權管理,配置相同的日誌匯出路徑來進行Action Trail。

  • 語義檢索:可以使用向量 Bucket 提供的 QueryVectors 介面對索引表中的向量資料進行查詢,並擷取按照相似性進行排序的檢索結果。與此同時,OSS 向量 Bucket 支援根據標量中繼資料進行過濾查詢,可以在將向量資料寫入 OSS 向量 Bucket 時,攜帶標量中繼資料,以達到標量後過濾的效果。同時,在建立向量索引 Index 時,可以設定非過濾中繼資料。非過濾中繼資料無法作為後過濾條件,但會隨檢索結果返回,作為向量結果的內容描述資訊。

應用情境

情境一:構建低成本的 RAG 應用

隨著 AI 業務發展,向量資料規模呈指數級增長,儲存和檢索成本壓力日漸增加。對於知識庫、AI 助手、醫學影像檢索等多模態檢索情境,使用者對檢索延遲的容忍度逐漸放寬(可能從幾十毫秒到百毫秒級)。此時,使用向量 Bucket 作為 RAG 應用的向量儲存底座,能以極低的成本滿足業務需求。

情境二:構建分層檢索的 AI Agent

不同的 AI Agent 對檢索效能的要求各異。可以將全量向量資料集中儲存在成本極低的 OSS 向量 Bucket 中;對於需要高效能、低延遲的業務情境,再將熱點資料同步至其他產品如Table Store Tablestore 中進行高效能檢索,以構建分層檢索 AI Agent 應用架構。

情境三:構建資料統一管理的 AI 內容管理平台

AI 應用帶來海量非結構化內容(UGC、內部資料、AI 產生內容)與相應的向量化結果,儲存與檢索體系容易割裂。通過將未經處理資料存入通用 OSS Bucket,向量資料存入 OSS 向量 Bucket,可構建高效的 AI 資料管理平台,如 AIGC 資料管理等。僅需一套 API/SDK 即可同時管理和訪問原始檔案與向量索引,輕鬆構建高效、統一的 AI 內容管理平台。

企業級特性

網域名稱訪問

提供獨立的公網和內網訪問網域名稱,與通用 OSS Bucket 隔離。

  • 公網訪問網域名稱$bucketname-$uid.regionID.oss-vectors.aliyuncs.com

  • 內網訪問網域名稱$bucketname-$uid.regionID-internal.oss-vectors.aliyuncs.com

注意:除 ListVectorBuckets 操作外,其他動作必須使用第三層網域名。

安全傳輸

支援通過 HTTPS 協議進行加密傳輸,保障資料在傳輸過程中的安全。

存取控制

  • Bucket Policy:支援基於資源的授權策略,可將許可權控制精確到向量 Bucket、單個或多個向量索引層級。

  • RAM Policy:支援基於身份的 RAM 授權策略,能夠對向量 Bucket、向量索引及資料操作進行細粒度許可權控制,同時支援跨帳號訪問授權。

日誌

  • 訪問日誌轉存:支援將訪問日誌即時或准即時轉存到指定的 Bucket 中。

  • 統一日誌格式:日誌格式與通用 OSS 日誌完全相容,並額外增加了 BucketARN 欄位,用以唯一標識向量 Bucket 資源,方便進行統一的日誌分析。

配額與限制

向量 Bucket 具有某些限制和約束,在設計與實現向量儲存和檢索方案時,請根據以下限制合理規劃 Bucket 數量、索引規模、中繼資料結構以及介面調用策略。

  • 單個主帳號在單個地區最多建立 10 個向量Bucket,若需調大該配額,可以聯絡支援人員申請調整。

  • 單個向量 Bucket 中最多可建立 100 張向量索引,若需調大該配額,可以聯絡支援人員申請調整。

  • 單個向量索引表最多可儲存 20 億行向量資料。

  • 向量維度範圍:1~4096 維。

  • 向量檢索請求的 TopK 預設範圍:1~100。

  • 單個向量數組總大小:1 KB~500 KB。

  • 單個向量的中繼資料(可篩選 + 不可篩選)總大小上限:40 KB。

  • 單個向量的可篩選中繼資料大小上限:2 KB。

  • 單個向量的不可篩選中繼資料欄位數上限:10 個。

  • 在通過中繼資料對向量進行過濾查詢時:

    • 單次過濾指令中可過濾中繼資料的累計長度不超過 64 KB。

    • 單次過濾指令中可過濾中繼資料項數量不超過 1024 個。

    • 過濾條件嵌套層級最多支援 8 層。

  • 建立向量索引的 API (PutVectorIndex)請求頻率限制為最多每秒 5 次。

  • 寫入向量資料的 API (PutVectors)單批次最大寫入 500 條,每秒最多支援 5 次請求(即 QPS 上限為 5)。

  • 列舉向量索引的 API ( ListVectorIndexes) 響應中每頁最大返回索引個數 500,可分頁擷取下一批索引列表。

  • 列舉向量索引的 API (ListVectorIndexes ) 並發度上限 16 個。