全部產品
Search
文件中心

OpenSearch:向量索引通用配置

更新時間:Jun 28, 2025

在配置表時索引結構部分可以對向量索引進行進階配置,以下將詳細說明這些進階版配置的參數含義。

在建立表時,第四步配置索引結構中,有關於向量索引的通用配置:

cn向量索引結構配置.png

進階配置展開如下:

image.png

各配置說明如下:

配置

可選值

含義

向量維度

-

向量維度是指向量所具有的特徵或屬性的數量。向量維度大小決定了向量所能表達的資訊和特徵的複雜程度。向量維度配置需要根據使用者的向量模型產生的向量進行配置。

距離類型

  • 歐式距離(SquareEuclidean)

  • 內積距離(InnerProduct)

  • Cosine距離

歐式距離向量得分越小越相關。

內積距離向量得分越大越相關。

Cosine距離取值範圍為[-1, 1]。為-1時表示兩個向量方向相反,相似性最低。為1時表示兩個向量方向相同,相似性最高。

向量索引演算法

  • Qc

  • HNSW

  • Linear

  • QGraph

  • CAGRA

  • DiskANN

詳情可參考:向量介紹

說明

僅資料節點規格類型系列為SSD時支援DiskANN演算法。

即時索引

  • true

  • false

選擇true則表示開啟即時索引,使用者通過API推送的即時資料,執行個體可即時構建向量,以供即時查詢。

即時索引參數

{"proxima.oswg.streamer.segment_size":2048}

建議保持預設值。

即時檢索參數

-

不同的向量索引演算法該參數的配置方式不同,詳情可參考:

向量分隔字元

可自訂

向量檢索時各維度使用的分隔字元(如vector:'1.05066,0.15610,0.156145...' 其中分隔字元為逗號)

線性構建的閾值

預設為5000

表示資料量在5000以內用線性。

忽略有問題的向量資料

  • true

  • false

當向量維度不正常,向量資料為空白時,該參數配置為true,則不影響全量/批次增量資料的構建。