全部產品
Search
文件中心

OpenSearch:向量檢索演算法選型

更新時間:Oct 29, 2025

向量檢索演算法

優勢

劣勢

情境

量化聚類(Quantized Clustering)

CPU、記憶體資源佔用較低。

  • 召回率較HNSW低。

  • 查詢速度較HNSW慢。

適用於億層級資料集,對資料準確性和查詢延遲要求不是非常高的情境。

HNSW(Hierarchical Navigable Small World)

召回率高、查詢速度快。

CPU、記憶體資源佔用較高。

適用於千萬層級資料集,並且對資料準確性和查詢延遲有嚴格要求的情境。

linear

召回率100%。

  • 查詢速度慢。

  • CPU、記憶體資源佔用較上述兩種演算法多。

適用於萬層級的資料。

QGraph(Quantized Graph)

CPU、記憶體資源佔用低,耗時短,查詢效能高。

召回率較HNSW低。

適用于海量資料(十億級以上),對查詢耗時和查詢效能要求較高,對準確性要求不苛刻的情境。

CagraHnsw

利用 GPU 完成索引構建,速度可達 CPU 構建的十倍以上。

召回率較 HNSW 略低。

適用于海量資料定期更新索引的情境。

CAGRA

GPU演算法,效能是CPU的數倍甚至數十倍。

GPU成本高,性價比在低QPS情境下不明顯。

適用於高QPS,低耗時要求的情境。

DiskANN

說明

僅資料節點規格類型系列為SSD時支援DiskANN演算法

索引可以放磁碟,記憶體佔用低。

查詢耗時較高,吞吐低。

巨量資料量(數十億級),記憶體有限,延遲不敏感情境。