各類型向量檢索演算法對比選型-智能OpenSearch OpenSearch-阿里雲

向量檢索演算法	優勢	劣勢	情境
量化聚類（Quantized Clustering）	CPU、記憶體資源佔用較低。	召回率較HNSW低。查詢速度較HNSW慢。	適用於億層級資料集，對資料準確性和查詢延遲要求不是非常高的情境。
HNSW（Hierarchical Navigable Small World）	召回率高、查詢速度快。	CPU、記憶體資源佔用較高。	適用於千萬層級資料集，並且對資料準確性和查詢延遲有嚴格要求的情境。
linear	召回率100%。	查詢速度慢。 CPU、記憶體資源佔用較上述兩種演算法多。	適用於萬層級的資料。
QGraph（Quantized Graph）	CPU、記憶體資源佔用低，耗時短，查詢效能高。	召回率較HNSW低。	適用于海量資料（十億級以上），對查詢耗時和查詢效能要求較高，對準確性要求不苛刻的情境。
CagraHnsw	利用 GPU 完成索引構建，速度可達 CPU 構建的十倍以上。	召回率較 HNSW 略低。	適用于海量資料定期更新索引的情境。
CAGRA	GPU演算法，效能是CPU的數倍甚至數十倍。	GPU成本高，性價比在低QPS情境下不明顯。	適用於高QPS，低耗時要求的情境。
DiskANN 說明僅資料節點規格類型系列為SSD時支援DiskANN演算法	索引可以放磁碟，記憶體佔用低。	查詢耗時較高，吞吐低。	巨量資料量（數十億級），記憶體有限，延遲不敏感情境。