向量檢索演算法 | 優勢 | 劣勢 | 情境 |
量化聚類(Quantized Clustering) | CPU、記憶體資源佔用較低。 |
| 適用於億層級資料集,對資料準確性和查詢延遲要求不是非常高的情境。 |
HNSW(Hierarchical Navigable Small World) | 召回率高、查詢速度快。 | CPU、記憶體資源佔用較高。 | 適用於千萬層級資料集,並且對資料準確性和查詢延遲有嚴格要求的情境。 |
linear | 召回率100%。 |
| 適用於萬層級的資料。 |
QGraph(Quantized Graph) | CPU、記憶體資源佔用低,耗時短,查詢效能高。 | 召回率較HNSW低。 | 適用于海量資料(十億級以上),對查詢耗時和查詢效能要求較高,對準確性要求不苛刻的情境。 |
CagraHnsw | 利用 GPU 完成索引構建,速度可達 CPU 構建的十倍以上。 | 召回率較 HNSW 略低。 | 適用于海量資料定期更新索引的情境。 |
CAGRA | GPU演算法,效能是CPU的數倍甚至數十倍。 | GPU成本高,性價比在低QPS情境下不明顯。 | 適用於高QPS,低耗時要求的情境。 |
DiskANN 說明 僅資料節點規格類型系列為SSD時支援DiskANN演算法 | 索引可以放磁碟,記憶體佔用低。 | 查詢耗時較高,吞吐低。 | 巨量資料量(數十億級),記憶體有限,延遲不敏感情境。 |