選擇適合語義搜尋、RAG(Retrieval-Augmented Generation)檢索、跨模態匹配和重排序情境的模型。
文本Embedding
純文字搜尋、RAG或聚類情境,推薦使用text-embedding-v4。如果需要遷移已有的v3索引,可使用text-embedding-v3(維度相容)。
如何選擇維度?
大規模搜尋且儲存空間有限:選擇256或512維。
通用情境:選擇1024維(預設值,平衡效果好)。
對檢索精度要求高:選擇1536或2048維。
多模態Embedding
如需跨模態檢索(文本搜圖片、文本搜視頻),根據需求選擇融合向量或獨立向量。
融合向量 vs 獨立向量
融合向量:將文本和圖片融合為一個向量,適用於圖文混合檢索。推薦使用
qwen3-vl-embedding。獨立向量:為每種模態分別產生向量,適用於跨模態搜尋(文搜圖、圖搜圖)。推薦使用
tongyi-embedding-vision-plus。
只有純文字資料?
建議使用text-embedding-v4,速度更快、成本更低、維度選擇更多。多模態Embedding適用於跨模態檢索(文本和圖片互搜、文本和視頻互搜)。
重排序(Rerank)
用於提升RAG精度:在Embedding檢索之後使用重排序模型對Top-N結果進行重排序,通過交叉注意力機制提高排序品質。
純文字重排序:使用
qwen3-rerank,支援100+語言,最多500個文檔。多模態重排序:使用
qwen3-vl-rerank,支援文本、圖片和視頻混合排序。
所有模型
新加坡
模型 | 類型 | 向量維度 | 最大Token數 | 適用情境 |
| 文本Embedding | 64~2048(預設1024) | 8,192 | 文本搜尋、RAG、聚類 |
| 文本Embedding | 512~1024(預設1024) | 8,192 | 已有v3索引遷移 |
| 多模態Embedding | 64~1152(預設1152) | 1,024 | 跨模態搜尋(僅獨立向量) |
| 多模態Embedding | 64~768(預設768) | 1,024 | 跨模態搜尋,注重成本(僅獨立向量) |
| 重排序 | - | 4,000/條 | 文本搜尋結果重排序、RAG |
北京
模型 | 類型 | 向量維度 | 最大Token數 | 適用情境 |
| 文本Embedding | 64~2048(預設1024) | 8,192 | 文本搜尋、RAG、聚類 |
| 多模態Embedding | 256~2560(預設2560) | 32,000 | 圖文混合檢索(融合向量+獨立向量) |
| 重排序 | - | 8,000/條 | 多模態搜尋結果重排序 |