Embedding與Rerank模型 - Alibaba Cloud Model Studio

選擇適合語義搜尋、RAG（Retrieval-Augmented Generation）檢索、跨模態匹配和重排序情境的模型。

文本Embedding

純文字搜尋、RAG或聚類情境，推薦使用text-embedding-v4。如果需要遷移已有的v3索引，可使用text-embedding-v3（維度相容）。

如需跨模態檢索（文本搜圖片、文本搜視頻），根據需求選擇融合向量或獨立向量。

建議使用text-embedding-v4，速度更快、成本更低、維度選擇更多。多模態Embedding適用於跨模態檢索（文本和圖片互搜、文本和視頻互搜）。

用於提升RAG精度：在Embedding檢索之後使用重排序模型對Top-N結果進行重排序，通過交叉注意力機制提高排序品質。

模型	類型	向量維度	最大Token數	適用情境
`text-embedding-v4`	文本Embedding	64~2048（預設1024）	8,192	文本搜尋、RAG、聚類
`text-embedding-v3`	文本Embedding	512~1024（預設1024）	8,192	已有v3索引遷移
`tongyi-embedding-vision-plus`	多模態Embedding	64~1152（預設1152）	1,024	跨模態搜尋（僅獨立向量）
`tongyi-embedding-vision-flash`	多模態Embedding	64~768（預設768）	1,024	跨模態搜尋，注重成本（僅獨立向量）
`qwen3-rerank`	重排序	-	4,000/條	文本搜尋結果重排序、RAG