全部產品
Search
文件中心

Alibaba Cloud Model Studio:Embedding與Rerank模型

更新時間:Apr 22, 2026

選擇適合語義搜尋、RAG(Retrieval-Augmented Generation)檢索、跨模態匹配和重排序情境的模型。

文本Embedding

純文字搜尋、RAG或聚類情境,推薦使用text-embedding-v4。如果需要遷移已有的v3索引,可使用text-embedding-v3(維度相容)。

如何選擇維度?

  • 大規模搜尋且儲存空間有限:選擇256或512維。

  • 通用情境:選擇1024維(預設值,平衡效果好)。

  • 對檢索精度要求高:選擇1536或2048維。

多模態Embedding

如需跨模態檢索(文本搜圖片、文本搜視頻),根據需求選擇融合向量或獨立向量。

融合向量 vs 獨立向量

  • 融合向量:將文本和圖片融合為一個向量,適用於圖文混合檢索。推薦使用qwen3-vl-embedding

  • 獨立向量:為每種模態分別產生向量,適用於跨模態搜尋(文搜圖、圖搜圖)。推薦使用tongyi-embedding-vision-plus

只有純文字資料?

建議使用text-embedding-v4,速度更快、成本更低、維度選擇更多。多模態Embedding適用於跨模態檢索(文本和圖片互搜、文本和視頻互搜)。

重排序(Rerank)

用於提升RAG精度:在Embedding檢索之後使用重排序模型對Top-N結果進行重排序,通過交叉注意力機制提高排序品質。

  • 純文字重排序:使用qwen3-rerank,支援100+語言,最多500個文檔。

  • 多模態重排序:使用qwen3-vl-rerank,支援文本、圖片和視頻混合排序。

所有模型

新加坡

模型

類型

向量維度

最大Token數

適用情境

text-embedding-v4

文本Embedding

64~2048(預設1024)

8,192

文本搜尋、RAG、聚類

text-embedding-v3

文本Embedding

512~1024(預設1024)

8,192

已有v3索引遷移

tongyi-embedding-vision-plus

多模態Embedding

64~1152(預設1152)

1,024

跨模態搜尋(僅獨立向量)

tongyi-embedding-vision-flash

多模態Embedding

64~768(預設768)

1,024

跨模態搜尋,注重成本(僅獨立向量)

qwen3-rerank

重排序

-

4,000/條

文本搜尋結果重排序、RAG

北京

模型

類型

向量維度

最大Token數

適用情境

text-embedding-v4

文本Embedding

64~2048(預設1024)

8,192

文本搜尋、RAG、聚類

qwen3-vl-embedding

多模態Embedding

256~2560(預設2560)

32,000

圖文混合檢索(融合向量+獨立向量)

qwen3-vl-rerank

重排序

-

8,000/條

多模態搜尋結果重排序