Embedding与Rerank模型 - 大模型服务平台百炼

选择适合语义搜索、RAG（Retrieval-Augmented Generation）检索、跨模态匹配和重排序场景的模型。

文本Embedding

纯文本搜索、RAG或聚类场景，推荐使用text-embedding-v4。如果需要迁移已有的v3索引，可使用text-embedding-v3（维度兼容）。

如需跨模态检索（文本搜图片、文本搜视频），根据需求选择融合向量或独立向量。

建议使用text-embedding-v4，速度更快、成本更低、维度选择更多。多模态Embedding适用于跨模态检索（文本和图片互搜、文本和视频互搜）。

用于提升RAG精度：在Embedding检索之后使用重排序模型对Top-N结果进行重排序，通过交叉注意力机制提高排序质量。

模型	类型	向量维度	最大Token数	适用场景
`text-embedding-v4`	文本Embedding	64~2048（默认1024）	8,192	文本搜索、RAG、聚类
`text-embedding-v3`	文本Embedding	512~1024（默认1024）	8,192	已有v3索引迁移
`tongyi-embedding-vision-plus`	多模态Embedding	64~1152（默认1152）	1,024	跨模态搜索（仅独立向量）
`tongyi-embedding-vision-flash`	多模态Embedding	64~768（默认768）	1,024	跨模态搜索，注重成本（仅独立向量）
`qwen3-rerank`	重排序	-	4,000/条	文本搜索结果重排序、RAG