埋め込みとリランク - Alibaba Cloud Model Studio - Alibaba Cloud ドキュメントセンター

セマンティック検索、検索拡張生成 (RAG)、クロスモーダルマッチング、リランキングに適したモデルを見つけます。

テキスト埋め込み

プレーンテキスト検索、RAG、またはクラスタリングには text-embedding-v4 を使用します。既存の v3 インデックスを移行する必要がある場合は、次元互換性のために text-embedding-v3 を使用します。

Text-to-Image や Text-to-Video の検索など、クロスモーダル検索では、融合ベクトルと独立ベクトルのいずれかを選択します。

融合ベクトル：テキストと画像を 1 つのベクトルに融合し、テキストと画像が混在する検索に使用します。qwen3-vl-embedding を使用します。
独立ベクトル：モダリティごとに別々のベクトルを生成します。クロスモーダル検索 (Text-to-Image、Image-to-Image) に適しています。tongyi-embedding-vision-plus を使用します。

text-embedding-v4 を使用してください。より高速でコスト効率が高く、次元の選択肢も豊富です。マルチモーダル埋め込みは、Text-to-Image や Text-to-Video の検索など、クロスモーダル検索向けです。

埋め込みベースの検索の後、リランクモデルを使用してクロスアテンションにより上位 N 件の結果を並べ替え、精度を高めます。

モデル ID	タイプ	次元	最大トークン数	ユースケース
`text-embedding-v4`	テキスト埋め込み	64–2048 (デフォルト： 1024)	8,192	テキスト検索、RAG、クラスタリング
`text-embedding-v3`	テキスト埋め込み	512–1024 (デフォルト： 1024)	8,192	既存の v3 インデックスの移行
`tongyi-embedding-vision-plus`	マルチモーダル埋め込み	64–1152 (デフォルト： 1152)	1,024	クロスモーダル検索 (独立ベクトルのみ)
`tongyi-embedding-vision-flash`	マルチモーダル埋め込み	64–768 (デフォルト： 768)	1,024	コスト重視のクロスモーダル検索 (独立ベクトルのみ)
`qwen3-rerank`	リランク	-	4,000 トークン/アイテム	テキスト検索結果のリランキング、RAG
`qwen3-vl-embedding`	マルチモーダル埋め込み	256–2560 (デフォルト： 2560)	32,000	テキストと画像が混在する検索 (融合ベクトル + 独立ベクトル)
`qwen3-vl-rerank`	リランク	-	8,000 トークン/アイテム	マルチモーダル検索結果のリランキング