埋め込みモデルとリランキングモデル - Alibaba Cloud Model Studio

セマンティック検索、検索拡張生成 (RAG)、クロスモーダルマッチング、再ランキングのユースケースに適したモデルを見つけます。

テキスト埋め込み

プレーンテキスト検索、検索拡張生成 (RAG)、またはクラスタリングのシナリオでは、text-embedding-v4 を使用します。既存の v3 インデックスを移行する必要がある場合は、ディメンションの互換性のために text-embedding-v3 を使用します。

テキストによる画像検索やテキストによる動画検索などのクロスモーダル検索では、要件に応じて融合ベクターと独立ベクターから選択します。

融合ベクター：テキストと画像を単一のベクターに融合し、テキストと画像の混合検索に使用します。qwen3-vl-embedding の使用を推奨します。
独立ベクター：モダリティごとに個別のベクターを生成します。これは、クロスモーダル検索 (テキストによる画像検索、画像による画像検索) に適しています。tongyi-embedding-vision-plus の使用を推奨します。

text-embedding-v4 の使用を推奨します。このモデルはより高速でコスト効率が高く、より多くのディメンションオプションを提供します。マルチモーダル埋め込みは、テキストと画像の検索やテキストと動画の検索などのクロスモーダル検索に使用されます。

埋め込みベースの初期検索の後にリランキングモデルを使用することで、RAG の精度を向上させます。このモデルは、クロスアテンションメカニズムを使用して上位 N 件の結果を並べ替え、ランキング品質を向上させます。

モデル	タイプ	ベクターディメンション	最大トークン数	ユースケース
`text-embedding-v4`	テキスト埋め込み	64–2048 (デフォルト：1024)	8,192	テキスト検索、RAG、クラスタリング
`text-embedding-v3`	テキスト埋め込み	512–1024 (デフォルト：1024)	8,192	既存の v3 インデックスの移行
`tongyi-embedding-vision-plus`	マルチモーダル埋め込み	64–1152 (デフォルト：1152)	1,024	クロスモーダル検索 (独立ベクターのみ)
`tongyi-embedding-vision-flash`	マルチモーダル埋め込み	64–768 (デフォルト：768)	1,024	コスト重視のクロスモーダル検索 (独立ベクターのみ)
`qwen3-rerank`	リランキング	-	アイテムあたり 4,000	テキスト検索結果の再ランキング、RAG