セマンティック検索、検索拡張生成 (RAG)、クロスモーダルマッチング、再ランキングのユースケースに適したモデルを見つけます。
テキスト埋め込み
プレーンテキスト検索、検索拡張生成 (RAG)、またはクラスタリングのシナリオでは、text-embedding-v4 を使用します。既存の v3 インデックスを移行する必要がある場合は、ディメンションの互換性のために text-embedding-v3 を使用します。
ディメンションの選択方法
大規模検索でストレージに制限がある場合:256 または 512 ディメンションを選択します。
汎用的なユースケースの場合:1024 ディメンション (デフォルト、バランスの取れた選択肢) を選択します。
高い検索精度が必要な場合:1536 または 2048 ディメンションを選択します。
マルチモーダル埋め込み
テキストによる画像検索やテキストによる動画検索などのクロスモーダル検索では、要件に応じて融合ベクターと独立ベクターから選択します。
融合ベクターと独立ベクターの比較
融合ベクター:テキストと画像を単一のベクターに融合し、テキストと画像の混合検索に使用します。
qwen3-vl-embeddingの使用を推奨します。独立ベクター:モダリティごとに個別のベクターを生成します。これは、クロスモーダル検索 (テキストによる画像検索、画像による画像検索) に適しています。
tongyi-embedding-vision-plusの使用を推奨します。
テキストのみのデータを扱う場合
text-embedding-v4 の使用を推奨します。このモデルはより高速でコスト効率が高く、より多くのディメンションオプションを提供します。マルチモーダル埋め込みは、テキストと画像の検索やテキストと動画の検索などのクロスモーダル検索に使用されます。
リランキング
埋め込みベースの初期検索の後にリランキングモデルを使用することで、RAG の精度を向上させます。このモデルは、クロスアテンションメカニズムを使用して上位 N 件の結果を並べ替え、ランキング品質を向上させます。
プレーンテキストのリランキング:
qwen3-rerankを使用し、100 以上の言語と最大 500 のドキュメントをサポートします。マルチモーダルのリランキング:
qwen3-vl-rerankを使用し、テキスト、画像、動画が混在する結果を再ランキングします。
すべてのモデル
シンガポール
モデル | タイプ | ベクターディメンション | 最大トークン数 | ユースケース |
| テキスト埋め込み | 64–2048 (デフォルト:1024) | 8,192 | テキスト検索、RAG、クラスタリング |
| テキスト埋め込み | 512–1024 (デフォルト:1024) | 8,192 | 既存の v3 インデックスの移行 |
| マルチモーダル埋め込み | 64–1152 (デフォルト:1152) | 1,024 | クロスモーダル検索 (独立ベクターのみ) |
| マルチモーダル埋め込み | 64–768 (デフォルト:768) | 1,024 | コスト重視のクロスモーダル検索 (独立ベクターのみ) |
| リランキング | - | アイテムあたり 4,000 | テキスト検索結果の再ランキング、RAG |
中国 (北京)
モデル | タイプ | ベクターディメンション | 最大トークン数 | ユースケース |
| テキスト埋め込み | 64–2048 (デフォルト:1024) | 8,192 | テキスト検索、RAG、クラスタリング |
| マルチモーダル埋め込み | 256–2560 (デフォルト:2560) | 32,000 | テキストと画像の混合検索 (融合ベクター + 独立ベクター) |
| リランキング | - | アイテムあたり 8,000 | マルチモーダル検索結果の再ランキング |