セマンティック検索、検索拡張生成 (RAG)、クロスモーダルマッチング、リランキングに適したモデルを見つけます。
テキスト埋め込み
プレーンテキスト検索、RAG、またはクラスタリングには text-embedding-v4 を使用します。既存の v3 インデックスを移行する必要がある場合は、次元互換性のために text-embedding-v3 を使用します。
次元の選び方
ストレージが限られている大規模検索の場合: 256 または 512 次元を選択してください。
汎用的なユースケースの場合: 1024 次元 (デフォルト、バランスが良好) を選択してください。
検索精度を重視する場合: 1536 または 2048 次元を選択してください。
マルチモーダル埋め込み
Text-to-Image や Text-to-Video の検索など、クロスモーダル検索では、融合ベクトルと独立ベクトルのいずれかを選択します。
融合ベクトルと独立ベクトル
融合ベクトル: テキストと画像を 1 つのベクトルに融合し、テキストと画像が混在する検索に使用します。
qwen3-vl-embeddingを使用します。独立ベクトル: モダリティごとに別々のベクトルを生成します。クロスモーダル検索 (Text-to-Image、Image-to-Image) に適しています。
tongyi-embedding-vision-plusを使用します。
テキストのみのデータを扱いますか?
text-embedding-v4 を使用してください。より高速でコスト効率が高く、次元の選択肢も豊富です。マルチモーダル埋め込みは、Text-to-Image や Text-to-Video の検索など、クロスモーダル検索向けです。
リランク
埋め込みベースの検索の後、リランクモデルを使用してクロスアテンションにより上位 N 件の結果を並べ替え、精度を高めます。
プレーンテキストのリランク:
qwen3-rerankを使用します。100 以上の言語に対応し、最大 500 件のドキュメントをサポートします。マルチモーダルのリランキング:
qwen3-vl-rerankを使用して、テキスト、画像、動画が混在するデータをリランキングします。
すべてのモデル
モデル ID | タイプ | 次元 | 最大トークン数 | ユースケース |
| テキスト埋め込み | 64–2048 (デフォルト: 1024) | 8,192 | テキスト検索、RAG、クラスタリング |
| テキスト埋め込み | 512–1024 (デフォルト: 1024) | 8,192 | 既存の v3 インデックスの移行 |
| マルチモーダル埋め込み | 64–1152 (デフォルト: 1152) | 1,024 | クロスモーダル検索 (独立ベクトルのみ) |
| マルチモーダル埋め込み | 64–768 (デフォルト: 768) | 1,024 | コスト重視のクロスモーダル検索 (独立ベクトルのみ) |
| リランク | - | 4,000 トークン/アイテム | テキスト検索結果のリランキング、RAG |
| マルチモーダル埋め込み | 256–2560 (デフォルト: 2560) | 32,000 | テキストと画像が混在する検索 (融合ベクトル + 独立ベクトル) |
| リランク | - | 8,000 トークン/アイテム | マルチモーダル検索結果のリランキング |