すべてのプロダクト
Search
ドキュメントセンター

Alibaba Cloud Model Studio:埋め込みモデルとリランキングモデル

最終更新日:Apr 23, 2026

セマンティック検索、検索拡張生成 (RAG)、クロスモーダルマッチング、再ランキングのユースケースに適したモデルを見つけます。

テキスト埋め込み

プレーンテキスト検索、検索拡張生成 (RAG)、またはクラスタリングのシナリオでは、text-embedding-v4 を使用します。既存の v3 インデックスを移行する必要がある場合は、ディメンションの互換性のために text-embedding-v3 を使用します。

ディメンションの選択方法

  • 大規模検索でストレージに制限がある場合:256 または 512 ディメンションを選択します。

  • 汎用的なユースケースの場合:1024 ディメンション (デフォルト、バランスの取れた選択肢) を選択します。

  • 高い検索精度が必要な場合:1536 または 2048 ディメンションを選択します。

マルチモーダル埋め込み

テキストによる画像検索やテキストによる動画検索などのクロスモーダル検索では、要件に応じて融合ベクターと独立ベクターから選択します。

融合ベクターと独立ベクターの比較

  • 融合ベクター:テキストと画像を単一のベクターに融合し、テキストと画像の混合検索に使用します。qwen3-vl-embedding の使用を推奨します。

  • 独立ベクター:モダリティごとに個別のベクターを生成します。これは、クロスモーダル検索 (テキストによる画像検索、画像による画像検索) に適しています。tongyi-embedding-vision-plus の使用を推奨します。

テキストのみのデータを扱う場合

text-embedding-v4 の使用を推奨します。このモデルはより高速でコスト効率が高く、より多くのディメンションオプションを提供します。マルチモーダル埋め込みは、テキストと画像の検索やテキストと動画の検索などのクロスモーダル検索に使用されます。

リランキング

埋め込みベースの初期検索の後にリランキングモデルを使用することで、RAG の精度を向上させます。このモデルは、クロスアテンションメカニズムを使用して上位 N 件の結果を並べ替え、ランキング品質を向上させます。

  • プレーンテキストのリランキングqwen3-rerank を使用し、100 以上の言語と最大 500 のドキュメントをサポートします。

  • マルチモーダルのリランキングqwen3-vl-rerank を使用し、テキスト、画像、動画が混在する結果を再ランキングします。

すべてのモデル

シンガポール

モデル

タイプ

ベクターディメンション

最大トークン数

ユースケース

text-embedding-v4

テキスト埋め込み

64–2048 (デフォルト:1024)

8,192

テキスト検索、RAG、クラスタリング

text-embedding-v3

テキスト埋め込み

512–1024 (デフォルト:1024)

8,192

既存の v3 インデックスの移行

tongyi-embedding-vision-plus

マルチモーダル埋め込み

64–1152 (デフォルト:1152)

1,024

クロスモーダル検索 (独立ベクターのみ)

tongyi-embedding-vision-flash

マルチモーダル埋め込み

64–768 (デフォルト:768)

1,024

コスト重視のクロスモーダル検索 (独立ベクターのみ)

qwen3-rerank

リランキング

-

アイテムあたり 4,000

テキスト検索結果の再ランキング、RAG

中国 (北京)

モデル

タイプ

ベクターディメンション

最大トークン数

ユースケース

text-embedding-v4

テキスト埋め込み

64–2048 (デフォルト:1024)

8,192

テキスト検索、RAG、クラスタリング

qwen3-vl-embedding

マルチモーダル埋め込み

256–2560 (デフォルト:2560)

32,000

テキストと画像の混合検索 (融合ベクター + 独立ベクター)

qwen3-vl-rerank

リランキング

-

アイテムあたり 8,000

マルチモーダル検索結果の再ランキング