Text Rerank API - qwen3-rerank, gte-rerank-v2, qwen3-vl-rerank | Model Studio - Alibaba Cloud Model Studio

リランキングモデルは、初期検索で返されたドキュメントを再スコアリングし、最も関連性の高い結果を最上位に表示します。

モデル概要

重要

gte-rerank モデルは 2026 年 5 月 30 日に提供を終了します。qwen3-rerank に切り替えてください。

シンガポール

モデル

最大ドキュメント数

アイテムあたりの最大入力トークン数

リクエストあたりの最大入力トークン数

サポート言語

シナリオ

qwen3-rerank

500

4,000

120,000

中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語など 100 以上の主要言語

テキストセマンティック検索
RAG アプリケーション

北京

モデル

最大ドキュメント数

アイテムあたりの最大入力トークン数

リクエストあたりの最大入力トークン数

サポート言語

シナリオ

qwen3-vl-rerank

テキスト：100

イメージ：40

ビデオ：4

8,000

120,000

中国語、英語、日本語、韓国語、フランス語、ドイツ語など 33 の主要言語

イメージクラスタリング
クロスモーダル検索
イメージ取得
ビデオ取得

gte-rerank-v2

500

4,000

30,000

中国語、英語、日本語、韓国語、タイ語、スペイン語、フランス語、ポルトガル語、ドイツ語、インドネシア語、アラビア語など 50 以上の言語

テキストセマンティック検索
RAG アプリケーション

アイテムあたりの最大入力トークン数：クエリまたはドキュメントあたりの最大トークン数。この制限を超えると切り捨てがトリガーされ、ランキングの精度が低下する可能性があります。
最大ドキュメント数：リクエストあたりの最大ドキュメント数。`qwen3-vl-rerank` の場合、制限はドキュメントタイプ (テキスト、イメージ、ビデオ、または混合) によって異なります。
リクエストあたりの最大入力トークン数: クエリのトークン数 × ドキュメント数 + ドキュメントの合計トークン数として計算されます。リクエストあたりの制限を超えてはなりません。

入力制限

モデル	画像	ビデオ
qwen3-vl-rerank	JPEG、PNG、WEBP、BMP、TIFF、ICO、DIB、ICNS、SGI (URL または Base64 をサポート)	MP4、AVI、MOV (URL のみ)

前提条件

API キーを取得し、API キーを環境変数として設定します。SDK を使用するには、DashScope SDK をインストールします。

HTTP

各モデルは異なるエンドポイントを使用します：

qwen3-rerank: POST https://{WorkspaceId}.cn-beijing.maas.aliyuncs.com/compatible-api/v1/reranks
qwen3-vl-rerank / gte-rerank-v2: POST https://{WorkspaceId}.cn-beijing.maas.aliyuncs.com/api/v1/services/rerank/text-rerank/text-rerank

{WorkspaceId} を実際のワークスペース ID に置き換えます。

2つの API は、リクエストボディの構造と応答フォーマットが異なります。各モデルのリクエストと応答の例をご参照ください。

リクエスト	qwen3-rerank # これはシンガポールリージョンの URL です。WorkspaceId を実際のワークスペース ID に置き換えてください。URL はリージョンによって異なります。 curl --request POST \ --url https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/compatible-mode/v1/reranks \ --header "Authorization: Bearer $DASHSCOPE_API_KEY" \ --header "Content-Type: application/json" \ --data '{ "model": "qwen3-rerank", "documents": [ "Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance.", "Quantum computing is a cutting-edge field of computer science.", "The development of pre-trained language models has brought new advancements to rerank models." ], "query": "What is a rerank model?", "top_n": 2, "instruct": "Given a web search query, retrieve relevant passages that answer the query." }' `WorkspaceId` を実際のワークスペース ID に置き換えます。 qwen3-vl-rerank テキストクエリ curl --location 'https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/services/rerank/text-rerank/text-rerank' \ --header "Authorization: Bearer $DASHSCOPE_API_KEY" \ --header 'Content-Type: application/json' \ --data '{ "model": "qwen3-vl-rerank", "input":{ "query": {"text": "What is a rerank model?"}, "documents": [ {"text": "Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance."}, {"image": "https://img.alicdn.com/imgextra/i3/O1CN01rdstgY1uiZWt8gqSL_!!6000000006071-0-tps-1970-356.jpg"}, {"video": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250107/lbcemt/new+video.mp4"} ] }, "parameters": { "return_documents": true, "top_n": 2, "fps": 1.0 } }' イメージクエリ curl --location 'https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/services/rerank/text-rerank/text-rerank' \ --header "Authorization: Bearer $DASHSCOPE_API_KEY" \ --header 'Content-Type: application/json' \ --data '{ "model": "qwen3-vl-rerank", "input":{ "query": {"image": "https://img.alicdn.com/imgextra/i3/O1CN01rdstgY1uiZWt8gqSL_!!6000000006071-0-tps-1970-356.jpg"}, "documents": [ {"text": "Text rerank models are widely used in search engines and recommendation systems to sort candidate captions based on text relevance."}, {"image": "https://img.alicdn.com/imgextra/i3/O1CN01rdstgY1uiZWt8gqSL_!!6000000006071-0-tps-1970-356.jpg"}, {"video": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250107/lbcemt/new+video.mp4"} ] }, "parameters": { "return_documents": true, "top_n": 2, "fps": 1.0 } }' gte-rerank-v2 curl --location 'https://{WorkspaceId}.ap-southeast-1.maas.aliyuncs.com/api/v1/services/rerank/text-rerank/text-rerank' \ --header "Authorization: Bearer $DASHSCOPE_API_KEY" \ --header 'Content-Type: application/json' \ --data '{ "model": "gte-rerank-v2", "input":{ "query": "What is a rerank model?", "documents": [ "Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance.", "Quantum computing is a cutting-edge field of computer science.", "The development of pre-trained language models has brought new advancements to rerank models." ] }, "parameters": { "return_documents": true, "top_n": 2 } }'
リクエストヘッダー
Content-Type `string` (必須) リクエストのコンテンツタイプは `application/json` である必要があります。
Authorization `string` (必須) Model Studio API キーでリクエストを認証します。例： Bearer sk-xxxx。
リクエストボディ
model `string` (必須) モデル名。サポートされている値：qwen3-rerank、gte-rerank-v2、qwen3-vl-rerank。
input `object` (必須) 入力コンテンツ。 `qwen3-rerank` で `input` オブジェクトがない場合は、`query` とドキュメントを `model` と同じレベルに配置します。プロパティ query `string \| object` (必須) クエリテキスト (最大 4,000 トークン)。 `qwen3-vl-rerank` は 2 つの `クエリ` フォーマットをサポートしています: 文字列形式：テキスト文字列を直接渡します。例：`"query": "What is a rerank model?"`。オブジェクト形式：モダリティタイプと値を指定したディクショナリを `{"modality type": "input content"}` のように渡します。サポートされているタイプは `text` と `image` です。テキストクエリ： `"query": {"text": "What is a text rerank model?"}` イメージクエリ: `"query": {"image": "イメージ URL または Base64 エンコードされた文字列"}` documents `array` (必須) ソート対象の候補ドキュメント。各要素は文字列です。 `qwen3-vl-rerank` は、要素ごとに辞書または文字列を受け付けます： `{"modality type": "text/image URL/video URL"}`。サポートされているタイプ： `text`、`image`、`video`。テキスト: キーは `text` で、値は文字列です。辞書ラッパーなしのプレーンな文字列も有効です。イメージ: キーは `image`、値は URL または Base64 データ URI (`data:image/{format};base64,{data}`、ここで `{format}` は `jpeg`/`png`、`{data}` はエンコードされた文字列) です。動画: キーは `video`、値には公開アクセス可能な URL を指定する必要があります。
parameters `object` (任意) オプションのパラメーター。 `qwen3-rerank` では、`parameters` オブジェクトは不要です。`top_n` と `instruct` を `model` と同じレベルに配置します。プロパティ top_n `int` (任意) 返す上位ランクのドキュメント数。デフォルト：すべてのドキュメント。合計ドキュメント数を超える値を指定すると、すべてのドキュメントが返されます。 return_documents `bool` (任意) 結果にドキュメントテキストを含めるかどうか。デフォルト： `false`。対応モデル： `gte-rerank-v2`、`qwen3-vl-rerank`。 instruct `string` (任意) カスタムソート命令。`qwen3-rerank` および `qwen3-vl-rerank` に適用され、モデルに異なるソートポリシーを適用するように指示します。例: Q&A 取得タスク (デフォルト): `「Web 検索クエリが与えられた場合、そのクエリに回答する関連パッセージを取得する」` フォーカス：回答を見つける。モデルは、ドキュメントがクエリに回答しているかどうかを優先します。例：クエリ「風邪を予防する方法は？」に対し、ドキュメント「頻繁な手洗いは風邪を予防する」は高スコアになりますが、「風邪は一般的な病気です」は (トピック的には関連していますが、回答ではないため) 低スコアになります。セマンティック類似性ソートタスク: `"意味的に類似したテキストを取得する。"` フォーカス：セマンティックな等価性を判断する。モデルは、言葉遣いや構造に関係なく、クエリとドキュメントが同じコアな意味を持つかどうかを評価します。例：よくある質問のシナリオで、「パスワードを変更するにはどうすればよいですか？」と「パスワードを忘れた場合はどうなりますか？」はセマンティックに類似しています (高スコア)。モデルは、両方が同じユーザーの意図を反映しているかどうかに焦点を当てます。命令は英語で記述してください。デフォルト：Q&A 取得タスク。その他の命令は、モデルリポジトリで入手できます。 fps `float` (任意) `qwen3-vl-rerank` のみ。ビデオフレームの抽出数を制御します。値が小さいほど、フレーム数は少なくなります。範囲: 0～1 (デフォルト: 1.0)。

応答	成功応答 qwen3-rerank `{ "object": "list", "results": [ { "index": 0, "relevance_score": 0.9334521178273196 }, { "index": 2, "relevance_score": 0.34100082626411193 } ], "model": "qwen3-rerank", "id": "85ba5752-1900-47d2-8896-23f99b13f6e1", "usage": { "total_tokens": 79 } }` qwen3-vl-rerank / gte-rerank-v2 { "output": { "results": [ { "document": { "text": "Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance." }, "index": 0, "relevance_score": 0.9334521178273196 }, { "document": { "text": "The development of pre-trained language models has brought new advancements to rerank models." }, "index": 2, "relevance_score": 0.34100082626411193 } ] }, "usage": { "total_tokens": 79 }, "request_id": "85ba5752-1900-47d2-8896-23f99b13f6e1" } 失敗応答リクエストが失敗した場合、`コード`と`メッセージ`がエラーの原因を示します。 `{ "code":"InvalidApiKey", "message":"Invalid API-key provided.", "request_id":"fb53c4ec-1c12-4fc4-a580-cdb7c3261fc1" }`
request_id `string` 追跡とトラブルシューティングのためのユニークなリクエスト識別子。
output `object` タスクの出力。 `qwen3-rerank` の場合、応答に `output` オブジェクトは含まれず、`results` 配列はトップレベルに配置されます。プロパティ results `array` `relevance_score` の降順で結果がソートされます。プロパティ document `dict` 元のドキュメントオブジェクト。`return_documents` が `true` の場合にのみ返されます。フォーマット: `{"text": "Original document text"}`。 index `int` 入力 `documents` 配列内のドキュメントのインデックス。 relevance_score `double` ドキュメントとクエリ間のセマンティックな関連性。範囲：0.0〜1.0 (高いほど関連性が高い)。説明スコアは現在のリクエストに相対的なものであり、リクエスト間で比較することはできません。
usage `object` トークン使用量統計。プロパティ total_tokens `int` リクエストによって消費された合計トークン数。
code `string` エラーコード。失敗したリクエストに対してのみ返されます。詳細については、「エラーコード」をご参照ください。
message `string` 詳細なエラーメッセージ。失敗したリクエストに対してのみ返されます。詳細については、「エラーコード」をご参照ください。

SDK の使用

例

リランキングモデル API を呼び出します。

SDK のパラメーター名は HTTP API と一致しますが、構造は異なります。HTTP はネストされた input および parameters オブジェクトを使用するのに対し、SDK は FLAT 構造を使用します。

Python

import dashscope
# 中国 (北京) リージョン。{WorkspaceId} を実際のワークスペース ID に置き換えてください。構成はリージョンによって異なります。
dashscope.base_http_api_url = "https://{WorkspaceId}.cn-beijing.maas.aliyuncs.com/api/v1"

def text_rerank():
    resp = dashscope.TextReRank.call(
        model="gte-rerank-v2",
        query="What is a rerank model?",
        documents=[
            "Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance.",
            "Quantum computing is a cutting-edge field of computer science.",
            "The development of pre-trained language models has brought new advancements to rerank models."
        ],
        top_n=2,
        return_documents=True
    )
    print(resp)

if __name__ == '__main__':
    text_rerank()

イメージクエリを使用したマルチモーダル再ランキングには、 qwen3-vl-rerank を使用します。

Python

import dashscope
from http import HTTPStatus
import json
# 中国 (北京) リージョン。{WorkspaceId} を実際のワークスペース ID に置き換えてください。
dashscope.base_http_api_url = "https://{WorkspaceId}.cn-beijing.maas.aliyuncs.com/api/v1"

def vl_rerank():
    resp = dashscope.TextReRank.call(
        model="qwen3-vl-rerank",
        query={"image": "https://img.alicdn.com/imgextra/i3/O1CN01rdstgY1uiZWt8gqSL_!!6000000006071-0-tps-1970-356.jpg"},
        documents=[
            {"text": "Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance."},
            {"image": "https://img.alicdn.com/imgextra/i3/O1CN01rdstgY1uiZWt8gqSL_!!6000000006071-0-tps-1970-356.jpg"},
            {"video": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250107/lbcemt/new+video.mp4"}
        ],
        top_n=2,
        return_documents=True
    )
    if resp.status_code == HTTPStatus.OK:
        print(json.dumps(resp, default=str, ensure_ascii=False, indent=4))
    else:
        print(resp)


if __name__ == '__main__':
    vl_rerank()

出力例

説明

SDK は HTTP レスポンスをラップします。リクエストが成功した場合、コード と メッセージ は常に空の文字列です。

{
    "status_code": 200,
    "request_id": "4b0805c0-6b36-490d-8bc1-4365f4c89905",
    "code": "",
    "message": "",
    "output": {
        "results": [
            {
                "index": 0,
                "relevance_score": 0.9334521178273196,
                "document": {
                    "text": "Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance."
                }
            },
            {
                "index": 2,
                "relevance_score": 0.34100082626411193,
                "document": {
                    "text": "The development of pre-trained language models has brought new advancements to rerank models."
                }
            }
        ]
    },
    "usage": {
        "total_tokens": 79
    }
}

エラーコード

モデルの呼び出しが失敗し、エラーメッセージが返された場合は、「エラーコード」を参照して解決してください。

モデル概要

シンガポール

北京

入力制限

前提条件

HTTP

リクエスト

qwen3-rerank

qwen3-vl-rerank

gte-rerank-v2

リクエストヘッダー

リクエストボディ

応答

成功応答

qwen3-rerank

qwen3-vl-rerank / gte-rerank-v2

失敗応答

SDK の使用

例

出力例

エラーコード