効率を向上させるため、検索システムは初期検索フェーズで十分に正確ではない結果を返す場合があります。再ランキング(rerank)モデルは、取得されたドキュメントに対してより正確なソートを行い、最も関連性の高い結果が上位に表示されるようにします。
モデル概要
シンガポール
|
モデル名 |
最大ドキュメント数 |
アイテムあたりの最大入力トークン数 |
リクエストあたりの最大入力トークン数 |
サポート言語 |
価格(1M トークンあたり) |
無料クォータ |
シナリオ |
|
qwen3-rerank |
500 |
4,000 |
120,000 |
中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語など 100 言語以上 |
$0.1 |
100 万トークン Model Studio のアクティベート後 90 日間有効 |
|
北京
|
モデル名 |
最大ドキュメント数 |
アイテムあたりの最大入力トークン数 |
リクエストあたりの最大入力トークン数 |
サポート言語 |
価格(1M トークンあたり) |
無料クォータ |
シナリオ |
|
qwen3-vl-rerank |
100 |
8,000 |
120,000 |
中国語、英語、日本語、韓国語、フランス語、ドイツ語など 33 の主要言語 |
画像:$0.258 テキスト:$0.1 |
無料クォータなし |
|
|
gte-rerank-v2 |
500 |
4,000 |
30,000 |
中国語、英語、日本語、韓国語、タイ語、スペイン語、フランス語、ポルトガル語、ドイツ語、インドネシア語、アラビア語など 50 言語以上 |
$0.115 |
|
-
アイテムあたりの最大入力トークン数:各クエリまたはドキュメントに許可される最大トークン数です。入力がこの制限を超えると、切り捨てられます。API は切り捨てられた内容に基づいて結果を計算するため、不正確なランキングになる可能性があります。
-
最大ドキュメント数:1 回のリクエストで許可される最大ドキュメント数です。
-
リクエストあたりの最大入力トークン数:次の数式で計算されます。
クエリトークン数 × ドキュメント数 + ドキュメントの合計トークン数。この合計値は、リクエストあたりの最大入力トークン数を超えてはなりません。
入力制限事項
|
モデル |
画像 |
動画 |
|
qwen3-vl-rerank |
JPEG、PNG、WEBP、BMP、TIFF、ICO、DIB、ICNS、SGI(URL または Base64 形式対応) |
MP4、AVI、MOV(URL のみ対応) |
前提条件
API キーを取得し、API キーを環境変数として設定する必要があります。SDK を使用する場合は、DashScope SDK をインストールする必要もあります。
HTTP 呼び出し
POST https://dashscope.aliyuncs.com/api/v1/services/rerank/text-rerank/text-rerank
リクエスト |
qwen3-rerank
qwen3-vl-rerankテキストクエリ
画像クエリ gte-rerank-v2
|
リクエストヘッダー |
|
|
Content-Type リクエストのコンテンツタイプです。 |
|
|
Authorization Model Studio API キーを使用した認証情報です。 例: |
|
リクエストボディ |
|
|
model モデル名です。サポートされているモデルには、qwen3-rerank、gte-rerank-v2、qwen3-vl-rerank があります。 |
|
|
input 入力コンテンツです。
|
|
|
parameters object (オプション) オプションのパラメーターです。
|
応答 |
成功応答
失敗応答リクエストが失敗した場合、応答の
|
|
request_id リクエストの一意の識別子です。問題の追跡とトラブルシューティングに使用します。 |
|
|
output タスクの出力です。 |
|
|
usage 出力の統計です。 |
|
|
code エラーコードです。リクエストが失敗した場合にのみ返されます。詳細については、「エラーコード」をご参照ください。 |
|
|
message 詳細なエラーメッセージです。リクエストが失敗した場合にのみ返されます。詳細については、「エラーコード」をご参照ください。 |
SDK の使用
例
次の例は、再ランキングモデル API を呼び出す方法を示しています。
SDK のパラメーター名はほとんど HTTP API と一致していますが、パラメーター構造はカプセル化されています。たとえば、HTTP API はネストされたinputおよびparameters構造を使用しますが、SDK はフラットな構造を使用します。開発中にこの違いに注意してください。
import dashscope
def text_rerank():
resp = dashscope.TextReRank.call(
model="gte-rerank-v2",
query="What is a rerank model?",
documents=[
"Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance.",
"Quantum computing is a cutting-edge field of computer science.",
"The development of pre-trained language models has brought new advancements to rerank models."
],
top_n=2,
return_documents=True
)
print(resp)
if __name__ == '__main__':
text_rerank()次の例は、画像をクエリとして使用して、qwen3-vl-rerank モデルでマルチモーダルソートを使用する方法を示しています。
import dashscope
from http import HTTPStatus
import json
def vl_rerank():
resp = dashscope.TextReRank.call(
model="qwen3-vl-rerank",
query={"image": "https://img.alicdn.com/imgextra/i3/O1CN01rdstgY1uiZWt8gqSL_!!6000000006071-0-tps-1970-356.jpg"},
documents=[
{"text": "Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance."},
{"image": "https://img.alicdn.com/imgextra/i3/O1CN01rdstgY1uiZWt8gqSL_!!6000000006071-0-tps-1970-356.jpg"},
{"video": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/20250107/lbcemt/new+video.mp4"}
],
top_n=2,
return_documents=True
)
if resp.status_code == HTTPStatus.OK:
print(json.dumps(resp, default=str, ensure_ascii=False, indent=4))
else:
print(resp)
if __name__ == '__main__':
vl_rerank()出力例
SDK は元の HTTP 応答をカプセル化します。リクエストが成功した場合、SDK は常に code フィールドと message フィールドを空の文字列として返します。
{
"status_code": 200,
"request_id": "4b0805c0-6b36-490d-8bc1-4365f4c89905",
"code": "",
"message": "",
"output": {
"results": [
{
"index": 0,
"relevance_score": 0.9334521178273196,
"document": {
"text": "Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance."
}
},
{
"index": 2,
"relevance_score": 0.34100082626411193,
"document": {
"text": "The development of pre-trained language models has brought new advancements to rerank models."
}
}
]
},
"usage": {
"total_tokens": 79
}
}
エラーコード
モデル呼び出しが失敗し、エラーメッセージが返された場合は、解決策について「エラーメッセージ」をご参照ください。