効率性を確保するため、検索システムは初期検索フェーズで十分に正確ではない結果を返す場合があります。再ランキングモデルは、取得されたドキュメントに対してより正確な 2 回目のソートを行い、ユーザーのクエリと最も関連性の高いドキュメントが上位に表示されるようにすることで、アプリケーションの精度を向上させます。
モデル概要
シンガポール
モデル名 | 最大ドキュメント数 | アイテムあたりの最大入力トークン数 | リクエストあたりの最大入力トークン数 | サポート言語 | 価格(100 万トークンあたり) | 無料クォータ | シナリオ |
qwen3-rerank | 500 | 4,000 | 30,000 | 中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語など 100 を超える主要言語 | $0.1 |
|
北京
モデル名 | 最大ドキュメント数 | アイテムあたりの最大入力トークン数 | リクエストあたりの最大入力トークン数 | サポート言語 | 価格(100 万トークンあたり) | 無料クォータ | シナリオ |
qwen3-vl-rerank | 100 | 8,000 | 800,000 | 中国語、英語、日本語、韓国語、フランス語、ドイツ語など 33 の主要言語 | イメージ:$0.258 テキスト:$0.1 | 無料クォータなし |
|
gte-rerank-v2 | 500 | 4,000 | 30,000 | 中国語、英語、日本語、韓国語、タイ語、スペイン語、フランス語、ポルトガル語、ドイツ語、インドネシア語、アラビア語など 50 を超える言語 | $0.115 |
|
アイテムあたりの最大入力トークン数:各クエリまたはドキュメントに許可される最大トークン数です。入力がこの制限を超える場合、切り捨てられます。API は切り捨てられた内容に基づいて結果を計算するため、ランキングが不正確になる可能性があります。
最大ドキュメント数:1 つのリクエストで許可される最大ドキュメント数です。
リクエストあたりの最大入力トークン数:数式
クエリトークン数 × ドキュメント数 + ドキュメントトークン合計で計算されます。この合計値は、リクエストあたりに許可される最大入力トークン数を超えてはなりません。
入力フォーマットの制限
モデル | イメージ | ビデオ |
qwen3-vl-rerank | JPEG、PNG、WEBP、BMP、TIFF、ICO、DIB、ICNS、および SGI(URL または Base64 対応) | MP4、AVI、および MOV(URL のみ) |
前提条件
API キーを取得し、API キーを環境変数として設定する必要があります。ソフトウェア開発キット(SDK)を使用する場合は、DashScope SDK をインストールする必要もあります。
HTTP 呼び出し
POST https://dashscope.aliyuncs.com/api/v1/services/rerank/text-rerank/text-rerankリクエスト | qwen3-rerankqwen3-vl-rerankgte-rerank-v2 |
リクエストヘッダー | |
Content-Type リクエストのコンテンツタイプです。 | |
Authorization Model Studio API キーを使用した認証情報です。 例: | |
リクエスト本文 | |
model モデル名です。サポートされているモデルには、qwen3-rerank、gte-rerank-v2、および qwen3-vl-rerank が含まれます。 | |
input 入力コンテンツです。
| |
parameters object (任意) 任意のパラメーターです。
|
応答 | 成功時の応答失敗時の応答リクエストが失敗した場合、応答の |
request_id リクエストの一意な識別子です。トレースおよび問題のトラブルシューティングに使用します。 | |
output タスクの出力です。 | |
usage 出力統計情報を提供します。 | |
code エラーコードです。リクエストが失敗した場合にのみ返されます。詳細については、「エラーコード」をご参照ください。 | |
message 詳細なエラーメッセージです。リクエストが失敗した場合にのみ返されます。詳細については、「エラーコード」をご参照ください。 |
SDK 呼び出し
例
以下の例は、再ランキングモデル API を呼び出す方法を示しています。
SDK のパラメーター名は HTTP API のものとほぼ一致していますが、パラメーター構造はカプセル化されています。たとえば、HTTP API ではネストされたinputおよびparameters構造を使用しますが、SDK ではフラットな構造を使用します。開発中はこの違いに注意してください。
import dashscope
def text_rerank():
resp = dashscope.TextReRank.call(
model="gte-rerank-v2",
query="What is a rerank model?",
documents=[
"Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance.",
"Quantum computing is a cutting-edge field of computer science.",
"The development of pre-trained language models has brought new advancements to rerank models."
],
top_n=2,
return_documents=True
)
print(resp)
if __name__ == '__main__':
text_rerank()サンプル出力
SDK は元の HTTP 応答をカプセル化しています。リクエストが成功した場合、SDK は常に code および message フィールドを空文字列として返します。
{
"status_code": 200,
"request_id": "4b0805c0-6b36-490d-8bc1-4365f4c89905",
"code": "",
"message": "",
"output": {
"results": [
{
"index": 0,
"relevance_score": 0.9334521178273196,
"document": {
"text": "Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance."
}
},
{
"index": 2,
"relevance_score": 0.34100082626411193,
"document": {
"text": "The development of pre-trained language models has brought new advancements to rerank models."
}
}
]
},
"usage": {
"total_tokens": 79
}
}エラーコード
呼び出しが失敗した場合は、「エラーメッセージ」を参照してトラブルシューティングを行ってください。