Untuk meningkatkan efisiensi, sistem retrieval mungkin mengembalikan hasil yang kurang presisi pada fase awal. Model rerank melakukan pengurutan ulang yang lebih akurat terhadap dokumen yang telah diambil guna memastikan hasil paling relevan muncul di posisi teratas.
Ikhtisar Model
Singapore
|
Model Name |
Max number of documents |
Max input tokens per item |
Max input tokens per request |
Supported languages |
Price (per 1M tokens) |
Free quota |
Scenarios |
|
qwen3-rerank |
500 |
4.000 |
120.000 |
Lebih dari 100 bahasa utama, seperti Tiongkok, Inggris, Spanyol, Prancis, Portugis, Indonesia, Jepang, Korea, Jerman, dan Rusia |
$0,1 |
1 juta token Berlaku selama 90 hari setelah mengaktifkan Model Studio |
|
Beijing
|
Model name |
Max number of documents |
Max input tokens per item |
Max input tokens per request |
Supported languages |
Price (per 1M tokens) |
Free quota |
Scenarios |
|
qwen3-vl-rerank |
100 |
8.000 |
120.000 |
33 bahasa utama, seperti Tionghoa, Inggris, Jepang, Korea, Prancis, dan Jerman |
Image: $0,258 Text: $0,1 |
No free quota |
|
|
gte-rerank-v2 |
500 |
4.000 |
30.000 |
Lebih dari 50 bahasa, termasuk Mandarin, Inggris, Jepang, Korea, Thailand, Spanyol, Prancis, Portugis, Jerman, Indonesia, dan Arab |
$0,115 |
|
-
Max input tokens per item: Jumlah maksimum token yang diizinkan untuk setiap kueri atau dokumen. Jika input melebihi batas ini, konten akan dipotong (truncated). API menghitung hasil berdasarkan konten yang telah dipotong, yang dapat menyebabkan peringkat tidak akurat.
-
Max number of documents: Jumlah maksimum dokumen yang diizinkan dalam satu permintaan.
-
Max input tokens per request: Dihitung menggunakan rumus
Query Tokens × Number of documents + Total document tokens. Total ini tidak boleh melebihi jumlah maksimum token input yang diizinkan per permintaan.
Batasan Input
|
Model |
Image |
Video |
|
qwen3-vl-rerank |
JPEG, PNG, WEBP, BMP, TIFF, ICO, DIB, ICNS, dan SGI (URL atau Base64 didukung) |
MP4, AVI, dan MOV (hanya URL) |
Prasyarat
Anda harus mendapatkan kunci API dan menyetel kunci API sebagai variabel lingkungan. Untuk menggunakan SDK, Anda juga harus menginstal SDK DashScope.
Panggilan HTTP
POST https://dashscope.aliyuncs.com/api/v1/services/rerank/text-rerank/text-rerank
Request |
qwen3-rerank
qwen3-vl-rerankText query
Image query gte-rerank-v2
|
Request headers |
|
|
Content-Type Tipe konten dari permintaan. Harus berupa |
|
|
Authorization Kredensial otentikasi menggunakan kunci API Model Studio. Contoh: |
|
Request body |
|
|
model Nama model. Model yang didukung meliputi qwen3-rerank, gte-rerank-v2, dan qwen3-vl-rerank. |
|
|
input Konten input. Saat Anda menggunakan |
|
|
parameters object (Optional) Parameter opsional. Saat Anda menggunakan |
Response |
Successful response
Failed responseJika permintaan gagal, bidang
|
|
request_id Pengidentifikasi unik untuk permintaan. Gunakan untuk pelacakan dan troubleshooting masalah. |
|
|
output Output dari tugas. |
|
|
usage Statistik output. |
|
|
code Kode kesalahan. Hanya dikembalikan jika permintaan gagal. Lihat kode kesalahan untuk detailnya. |
|
|
message Pesan kesalahan detail. Hanya dikembalikan jika permintaan gagal. Lihat kode kesalahan untuk detailnya. |
Gunakan SDK
Contoh
Contoh berikut menunjukkan cara memanggil API model rerank.
Nama parameter dalam SDK sebagian besar konsisten dengan API HTTP, tetapi struktur parameternya telah dienkapsulasi. Misalnya, API HTTP menggunakan struktur bersaranginputdanparameters, sedangkan SDK menggunakan struktur flat. Perhatikan perbedaan ini selama pengembangan.
import dashscope
def text_rerank():
resp = dashscope.TextReRank.call(
model="gte-rerank-v2",
query="What is a rerank model?",
documents=[
"Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance.",
"Quantum computing is a cutting-edge field of computer science.",
"The development of pre-trained language models has brought new advancements to rerank models."
],
top_n=2,
return_documents=True
)
print(resp)
if __name__ == '__main__':
text_rerank()Contoh berikut menunjukkan cara menggunakan model qwen3-vl-rerank untuk pengurutan multimodal menggunakan gambar sebagai kueri.
import dashscope
from http import HTTPStatus
import json
def vl_rerank():
resp = dashscope.TextReRank.call(
model="qwen3-vl-rerank",
query={"image": "https://img.alicdn.com/imgextra/i3/O1CN01rdstgY1uiZWt8gqSL_!!6000000006071-0-tps-1970-356.jpg"},
documents=[
{"text": "Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance."},
{"image": "https://img.alicdn.com/imgextra/i3/O1CN01rdstgY1uiZWt8gqSL_!!6000000006071-0-tps-1970-356.jpg"},
{"video": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250107/lbcemt/new+video.mp4"}
],
top_n=2,
return_documents=True
)
if resp.status_code == HTTPStatus.OK:
print(json.dumps(resp, default=str, ensure_ascii=False, indent=4))
else:
print(resp)
if __name__ == '__main__':
vl_rerank()Contoh output
SDK mengenkapsulasi respons HTTP asli. Untuk permintaan yang berhasil, SDK selalu mengembalikan bidang code dan message dengan nilai string kosong.
{
"status_code": 200,
"request_id": "4b0805c0-6b36-490d-8bc1-4365f4c89905",
"code": "",
"message": "",
"output": {
"results": [
{
"index": 0,
"relevance_score": 0.9334521178273196,
"document": {
"text": "Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance."
}
},
{
"index": 2,
"relevance_score": 0.34100082626411193,
"document": {
"text": "The development of pre-trained language models has brought new advancements to rerank models."
}
}
]
},
"usage": {
"total_tokens": 79
}
}
Kode Kesalahan
Jika pemanggilan model gagal dan mengembalikan pesan kesalahan, lihat Pesan Kesalahan untuk penyelesaiannya.