Untuk memastikan efisiensi, sistem retrieval dapat mengembalikan hasil yang kurang tepat selama fase retrieval awal. Model rerank melakukan penyortiran ulang yang lebih akurat terhadap dokumen yang telah diambil guna memastikan bahwa dokumen paling relevan dengan kueri pengguna muncul di bagian atas, sehingga meningkatkan akurasi aplikasi.
Ikhtisar model
Singapore
Model Name | Max number of documents | Max input tokens per item | Max input tokens per request | Supported languages | Price (per 1 million tokens) | Free quota | Scenarios |
qwen3-rerank | 500 | 4.000 | 30.000 | Lebih dari 100 bahasa utama, seperti Mandarin, Inggris, Spanyol, Prancis, Portugis, Indonesia, Jepang, Korea, Jerman, dan Rusia. | $0,1 |
|
Beijing
Model name | Max number of documents | Max input tokens per item | Max input tokens per request | Supported languages | Price (per 1 million tokens) | Free quota | Scenarios |
qwen3-vl-rerank | 100 | 8.000 | 800.000 | 33 bahasa utama, seperti Tiongkok, Inggris, Jepang, Korea, Prancis, dan Jerman | Image: $0,258 Text: $0,1 | No free quota |
|
gte-rerank-v2 | 500 | 4.000 | 30.000 | Lebih dari 50 bahasa, termasuk Mandarin, Inggris, Jepang, Korea, Thailand, Spanyol, Prancis, Portugis, Jerman, Indonesia, dan Arab. | $0,115 |
|
Max input tokens per item: Jumlah maksimum token yang diizinkan untuk setiap kueri atau dokumen. Jika input melebihi batas ini, konten akan dipotong. API menghitung hasil berdasarkan konten yang telah dipotong, yang dapat menyebabkan peringkat menjadi tidak akurat.
Max number of documents: Jumlah maksimum dokumen yang diizinkan dalam satu permintaan.
Max input tokens per request: Dihitung menggunakan rumus
Query Tokens × Number of documents + Total document tokens. Total ini tidak boleh melebihi jumlah maksimum token input yang diizinkan per permintaan.
Batas format input
Model | Image | Video |
qwen3-vl-rerank | JPEG, PNG, WEBP, BMP, TIFF, ICO, DIB, ICNS, dan SGI (URL atau Base64 didukung) | MP4, AVI, dan MOV (hanya URL) |
Prasyarat
Anda harus mendapatkan Kunci API dan menyetel Kunci API sebagai Variabel lingkungan. Untuk menggunakan kit pengembangan perangkat lunak (SDK), Anda juga harus menginstal SDK DashScope.
Panggilan HTTP
POST https://dashscope.aliyuncs.com/api/v1/services/rerank/text-rerank/text-rerankRequest | qwen3-rerankqwen3-vl-rerankgte-rerank-v2 |
Request headers | |
Content-Type Tipe konten dari permintaan. Harus berupa | |
Authorization Kredensial otentikasi menggunakan Kunci API Model Studio. Contoh: | |
Request body | |
model Nama model. Model yang didukung meliputi qwen3-rerank, gte-rerank-v2, dan qwen3-vl-rerank. | |
input Konten input. Saat Anda menggunakan model | |
parameters object (Optional) Parameter opsional. Saat Anda menggunakan model |
Response | Successful responseFailed responseJika permintaan gagal, bidang |
request_id Pengidentifikasi unik untuk permintaan. Digunakan untuk pelacakan dan troubleshooting masalah. | |
output Output tugas. | |
usage Memberikan statistik output. | |
code Kode kesalahan. Hanya dikembalikan saat permintaan gagal. Lihat kode kesalahan untuk detailnya. | |
message Pesan kesalahan detail. Hanya dikembalikan saat permintaan gagal. Lihat kode kesalahan untuk detailnya. |
Panggilan SDK
Contoh
Contoh berikut menunjukkan cara memanggil API model rerank.
Nama parameter dalam SDK sebagian besar konsisten dengan API HTTP, tetapi struktur parameternya dienkapsulasi. Misalnya, API HTTP menggunakan struktur bersaranginputdanparameters, sedangkan SDK menggunakan struktur datar. Perhatikan perbedaan ini selama pengembangan.
import dashscope
def text_rerank():
resp = dashscope.TextReRank.call(
model="gte-rerank-v2",
query="What is a rerank model?",
documents=[
"Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance.",
"Quantum computing is a cutting-edge field of computer science.",
"The development of pre-trained language models has brought new advancements to rerank models."
],
top_n=2,
return_documents=True
)
print(resp)
if __name__ == '__main__':
text_rerank()Contoh output
SDK mengenkapsulasi respons HTTP asli. Untuk permintaan yang berhasil, SDK selalu mengembalikan bidang code dan message dengan nilai string kosong.
{
"status_code": 200,
"request_id": "4b0805c0-6b36-490d-8bc1-4365f4c89905",
"code": "",
"message": "",
"output": {
"results": [
{
"index": 0,
"relevance_score": 0.9334521178273196,
"document": {
"text": "Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance."
}
},
{
"index": 2,
"relevance_score": 0.34100082626411193,
"document": {
"text": "The development of pre-trained language models has brought new advancements to rerank models."
}
}
]
},
"usage": {
"total_tokens": 79
}
}Kode kesalahan
Jika panggilan gagal, lihat Pesan kesalahan untuk troubleshooting.