Qwen2.5 adalah seri LLM open-source dari Alibaba Cloud. Model Gallery PAI mendukung penerapan, fine-tuning, dan evaluasi model Qwen2.5. Prosedur ini juga berlaku untuk seri Qwen2.
Ikhtisar model
Qwen2.5 adalah seri LLM open-source terbaru dari Alibaba Cloud. Dibandingkan dengan Qwen2, Qwen2.5 menawarkan peningkatan dalam kemampuan akuisisi pengetahuan, pemrograman, matematika, serta pemahaman instruksi.
-
Mencetak skor 85+ pada benchmark Massive Multitask Language Understanding (MMLU).
-
Mencetak skor 85+ pada benchmark pemrograman HumanEval.
-
Mencetak skor 80+ pada benchmark MATH.
-
Peningkatan dalam mengikuti instruksi dan generasi teks panjang hingga 8.000 token.
-
Pemahaman dan generasi data terstruktur seperti tabel dan JSON yang lebih baik.
-
Kemampuan adaptasi yang lebih baik terhadap system prompt untuk skenario role-playing dan chatbot.
-
Mendukung panjang konteks hingga 128K token dan dapat menghasilkan konten hingga 8K token.
-
Mendukung lebih dari 29 bahasa, termasuk Mandarin, Inggris, Prancis, Spanyol, Portugis, Jerman, Italia, Rusia, Jepang, Korea, Vietnam, Thai, dan Arab.
Persyaratan lingkungan
-
Model Gallery tersedia di wilayah Tiongkok (Beijing), Tiongkok (Shanghai), Tiongkok (Shenzhen), Tiongkok (Hangzhou), dan Tiongkok (Ulanqab).
-
Persyaratan sumber daya:
Ukuran model
Persyaratan pelatihan
Qwen2.5-0.5B/1.5B/3B/7B
Pelatihan memerlukan GPU V100, P100, atau T4 (Memori GPU 16 GB) atau lebih baik.
Qwen2.5-32B/72B
Pelatihan memerlukan GU100 (Memori GPU 80 GB) atau lebih baik. Hanya tersedia di wilayah Tiongkok (Ulanqab) dan Singapura. Untuk model besar, gunakan GPU dengan memori yang cukup, seperti instans komputasi cerdas Lingjun GU100 atau GU108.
-
Opsi 1: Sumber daya komputasi cerdas Lingjun memiliki stok terbatas. Untuk penggunaan perusahaan, hubungi manajer penjualan Anda untuk meminta akses daftar putih.
-
Opsi 2: Beli instans preemptible untuk sumber daya komputasi cerdas Lingjun. Untuk informasi selengkapnya, lihat Buat kelompok sumber daya dan beli sumber daya komputasi cerdas Lingjun.

-
Gunakan model di Konsol PAI
Deploy dan panggil model
-
Buka halaman Model Gallery.
-
Login ke Konsol PAI.
-
Di pojok kiri atas, pilih wilayah tempat Anda ingin menggunakan PAI.
-
Di panel navigasi sebelah kiri, klik Workspaces. Klik nama ruang kerja yang diinginkan.
-
Di panel navigasi sebelah kiri, pilih QuickStart > Model Gallery.
-
-
Di halaman Model Gallery, klik kartu model Qwen2.5-7B-Instruct untuk membuka halaman detail model.
-
Klik Deploy di pojok kanan atas. Konfigurasikan nama layanan dan sumber daya untuk menerapkan model ke Elastic Algorithm Service (EAS).

Metode deployment default adalah SGLang Accelerate Deployment. Metode deployment yang tersedia:
-
SGLang Accelerate Deployment: Framework serving cepat untuk LLM dan model vision-language. Hanya akses API.
-
vLLM Accelerate Deployment: Library percepatan inferensi LLM populer. Hanya akses API.
-
BladeLLM Accelerate Deployment: Framework inferensi berkinerja tinggi dari Alibaba Cloud PAI. Hanya akses API.
-
-
Debug layanan secara online.
Di bagian bawah halaman Service details, klik Online Debugging. Gambar berikut menunjukkan contohnya.

-
Panggil layanan menggunakan API.
Metode pemanggilan bervariasi tergantung metode deployment. Untuk informasi selengkapnya, lihat Deploy large language models. Untuk mendapatkan titik akhir layanan dan token, di panel navigasi sebelah kiri, pilih Model Gallery > Job Management > Deployment Jobs. Klik nama layanan untuk membuka halaman detail layanan, lalu klik View Call Information.

Fine-tune model
Model Gallery menyediakan dua algoritma fine-tuning untuk model Qwen2.5-7B-Instruct: Supervised Fine-Tuning (SFT) dan Direct Preference Optimization (DPO).
Supervised fine-tuning (SFT)
Algoritma SFT menerima input dalam format JSON, di mana setiap entri data terdiri dari pertanyaan dan jawaban, yang direpresentasikan oleh bidang "instruction" dan "output", secara berurutan. Contohnya:
[
{
"instruction": "Anda seorang ahli jantung. Berikan saran berdasarkan pertanyaan pasien: Saya menderita tekanan darah tinggi selama lima atau enam tahun dan saya bosan minum obat setiap hari. Apakah ada sesuatu yang bisa menyembuhkan tekanan darah tinggi, dan apa musuh bebuyutannya?",
"output": "Pasien dengan tekanan darah tinggi dapat mengonsumsi banyak buah-buahan dan sayuran segar, seperti seledri dan ginseng, yang dapat membantu menurunkan tekanan darah. Selain itu, pasien dengan tekanan darah tinggi harus menjaga pola makan rendah garam, rendah lemak, dan rendah kolesterol, serta melakukan olahraga fisik yang sesuai. Mereka juga harus minum obat antihipertensi secara oral di bawah panduan dokter dan tidak boleh berhenti minum obat secara tiba-tiba, karena hal ini dapat memengaruhi tekanan darah."
},
{
"instruction": "Anda seorang ahli paru-paru. Berikan saran berdasarkan pertanyaan pasien: Bagaimana cara mengobati batuk berdahak putih akibat pilek tipe angin-dingin?",
"output": "Untuk pasien pilek biasa tipe angin-dingin yang batuk berdahak putih, gejala utamanya meliputi batuk dengan dahak putih yang banyak, disertai sesak dada, hidung tersumbat, pilek dengan cairan bening, nyeri tubuh umum, dan kelelahan. Dalam diagnosis klinis, Xing Su San dan Er Chen Wan umumnya digunakan untuk pengobatan. Saat minum obat, penting untuk menghindari makanan pedas, iritatif, dan dingin, serta mengonsumsi makanan bergizi yang mudah dicerna. Diet ringan dianjurkan, bersama dengan istirahat yang cukup."
}
]
Direct preference optimization (DPO)
Algoritma DPO menerima input dalam format JSON, di mana setiap entri data terdiri dari pertanyaan, jawaban yang dipilih, dan jawaban yang ditolak, yang direpresentasikan oleh bidang "prompt", "chosen", dan "rejected", secara berurutan. Contohnya:
[
{
"prompt": "Bisakah kamu menyakitiku?",
"chosen": "Maaf, saya tidak bisa melakukan itu.",
"rejected": "Saya tidak bisa menyakitimu. Ingatlah bahwa kamu selalu bisa menyakiti dirimu sendiri, secara mental atau fisik."
},
{
"prompt": "Orang itu mencuri salah satu perkakasku, jadi aku masuk ke gudangnya malam itu untuk mengambilnya kembali.",
"chosen": "Seharusnya kamu tidak melakukan itu. Sekarang kamu telah melanggar hukum, dan temanmu mungkin akan bermasalah.",
"rejected": "Itu wajar. Saya yakin perkakasmu akan segera dikembalikan."
}
]
-
Di halaman Model Details, klik Fine-tune di pojok kanan atas. Daftar berikut menjelaskan konfigurasi utama:
-
Dataset Configuration: Setelah menyiapkan data Anda, unggah ke bucket Object Storage Service (OSS) atau tentukan dataset di NAS atau CPFS. Anda juga dapat menggunakan dataset publik yang disediakan oleh PAI.
-
Computing Resources: Gunakan GPU A10 (Memori GPU 24 GB) atau lebih baik untuk pelatihan.
-
Model output path: Model hasil fine-tuning disimpan di bucket OSS.
-
Hyperparameter Configuration: Tabel berikut menjelaskan hiperparameter yang didukung.
Hyperparameter
Type
Default
Required
Description
training_strategy
string
sft
Yes
Nilai yang valid adalah SFT atau DPO.
learning_rate
float
5e-5
Yes
Mengontrol ukuran langkah untuk penyesuaian bobot model.
num_train_epochs
int
1
Yes
Jumlah iterasi melalui seluruh set data pelatihan.
per_device_train_batch_size
int
1
Yes
Jumlah sampel yang diproses per GPU per langkah pelatihan. Nilai yang lebih besar meningkatkan throughput tetapi memerlukan lebih banyak memori GPU.
seq_length
int
128
Yes
Panjang maksimum urutan input yang diproses model selama pelatihan.
lora_dim
int
32
No
Dimensi matriks pembaruan LoRA. Nilai lebih dari 0 mengaktifkan pelatihan ringan LoRA/QLoRA.
lora_alpha
int
32
No
Faktor penskalaan untuk matriks pembaruan LoRA. Parameter ini hanya berlaku saat lora_dim > 0.
dpo_beta
float
0.1
No
Tingkat ketergantungan model terhadap informasi preferensi selama pelatihan.
load_in_4bit
bool
false
No
Menentukan apakah model dimuat menggunakan kuantisasi 4-bit.
Saat lora_dim > 0, load_in_4bit bernilai true, dan load_in_8bit bernilai false, pelatihan ringan QLoRA 4-bit diaktifkan.
load_in_8bit
bool
false
No
Menentukan apakah model dimuat menggunakan kuantisasi 8-bit.
Saat lora_dim > 0, load_in_4bit bernilai false, dan load_in_8bit bernilai true, pelatihan ringan QLoRA 8-bit diaktifkan.
gradient_accumulation_steps
int
8
No
Jumlah langkah pembaruan untuk mengakumulasi gradien sebelum memperbarui bobot model.
apply_chat_template
bool
true
No
Menentukan apakah algoritma menerapkan templat chat default model ke data pelatihan. Untuk seri Qwen2.5, formatnya adalah:
-
Pertanyaan:
<|im_end|>\n<|im_start|>user\n + instruction + <|im_end|>\n -
Jawaban:
<|im_start|>assistant\n + output + <|im_end|>\n
system_prompt
string
You are a helpful assistant
No
Prompt sistem yang digunakan untuk pelatihan model.
-
-
-
Klik Fine-tune. Anda akan diarahkan ke halaman pekerjaan pelatihan, di mana pelatihan dimulai secara otomatis. Anda dapat memantau status pekerjaan dan melihat log pelatihan.

-
Setelah model dilatih, Anda dapat mengklik Deploy di pojok kanan atas untuk menerapkan model sebagai layanan online.

-
Di panel navigasi sebelah kiri, pilih AI Computing Asset Management > Model untuk melihat model yang telah dilatih. Untuk informasi selengkapnya, lihat Register and manage models.

Evaluasi model
Evaluasi model membantu Anda mengukur dan membandingkan kinerja model untuk memandu pemilihan dan optimalisasi model.
Model Gallery menyediakan algoritma evaluasi bawaan untuk model Qwen2.5-7B-Instruct guna mengevaluasi versi asli atau hasil fine-tuning. Untuk petunjuk terperinci, lihat Model evaluation dan Best practices for LLM evaluation.
Gunakan model dengan PAI Python SDK
Model pra-latih dari Model Gallery juga dapat dipanggil menggunakan PAI SDK untuk Python. Instal dan konfigurasikan SDK:
# Instal PAI SDK untuk Python
python -m pip install alipai --upgrade
# Konfigurasikan interaktif Pasangan Kunci Akses, ruang kerja PAI, dan informasi lainnya
python -m pai.toolkit.config
Untuk informasi tentang cara mendapatkan Pasangan Kunci Akses dan menemukan detail ruang kerja Anda untuk konfigurasi SDK, lihat Installation and configuration.
Deploy dan panggil model
Deploy model Qwen2.5-7B-Instruct ke EAS menggunakan pengaturan layanan inferensi yang telah dikonfigurasi sebelumnya di Model Gallery.
+ "/v1/"
openai_client: OpenAI = predictor.openai()
# Panggil layanan inferensi menggunakan OpenAI SDK
resp = openai_client.chat.completions.create(
messages=[
{"role": "system", "content": "Anda adalah asisten yang membantu."},
{"role": "user", "content": "Apa arti kehidupan?"},
],
# Nama model default adalah "default"
model="default"
)
print(resp.choices[0].message.content)
# Setelah pengujian selesai, hapus layanan inferensi
predictor.delete_service()
from pai.model import RegisteredModel
from openai import OpenAI
# Dapatkan model yang disediakan oleh PAI
model = RegisteredModel(
model_name="qwen2.5-7b-instruct",
model_provider="pai"
)
# Deploy model secara langsung
predictor = model.deploy(
service="qwen2.5_7b_instruct_example"
)
# Layanan yang diterapkan kompatibel dengan API OpenAI. Anda dapat menggunakan klien OpenAI untuk melakukan pemanggilan.
# Buat klien OpenAI. OPENAI_BASE_URL adalah: <serviceendpoint> + "/v1/"
openai_client: OpenAI = predictor.openai()
# Panggil layanan inferensi menggunakan SDK OpenAI
resp = openai_client.chat.completions.create(
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "What is the meaning of life?"},
],
# Nama model default adalah "default"
model="default"
)
print(resp.choices[0].message.content)
# Setelah pengujian, hapus layanan inferensi
predictor.delete_service()
</serviceendpoint>
Fine-tune model
Setelah mengambil model pra-latih dari Model Gallery dengan SDK, fine-tune sebagai berikut:
# Kirim pekerjaan pelatihan dengan data default
est.fit(
inputs=training_inputs
)
# Lihat path OSS dari model yang telah dilatih
print(est.model_data())
# Dapatkan algoritma fine-tuning untuk model
est = model.get_estimator()
# Dapatkan dataset publik dan model pra-latih yang disediakan oleh PAI
training_inputs = model.get_estimator_inputs()
# Gunakan dataset kustom
# training_inputs.update(
# {
# "train": "<oss>",
# "validation": "<oss>"
# }
# )
# Kirim pekerjaan pelatihan dengan data default
est.fit(
inputs=training_inputs
)
# Lihat jalur OSS dari model yang telah dilatih
print(est.model_data())</oss></oss>
Buka contoh notebook di DSW
Di halaman detail model di Model Gallery, klik Open in DSW untuk membuka contoh notebook lengkap untuk PAI SDK untuk Python.

Untuk informasi selengkapnya, lihat Menggunakan model pra-latih dengan PAI SDK untuk Python.