Model Gallery mengintegrasikan PAI-DLC dan PAI-EAS, menyediakan cara efisien tanpa kode untuk menerapkan dan melatih model bahasa besar (LLM) sumber terbuka. Topik ini menggunakan model Qwen3-0.6B sebagai contoh untuk menunjukkan cara menggunakan Model Gallery. Alur kerja yang sama berlaku untuk model lainnya.
Prasyarat
Gunakan Akun Alibaba Cloud Anda untuk mengaktifkan Platform for AI (PAI) dan membuat ruang kerja. Masuk ke Konsol PAI, pilih Wilayah di pojok kiri atas, lalu selesaikan otorisasi satu klik.
Billing
Contoh dalam panduan ini membuat tugas PAI-DLC dan layanan PAI-EAS menggunakan Sumber daya publik. Sumber daya ini menggunakan metode penagihan bayar sesuai pemakaian. Untuk detail aturan penagihan, lihat Penagihan PAI-DLC dan Penagihan PAI-EAS.
Penerapan model
Terapkan model
Masuk ke Konsol PAI. Di panel navigasi kiri, klik Model Gallery, temukan Qwen3-0.6B, lalu klik Deploy.

Konfigurasikan parameter penerapan. Halaman konfigurasi penerapan telah diisi sebelumnya dengan parameter default. Klik Deploy > Confirm. Proses penerapan memerlukan waktu sekitar 5 menit. Penerapan selesai ketika status berubah menjadi In operation.
Secara default, layanan model menggunakan Sumber daya publik dan metode penagihan bayar sesuai pemakaian.

Panggil model
Pada halaman detail layanan, klik View Call Information untuk mendapatkan Internet Endpoint dan Token.
Untuk melihat detail pekerjaan penerapan nanti, buka Model Gallery > Job Management > Deployment Jobs di panel navigasi, lalu klik Service name.

Uji layanan model. Anda dapat memanggil model dengan salah satu cara berikut:
Debugging online
Beralih ke tab Online Debugging. Layanan model bahasa besar mendukung Conversation Debugging dan API Debugging.


Klien Cherry Studio
Cherry Studio adalah klien populer untuk interaksi dengan model bahasa besar. Klien ini mencakup fitur MCP yang memungkinkan Anda berdialog dengan model besar secara mudah.
Sambungkan ke model Qwen3 yang diterapkan di PAI
Instal klien
Buka Cherry Studio untuk mengunduh dan menginstal klien.
Anda juga dapat mengunduhnya dari
https://github.com/CherryHQ/cherry-studio/releases.Tambahkan penyedia.
Klik ikon Settings
di pojok kiri bawah. Di bagian Model Provider, klik Add.Pada bidang Provider Name, masukkan nama kustom, misalnya Platform for AI. Untuk Provider Type, pilih OpenAI.
Klik OK.
Masukkan Token di bidang API Key dan Internet Endpoint di bidang API Host.
Klik Add. Di bidang Model ID , masukkan
Qwen3-0.6B(peka huruf besar/kecil).Anda dapat mengklik Check di samping bidang API Key untuk menguji konektivitas.
Klik ikon
untuk kembali ke halaman obrolan. Di bagian atas jendela, alihkan ke model Qwen3-0.6B yang telah Anda tambahkan dan mulai percakapan.
Python SDK
from openai import OpenAI import os # Jika variabel lingkungan belum disetel, ganti baris berikut dengan Token layanan EAS Anda: token = '<YOUR_EAS_SERVICE_TOKEN>' token = os.environ.get("Token") # Jangan hapus "/v1" di akhir Internet Endpoint Anda. client = OpenAI( api_key=token, base_url=f'<YOUR_INTERNET_ENDPOINT>/v1', ) if token is None: print("Harap setel variabel lingkungan Token, atau tetapkan nilai Token langsung ke variabel 'token'.") exit() query = 'Hello, who are you?' messages = [{'role': 'user', 'content': query}] resp = client.chat.completions.create(model='Qwen3-0.6B', messages=messages, max_tokens=512, temperature=0) query = messages[0]['content'] response = resp.choices[0].message.content print(f'query: {query}') print(f'response: {response}')
Pengingat penting
Layanan model yang dibuat dalam panduan ini menggunakan Sumber daya publik dan ditagih berdasarkan metode bayar sesuai pemakaian. Untuk menghindari biaya tambahan, hentikan atau hapus layanan tersebut jika tidak lagi diperlukan.

Penyempurnaan model
Anda dapat meningkatkan performa model dalam domain tertentu dengan melakukan fine-tuning pada set data spesifik domain. Skenario berikut menunjukkan tujuan dan langkah-langkah fine-tuning.
Kasus penggunaan
Di industri logistik, Anda sering perlu mengekstraksi informasi terstruktur—seperti nama penerima, alamat, dan nomor telepon—dari bahasa alami. Model berparameter besar seperti Qwen3-235B-A22B sangat unggul dalam tugas ini, tetapi mahal dan memiliki latensi tinggi. Untuk menyeimbangkan performa dan biaya, Anda dapat terlebih dahulu menggunakan model berparameter besar untuk memberi label data, lalu menggunakan data tersebut untuk melakukan fine-tuning pada model berparameter kecil seperti Qwen3-0.6B agar mencapai performa serupa. Proses ini juga dikenal sebagai distilasi model.
Pada tugas ini, model Qwen3-0.6B asli mencapai akurasi sebesar 50%. Setelah fine-tuning, akurasinya dapat melebihi 90%.
Contoh informasi alamat penerima | Contoh informasi terstruktur |
Amina Patel - Nomor telepon (474) 598-1543 - 1425 S 5th St, Apt 3B, Allentown, Pennsylvania 18104 | |
Persiapan data
Untuk menyuling pengetahuan dari model guru (Qwen3-235B-A22B) ke model Qwen3-0.6B untuk tugas ini, pertama-tama gunakan API model guru untuk mengekstraksi alamat penerima menjadi data JSON terstruktur. Menghasilkan data JSON ini bisa memakan waktu. Oleh karena itu, panduan ini menyediakan set data pelatihan sampeltrain.json dan set validasieval.json.
Dalam distilasi model, model besar juga dikenal sebagai model guru. Data yang digunakan dalam panduan ini dihasilkan secara sintetis oleh model besar dan tidak mengandung informasi pengguna sensitif apa pun.
Penerapan di produksi
Lakukan fine-tuning pada model
Di panel navigasi, klik Model Gallery, temukan kartu Qwen3-0.6B, lalu klik Fine-tune.

Konfigurasikan parameter untuk pekerjaan pelatihan. Anda hanya perlu mengonfigurasi parameter kunci berikut. Biarkan parameter lain pada nilai default-nya.
Training Mode: Default-nya adalah SFT (Supervised Fine-Tuning) menggunakan metode LoRA.
LoRA adalah teknik fine-tuning efisien yang menghemat sumber daya pelatihan dengan hanya memodifikasi subset parameter model.
Training dataset: Pertama, unduh set data pelatihan sampel train.json. Kemudian, di halaman konfigurasi, pilih OSS file or directory, klik ikon
untuk memilih bucket, klik Upload File untuk mengunggah set data ke Object Storage Service (OSS), lalu pilih file tersebut.
Validate dataset: Pertama, unduh set data validasi sampel eval.json. Kemudian, klik Add validation dataset dan ulangi proses unggah yang digunakan untuk set data pelatihan.
Set data validasi digunakan selama pelatihan untuk mengevaluasi performa model pada data yang belum pernah dilihat.
Model output path: Secara default, layanan menyimpan model yang telah disempurnakan ke jalur OSS. Jika folder tujuan tidak ada, klik Create folder dan tentukan nama folder.
Resource Group Type: Pilih Public Resource Group. Pekerjaan fine-tuning ini memerlukan sekitar 5 GB Memori GPU. Konsol secara otomatis menyaring tipe instans yang tersedia untuk memenuhi persyaratan ini. Pilih tipe instans, seperti
ecs.gn7i-c16g1.4xlarge.Hyperparameters:
learning_rate: Atur ke 0.0005
num_train_epochs: Atur ke 4
per_device_train_batch_size: Atur ke 8
seq_length: Atur ke 512
Kemudian, klik Train > OK. Status pekerjaan pelatihan berubah dari Creating ke In operation, yang memulai fine-tuning model.
Monitor pekerjaan pelatihan dan tunggu hingga selesai. Proses fine-tuning memerlukan waktu sekitar 10 menit. Selama proses ini, halaman detail tugas menampilkan log tugas dan kurva metrik. Setelah pekerjaan selesai, layanan menyimpan model yang telah disempurnakan ke folder OSS yang ditentukan.
Untuk melihat detail pekerjaan nanti, di panel navigasi, klik Model Gallery > Job Management > Training Jobs, lalu klik nama pekerjaan.

Terapkan model yang telah disempurnakan
Di halaman detail pekerjaan pelatihan, klik Deploy untuk membuka pengaturan penerapan. Untuk Resource Type, pilih Public Resources. Menerapkan model 0.6B memerlukan sekitar 5 GB memori GPU. Di bawah Instance Type, hanya spesifikasi yang memenuhi persyaratan ini yang tercantum. Pilih opsi, seperti ecs.gn7i-c8g1.2xlarge, biarkan parameter lain pada nilai default-nya, lalu klik Deploy > OK.
Penerapan memerlukan waktu sekitar 5 menit. Penerapan berhasil setelah status berubah menjadi Running.
Untuk melihat detail pekerjaan pelatihan nanti, di panel navigasi kiri, klik Model Gallery > Job Management > Training Jobs, lalu klik nama pekerjaan.

Jika tombol Deploy dinonaktifkan setelah pekerjaan pelatihan selesai, artinya model output masih dalam proses pendaftaran. Tunggu sekitar satu menit.

Untuk memanggil model, ikuti langkah-langkah di Panggil model.
Evaluasi model yang telah disempurnakan
Sebelum menerapkan model yang telah disempurnakan ke lingkungan produksi, Anda harus mengevaluasi performanya. Evaluasi ini memastikan model stabil dan akurat, yang membantu mencegah masalah tak terduga setelah penerapan.
Siapkan data uji
Siapkan set data uji yang tidak tumpang tindih dengan data pelatihan untuk mengevaluasi performa model. Kode uji akurasi di bawah ini secara otomatis mengunduh set uji yang diperlukan.
Data uji Anda tidak boleh mengandung sampel apa pun dari data pelatihan Anda. Hal ini memastikan evaluasi akurat terhadap kemampuan generalisasi model pada data baru dan mencegah skor yang terlalu tinggi akibat menghafal sampel.
Rancang metrik evaluasi
Kriteria evaluasi Anda harus selaras dengan tujuan bisnis Anda. Untuk kasus penggunaan ini, selain memverifikasi bahwa output adalah string JSON yang valid, pastikan pasangan kunci-nilai-nya benar.
Anda harus mendefinisikan metrik evaluasi secara terprogram. Untuk contoh implementasi, lihat metode compare_address_info dalam kode uji akurasi di bawah ini.Evaluasi performa model
Jalankan kode berikut untuk menghitung akurasi model pada set uji.
Output:
Semua prediksi selesai! Hasil telah disimpan ke predicted_labels.jsonl
Jumlah sampel: 400
Tanggapan benar: 382
Tanggapan salah: 18
Akurasi: 95.5 %Akurasi yang Anda amati mungkin berbeda dari hasil dalam panduan ini karena faktor seperti seed acak yang digunakan selama fine-tuning dan sifat stokastik output model besar. Hal ini diharapkan.
Model mencapai akurasi 95.5%, peningkatan signifikan dibandingkan akurasi model Qwen3-0.6B asli sebesar 50%. Hal ini menunjukkan bahwa fine-tuning telah secara substansial meningkatkan kemampuan model untuk mengekstraksi informasi terstruktur untuk entri data logistik.
Panduan ini hanya menggunakan 4 epoch pelatihan untuk mengurangi waktu pelatihan, yang cukup untuk meningkatkan akurasi hingga 95.5%. Anda dapat meningkatkan akurasi lebih lanjut dengan menambah jumlah epoch pelatihan.
Penting
Membuat layanan model dalam panduan ini menggunakan Sumber daya publik, yang ditagih berdasarkan metode bayar sesuai pemakaian. Saat Anda tidak lagi memerlukan layanan tersebut, hentikan atau hapus untuk menghindari biaya tambahan.

Referensi
Untuk detail fitur Model Gallery seperti Evaluasi dan kompresi, lihat Model Gallery.
Untuk detail fitur EAS seperti Auto Scaling, uji stres, dan Pemantauan Peringatan, lihat Ikhtisar EAS.

