Terapkan model ViT yang telah dilatih sebelumnya untuk klasifikasi gambar, atau lakukan fine-tuning dengan set data Anda sendiri guna mengklasifikasikan gambar ke dalam kategori khusus.
Prasyarat
Buat bucket OSS. Untuk informasi selengkapnya, lihat Create buckets.
Langkah 1: Buka halaman detail model
-
Buka halaman Model Gallery.
-
Login ke PAI console.
-
Di pojok kiri atas, pilih wilayah.
-
Di panel navigasi sebelah kiri, klik Workspaces. Klik nama ruang kerja yang ingin Anda buka.
-
Di panel navigasi sebelah kiri, pilih Quick Start > Model Gallery.
-
-
Di halaman Model Gallery, pada bagian Computer Vision, klik Image Classification. Kemudian, klik kartu model ViT Image Classification-General untuk membuka halaman detail model.

Di halaman daftar model, tersedia berbagai model dari komunitas open-source yang berbeda. Pilih model yang sesuai dengan kebutuhan Anda.
-
Model dengan lebih banyak parameter memberikan performa lebih baik tetapi memerlukan lebih banyak data untuk fine-tuning dan menimbulkan biaya serving yang lebih tinggi.
-
Semakin mirip set data pralatih dengan kasus penggunaan Anda, semakin baik performa model. Periksa informasi set data pralatih di halaman detail model.
-
Langkah 2: Terapkan model secara langsung
Model cv_vit-base_image-classification_ImageNet-labels berasal dari model ViT Image Classification-General komunitas ModelScope. Model ini didasarkan pada arsitektur Transformer ViT Base dan dilatih menggunakan set data ImageNet-1K. Model ini mendukung tugas klasifikasi yang dicakup oleh label ImageNet-1K. Model Gallery menerapkan model ini ke Elastic Algorithm Service (EAS) untuk membuat layanan inferensi. Ikuti langkah-langkah berikut:
-
Terapkan layanan.
-
Di halaman detail model, klik Deploy.
-
Konfirmasi Model service info dan Deployment info.
Model Gallery telah mengonfigurasi sumber daya komputasi dan nama layanan berdasarkan karakteristik model. Gunakan pengaturan default untuk contoh ini, atau sesuaikan sendiri. Untuk informasi selengkapnya, lihat Deploy and debug models.
-
Klik Deploy. Di kotak dialog Billing Notification, klik OK.
Halaman akan dialihkan ke halaman Service details. Di bagian Basic Information, tunggu hingga Status berubah menjadi Running.
-
-
Panggil layanan model.
Setelah penerapan selesai, kirim permintaan prediksi ke API HTTP layanan model. Layanan ini menerima gambar yang dikodekan dalam Base64 dan mengembalikan hasil dalam format JSON.
-
Di halaman Service details, pada bagian Resource Information, klik View Call Information.

-
Di kotak dialog Call Information, pada tab Public network address call, simpan Endpoint dan Token.
-
Gunakan library Python Requests untuk memanggil layanan model. Contoh:
import requests import base64 image_path = "<PathToLocalImage>" url = "<PredictionServiceURL>" token = "<PredictionServiceAccessToken>" def encode_file_to_base64(f): with open(f, "rb") as file: encoded_string = base64.b64encode(file.read()) base64_str = str(encoded_string, "utf-8") return base64_str base64_string = encode_file_to_base64(image_path) request_body = { "image": base64_string } headers = {"Authorization": token} resp = requests.post(url=url, headers=headers, json=request_body) print(resp.content.decode()) print("status code:", resp.status_code)Ganti
urldengan Endpoint,tokendengan Token dari langkah sebelumnya, dan image_path dengan path ke file gambar lokal (.png atau .jpg).Pemanggilan yang berhasil akan mengembalikan lima label paling mungkin beserta skornya. Contoh output:
{ "scores": [ 0.4078965485095978, 0.24673610925674438, 0.1930493414402008, 0.0026617543771862984, 0.0009246605914086103 ], "labels": [ "tiger cat", "tabby, tabby cat", "Egyptian cat", "lynx, catamount", "tiger, Panthera tigris" ] }
-
Langkah 3: Fine-tune model
Model cv_vit-base_image-classification_ImageNet-labels mendukung tugas klasifikasi yang dicakup oleh label ImageNet-1K. Jika domain target Anda tidak tercakup, lakukan fine-tuning model dengan set kecil gambar berlabel untuk domain spesifik Anda.
-
Siapkan data.
-
Siapkan set data Anda sesuai struktur direktori berikut:
Model melakukan pelatihan menggunakan data gambar dari bucket OSS. Susun set data dalam direktori root dengan satu subdirektori per kategori. Nama setiap subdirektori berfungsi sebagai label kategori. Misalnya, jika set data pelatihan berada di
oss://{YourOssBucket}.{OssEndpoint}/{PathToTrainData}/, strukturnya harus seperti berikut:├── category-1 │ ├── image1.jpeg │ └── image2.jpeg ├── category-2 │ ├── image3.jpeg │ └── image4.jpeg |... |... └── category-n ├── imagexxx.jpeg └── imageyyy.jpegUntuk performa yang lebih baik, siapkan juga set data validasi dengan struktur direktori yang sama guna mengevaluasi model dan menyetel hiperparameter.
-
Unggah set data ke bucket OSS Anda menggunakan struktur direktori yang dijelaskan di atas. Untuk informasi selengkapnya, lihat Upload files.
-
-
Kirim pekerjaan pelatihan.
-
Di halaman Model Details, klik Fine-tune. Di halaman konfigurasi, tentukan Training dataset, Validate dataset, dan Output Path.
Model Gallery telah mengonfigurasi Computing Resources dan Hyperparameters. Gunakan nilai default atau sesuaikan sendiri. Untuk informasi selengkapnya, lihat Model deployment and training.
CatatanSecara default, model menggunakan set data MiniImageNet-100 untuk fine-tuning, sehingga Anda dapat menguji proses pelatihan tanpa menyiapkan data sendiri.
-
Klik Fine-tune.

Halaman akan dialihkan ke halaman Task details, tempat Anda dapat memantau progres, log, dan hasil evaluasi. Setelah pelatihan selesai, model disimpan ke Output Path yang telah Anda tentukan.

-
-
Terapkan model yang telah difine-tune.
PAI secara otomatis mendaftarkan model yang telah dilatih di AI Assets - Model Management untuk dilihat dan diterapkan. Untuk informasi selengkapnya, lihat Register and manage models.