Bangun model metric learning untuk inferensi menggunakan komponen Image Metric Learning Training (raw).
Prasyarat
OSS telah diaktifkan, dan Machine Learning Studio telah diberi izin untuk mengakses OSS. Untuk informasi selengkapnya, lihat Aktifkan OSS dan Berikan izin.
Batasan
Mesin komputasi yang didukung adalah DLC.
Deskripsi algoritma
Komponen Image Metric Learning Training (raw) menyediakan model umum, seperti resnet50, resnet18, resnet34, resnet101, swint_tiny, swint_small, swint_base, vit_tiny, vit_small, vit_base, xcit_tiny, xcit_small, dan xcit_base.
Konfigurasi komponen
-
Input Stub
Input Port (dari kiri ke kanan)
Tipe data yang dibatasi
Komponen Hulu yang Direkomendasikan
Wajib
Training data annotation file
OSS
No
Evaluation data annotation file
OSS
No
-
Parameter komponen
Tab
Parameter
Wajib
Deskripsi
Nilai Default
Field Settings
Metric learning model type
Yes
Tipe algoritma untuk pelatihan model. Nilai yang valid:
-
Data-parallel metric learning
-
Model-parallel metric learning
Data-parallel metric learning
OSS directory to save training output
Yes
Direktori OSS tempat model pelatihan disimpan. Contoh:
oss://examplebucket/yun****/designer_test.None
Path of the training data annotation file
No
Konfigurasikan parameter ini jika tidak ada training data annotation file yang terhubung ke input port.
CatatanJika file dikonfigurasi melalui input port dan parameter ini secara bersamaan, komponen akan menggunakan data dari input port.
Jalur OSS tempat file anotasi data pelatihan disimpan. Contoh:
oss://examplebucket/yourfolder****/data/imagenet/meta/train_labeled.txt.Setiap baris dalam file train_labeled.txt harus mengikuti format berikut:
absolute path/image_name.jpg label_id.PentingGunakan spasi untuk memisahkan image path dari label_id.
None
Path of the validation data annotation file
No
Konfigurasikan parameter ini jika tidak ada evaluation data annotation file yang terhubung ke input port.
CatatanJika file dikonfigurasi melalui input port dan parameter ini secara bersamaan, komponen akan menggunakan data dari input port.
Jalur OSS tempat file anotasi data validasi disimpan. Contoh:
oss://examplebucket/yourfolder****/data/imagenet/meta/val_labeled.txt.Setiap baris dalam file val_labeled.txt harus mengikuti format berikut:
absolute path/image_name.jpg label_id.PentingGunakan spasi untuk memisahkan image path dari label_id.
None
File of class name list
No
Masukkan nama kelas secara langsung atau tentukan jalur OSS file .txt yang berisi daftar nama kelas.
None
Data source format
Yes
Format data masukan. Nilai yang valid adalah ClsSourceImageList dan ClsSourceItag.
ClsSourceImageList
OSS path of the pre-trained model
No
Jika tersedia model pra-latih kustom, atur parameter ini ke jalur OSS-nya. Jika tidak dikonfigurasi, PAI akan menggunakan model pra-latih default.
None
Parameter Settings
Backbone for the metric learning model
Yes
Pilih model utama. Nilai yang valid:
-
resnet_50
-
resnet_18
-
resnet_34
-
resnet_101
-
swin_transformer_tiny
-
swin_transformer_small
-
swin_transformer_base
resnet50
Image resize size
Yes
Ukuran gambar setelah diubah ukurannya dalam piksel.
224
Feature dimension of the backbone output
Yes
Dimensi fitur dari output model utama. Harus berupa bilangan bulat.
2048
Feature dimension of the feature output
Yes
Dimensi fitur dari output Neck. Harus berupa bilangan bulat.
1536
Number of classes for training data classification annotation
Yes
Jumlah dimensi output yang ditetapkan untuk metric learning.
None
Loss function for the metric learning model
Yes
Fungsi loss mengevaluasi perbedaan antara nilai prediksi dan nilai aktual dari model pelatihan. Nilai yang valid:
-
AMSoftmax (recommended parameters: margin 0.4, scale 30)
-
ArcFaceLoss (recommended parameters: margin 28.6, scale 64)
-
CosFaceLoss (recommended parameters: margin 0.35, scale 64)
-
LargeMarginSoftmaxLoss (recommended parameters: margin 4, scale 1)
-
SphereFaceLoss (recommended parameters: margin 4, scale 1)
-
Model-parallel AMSoftmax, whose classification limit can be extended with the number of GPUs
-
Model-parallel Softmax, whose classification limit can be extended with the number of GPUs
AMSoftmax (parameter yang direkomendasikan: margin 0.4, scale 30)
Scale parameter for the metric learning loss function
Yes
Atur parameter ini berdasarkan fungsi loss yang digunakan untuk metric learning.
30
Margin parameter for the metric learning loss function
Yes
Atur parameter ini berdasarkan fungsi loss yang digunakan untuk metric learning.
0.4
Weight of the metric learning loss function
No
Bobot fungsi loss. Nilai ini menyeimbangkan rasio optimasi antara metric dan klasifikasi.
1.0
Optimization method
Yes
Metode optimasi untuk pelatihan model. Nilai yang valid:
-
SGD
-
AdamW
SGD
Initial learning rate
Yes
Tingkat pembelajaran awal. Harus berupa bilangan titik mengambang.
0.03
Training batch_size
Yes
Ukuran Batch untuk pelatihan. Jumlah sampel yang dilatih dalam setiap iterasi (step) selama pelatihan model.
None
Total training epochs
Yes
Satu epoch adalah satu putaran penuh pelatihan pada semua sampel. Jumlah total epoch adalah jumlah total putaran pelatihan semua sampel.
200
Checkpoint saving frequency
No
Frekuensi penyimpanan file model. Nilai 1 berarti model disimpan setelah setiap epoch.
10
Execution Tuning
Number of threads to read training data
No
Jumlah proses untuk membaca data pelatihan.
4
Enable half-precision
No
Pilih parameter ini untuk menggunakan half-precision dalam pelatihan model. Ini mengurangi penggunaan memori.
None
Single-node or distributed (MaxCompute/DLC)
Yes
Mesin tempat komponen dijalankan. Pilih mesin sesuai kebutuhan. Mesin komputasi yang didukung:
-
Standalone DLC
-
Distributed DLC
Standalone DLC
Number of workers
No
Konfigurasikan parameter ini saat mesin yang digunakan adalah Distributed DLC.
Jumlah proses konkuren (workers) selama pelatihan.
1
GPU model selection
Yes
Pilih spesifikasi GPU untuk menjalankan komponen.
8vCPU+60GB Mem+1xp100-ecs.gn5-c8g1.2xlarge
-
Contoh
Gunakan komponen Image Metric Learning Training (raw) untuk membangun alur kerja seperti pada gambar berikut.
Konfigurasikan komponen sebagai berikut:
-
Persiapkan dan anotasi data menggunakan modul iTAG yang disediakan oleh PAI. Untuk informasi selengkapnya, lihat iTAG.
-
Gunakan komponen Read OSS Data-4 dan Read OSS Data-5 untuk membaca file anotasi data pelatihan dan validasi. Atur parameter OSS Data Path pada masing-masing komponen Read OSS Data ke jalur OSS tempat file anotasi terkait disimpan.
-
Hubungkan kedua komponen Read OSS Data ke komponen Image Metric Learning Training (raw) dan konfigurasikan parameternya. Untuk informasi selengkapnya, lihat Konfigurasikan komponen di designer.