All Products
Search
Document Center

Platform For AI:Pelatihan metric learning gambar (raw)

Last Updated:Mar 07, 2026

Bangun model metric learning untuk inferensi menggunakan komponen Image Metric Learning Training (raw).

Prasyarat

OSS telah diaktifkan, dan Machine Learning Studio telah diberi izin untuk mengakses OSS. Untuk informasi selengkapnya, lihat Aktifkan OSS dan Berikan izin.

Batasan

Mesin komputasi yang didukung adalah DLC.

Deskripsi algoritma

Komponen Image Metric Learning Training (raw) menyediakan model umum, seperti resnet50, resnet18, resnet34, resnet101, swint_tiny, swint_small, swint_base, vit_tiny, vit_small, vit_base, xcit_tiny, xcit_small, dan xcit_base.

Konfigurasi komponen

  • Input Stub

    Input Port (dari kiri ke kanan)

    Tipe data yang dibatasi

    Komponen Hulu yang Direkomendasikan

    Wajib

    Training data annotation file

    OSS

    Read OSS Data

    No

    Evaluation data annotation file

    OSS

    Read OSS Data

    No

  • Parameter komponen

    Tab

    Parameter

    Wajib

    Deskripsi

    Nilai Default

    Field Settings

    Metric learning model type

    Yes

    Tipe algoritma untuk pelatihan model. Nilai yang valid:

    • Data-parallel metric learning

    • Model-parallel metric learning

    Data-parallel metric learning

    OSS directory to save training output

    Yes

    Direktori OSS tempat model pelatihan disimpan. Contoh: oss://examplebucket/yun****/designer_test.

    None

    Path of the training data annotation file

    No

    Konfigurasikan parameter ini jika tidak ada training data annotation file yang terhubung ke input port.

    Catatan

    Jika file dikonfigurasi melalui input port dan parameter ini secara bersamaan, komponen akan menggunakan data dari input port.

    Jalur OSS tempat file anotasi data pelatihan disimpan. Contoh: oss://examplebucket/yourfolder****/data/imagenet/meta/train_labeled.txt.

    Setiap baris dalam file train_labeled.txt harus mengikuti format berikut: absolute path/image_name.jpg label_id.

    Penting

    Gunakan spasi untuk memisahkan image path dari label_id.

    None

    Path of the validation data annotation file

    No

    Konfigurasikan parameter ini jika tidak ada evaluation data annotation file yang terhubung ke input port.

    Catatan

    Jika file dikonfigurasi melalui input port dan parameter ini secara bersamaan, komponen akan menggunakan data dari input port.

    Jalur OSS tempat file anotasi data validasi disimpan. Contoh: oss://examplebucket/yourfolder****/data/imagenet/meta/val_labeled.txt.

    Setiap baris dalam file val_labeled.txt harus mengikuti format berikut: absolute path/image_name.jpg label_id.

    Penting

    Gunakan spasi untuk memisahkan image path dari label_id.

    None

    File of class name list

    No

    Masukkan nama kelas secara langsung atau tentukan jalur OSS file .txt yang berisi daftar nama kelas.

    None

    Data source format

    Yes

    Format data masukan. Nilai yang valid adalah ClsSourceImageList dan ClsSourceItag.

    ClsSourceImageList

    OSS path of the pre-trained model

    No

    Jika tersedia model pra-latih kustom, atur parameter ini ke jalur OSS-nya. Jika tidak dikonfigurasi, PAI akan menggunakan model pra-latih default.

    None

    Parameter Settings

    Backbone for the metric learning model

    Yes

    Pilih model utama. Nilai yang valid:

    • resnet_50

    • resnet_18

    • resnet_34

    • resnet_101

    • swin_transformer_tiny

    • swin_transformer_small

    • swin_transformer_base

    resnet50

    Image resize size

    Yes

    Ukuran gambar setelah diubah ukurannya dalam piksel.

    224

    Feature dimension of the backbone output

    Yes

    Dimensi fitur dari output model utama. Harus berupa bilangan bulat.

    2048

    Feature dimension of the feature output

    Yes

    Dimensi fitur dari output Neck. Harus berupa bilangan bulat.

    1536

    Number of classes for training data classification annotation

    Yes

    Jumlah dimensi output yang ditetapkan untuk metric learning.

    None

    Loss function for the metric learning model

    Yes

    Fungsi loss mengevaluasi perbedaan antara nilai prediksi dan nilai aktual dari model pelatihan. Nilai yang valid:

    • AMSoftmax (recommended parameters: margin 0.4, scale 30)

    • ArcFaceLoss (recommended parameters: margin 28.6, scale 64)

    • CosFaceLoss (recommended parameters: margin 0.35, scale 64)

    • LargeMarginSoftmaxLoss (recommended parameters: margin 4, scale 1)

    • SphereFaceLoss (recommended parameters: margin 4, scale 1)

    • Model-parallel AMSoftmax, whose classification limit can be extended with the number of GPUs

    • Model-parallel Softmax, whose classification limit can be extended with the number of GPUs

    AMSoftmax (parameter yang direkomendasikan: margin 0.4, scale 30)

    Scale parameter for the metric learning loss function

    Yes

    Atur parameter ini berdasarkan fungsi loss yang digunakan untuk metric learning.

    30

    Margin parameter for the metric learning loss function

    Yes

    Atur parameter ini berdasarkan fungsi loss yang digunakan untuk metric learning.

    0.4

    Weight of the metric learning loss function

    No

    Bobot fungsi loss. Nilai ini menyeimbangkan rasio optimasi antara metric dan klasifikasi.

    1.0

    Optimization method

    Yes

    Metode optimasi untuk pelatihan model. Nilai yang valid:

    • SGD

    • AdamW

    SGD

    Initial learning rate

    Yes

    Tingkat pembelajaran awal. Harus berupa bilangan titik mengambang.

    0.03

    Training batch_size

    Yes

    Ukuran Batch untuk pelatihan. Jumlah sampel yang dilatih dalam setiap iterasi (step) selama pelatihan model.

    None

    Total training epochs

    Yes

    Satu epoch adalah satu putaran penuh pelatihan pada semua sampel. Jumlah total epoch adalah jumlah total putaran pelatihan semua sampel.

    200

    Checkpoint saving frequency

    No

    Frekuensi penyimpanan file model. Nilai 1 berarti model disimpan setelah setiap epoch.

    10

    Execution Tuning

    Number of threads to read training data

    No

    Jumlah proses untuk membaca data pelatihan.

    4

    Enable half-precision

    No

    Pilih parameter ini untuk menggunakan half-precision dalam pelatihan model. Ini mengurangi penggunaan memori.

    None

    Single-node or distributed (MaxCompute/DLC)

    Yes

    Mesin tempat komponen dijalankan. Pilih mesin sesuai kebutuhan. Mesin komputasi yang didukung:

    • Standalone DLC

    • Distributed DLC

    Standalone DLC

    Number of workers

    No

    Konfigurasikan parameter ini saat mesin yang digunakan adalah Distributed DLC.

    Jumlah proses konkuren (workers) selama pelatihan.

    1

    GPU model selection

    Yes

    Pilih spesifikasi GPU untuk menjalankan komponen.

    8vCPU+60GB Mem+1xp100-ecs.gn5-c8g1.2xlarge

Contoh

Gunakan komponen Image Metric Learning Training (raw) untuk membangun alur kerja seperti pada gambar berikut.Workflow Konfigurasikan komponen sebagai berikut:

  1. Persiapkan dan anotasi data menggunakan modul iTAG yang disediakan oleh PAI. Untuk informasi selengkapnya, lihat iTAG.

  2. Gunakan komponen Read OSS Data-4 dan Read OSS Data-5 untuk membaca file anotasi data pelatihan dan validasi. Atur parameter OSS Data Path pada masing-masing komponen Read OSS Data ke jalur OSS tempat file anotasi terkait disimpan.

  3. Hubungkan kedua komponen Read OSS Data ke komponen Image Metric Learning Training (raw) dan konfigurasikan parameternya. Untuk informasi selengkapnya, lihat Konfigurasikan komponen di designer.