All Products
Search
Document Center

Platform For AI:Kirim pekerjaan transfer learning PyTorch dengan NAS

Last Updated:Mar 11, 2026

Kirim pekerjaan transfer learning PyTorch menggunakan DLC dengan penyimpanan DSW dan NAS.

Prasyarat

Buat sistem file NAS tujuan umum di wilayah target Anda. Untuk informasi selengkapnya, lihat Buat sistem file NAS tujuan umum menggunakan konsol.

Batasan

Operasi dalam dokumen ini hanya berlaku untuk kluster yang menggunakan sumber daya komputasi umum dalam kelompok sumber daya publik.

Buat dataset

  1. Buka halaman Datasets.

    1. Masuk ke PAI console.

    2. Di panel navigasi sebelah kiri, klik Workspaces. Di halaman Workspaces, klik nama ruang kerja yang ingin Anda kelola.

    3. Di panel navigasi sebelah kiri, pilih AI Asset Management > Datasets.

  2. Buat dataset dasar. Atur parameter Storage Class ke General-purpose NAS file system.

Buat instans DSW

Buat instans DSW dan konfigurasikan parameter berikut. Untuk informasi selengkapnya, lihat Buat instans DSW.image

Parameter

Deskripsi

Environment Context

Dataset Mount

Klik Custom Dataset, pilih dataset NAS yang dibuat pada bagian sebelumnya, dan atur Mount Path menjadi /mnt/data/.

Working Directory

Pilih Dataset-/mnt/data/.

Network Information

VPC Configuration

Tidak diperlukan.

Siapkan data

Unduh dan ekstrak data pelatihan publik (Download data).

  1. Buka lingkungan pengembangan instans DSW.

    1. Masuk ke PAI console.

    2. Di panel navigasi sebelah kiri, klik Workspaces. Di halaman Workspaces, klik nama ruang kerja yang ingin Anda kelola.

    3. Di pojok kiri atas halaman, pilih wilayah tempat Anda ingin menggunakan PAI.

    4. Di panel navigasi sebelah kiri, pilih Model Training > Data Science Workshop (DSW).

    5. Opsional: Di halaman Data Science Workshop (DSW), masukkan nama instans DSW atau kata kunci di kotak pencarian untuk mencari instans DSW tersebut.

    6. Klik Open di kolom Actions instans tersebut.

  2. Di bilah menu bagian atas lingkungan pengembangan DSW, klik Notebook.

  3. Unduh data.

    1. Klik ikon 创建文件夹 di bilah alat kiri atas untuk membuat folder bernama pytorch_transfer_learning.

    2. Di bilah menu, klik Terminal untuk membuka terminal.

    3. Di terminal, masuk ke folder yang telah dibuat dan unduh dataset.

      cd /mnt/workspace/pytorch_transfer_learning/
      wget https://pai-public-data.oss-cn-beijing.aliyuncs.com/hol-pytorch-transfer-cv/data.tar.gz

      image

    4. Ekstrak dataset.

      tar -xf ./data.tar.gz
    5. Beralih ke tab Notebook, masuk ke direktori pytorch_transfer_learning, klik kanan folder data hasil ekstraksi (hymenoptera_data), lalu pilih Rename. Ubah namanya menjadi input.

Siapkan kode pelatihan dan penyimpanan model

  1. Unduh kode pelatihan ke folder pytorch_transfer_learning.

    cd /mnt/workspace/pytorch_transfer_learning/
    wget https://pai-public-data.oss-cn-beijing.aliyuncs.com/hol-pytorch-transfer-cv/main.py
  2. Buat folder output untuk menyimpan model hasil pelatihan.

    mkdir output
  3. Verifikasi bahwa folder tersebut berisi file-file berikut:

    • input: folder data pelatihan.

    • main.py: kode pelatihan.

    • output: folder penyimpanan model.

    最终的文件夹内容

Buat pekerjaan

  1. Buka halaman Create Job.

    1. Masuk ke PAI console. Pilih wilayah dan ruang kerja target di bagian atas halaman, lalu klik Deep Learning Containers (DLC).

    2. Di halaman Deep Learning Containers (DLC), klik Create Job.

  2. Konfigurasikan parameter berikut di halaman Create Job.

    Parameter

    Deskripsi

    Basic Information

    Job Name

    Nama pekerjaan pelatihan pembelajaran mendalam.

    Environment Context

    Node Image

    Pilih Alibaba Cloud Image dan image PyTorch. Contoh: pytorch-training:1.12-gpu-py39-cu113-ubuntu20.04.

    Dataset

    Klik Custom Dataset dan pilih dataset NAS yang telah dibuat sebelumnya.

    Start Command

    Masukkan perintah berikut:

    python /mnt/data/pytorch_transfer_learning/main.py -i /mnt/data/pytorch_transfer_learning/input -o /mnt/data/pytorch_transfer_learning/output

    Third-party Library Configuration

    Pilih Third-party Library List dan masukkan library berikut:

    numpy==1.16.4
    absl-py==0.11.0

    Code Configuration

    Tidak diperlukan.

    Resource Information

    Resource Source

    Pilih Public Resources.

    Framework

    Pilih PyTorch.

    Job Resources

    Pilih spesifikasi sumber daya. Contoh: Resource Specification > CPU > ecs.g6.xlarge, dan atur Nodes menjadi 1.

  3. Klik OK.

Lihat detail pekerjaan dan log

  1. Klik nama pekerjaan di halaman Deep Learning Containers (DLC).

  2. Lihat Basic Information dan Resource Information di halaman ikhtisar pekerjaan.

  3. Di bagian Instance di bagian bawah halaman, klik Log di kolom Actions.

    Contoh log:image