Kirim pekerjaan transfer learning PyTorch menggunakan DLC dengan penyimpanan DSW dan NAS.
Prasyarat
Buat sistem file NAS tujuan umum di wilayah target Anda. Untuk informasi selengkapnya, lihat Buat sistem file NAS tujuan umum menggunakan konsol.
Batasan
Operasi dalam dokumen ini hanya berlaku untuk kluster yang menggunakan sumber daya komputasi umum dalam kelompok sumber daya publik.
Buat dataset
-
Buka halaman Datasets.
-
Masuk ke PAI console.
-
Di panel navigasi sebelah kiri, klik Workspaces. Di halaman Workspaces, klik nama ruang kerja yang ingin Anda kelola.
-
Di panel navigasi sebelah kiri, pilih .
-
-
Buat dataset dasar. Atur parameter Storage Class ke General-purpose NAS file system.
Buat instans DSW
Buat instans DSW dan konfigurasikan parameter berikut. Untuk informasi selengkapnya, lihat Buat instans DSW.
|
Parameter |
Deskripsi |
|
|
Environment Context |
Dataset Mount |
Klik Custom Dataset, pilih dataset NAS yang dibuat pada bagian sebelumnya, dan atur Mount Path menjadi |
|
Working Directory |
Pilih |
|
|
Network Information |
VPC Configuration |
Tidak diperlukan. |
Siapkan data
Unduh dan ekstrak data pelatihan publik (Download data).
-
Buka lingkungan pengembangan instans DSW.
-
Masuk ke PAI console.
-
Di panel navigasi sebelah kiri, klik Workspaces. Di halaman Workspaces, klik nama ruang kerja yang ingin Anda kelola.
-
Di pojok kiri atas halaman, pilih wilayah tempat Anda ingin menggunakan PAI.
-
Di panel navigasi sebelah kiri, pilih .
-
Opsional: Di halaman Data Science Workshop (DSW), masukkan nama instans DSW atau kata kunci di kotak pencarian untuk mencari instans DSW tersebut.
-
Klik Open di kolom Actions instans tersebut.
-
-
Di bilah menu bagian atas lingkungan pengembangan DSW, klik Notebook.
-
Unduh data.
-
Klik ikon
di bilah alat kiri atas untuk membuat folder bernama pytorch_transfer_learning. -
Di bilah menu, klik Terminal untuk membuka terminal.
-
Di terminal, masuk ke folder yang telah dibuat dan unduh dataset.
cd /mnt/workspace/pytorch_transfer_learning/ wget https://pai-public-data.oss-cn-beijing.aliyuncs.com/hol-pytorch-transfer-cv/data.tar.gz
-
Ekstrak dataset.
tar -xf ./data.tar.gz -
Beralih ke tab Notebook, masuk ke direktori pytorch_transfer_learning, klik kanan folder data hasil ekstraksi (hymenoptera_data), lalu pilih Rename. Ubah namanya menjadi input.
-
Siapkan kode pelatihan dan penyimpanan model
-
Unduh kode pelatihan ke folder
pytorch_transfer_learning.cd /mnt/workspace/pytorch_transfer_learning/ wget https://pai-public-data.oss-cn-beijing.aliyuncs.com/hol-pytorch-transfer-cv/main.py -
Buat folder output untuk menyimpan model hasil pelatihan.
mkdir output -
Verifikasi bahwa folder tersebut berisi file-file berikut:
-
input: folder data pelatihan.
-
main.py: kode pelatihan.
-
output: folder penyimpanan model.

-
Buat pekerjaan
-
Buka halaman Create Job.
-
Masuk ke PAI console. Pilih wilayah dan ruang kerja target di bagian atas halaman, lalu klik Deep Learning Containers (DLC).
-
Di halaman Deep Learning Containers (DLC), klik Create Job.
-
-
Konfigurasikan parameter berikut di halaman Create Job.
Parameter
Deskripsi
Basic Information
Job Name
Nama pekerjaan pelatihan pembelajaran mendalam.
Environment Context
Node Image
Pilih Alibaba Cloud Image dan image PyTorch. Contoh:
pytorch-training:1.12-gpu-py39-cu113-ubuntu20.04.Dataset
Klik Custom Dataset dan pilih dataset NAS yang telah dibuat sebelumnya.
Start Command
Masukkan perintah berikut:
python /mnt/data/pytorch_transfer_learning/main.py -i /mnt/data/pytorch_transfer_learning/input -o /mnt/data/pytorch_transfer_learning/outputThird-party Library Configuration
Pilih Third-party Library List dan masukkan library berikut:
numpy==1.16.4 absl-py==0.11.0Code Configuration
Tidak diperlukan.
Resource Information
Resource Source
Pilih Public Resources.
Framework
Pilih PyTorch.
Job Resources
Pilih spesifikasi sumber daya. Contoh: Resource Specification > CPU > ecs.g6.xlarge, dan atur Nodes menjadi 1.
-
Klik OK.
Lihat detail pekerjaan dan log
-
Klik nama pekerjaan di halaman Deep Learning Containers (DLC).
-
Lihat Basic Information dan Resource Information di halaman ikhtisar pekerjaan.
-
Di bagian Instance di bagian bawah halaman, klik Log di kolom Actions.
Contoh log:
