Ketika data uji atau hiperparameter dari pekerjaan pelatihan diperbarui dan memerlukan pelatihan tambahan berkelanjutan atau penyempurnaan model, Anda dapat menggunakan fitur penjadwalan berkala untuk menyerahkan pekerjaan Deep Learning Containers (DLC) pada titik waktu tertentu. Anda dapat mengonfigurasi penjadwalan berkala untuk pekerjaan DLC di DataWorks untuk mengotomatiskan pengiriman pekerjaan. Topik ini menjelaskan cara menyerahkan pekerjaan DLC pada waktu yang dijadwalkan.
Informasi Latar Belakang
Anda dapat menggunakan salah satu metode berikut untuk mengonfigurasi penjadwalan berkala untuk pekerjaan DLC:
Prasyarat
Izin yang diperlukan untuk menggunakan DLC telah diperoleh. Untuk informasi lebih lanjut, lihat Berikan izin yang diperlukan untuk menggunakan DLC.
DataWorks telah diberi otorisasi untuk mengakses PAI.
Otorisasi dapat diselesaikan dengan satu klik pada halaman otorisasi. Untuk informasi lebih lanjut tentang peran terkait layanan yang dibuat berdasarkan otorisasi, lihat Peran 1: AliyunServiceRoleForDataworksEngine. Hanya Akun Alibaba Cloud atau Pengguna RAM dengan kebijakan AliyunDataWorksFullAccess yang dapat melakukan otorisasi satu klik.
Sebuah alur kerja telah dibuat.
Di DataStudio, operasi pengembangan dilakukan pada mesin pengembangan yang berbeda berdasarkan alur kerja. Anda harus membuat alur kerja sebelum dapat membuat node. Untuk informasi lebih lanjut, lihat Buat alur kerja.
Peringatan
Setiap kali sebuah node PAI DLC dijalankan, tugas DLC baru akan dihasilkan di platform DLC PAI. Untuk mencegah beberapa tugas dengan nama yang sama dihasilkan di PAI ketika Anda menggunakan DataWorks untuk menjadwalkan node PAI DLC secara berkala, kami sarankan Anda mengonfigurasi siklus penjadwalan yang sesuai berdasarkan kebutuhan bisnis Anda ketika mengembangkan tugas DLC di DataWorks. Kami juga menyarankan Anda menambahkan variabel datetime ke nama tugas dan menetapkan parameter penjadwalan berbasis waktu ke variabel sebagai nilai. Dengan cara ini, Anda dapat menambahkan tanggal dan waktu ke nama tugas. Untuk informasi lebih lanjut, lihat bagian Langkah 2: Kembangkan tugas PAI DLC dalam topik ini.
Anda tidak dapat menggunakan grup sumber daya bersama untuk penjadwalan untuk menjalankan tugas PAI DLC.
Operasi yang dijelaskan dalam topik ini dilakukan di wilayah China (Shanghai). Anda dapat melakukan operasi di wilayah lain berdasarkan instruksi yang ditampilkan di konsol DataWorks.
Metode 1: Muat pekerjaan DLC pada node PAI DLC di konsol DataWorks dan konfigurasikan penjadwalan pekerjaan
Langkah 1: Buat pekerjaan DLC
Masuk ke Platform for AI (PAI) console. Pergi ke halaman Pekerjaan Pelatihan Terdistribusi, dan buat pekerjaan DLC. Dalam topik ini, pekerjaan DLC berbasis PyTorch digunakan sebagai contoh. Untuk informasi tentang cara membuat pekerjaan DLC berbasis PyTorch, lihat Kirim pekerjaan pelatihan mandiri yang menggunakan PyTorch.
Langkah 2: Buat node PAI DLC
Pergi ke halaman DataStudio.
Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi sisi kiri, pilih . Pada halaman yang muncul, pilih ruang kerja yang diinginkan dari daftar drop-down dan klik Go to Data Development.
Di halaman DataStudio, temukan alur kerja yang diinginkan, klik kanan nama alur kerja, dan pilih .
Di kotak dialog Create Node, konfigurasikan parameter Name dan klik Confirm. Kemudian, Anda dapat menggunakan node untuk mengembangkan tugas dan mengonfigurasi properti penjadwalan tugas.
Di tab node DLC, cari pekerjaan DLC yang Anda buat berdasarkan namanya dan muat pekerjaan tersebut.
Setelah Anda memuat pekerjaan, editor node DLC menghasilkan kode node berdasarkan konfigurasi tugas di PAI. Anda dapat memodifikasi konfigurasi tugas berdasarkan kode. Untuk informasi lebih lanjut, lihat bagian "Langkah 2: Kembangkan tugas PAI DLC" di topik Buat dan gunakan node PAI DLC.
Langkah 3: Konfigurasikan penjadwalan pekerjaan
Di panel sisi kanan tab node, klik Properties. Di panel Properties, Anda dapat melihat item konfigurasi seperti properti General, Scheduling Parameter, Schedule, Resource Group, dan Dependencies. Konfigurasikan parameter di bagian Schedule. DataWorks secara otomatis menjadwalkan dan menjalankan tugas node berdasarkan siklus penjadwalan yang ditentukan. Untuk informasi lebih lanjut, lihat Ikhtisar.
Sebelum Anda mengirim node, Anda harus mengonfigurasi parameter Rerun dan Parent Nodes di tab Properti.
Untuk mencegah beberapa tugas dengan nama yang sama dihasilkan di PAI ketika Anda menggunakan DataWorks untuk menjadwalkan node PAI DLC secara berkala, kami sarankan Anda menentukan siklus penjadwalan yang sesuai berdasarkan kebutuhan bisnis Anda.
Langkah 4: Debug kode tugas
Untuk memeriksa apakah node dikonfigurasi sesuai harapan, lakukan operasi berikut.
Opsional. Pilih grup sumber daya dan tetapkan parameter kustom ke variabel.
Klik ikon
di bilah alat atas tab konfigurasi node. Di kotak dialog Parameters, pilih grup sumber daya untuk penjadwalan yang ingin Anda gunakan untuk men-debug dan menjalankan kode tugas. Jika Anda menggunakan parameter penjadwalan dalam kode tugas Anda, Anda dapat menetapkan parameter penjadwalan ke variabel sebagai nilai dalam kode tugas untuk debugging. Untuk informasi lebih lanjut tentang logika penetapan nilai parameter penjadwalan, lihat Apa perbedaan logika penetapan nilai parameter penjadwalan di antara mode Jalankan, Jalankan dengan Parameter, dan Lakukan Pengujian Asap di Lingkungan Pengembangan?
Simpan dan eksekusi pernyataan SQL.
Di bilah alat atas, klik ikon
untuk menyimpan pernyataan SQL. Kemudian, klik ikon
untuk mengeksekusi pernyataan SQL. Opsional. Lakukan pengujian asap.
Anda dapat melakukan pengujian asap pada tugas di lingkungan pengembangan untuk memeriksa apakah tugas dijalankan sesuai harapan ketika Anda mengirim tugas atau setelah Anda mengirim tugas. Untuk informasi lebih lanjut, lihat Lakukan pengujian asap.
Langkah 5: Kirim tugas
Setelah tugas pada node dikonfigurasi, Anda harus mengirim dan menerapkan tugas. Setelah Anda mengirim dan menerapkan tugas, sistem menjalankan tugas secara teratur berdasarkan konfigurasi penjadwalan.
Klik ikon
di bilah alat atas untuk menyimpan tugas. Klik ikon
di bilah alat atas untuk mengirim tugas. Di kotak dialog Submit, konfigurasikan parameter Change description. Kemudian, tentukan apakah akan meninjau kode tugas setelah Anda mengirim tugas berdasarkan kebutuhan bisnis Anda.
CatatanAnda harus mengonfigurasi parameter Rerun dan Parent Nodes di tab Properti sebelum Anda mengirim tugas.
Anda dapat menggunakan fitur tinjauan kode untuk memastikan kualitas kode tugas dan mencegah kesalahan eksekusi tugas yang disebabkan oleh kode tugas yang tidak valid. Jika Anda mengaktifkan fitur tinjauan kode, kode tugas yang dikirim hanya dapat diterapkan setelah kode tugas lulus tinjauan kode. Untuk informasi lebih lanjut, lihat Tinjauan kode.
Jika Anda menggunakan ruang kerja dalam mode standar, Anda harus menerapkan tugas di lingkungan produksi setelah Anda mengirim tugas. Untuk menerapkan tugas pada node, klik Deploy di sudut kanan atas tab konfigurasi node. Untuk informasi lebih lanjut, lihat Terapkan node.
Langkah 6: Lihat log operasi
Setelah Anda mengirim dan menerapkan tugas, tugas dijalankan secara berkala berdasarkan konfigurasi penjadwalan. Anda dapat mengklik Operation Center di sudut kanan atas tab konfigurasi node yang sesuai untuk pergi ke Pusat Operasi dan melihat status penjadwalan tugas. Untuk informasi lebih lanjut, lihat Lihat dan kelola node yang dipicu otomatis.
Metode 2: Buat tugas skrip dan konfigurasikan penjadwalan pekerjaan
Langkah 1: Buat grup sumber daya eksklusif untuk penjadwalan
Buat grup sumber daya eksklusif untuk penjadwalan di konsol DataWorks. Untuk informasi lebih lanjut, lihat Buat grup sumber daya eksklusif untuk Integrasi Data.
Langkah 2: Hubungkan grup sumber daya eksklusif dengan ruang kerja
Hubungkan grup sumber daya eksklusif dengan ruang kerja. Dengan cara ini, Anda dapat memilih grup sumber daya di ruang kerja ketika Anda mengirim pekerjaan. Untuk informasi lebih lanjut, lihat Langkah 2: Hubungkan grup sumber daya eksklusif untuk penjadwalan dengan ruang kerja.
Langkah 3: Instal paket DLC
Untuk menginstal paket, hubungi dukungan teknis untuk mendapatkan izin yang diperlukan.
Buat perintah
Masuk ke Konsol DataWorks. Di panel navigasi sisi kiri, klik Resource Group. Tab Exclusive Resource Groups muncul di halaman Grup Sumber Daya.
Temukan grup sumber daya eksklusif Data Scheduling. Klik ikon
di kolom Tindakan dan kemudian klik O&M Assistant. Di halaman Asisten O&M, klik Create Command. Konfigurasikan parameter kunci berikut dan klik OK.
Parameter
Deskripsi
Command Type
Jenis perintah. Pilih Manual Installation.
Command Content
Isi perintah. Masukkan konten berikut:
wget -P /home/admin/usertools/tools/ https://dlc-release.oss-cn-zhangjiakou.aliyuncs.com/console/public/latest/dlc --no-check-certificate chmod +x /home/admin/usertools/tools/dlcInstallation Directories
Direktori yang digunakan untuk instalasi. Simpan perintah ke direktori /home/admin/usertools/tools/.
Timeout
Periode waktu habis perintah. Unit: detik. Jika perintah habis waktu, sistem secara paksa menghentikan perintah. Kami sarankan Anda menetapkan parameter ini ke 60.
Jalankan perintah.
Di halaman Asisten O&M, temukan perintah dan klik Run command di kolom Actions.

Di panel Run command, klik Run.
Lihat hasil eksekusi perintah.
Di halaman Asisten O&M, temukan perintah dan klik View Result di kolom Tindakan.

Di kotak dialog Command Execution Result, lihat hasil eksekusi perintah. Jika kemajuan eksekusi adalah 100%, paket DLC telah diinstal.

Langkah 4: Buat alur kerja
Pergi ke halaman DataStudio.
Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi sisi kiri, pilih . Pada halaman yang muncul, pilih ruang kerja yang diinginkan dari daftar drop-down dan klik Go to Data Development.
Geser pointer ke ikon
dan pilih . Di kotak dialog Create Node, konfigurasikan parameter Nama dan Path. Klik Confirm untuk membuat node.
Langkah 5: Kirim pekerjaan untuk pengujian
Untuk mengonfigurasi pengiriman pekerjaan otomatis pada titik waktu tertentu, diperlukan node pekerjaan. Sebelum Anda mengirim pekerjaan, buat node pekerjaan awal dan jalankan pengujian asap pada node. Jika node awal tersedia, lanjutkan ke Langkah 6.
Modifikasi skrip penyebaran.
Di tab alur kerja, klik dua kali node Shell yang dibuat. Dalam contoh ini, klik dua kali node Penyebaran.
Di tab node Shell, masukkan perintah berikut:
# Hasilkan file deskripsi pekerjaan. cat << EOF > jobfile name=dataworks-job workers=1 worker_spec=ecs.g6.large worker_image=registry-vpc.cn-hangzhou.aliyuncs.com/pai-dlc/pytorch-training:1.7.1-gpu-py37-cu110-ubuntu18.04 command=echo $(date) EOF # Kirim pekerjaan. /home/admin/usertools/tools/dlc submit pytorchjob\ --access_id=<access_id> \ --access_key=<access_key> \ --endpoint=pai-dlc.cn-hangzhou.aliyuncs.com \ --region=cn-hangzhou \ --job_file=./jobfile \ --interactivejobfile menunjukkan file deskripsi pekerjaan. Untuk informasi lebih lanjut tentang konfigurasi pekerjaan, lihat Perintah yang digunakan untuk mengirim pekerjaan. Anda harus mengonfigurasi parameter endpoint berdasarkan wilayah tempat Anda ingin menerapkan pekerjaan.
Wilayah
Endpoint
China (Shanghai)
pai-dlc.cn-shanghai.aliyuncs.com
China (Beijing)
pai-dlc.cn-beijing.aliyuncs.com
China (Hangzhou)
pai-dlc.cn-hangzhou.aliyuncs.com
China (Shenzhen)
pai-dlc.cn-shenzhen.aliyuncs.com
China (Hong Kong)
pai-dlc.cn-hongkong.aliyuncs.com
Singapura
pai-dlc.ap-southeast-1.aliyuncs.com
Malaysia (Kuala Lumpur)
pai-dlc.ap-southeast-3.aliyuncs.com
Jerman (Frankfurt)
pai-dlc.eu-central-1.aliyun.cs.com
Jalankan skrip.
Di bagian atas tab node Shell, klik ikon
. Di pesan Warning, klik Continue to Run.
Di kotak dialog Runtime Parameters, atur parameter Resource Group ke grup sumber daya eksklusif yang telah dibuat.
Kemudian, klik OK.
Setelah skrip dijalankan, sebuah pekerjaan akan dihasilkan. Anda dapat pergi ke halaman DLC dari ruang kerja default untuk melihat pekerjaan yang dihasilkan.
Langkah 6: Lakukan penjadwalan pekerjaan
Jalankan pekerjaan penjadwalan.
Di panel sisi kanan tab node Shell, klik tab Properties.
Di bagian Schedule pada halaman Properties, konfigurasikan parameter Scheduling Cycle dan Rerun.
Di bagian Dependencies, klik Use Root Node di sebelah bidang Parent Nodes.
Konfigurasikan dependensi. Untuk informasi lebih lanjut, lihat Konfigurasikan dependensi penjadwalan siklus yang sama.
Di tab node Shell, klik ikon
untuk menyimpan konfigurasi. Di tab node Shell, klik ikon
untuk mengirim node yang dijadwalkan.
Lihat instance dari node penjadwalan.
Di sudut kanan atas tab node Shell, klik Operation Center.
Di halaman Operation Center, pilih .
Di halaman daftar instance, lihat waktu yang dijadwalkan untuk pengiriman pekerjaan otomatis di kolom Schedule.
Di kolom Tindakan, pilih untuk melihat log operasi setiap pengiriman pekerjaan terjadwal.
Referensi
Anda dapat melihat dan mengelola pekerjaan DLC yang dikirimkan di konsol PAI.