Machine Learning Designer dari Platform for AI (PAI) memungkinkan Anda menggunakan tugas DataWorks untuk menjadwalkan pipeline secara offline guna memperbarui model secara berkala dan membuat pipeline untuk pelatihan model. Topik ini menjelaskan cara menggunakan tugas DataWorks untuk menjadwalkan pipeline Machine Learning Designer secara berkala dalam mode offline serta menyinkronkan model PAI ke Object Storage Service (OSS) secara otomatis selama penjadwalan tugas.
Prasyarat
Semua node dalam sebuah pipeline telah berhasil dijalankan.
DataWorks telah diaktifkan dan alur kerja telah dibuat. Untuk informasi lebih lanjut, lihat Buat alur kerja.
Ruang kerja tempat alur kerja berada harus sama dengan ruang kerja pipeline Machine Learning Designer Anda. Jika tidak, Anda tidak dapat menyetel parameter Path ke alur kerja saat membuat tugas penjadwalan offline.
Jika ruang kerja tempat alur kerja DataWorks berada dalam mode standar, sinkronkan model yang dihasilkan oleh pelatihan offline ke lingkungan produksi sebelum tugas periodik dijadwalkan karena data MaxCompute diisolasi antara lingkungan pengembangan dan produksi. Untuk informasi lebih lanjut, lihat Jadwalkan pipeline prediksi batch secara berkala.
Prosedur
Rasio pipeline PAI-Designer terhadap node Designer di DataWorks adalah 1:N, artinya Anda dapat membuat beberapa node Designer di DataWorks berdasarkan pipeline PAI-Designer yang sama.
Masuk ke Konsol PAI, pilih ruang kerja yang diinginkan, lalu klik Enter Visualized Modeling (Designer). Pada halaman yang muncul, klik dua kali pipeline yang diinginkan.
(Opsional) Tambahkan komponen Ekspor Model jika Anda perlu menyinkronkan model di Machine Learning Designer ke OSS selama penjadwalan tugas periodik.
Di tab Pipeline Attributes, atur Data Storage ke jalur OSS tempat file model disimpan.
Jika Anda perlu mengekspor file model dalam format PMML, klik komponen model yang diinginkan, seperti komponen Logistic Regression for Binary Classification, dan pilih Whether To Generate PMML pada tab Fields Setting komponen tersebut.
CatatanHanya komponen model tertentu yang mendukung ekspor file model dalam format PMML. Lewati langkah ini untuk komponen model yang tidak mendukung fitur ini.
Hubungkan komponen model ke komponen hilir Ekspor Model. Untuk informasi lebih lanjut, lihat Ekspor model.
Gunakan tugas DataWorks untuk menjadwalkan pipeline Machine Learning Designer secara offline.
Di pojok kiri atas kanvas, klik Periodic Scheduling. Dalam kotak dialog yang muncul, klik Create Scheduling Node. Di kotak dialog Create Node di DataWorks, tentukan nama node dan klik Confirm.
Di halaman edit node, pilih pipeline yang Anda buat di Machine Learning Designer dari daftar drop-down Select PAI Designer Experiment.
Jika Anda ingin memodifikasi pipeline di Machine Learning Designer, klik Edit in PAI Designer.

Di tab edit node, klik tab Properties di panel navigasi sisi kanan. Di panel Properti, konfigurasikan properti penjadwalan untuk node tersebut.
Panel Properties berisi bagian General, Scheduling Parameter, Schedule, Resource Group, dan Dependencies. Anda dapat menentukan siklus penjadwalan di bagian Schedule. DataWorks akan menjalankan pipeline berdasarkan siklus penjadwalan yang Anda tentukan. Untuk informasi lebih lanjut, lihat Konfigurasi properti penjadwalan.
CatatanSelama penjadwalan di DataWorks, sistem mungkin melaporkan kesalahan terkait "Start Container timeout". Hal ini karena masalah timeout kadang-kadang terjadi. Kami merekomendasikan Anda mengaktifkan fitur Auto Rerun upon Failure saat mengonfigurasi properti waktu. Setelah fitur ini diaktifkan, sistem penjadwalan secara otomatis menjalankan ulang pipeline yang gagal (kecuali pipeline yang dihentikan oleh pengguna) berdasarkan jumlah rerun dan interval rerun yang ditentukan.

Klik ikon
dan
di bilah alat dan ikuti petunjuk di layar untuk menyimpan dan mengirimkan node.PentingAnda harus mengonfigurasi parameter Rerun dan Parent Nodes di panel Properti sebelum Anda mengirimkan node.
Jika ruang kerja yang Anda gunakan berada dalam mode standar, klik Deploy di bagian atas halaman setelah Anda mengirimkan node. Untuk informasi lebih lanjut, lihat Deploy node.
Klik Operation Center di bagian atas halaman untuk melihat status dan log operasional tugas pembelajaran mesin.
Anda juga dapat mengisi ulang data untuk node dan menguji pipeline. Untuk informasi lebih lanjut, lihat Lihat dan kelola tugas yang dipicu otomatis.
Referensi
Untuk informasi lebih lanjut tentang prediksi dan penyebaran model, lihat Prediksi dan penyebaran model.
Machine Learning Designer memungkinkan Anda menggunakan komponen Update EAS Service(Beta) untuk memperbarui layanan model online. Untuk informasi lebih lanjut, lihat Perbarui layanan model online secara berkala.