全部产品
Search
文档中心

Platform For AI:Gunakan Tugas DataWorks untuk Menjadwalkan Pipeline di Machine Learning Designer

更新时间:Jul 02, 2025

Machine Learning Designer dari Platform for AI (PAI) memungkinkan Anda menggunakan tugas DataWorks untuk menjadwalkan pipeline secara offline guna memperbarui model secara berkala dan membuat pipeline untuk pelatihan model. Topik ini menjelaskan cara menggunakan tugas DataWorks untuk menjadwalkan pipeline Machine Learning Designer secara berkala dalam mode offline serta menyinkronkan model PAI ke Object Storage Service (OSS) secara otomatis selama penjadwalan tugas.

Prasyarat

  • Semua node dalam sebuah pipeline telah berhasil dijalankan.

  • DataWorks telah diaktifkan dan alur kerja telah dibuat. Untuk informasi lebih lanjut, lihat Buat alur kerja.

Penting

Ruang kerja tempat alur kerja berada harus sama dengan ruang kerja pipeline Machine Learning Designer Anda. Jika tidak, Anda tidak dapat menyetel parameter Path ke alur kerja saat membuat tugas penjadwalan offline.

  • Jika ruang kerja tempat alur kerja DataWorks berada dalam mode standar, sinkronkan model yang dihasilkan oleh pelatihan offline ke lingkungan produksi sebelum tugas periodik dijadwalkan karena data MaxCompute diisolasi antara lingkungan pengembangan dan produksi. Untuk informasi lebih lanjut, lihat Jadwalkan pipeline prediksi batch secara berkala.

Prosedur

Catatan

Rasio pipeline PAI-Designer terhadap node Designer di DataWorks adalah 1:N, artinya Anda dapat membuat beberapa node Designer di DataWorks berdasarkan pipeline PAI-Designer yang sama.

  1. Masuk ke Konsol PAI, pilih ruang kerja yang diinginkan, lalu klik Enter Visualized Modeling (Designer). Pada halaman yang muncul, klik dua kali pipeline yang diinginkan.

  2. (Opsional) Tambahkan komponen Ekspor Model jika Anda perlu menyinkronkan model di Machine Learning Designer ke OSS selama penjadwalan tugas periodik.

    1. Di tab Pipeline Attributes, atur Data Storage ke jalur OSS tempat file model disimpan.

    2. Jika Anda perlu mengekspor file model dalam format PMML, klik komponen model yang diinginkan, seperti komponen Logistic Regression for Binary Classification, dan pilih Whether To Generate PMML pada tab Fields Setting komponen tersebut.

      Catatan

      Hanya komponen model tertentu yang mendukung ekspor file model dalam format PMML. Lewati langkah ini untuk komponen model yang tidak mendukung fitur ini.

    3. Hubungkan komponen model ke komponen hilir Ekspor Model. Untuk informasi lebih lanjut, lihat Ekspor model.

  3. Gunakan tugas DataWorks untuk menjadwalkan pipeline Machine Learning Designer secara offline.

    1. Di pojok kiri atas kanvas, klik Periodic Scheduling. Dalam kotak dialog yang muncul, klik Create Scheduling Node. Di kotak dialog Create Node di DataWorks, tentukan nama node dan klik Confirm.

    2. Di halaman edit node, pilih pipeline yang Anda buat di Machine Learning Designer dari daftar drop-down Select PAI Designer Experiment.

      Jika Anda ingin memodifikasi pipeline di Machine Learning Designer, klik Edit in PAI Designer. 编辑页面

    3. Di tab edit node, klik tab Properties di panel navigasi sisi kanan. Di panel Properti, konfigurasikan properti penjadwalan untuk node tersebut.

      Panel Properties berisi bagian General, Scheduling Parameter, Schedule, Resource Group, dan Dependencies. Anda dapat menentukan siklus penjadwalan di bagian Schedule. DataWorks akan menjalankan pipeline berdasarkan siklus penjadwalan yang Anda tentukan. Untuk informasi lebih lanjut, lihat Konfigurasi properti penjadwalan.

      Catatan

      Selama penjadwalan di DataWorks, sistem mungkin melaporkan kesalahan terkait "Start Container timeout". Hal ini karena masalah timeout kadang-kadang terjadi. Kami merekomendasikan Anda mengaktifkan fitur Auto Rerun upon Failure saat mengonfigurasi properti waktu. Setelah fitur ini diaktifkan, sistem penjadwalan secara otomatis menjalankan ulang pipeline yang gagal (kecuali pipeline yang dihentikan oleh pengguna) berdasarkan jumlah rerun dan interval rerun yang ditentukan.

      调度配置

    4. Klik ikon 保存 dan 提交 di bilah alat dan ikuti petunjuk di layar untuk menyimpan dan mengirimkan node.

      Penting

      Anda harus mengonfigurasi parameter Rerun dan Parent Nodes di panel Properti sebelum Anda mengirimkan node.

      Jika ruang kerja yang Anda gunakan berada dalam mode standar, klik Deploy di bagian atas halaman setelah Anda mengirimkan node. Untuk informasi lebih lanjut, lihat Deploy node.

    5. Klik Operation Center di bagian atas halaman untuk melihat status dan log operasional tugas pembelajaran mesin.

      Anda juga dapat mengisi ulang data untuk node dan menguji pipeline. Untuk informasi lebih lanjut, lihat Lihat dan kelola tugas yang dipicu otomatis.

Referensi