DataWorks menyediakan node PAI Designer yang memuat pipeline Machine Learning Designer dan menjalankannya sesuai jadwal periodik. Gunakan jenis node ini untuk mengintegrasikan pipeline PAI yang sudah ada ke dalam alur kerja penjadwalan DataWorks Anda.
Prasyarat
Sebelum memulai, pastikan Anda telah:
-
DataWorks diotorisasi untuk mengakses PAI. Selesaikan otorisasi dengan beberapa klik di halaman otorisasi. Tindakan ini akan membuat peran terkait layanan AliyunServiceRoleForDataworksEngine. Untuk detailnya, lihat Role 1: AliyunServiceRoleForDataworksEngine. Hanya Akun Alibaba Cloud atau pengguna RAM dengan kebijakan AliyunDataWorksFullAccess yang dapat melakukan otorisasi satu klik.
-
Node PAI Designer telah dibuat di DataWorks.
Langkah 1: Kembangkan tugas
Pada tab konfigurasi node PAI Designer, siapkan pipeline Anda dan konfigurasikan penjadwalan.
Muat atau buat pipeline
Untuk memuat pipeline yang sudah ada, cari berdasarkan namanya pada tab konfigurasi. Pastikan pipeline tersebut telah dibuat terlebih dahulu di PAI—pipeline harus sudah tersedia agar muncul dalam hasil pencarian.
Untuk membuat pipeline langsung dari tab konfigurasi, pilih salah satu metode berikut:
| Metode | Deskripsi |
|---|---|
| Blank pipeline | Tambahkan komponen dan gunakan seret-dan-lepas untuk membangun model dari awal. Lihat Create a blank pipeline. |
| Preset template | Mulai dari templat bawaan, lalu modifikasi komponen atau konfigurasinya. Lihat Create a pipeline from a preset template. |
| Custom template | Gunakan pipeline yang sebelumnya disimpan sebagai templat kustom oleh anggota ruang kerja. Lihat Create a pipeline from a custom template. |
Konfigurasikan parameter penjadwalan
Parameter penjadwalan memungkinkan Anda meneruskan nilai dinamis ke kode node saat waktu proses. DataWorks secara otomatis mengganti setiap referensi variabel dalam kode node Anda dengan nilai yang didefinisikan di tab Properties setiap kali node dijalankan.
Untuk mengonfigurasi parameter penjadwalan:
-
Klik Properties di panel navigasi sisi kanan.
-
Definisikan variabel dalam kode node menggunakan format
${Variable}:--command='echo '\''${Variable}'\'';' \ --Anda dapat menetapkan parameter penjadwalan tertentu ke variabel tersebut. -
Di bagian Scheduling Parameters pada tab Properties, tetapkan nilai untuk variabel tersebut.
-
Klik Save.
Untuk format variabel yang didukung, lihat Supported formats of scheduling parameters.
Langkah 2: Terapkan dan pantau node
-
Terapkan node tersebut. Lihat Deploy nodes.
-
Setelah penerapan, klik Perform O&M di bawah Prod Online untuk membuka node di Operation Center dan melihat status jalannya. Lihat Getting started with Operation Center.
Jalankan node PAI Designer secara manual
Node PAI Designer tidak memiliki titik masuk eksekusi di DataStudio. Untuk memicu eksekusi secara manual, buka Operation Center di lingkungan pengembangan dan pilih Auto Triggered Node O&M > Auto Triggered Nodes di bagian Node O&M. Temukan node tersebut, lalu klik Test atau Backfill Data di kolom Actions.