全部产品
Search
文档中心

:Buat alur kerja

更新时间:Dec 03, 2025

Topik ini menjelaskan cara membuat alur kerja, membuat node dalam alur kerja, serta mengonfigurasi dependensi. Setelah alur kerja dibuat, Anda dapat menggunakan fitur pengembangan data untuk menganalisis dan menghitung data di ruang kerja.

Prasyarat

Sebelum memulai, pastikan Anda telah membuat tabel data bisnis bank_data dan tabel sink result_table di ruang kerja. Tabel data bisnis harus berisi data. Untuk informasi selengkapnya, lihat Buat tabel dan unggah data.

Informasi latar belakang

Fitur pengembangan data DataWorks menggunakan alur kerja untuk memproses data dan mengelola dependensi. Anda dapat mengatur dependensi antar-node dengan menyeret dan melepasnya dalam alur kerja. Satu ruang kerja dapat berisi beberapa alur kerja. Untuk informasi selengkapnya, lihat Buat alur kerja.

Buat alur kerja

  1. Masuk ke DataWorks console. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi kiri, pilih Data Development and O&M > Data Development. Pada halaman yang muncul, pilih ruang kerja yang diinginkan dari daftar drop-down dan klik Go to Data Studio.

  2. Pada halaman Data Development, arahkan penunjuk ke ikon 新建 dan klik Create Workflow.

  3. Di kotak dialog Create Workflow, masukkan Workflow Name dan Description.

  4. Klik Create.

Buat node dan konfigurasikan dependensi

Buat node beban nol (start) dan node ODPS SQL (insert_data) dalam alur kerja. Kemudian, konfigurasikan dependensi sehingga insert_data bergantung pada start.

Penting
  • Node beban nol adalah node kontrol yang tidak memengaruhi data apa pun selama eksekusi alur kerja. Node ini hanya digunakan untuk kontrol Operasi dan Pemeliharaan (O&M) terhadap node turunannya.

  • Jika node lain bergantung pada node beban nol dan insinyur O&M secara manual mengatur status node beban nol menjadi gagal, node turunan yang belum dieksekusi tidak akan dipicu. Selama O&M, hal ini mencegah propagasi data hulu yang salah.

  • Dalam suatu alur kerja, node leluhur dari node beban nol biasanya adalah node root ruang kerja. Node root ruang kerja menggunakan format Workspace Name_root.

  • DataWorks secara otomatis menambahkan output untuk setiap node menggunakan struktur Workspace Name.Node Name. Jika dua node dalam ruang kerja memiliki nama yang sama, Anda harus mengubah output salah satu node tersebut.

Buat node beban nol sebagai node root untuk mengontrol seluruh alur kerja. Rancang alur kerja sebagai berikut:

  1. Klik ganda nama alur kerja untuk membuka panel pengembangan. Klik General > Zero-Load Node.

    Anda juga dapat menyeret Virtual Node ke panel pengembangan di sebelah kanan.

    虚拟节点

  2. Di kotak dialog Create Node, pilih Path, masukkan start untuk Node Name, lalu klik Confirm.

  3. Gunakan metode yang sama untuk membuat node ODPS SQL dan beri nama insert_data.

  4. Seret garis untuk mengatur node start sebagai node leluhur dari node insert_data.

    依赖关系

Konfigurasikan dependensi hulu node beban nol

Dalam suatu alur kerja, node beban nol biasanya bertindak sebagai pengontrol seluruh alur kerja dan merupakan node leluhur dari semua node lain dalam alur kerja tersebut.

Workspace Root Node biasanya merupakan Ancestor Node untuk node beban nol:

  1. Klik ganda nama node beban nol untuk membuka halaman edit node tersebut.

  2. Di sisi kanan halaman edit node, klik Scheduling.

  3. Di area Dependencies, klik Use Workspace Root Node untuk mengatur node root ruang kerja sebagai node leluhur dari node beban nol.

    image.png

  4. Simpan dan komit node tersebut.

    Penting

    Konfigurasikan properti Rerun dan Parent Nodes untuk node sebelum mengomitasinya.

    1. Klik ikon 保存 di bilah alat untuk menyimpan node.

    2. Klik ikon 提交 di bilah alat.

    3. Di kotak dialog Commit, masukkan Change Description.

    4. Klik Confirm.

Edit dan jalankan node ODPS SQL

Bagian ini menjelaskan cara menggunakan kode SQL dalam node ODPS_SQL insert_data untuk mengkueri jumlah orang lajang yang memiliki pinjaman rumah pada berbagai tingkat pendidikan dan menyimpan hasilnya. Hasil ini kemudian dapat digunakan oleh node turunan untuk analisis atau tampilan lebih lanjut.

  1. Buka editor untuk node ODPS SQL dan masukkan kode berikut.

    Untuk informasi selengkapnya tentang sintaksis, lihat SQL overview.

    INSERT OVERWRITE TABLE result_table  -- Masukkan data ke dalam tabel result_table.
    SELECT education
        , COUNT(marital) AS num
    FROM bank_data
    WHERE housing = 'yes'
        AND marital = 'single'
    GROUP BY education;
  2. Klik kanan bank_data dalam kode dan pilih Delete Input.

    Tabel bank_data yang dibuat dalam Buat tabel dan unggah data tidak dihasilkan oleh node yang dijadwalkan secara berkala. Jika suatu node memilih data dari tabel semacam itu, Anda dapat mengklik kanan nama tabel di editor kode dan menghapus input tersebut. Anda juga dapat menambahkan komentar aturan di bagian atas kode. Hal ini mencegah parser otomatis mengenali dependensi ini.删除输入

    Catatan

    Dependensi penjadwalan di DataWorks memastikan bahwa suatu node dapat memperoleh data tabel yang diperbarui secara berkala oleh node leluhurnya yang dijadwalkan. Ini menjamin keakuratan pengambilan data hilir. Oleh karena itu, platform tidak dapat memantau tabel yang tidak diperbarui oleh sistem penjadwalan DataWorks. Jika suatu node menggunakan pernyataan select untuk mengkueri data dari tabel yang tidak dihasilkan oleh node yang dijadwalkan secara berkala, Anda harus menghapus secara manual dependensi node leluhur yang secara otomatis dihasilkan oleh pernyataan select tersebut.

  3. Klik ikon 保存 di bilah alat untuk menyimpan kode Anda.

  4. Klik ikon 运行.

    Setelah kode dijalankan, Anda dapat melihat log dan hasil eksekusi di bagian bawah halaman.

Komit alur kerja

  1. Setelah menjalankan dan men-debug node ODPS_SQL insert_data, kembali ke halaman alur kerja.

  2. Klik ikon 提交.

  3. Di kotak dialog Commit, pilih node yang akan dikomit, masukkan Change Description, pilih apakah akan Force Modify, dan centang Ignore I/O Inconsistency Alerts.

  4. Klik Commit.

    Setelah alur kerja dikomit, Anda dapat melihat status komit node di daftar node di bawah Workflow. Jika ikon image.png muncul di sebelah kiri nama node, artinya node tersebut belum dikomit. Jika ikon image.png tidak muncul, artinya node tersebut telah dikomit.

Langkah selanjutnya

Anda telah mempelajari cara membuat dan mengomitasikan alur kerja. Anda dapat melanjutkan ke tutorial berikutnya, di mana Anda akan mempelajari cara membuat task sinkronisasi untuk menulis data ke berbagai jenis sumber data. Untuk informasi selengkapnya, lihat Create a sync task.