Anda dapat melakukan backfill data untuk periode historis atau masa depan guna menulis data ke partisi berbasis waktu yang sesuai. Selama proses backfill data, parameter penjadwalan dalam kode secara otomatis diganti dengan nilai spesifik berdasarkan waktu bisnis yang dipilih. Kode bisnis tersebut kemudian menulis data untuk waktu yang sesuai ke partisi yang ditentukan. Partisi tujuan ditentukan oleh logika dan konten kode tugas.
Batasan izin
Anda harus memiliki izin operasi untuk semua node dalam alur kerja backfill data. Jika Anda tidak memiliki izin untuk salah satu node, konsekuensi berikut akan terjadi:
Tidak memiliki izin pada node target langsung: Jika Anda tidak memiliki izin operasi untuk node akar atau salah satu node turunannya, backfill data tidak dapat dijalankan.
Tidak memiliki izin pada node perantara: Jika node yang tidak memiliki izin merupakan node perantara dalam proses backfill data—artinya dependensi hulu dan hilirnya berada dalam cakupan backfill—sistem akan melakukan dry-run pada node tersebut.
Deskripsi dry-run: Setelah node dimulai, logika komputasi aktual tidak dijalankan. Sebaliknya, status "Succeeded" langsung dikembalikan untuk memastikan node turunannya dapat dipicu.
Peringatan risiko: Dry-run pada node perantara tidak menghasilkan data aktual. Hal ini dapat menyebabkan node turunannya menghasilkan output abnormal atau gagal karena kurangnya input. Harap berhati-hati.
Perhatian
Untuk memastikan stabilitas dan prediktabilitas operasi backfill data, bacalah aturan eksekusi berikut dengan cermat.
I. Siklus hidup instans dan retensi log
Pembersihan instans: Instans backfill data tidak dapat dihapus secara manual. Platform secara otomatis membersihkannya sekitar 30 hari setelah pembuatan. Jika suatu tugas tidak perlu lagi dijalankan, Anda dapat membekukan instansnya untuk menghentikan penjadwalannya.
Kebijakan retensi: Periode retensi untuk instans dan log bervariasi tergantung jenis kelompok sumber daya.
Jenis kelompok sumber daya
Kebijakan retensi instans
Kebijakan retensi log
Shared resource group for scheduling
30 hari
7 hari
Exclusive resource group for scheduling
30 hari
30 hari
Serverless resource group
30 hari
30 hari
Pembersihan log besar: Untuk instans yang telah selesai, platform secara rutin membersihkan log eksekusi yang melebihi 3 MB setiap hari.
II. Aturan eksekusi instans
Dependensi harian yang ketat: Backfill data dilakukan secara sekuensial berdasarkan waktu data. Instans untuk hari berikutnya hanya dimulai setelah semua instans hari sebelumnya berhasil. Jika ada instans yang gagal, eksekusi semua tugas untuk tanggal selanjutnya akan diblokir.
Perilaku konkurensi tugas per jam dan per menit: Saat Anda melakukan backfill data untuk semua instans pada hari tertentu, metode eksekusinya ditentukan oleh properti self-dependency tugas tersebut:
Self-dependency tidak diatur: Semua instans dalam satu hari, seperti pukul 00:00 dan 01:00, diizinkan berjalan dalam kelompok, selama dependensi hulunya terpenuhi.
Self-dependency diatur: Semua instans dalam satu hari dijalankan secara eksekusi sekuensial. Misalnya, instans pukul 01:00 menunggu instans pukul 00:00 berhasil sebelum dijalankan.
Konflik dengan instans yang dipicu otomatis: Untuk memastikan penjadwalan reguler, instans yang dipicu otomatis memiliki prioritas lebih tinggi daripada instans backfill data. Jika keduanya berjalan bersamaan, Anda harus secara manual menghentikan instans backfill data.
Penanganan node dalam blacklist: Jika node yang masuk daftar hitam merupakan node perantara dalam alur kerja backfill data, node tersebut juga akan melakukan dry-run, yang dapat memengaruhi output data dari node turunannya.
III. Sumber daya penjadwalan dan prioritas
Konfigurasikan sumber daya secara wajar: Terlalu banyak instans backfill data atau tingkat paralelisme yang tinggi akan mengonsumsi banyak sumber daya penjadwalan, yang dapat memengaruhi operasi normal tugas yang dipicu otomatis. Konfigurasikan sumber daya sesuai kebutuhan.
Kebijakan degradasi prioritas: Untuk melindungi operasi bisnis inti, platform secara dinamis menyesuaikan prioritas tugas berdasarkan waktu data dari backfill tersebut:
Backfill data untuk hari sebelumnya (T-1): Prioritas tugas tidak berubah dan ditentukan oleh prioritas garis dasar tempat tugas tersebut berada.
Backfill data historis (T-2 atau lebih awal): Prioritas tugas secara otomatis diturunkan sesuai aturan berikut:
Prioritas awal 7 atau 8 → Diturunkan menjadi 3
Prioritas awal 5 atau 3 → Diturunkan menjadi 2
Prioritas awal 1 → Tetap tidak berubah
Buat tugas data backfill
Langkah 1: Buka halaman Data Backfill
Buka halaman Operation Center.
Login ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi kiri, pilih . Pada halaman yang muncul, pilih ruang kerja yang diinginkan dari daftar drop-down lalu klik Go to Operation Center.
Di panel navigasi kiri, klik .
Untuk melakukan backfill data pada tugas yang dipicu otomatis, Anda juga dapat mengklik Backfill Data untuk tugas yang sesuai di halaman .
Langkah 2: Buat tugas data backfill
Di halaman Data Backfill, klik Create Data Backfill Task dan konfigurasikan parameter sesuai kebutuhan.
Konfigurasikan Basic Information.
Platform secara otomatis menghasilkan nama backfill data dalam format default. Anda dapat mengubah nama tersebut sesuai kebutuhan.
Pilih node yang akan di-backfill datanya.
Anda dapat melakukan backfill data untuk tugas yang memiliki izin operasi menggunakan salah satu metode berikut: Manually Select, Select By Link, Select By Workspace, dan Specify Task and All Downstream Tasks. Berdasarkan tugas yang dipilih, Anda juga dapat memilih tugas lain untuk di-backfill datanya. Parameter konfigurasi berbeda untuk setiap metode.
Manually Select
Pilih satu atau beberapa node sebagai node akar, lalu pilih node turunan dari node akar tersebut sebagai cakupan backfill data ini. Metode ini kompatibel dengan solusi backfill data asli Current Node, Current Node and Descendant Nodes, dan Advanced Mode.
Tabel berikut menjelaskan parameternya.
Parameter
Deskripsi
Task Selection Method
Pilih Manually Select.
Search For Root Tasks
Anda dapat mencari dan menambahkan tugas akar berdasarkan nama atau ID. Anda juga dapat mengklik Batch Add dan menentukan kondisi seperti kelompok sumber daya, siklus penjadwalan, dan ruang kerja untuk menambahkan beberapa tugas akar sekaligus.
CatatanAnda hanya dapat memilih node dari ruang kerja tempat Anda menjadi anggota.
Selected Data Backfills
Node yang akan di-backfill datanya. Daftar ini menampilkan node akar yang telah ditambahkan. Anda dapat memilih node turunan yang akan di-backfill berdasarkan node akar tersebut.
CatatanAnda dapat memfilter node turunan berdasarkan tingkat dependensi. Node turunan langsung dari node akar berada di tingkat pertama secara default, dan seterusnya.
Jumlah maksimum node akar yang dapat di-backfill secara bersamaan adalah 500. Jumlah total maksimum node (node akar dan turunannya) adalah 2.000 (3.000 di wilayah China (Beijing) dan China (Hangzhou)).
Task Blacklist
Jika suatu node tidak memerlukan data backfill, tambahkan ke daftar hitam. Node dalam daftar hitam tidak akan dimasukkan dalam data backfill ini.
CatatanAnda hanya dapat menambahkan tugas akar ke daftar hitam. Jika data backfill tidak diperlukan untuk tugas anak dari tugas akar, hapus dari Selected Data Backfill List.
Jika node dalam daftar hitam merupakan node perantara dalam data backfill ini (artinya dependensi hulu dan hilirnya berada dalam cakupan backfill), node tersebut akan melakukan dry-run agar node turunannya tetap dapat berjalan. Dry-run langsung mengembalikan status sukses tanpa benar-benar dijalankan. Namun, hal ini dapat menyebabkan output data abnormal pada node turunannya.
Select by Link
Pilih satu node awal dan satu atau beberapa node akhir. Melalui analisis otomatis, semua node di antara node awal dan akhir termasuk dalam cakupan backfill data ini, termasuk node awal dan akhir tersebut.
Tabel berikut menjelaskan parameternya.
Parameter
Deskripsi
Task Selection Method
Pilih By Link.
Search Tasks
Cari berdasarkan nama atau ID untuk menambahkan node awal dan satu atau beberapa node akhir. Platform akan menganalisis node perantara berdasarkan node awal dan akhir tersebut. Node perantara adalah turunan langsung atau tidak langsung dari node awal dan leluhur langsung atau tidak langsung dari node akhir.
Intermediate Tasks
Daftar node perantara yang dianalisis secara otomatis oleh platform berdasarkan node awal dan akhir.
CatatanDaftar hanya menampilkan 2.000 node. Node yang melebihi batas ini tidak akan ditampilkan tetapi tetap dieksekusi secara normal.
Task Blacklist
Jika suatu node tidak memerlukan data backfill, tambahkan ke daftar hitam. Node dalam daftar hitam tidak akan dimasukkan dalam data backfill ini.
CatatanJika node dalam daftar hitam merupakan node perantara dalam data backfill ini (artinya dependensi hulu dan hilirnya berada dalam cakupan backfill), node tersebut akan melakukan dry-run agar node turunannya tetap dapat berjalan. Dry-run langsung mengembalikan status sukses tanpa benar-benar dijalankan. Namun, hal ini dapat menyebabkan output data abnormal pada node turunannya.
Select by Workspace
Pilih sebuah node sebagai node akar dan tentukan cakupan backfill data ini berdasarkan ruang kerja tempat node turunannya berada. Metode ini kompatibel dengan solusi backfill data asli Massive Nodes Mode.
CatatanMetode ini kompatibel dengan solusi backfill data asli untuk Massive Nodes Mode.
Konfigurasi daftar hitam node tidak didukung.
Tabel berikut menjelaskan parameternya.
Parameter
Deskripsi
Task Selection Method
Pilih By Workspace.
Search Root Tasks
Cari dan tambahkan node akar berdasarkan nama atau ID. Platform akan melakukan backfill data untuk node di ruang kerja tempat node turunan dari node akar tersebut berada.
CatatanAnda hanya dapat memilih node dari ruang kerja tempat Anda menjadi anggota.
Include Root Node
Menentukan apakah data backfill ini mencakup node akar.
Workspaces For Data Backfill
Berdasarkan ruang kerja tempat node turunan dari node akar berada, pilih ruang kerja mana yang nodenya perlu di-backfill datanya.
CatatanAnda hanya dapat memilih ruang kerja DataWorks di wilayah saat ini untuk operasi data backfill.
Setelah memilih ruang kerja, data akan di-backfill untuk semua node di ruang kerja tersebut secara default. Anda dapat menyesuaikan daftar hitam dan daftar putih untuk data backfill sesuai kebutuhan.
Task Whitelist
Node yang tetap memerlukan data backfill, selain node yang sudah termasuk dalam ruang kerja yang dipilih.
Task Blacklist
Node di ruang kerja yang dipilih yang tidak memerlukan data backfill.
Specify Task and All Descendants
Setelah memilih node akar, platform secara otomatis menganalisis dan memasukkan node tersebut beserta semua node turunannya ke dalam cakupan backfill data ini.
PentingAnda hanya dapat melihat node yang dipicu saat tugas backfill data sedang berjalan. Gunakan fitur ini dengan hati-hati.
Tabel berikut menjelaskan parameternya.
Parameter
Deskripsi
Task Selection Method
Pilih Specify Task And All Downstream Tasks.
Search Root Task
Cari dan tambahkan node akar berdasarkan nama atau ID. Platform akan melakukan backfill data untuk node akar dan semua node turunannya.
CatatanAnda hanya dapat memilih node dari ruang kerja tempat Anda menjadi anggota.
Jika node akar yang dipilih tidak memiliki node turunan, hanya data untuk node akar tersebut yang akan di-backfill setelah tugas data backfill dikirim.
Task Blacklist
Jika suatu node tidak memerlukan data backfill, tambahkan ke daftar hitam. Node dalam daftar hitam tidak akan dimasukkan dalam data backfill ini.
CatatanJika node dalam daftar hitam merupakan node perantara dalam data backfill ini (artinya dependensi hulu dan hilirnya berada dalam cakupan backfill), node tersebut akan melakukan dry-run agar node turunannya tetap dapat berjalan. Dry-run langsung mengembalikan status sukses tanpa benar-benar dijalankan. Namun, hal ini dapat menyebabkan output data abnormal pada node turunannya.
Konfigurasikan kebijakan eksekusi backfill data.
Konfigurasikan informasi seperti waktu eksekusi, apakah akan dijalankan dalam kelompok, apakah akan memicu peringatan, dan kelompok sumber daya yang akan digunakan untuk tugas backfill data, sesuai kebutuhan.
Tabel berikut menjelaskan parameternya.
Parameter
Deskripsi
Data Timestamp
Anda dapat menentukan waktu data yang akan di-backfill. Sistem menerapkan kebijakan eksekusi berbeda berdasarkan tanggal dan opsi yang Anda pilih:
Skenario 1: Backfill data historis (Waktu data < Tanggal saat ini)
Ini adalah skenario data backfill paling umum. Ketika waktu data yang dipilih lebih awal dari hari ini, sistem langsung membuat dan menjalankan instans tugas untuk tanggal historis tersebut guna merekalkulasi data masa lalu.
Kasus penggunaan: Memperbaiki kesalahan data historis, mengisi data yang hilang.
Metode eksekusi: Eksekusi segera.
Skenario 2: Jadwalkan tugas masa depan (Waktu data > Tanggal saat ini)
Jika Anda memilih waktu data masa depan dan tidak memilih opsi khusus apa pun, ini akan membuat tugas terjadwal sekali untuk masa depan.
Kasus penggunaan: Menjadwalkan tugas sekali untuk tanggal masa depan yang telah diketahui.
Metode eksekusi: Eksekusi pada waktu yang dijadwalkan. Instans dibuat dan masuk ke status menunggu. Instans akan berjalan otomatis sesuai konfigurasi penjadwalan tugas saat waktu data yang sesuai tiba.
Skenario 3: Jalankan tugas masa depan lebih awal (Waktu data > Tanggal saat ini, dengan opsi Jalankan segera dipilih)
Immediately Run Future-scheduled Data Backfill Instances adalah opsi lanjutan yang memungkinkan Anda langsung memulai instans yang dijadwalkan untuk berjalan di masa depan. Waktu eksekusi tugas adalah sekarang, tetapi logika bisnis dan partisi data yang diproses adalah untuk tanggal masa depan.
Kasus penggunaan: Memvalidasi logika tugas untuk tanggal masa depan lebih awal, atau menyiapkan data di partisi tertentu untuk migrasi atau pengujian data.
Metode eksekusi: Eksekusi segera setelah dipilih.
Contoh: Tanggal saat ini adalah
2024-03-12. Anda memilih untuk melakukan backfill data untuk2024-03-17dan memilih opsi Run Data Backfill Instances With A Scheduled Time Later Than The Current Time Immediately. Maka, instans tugas akan langsung dimulai pada2024-03-12, tetapi parameter waktu data yang digunakan saat runtime (misalnya, untuk menentukan partisi data) adalah2024-03-17.
CatatanKonsep waktu data: Dalam komputasi offline, tugas biasanya memproses data kemarin (T-1) hari ini (T). Fitur data backfill memungkinkan Anda mengontrol secara tepat data hari mana yang diproses oleh tugas dengan menghasilkan instans untuk "waktu data" tertentu.
Rentang waktu ganda: Untuk melakukan backfill data pada beberapa tanggal tidak berurutan, klik [Add] untuk mengonfigurasi beberapa rentang waktu.
Perencanaan sumber daya: Satu data backfill sebaiknya tidak mencakup periode panjang. Banyak instans data backfill akan mengonsumsi sumber daya penjadwalan dan dapat memengaruhi operasi tugas otomatis reguler.
Time Range
Menentukan periode waktu saat tugas yang dipilih perlu dijalankan. Instans yang waktu penjadwalannya berada dalam periode tersebut dapat dihasilkan dan dijalankan. Anda dapat mengonfigurasi parameter ini agar tugas yang dijadwalkan per jam atau per menit hanya melakukan backfill data dalam periode waktu tertentu. Nilai default:
00:00 hingga 23:59.CatatanInstans yang waktu penjadwalannya tidak berada dalam periode tersebut tidak akan dihasilkan. Jika tugas dengan siklus lebih panjang bergantung pada tugas dengan siklus lebih pendek (misalnya, tugas harian bergantung pada tugas per jam), instans terisolasi dapat dihasilkan dan memblokir eksekusi tugas.
Ubah parameter ini hanya jika tugas yang dijadwalkan per jam atau per menit perlu melakukan backfill data untuk periode tertentu.
Group Run
Jika Anda melakukan backfill data untuk beberapa waktu data, Anda dapat menentukan jumlah kelompok untuk menjalankan tugas data backfill secara konkuren. Nilainya adalah:
Yes: Platform akan menghasilkan beberapa batch data backfill berdasarkan jumlah kelompok yang ditentukan dan menjalankan batch tersebut secara konkuren dalam kelompok.
No: Instans data backfill dijalankan secara sekuensial sesuai urutan waktu datanya, di mana instans baru hanya dimulai setelah instans sebelumnya selesai.
CatatanSaat Anda melakukan backfill data untuk hari tertentu pada tugas yang dijadwalkan per jam atau per menit, apakah instans tugas dijalankan secara konkuren dalam kelompok tergantung pada apakah self-dependency diatur untuk tugas tersebut.
Anda dapat menentukan jumlah kelompok dalam rentang
2~10. Berikut ini cara beberapa instans dijalankan secara konkuren dalam kelompok:Jika rentang waktu data lebih kecil dari jumlah kelompok, tugas dijalankan secara konkuren dalam kelompok.
Misalnya, jika waktu data dari
11 Januari hingga 13 Januaridan jumlah kelompok adalah 4, hanya tiga instans data backfill yang dihasilkan, satu untuk setiap waktu data. Ketiga instans tersebut dijalankan secara konkuren dalam kelompok.Jika jumlah waktu data lebih besar dari jumlah kelompok, platform menjalankan kombinasi tugas serial dan paralel berdasarkan Order waktu data.
Misalnya, jika waktu data dari
11 Januari hingga 13 Januaridan Anda mengatur jumlah kelompok menjadi 2, dua instans data backfill dihasilkan dan dijalankan secara paralel. Salah satu instans tersebut berisi dua waktu data, dan tugas yang sesuai dengan waktu data tersebut dijalankan secara sekuensial.
Data Backfill Alerting
Atur apakah operasi data backfill ini akan memicu peringatan.
Yes: Peringatan dihasilkan untuk data backfill jika kondisi pemicu terpenuhi.
No: Data backfill ini tidak akan memicu peringatan.
Trigger Condition
Hanya ketika Alerts For Data Backfill diatur ke Yes, Anda dapat menentukan kondisi pemicu peringatan:
Alert On Failure Or Success: Peringatan dihasilkan terlepas dari keberhasilan atau kegagalan data backfill.
Alert On Success: Peringatan dihasilkan jika data backfill berhasil.
Alert On Failure: Peringatan dihasilkan jika data backfill gagal.
Alert Notification Method
Anda dapat memilih menerima peringatan melalui Text Message And Email, Text Message, atau Email hanya jika Alerts For Data Backfill diatur ke Yes. Penerima peringatan adalah inisiator data backfill.
CatatanAnda dapat mengklik Check Contact Information untuk memverifikasi apakah nomor ponsel atau alamat email kontak peringatan telah terdaftar. Jika belum terdaftar, Anda dapat merujuk ke View and set alert contacts untuk mengonfigurasi informasi tersebut.
Order
Pilih Ascending By Business Date atau Descending By Business Date sebagai urutan untuk data backfill.
Resource Group For Scheduling
Tentukan kelompok sumber daya yang digunakan untuk menjalankan instans data backfill.
Follow Task Configuration: Menggunakan kelompok sumber daya yang dikonfigurasi untuk tugas yang dipicu otomatis guna mengeksekusi instans data backfill.
Specify Scheduling Resource Group: Gunakan kelompok sumber daya tertentu untuk mengeksekusi instans data backfill. Ini mencegah instans data backfill bersaing sumber daya dengan instans berulang.
CatatanPastikan kelompok sumber daya memiliki konektivitas jaringan, jika tidak tugas dapat gagal. Jika kelompok sumber daya yang ditentukan tidak disambungkan ke ruang kerja terkait, kelompok sumber daya asli dari tugas yang dipicu otomatis akan digunakan.
Kami menyarankan Anda menggunakan Serverless Resource Groups atau Exclusive Resource Groups for Scheduling, yang menyediakan kelompok sumber daya komputasi khusus untuk memastikan transmisi data cepat dan stabil saat tugas berjalan dengan konkurensi tinggi dan tidak dapat di-stagger.
Execution Period
Tentukan kapan tugas data backfill yang dihasilkan kali ini akan dieksekusi.
Follow Task Configuration: Instans data backfill dijalankan pada waktu yang dijadwalkan.
Specify Time Period: Tugas data backfill dipicu untuk dijalankan hanya dalam periode waktu yang ditentukan. Tetapkan periode waktu eksekusi yang sesuai berdasarkan jumlah tugas yang perlu di-backfill.
CatatanTugas yang berada dalam status tidak berjalan di luar periode waktu ini tidak akan dieksekusi. Tugas yang sedang berjalan di luar periode waktu ini akan terus dieksekusi.
Compute Resource
Saat ini, hanya sumber daya komputasi EMR dan Serverless Spark yang dapat diatur sebagai sumber daya komputasi untuk data backfill.
Pastikan sumber daya komputasi yang dipetakan tersedia dan aktif, jika tidak penjadwalan tugas dapat terganggu.
Konfigurasikan kebijakan validasi tugas backfill data.
Ini digunakan untuk mengonfigurasi apakah eksekusi tugas dihentikan jika validasi backfill data gagal. Platform memeriksa informasi dasar dan potensi risiko tugas backfill data ini, sebagai berikut:
Informasi dasar: Jumlah node yang terlibat dalam backfill data ini, jumlah instans yang dihasilkan, dan apakah terdapat situasi seperti loop node, node terisolasi, atau instans tanpa izin.
Deteksi risiko: Memeriksa loop dependensi tugas dan node terisolasi. Keduanya dapat menyebabkan tugas berjalan abnormal. Anda dapat mengatur opsi untuk menghentikan tugas backfill data jika pemeriksaan gagal.
Klik Submit. Tugas backfill data dibuat.
Langkah 3: Jalankan tugas data backfill
Saat waktu eksekusi yang dikonfigurasi untuk tugas backfill data tercapai dan tidak ditemukan anomali, tugas backfill data secara otomatis dipicu dan dijalankan.
Tugas backfill data tidak dijalankan jika kondisi berikut terpenuhi:
Fitur verifikasi diaktifkan untuk tugas backfill data dan verifikasi gagal. Untuk informasi selengkapnya, lihat Langkah 2: Buat tugas backfill data.
Jika pemeriksaan ekstensi diaktifkan untuk operasi backfill data, kegagalan pemeriksaan akan memblokir tugas agar tidak berjalan. Untuk informasi selengkapnya, lihat Extension Program Overview.
Kelola instans data backfill
Kueri instans data backfill
Di panel navigasi kiri, klik .

Di sisi kanan halaman Data Backfill, klik Expand Search dan tentukan kondisi filter, seperti Data Backfill Name, Status, dan Task Type, untuk mencari instans. Anda juga dapat menghentikan beberapa tugas backfill data yang sedang berjalan sekaligus.
Lihat status instans data backfill

Di area ini, Anda dapat melihat informasi tentang instans backfill data, termasuk:
Task Name: Nama instans backfill data. Klik ikon
di sebelah nama instans untuk melihat tanggal eksekusi, status eksekusi, serta node yang termasuk dan detail eksekusinya.Check Status: Status pemeriksaan instans backfill data saat ini.
Running Status: Status instans backfill data. Nilai yang valid adalah Succeeded, Run failed, Waiting for resources, dan Pending. Anda dapat melakukan troubleshooting berdasarkan status abnormal.
Nodes: Jumlah node dalam instans backfill data.
Data Timestamp: Tanggal saat instans backfill data dijalankan.
Lihat Task Analysis Results: Anda dapat melihat perkiraan jumlah instans yang dihasilkan, tanggal eksekusi, dan hasil pemeriksaan risiko untuk segera menangani tugas yang terblokir.

Actions: Anda dapat melakukan operasi seperti Batch Stop, Batch Rerun, dan Reuse pada instans backfill data.
Nama Operasi
Deskripsi
Batch Stop
Anda dapat menghentikan instans data backfill secara batch yang berada dalam status Running. Setelah operasi ini dilakukan, instans terkait diatur ke status Failed.
CatatanAnda tidak dapat menghentikan instans dengan status Not Running, Succeeded, atau Failed.
Batch Rerun
Menjalankan ulang instans data backfill secara batch.
CatatanHanya instans dalam status Succeeded atau Failed yang dapat dijalankan ulang.
Jika Anda melakukan operasi ini, instans data backfill yang dipilih akan segera dijalankan ulang secara bersamaan. Dependensi penjadwalan antar instans tidak dipertimbangkan. Jika Anda ingin menjalankan ulang instans data backfill secara berurutan, Anda dapat memilih Rerun Descendant Nodes atau melakukan operasi Data Backfill lagi.
Reuse
Anda dapat memilih untuk menggunakan kembali set node dari operasi data backfill sebelumnya, sehingga memudahkan pemilihan cepat node yang akan di-backfill datanya.
Kelola tugas data backfill

Di area ini, Anda dapat melihat informasi tentang node yang termasuk dalam instans backfill data, termasuk:
Name: Klik nama node untuk membuka halaman detail node dan melihat informasi node lebih lanjut.
Scheduling Time: Waktu eksekusi terjadwal untuk tugas node.
Start Run Time: Waktu saat tugas node mulai dijalankan.
End Time: Waktu saat tugas node selesai dijalankan.
Runtime: Durasi waktu tugas node dijalankan.
Actions: Anda dapat melihat DAG, atau Stop atau Rerun tugas node backfill data.
Nama Operasi
Deskripsi
DAG
Lihat DAG tugas untuk mengidentifikasi tugas leluhur dan turunan dari tugas tersebut. Untuk informasi selengkapnya, lihat Appendix: Use the features provided in a DAG.
Stop
Anda dapat menghentikan node yang berada dalam status Running. Setelah operasi ini dilakukan, status node diatur ke Failed.
CatatanAnda tidak dapat menghentikan node dalam status Not Run, Succeeded, atau Failed.
Operasi ini akan menyebabkan instans gagal dan memblokir eksekusi node turunannya. Harap waspada terhadap risiko dan berhati-hatilah.
Rerun
Menjalankan ulang tugas node target.
CatatanAnda hanya dapat menjalankan ulang node dengan status Succeeded atau Failed.
More
Rerun Descendant Nodes
Menjalankan ulang node turunan dari tugas node target.
Set Status To Successful
Mengatur status tugas node ini menjadi Succeeded.
Freeze
Mengatur node saat ini ke status dijeda (dibekukan) dan menghentikan penjadwalannya.
CatatanAnda tidak dapat membekukan tugas yang berada dalam status Waiting For Resources, Waiting For Scheduling Time, atau Running. Status Running mencakup kasus di mana kode node sedang berjalan atau pemeriksaan kualitas data sedang berlangsung.
Resume (Restore)
Melanjutkan penjadwalan untuk node yang dijeda (dibekukan).
View Lineage
Lihat graf alur data node tersebut.
Anda dapat memilih satu atau beberapa node tugas lalu mengklik Stop atau Rerun untuk menghentikan atau menjalankan ulang secara batch.
Deskripsi status instans
Jenis Status | Ikon Status |
Status Succeeded |
|
Status Not Run |
|
Status Failed |
|
Status Running |
|
Status Waiting |
|
Status Frozen |
|





