全部产品
Search
文档中心

DataWorks:Pengisian Ulang Data

更新时间:Jul 02, 2025

Topik ini menjawab beberapa pertanyaan umum tentang pengisian ulang data.

Untuk apa fitur pengisian ulang data digunakan?

Fitur pengisian ulang data digunakan untuk mengisi ulang data historis atau data masa depan pada node pemicu otomatis. Parameter penjadwalan yang dikonfigurasikan untuk node tersebut akan diganti secara otomatis berdasarkan cap waktu data yang ditentukan. Gambar berikut menunjukkan cara menulis data tambahan dari sumber data MySQL ke partisi berbasis waktu tertentu di MaxCompute. Incremental data synchronization

Instansi pengisian ulang data untuk sebuah node yang dijadwalkan berjalan per jam atau menit tidak berjalan secara paralel setelah saya mengaktifkan fitur paralelisme untuk instansi pengisian ulang data. Apa yang harus saya lakukan?

  • Deskripsi Masalah

    Instansi pengisian ulang data untuk node yang dijadwalkan per jam atau menit tidak berjalan secara paralel meskipun fitur paralelisme telah diaktifkan.

  • Penyebab

    Fitur paralelisme memungkinkan beberapa instansi pengisian ulang data untuk node harian dijalankan secara bersamaan selama beberapa hari berdasarkan cap waktu data. Namun, untuk node yang dijadwalkan per jam atau menit, pelaksanaan paralel bergantung pada konfigurasi ketergantungan diri, bukan fitur paralelisme. Untuk informasi lebih lanjut tentang ketergantungan diri, lihat Skenario 2: Konfigurasikan ketergantungan penjadwalan untuk node yang bergantung pada instansi siklus sebelumnya.

  • Solusi

    • Jika fitur paralelisme tidak diaktifkan, hanya satu instansi pengisian ulang data yang dihasilkan dan dijalankan secara berurutan berdasarkan cap waktu data.

    • Jika fitur paralelisme diaktifkan, Anda dapat menentukan maksimal 10 instansi pengisian ulang data untuk dijalankan secara bersamaan berdasarkan cap waktu data.

    Contoh skenario: Anda ingin mengisi ulang data selama seminggu untuk node yang dijadwalkan per jam atau menit.

    • Jika ketergantungan diri dikonfigurasikan, satu instansi pengisian ulang data dijalankan beberapa kali secara berurutan setiap hari berdasarkan cap waktu data.

    • Jika ketergantungan diri tidak dikonfigurasikan, beberapa instansi pengisian ulang data dijalankan secara paralel setiap hari berdasarkan cap waktu data.

Instansi pengisian ulang data untuk sebuah node tidak dijalankan setelah saya menentukan cap waktu data untuk pengisian ulang data. Instansi pengisian ulang data berada dalam status Tertunda (Jadwal) dan disorot dengan warna kuning dalam DAG dari node tersebut. Mengapa hal ini terjadi?

  • Deskripsi Masalah

    Instansi pengisian ulang data untuk sebuah node tidak dijalankan setelah menentukan cap waktu data. Instansi tersebut berstatus Tertunda (Jadwal) dan disorot dengan warna kuning pada grafik asiklik terarah (DAG).

  • Penyebab

    Jika parameter Cap Waktu Data ditetapkan ke rentang waktu yang lebih lambat dari waktu saat ini, instansi pengisian ulang data berstatus Tertunda (Jadwal).

  • Solusi

    Pilih kotak centang Jalankan Instansi Retroaktif yang Dijadwalkan Berjalan Setelah Waktu Saat Ini. Scheduling time for instances that are run in parallel

    Catatan
    • Jika parameter Cap Waktu Data ditetapkan ke rentang waktu di masa depan dan kotak centang tidak dipilih, instansi pengisian ulang data berstatus Tertunda (Jadwal) dengan sorotan kuning pada DAG.

    • Jika parameter Cap Waktu Data ditetapkan ke rentang waktu di masa depan dan kotak centang dipilih, DataWorks menjalankan instansi pengisian ulang data segera setelah cap waktu data berlalu.

Mengapa instansi pengisian ulang data untuk node pemicu otomatis berada dalam status Tertunda (Jadwal) setelah saya menentukan hari sebelumnya atau hari saat ini untuk parameter Cap Waktu Data?

  • Deskripsi Masalah

    Instansi pengisian ulang data untuk node pemicu otomatis berstatus Tertunda (Jadwal) setelah menentukan hari sebelumnya atau hari saat ini sebagai parameter Cap Waktu Data.

  • Penyebab

    DataWorks menjalankan node pemicu otomatis pada hari saat ini berdasarkan data dengan cap waktu data dari hari sebelumnya. Proses pengisian ulang data untuk cap waktu data tertentu pada node pemicu otomatis setara dengan proses menjalankan ulang instansi yang dihasilkan berdasarkan cap waktu data.

    Untuk mencari instansi node pemicu otomatis yang dijadwalkan berjalan pada hari saat ini, atur parameter Cap Waktu Data ke T1 pada halaman Instance Siklus di Pusat Operasi. Cap waktu data dari instansi tersebut adalah hari sebelumnya, sedangkan waktu penjadwalannya adalah hari saat ini. Search for an auto triggered node instance that is scheduled to run on the current day

Mengapa beberapa instansi pengisian ulang data dihasilkan untuk sebuah node ketika saya melakukan pengisian ulang data untuk rentang waktu dari 00:00 hingga 01:00 untuk node tersebut?

  • Deskripsi Masalah

    Beberapa instansi pengisian ulang data dihasilkan ketika melakukan pengisian ulang data untuk rentang waktu 00:00 hingga 01:00 pada sebuah node.

  • Penyebab

    Jumlah instansi pengisian ulang data yang dihasilkan bervariasi berdasarkan waktu penjadwalan yang ditentukan untuk node tersebut.

    • Contoh 1: Jika node dijadwalkan setiap jam dari 00:00 hingga 23:59, dua instansi pengisian ulang data dihasilkan dan dijadwalkan berjalan pada 00:00 dan 01:00 secara terpisah.

    • Contoh 2: Jika node dijadwalkan setiap 30 menit dari 00:00 hingga 23:59, tiga instansi pengisian ulang data dihasilkan dan dijadwalkan berjalan pada 00:00, 00:30, dan 01:00 secara terpisah.

Jika sejumlah besar instansi pengisian ulang data dihasilkan untuk sebuah node, beberapa dari instansi pengisian ulang data tersebut berada dalam status Tertunda (Sumber Daya) dan disorot dengan warna kuning dalam DAG dari node tersebut. Mengapa hal ini terjadi?

  • Deskripsi Masalah

    Beberapa instansi pengisian ulang data berstatus Tertunda (Sumber Daya) dengan sorotan kuning pada DAG ketika banyak instansi dihasilkan untuk sebuah node.

  • Penyebab

    Jumlah utas paralel yang didukung oleh grup sumber daya terbatas. Jika jumlah instansi paralel melebihi kapasitas yang didukung, instansi berlebih berstatus Tertunda (Sumber Daya).

    Catatan

    Untuk informasi tentang cara menyelesaikan masalah ini, lihat Node yang sedang menunggu sumber daya.

Saya menerima pesan kesalahan, yang menunjukkan bahwa waktu penjadwalan sebuah node yang memerlukan pengisian ulang data tidak berada dalam rentang cap waktu data yang ditentukan. Mengapa?

  • Deskripsi Masalah

    Pesan kesalahan muncul yang menunjukkan bahwa waktu penjadwalan sebuah node tidak berada dalam rentang cap waktu data yang ditentukan.

  • Penyebab

    Rentang waktu untuk penjadwalan tidak ditentukan untuk node yang dijadwalkan per jam atau menit. Akibatnya, instansi pengisian ulang data tidak dihasilkan untuk node tersebut.

Saya mengaktifkan fitur pengisian ulang data untuk sebuah node, tetapi tidak ada instansi pengisian ulang data yang dihasilkan. Mengapa?

  • Deskripsi Masalah

    Fitur pengisian ulang data diaktifkan untuk sebuah node, tetapi tidak ada instansi pengisian ulang data yang dihasilkan.

  • Penyebab

    Instansi pengisian ulang data hanya dapat dihasilkan jika waktu penjadwalan node berada dalam periode efektif penjadwalan yang ditentukan. Pastikan waktu penjadwalan node memenuhi persyaratan. Properties tab

Bagaimana cara saya mengisi ulang data untuk node yang dijadwalkan berjalan per minggu atau bulan?

  • Deskripsi: Saat mengisi ulang data untuk node yang dijadwalkan berjalan per minggu atau bulan, pilih hari sebelumnya sebelum waktu penjadwalan sebagai cap waktu data. Sistem penjadwalan hanya menjalankan node tersebut pada hari yang ditentukan setiap minggu atau bulan. Pada hari-hari lain, instansi uji coba kering dihasilkan tetapi tidak benar-benar dijalankan. Untuk informasi lebih lanjut, lihat Skenario 1: Sebuah instansi dijadwalkan berjalan pada hari tertentu setiap minggu atau setiap bulan.

    Catatan
  • Contoh Skenario: Pengisian Ulang Data untuk Node yang Dijadwalkan Berjalan Per Bulan

    Jika node dijadwalkan berjalan pada 00:00 di hari pertama setiap bulan, atur cap waktu data untuk pengisian ulang data ke hari terakhir bulan sebelumnya. Backfill data for a node scheduled to run by month