Alert umum di SchedulerX dan cara mengatasinya.
Apa arti "killed from server"?
Dalam kebanyakan kasus, SchedulerX menghentikan pekerjaan karena melebihi ambang batas timeout yang dikonfigurasi. Alert ini muncul ketika fitur penghentian otomatis berdasarkan timeout diaktifkan untuk pekerjaan tersebut.
Untuk mengatasi alert ini:
Buka Konsol SchedulerX dan periksa pengaturan timeout untuk pekerjaan yang terdampak.
Tentukan apakah pekerjaan benar-benar membutuhkan lebih banyak waktu atau justru macet:
Pekerjaan membutuhkan lebih banyak waktu: Tingkatkan nilai timeout agar sesuai dengan durasi eksekusi yang diharapkan.
Pekerjaan macet: Selidiki akar permasalahannya sebelum menaikkan batas timeout. Penyebab umum meliputi latensi layanan downstream, kontensi lock database, dan kehabisan sumber daya (CPU atau memori).
Catatan: Menaikkan batas timeout tanpa menyelidiki akar permasalahan dapat menyembunyikan isu kinerja yang mendasarinya.
Apa arti "don't update progress more than 30s"?
Agen SchedulerX berhenti mengirimkan pesan heartbeat ke server selama lebih dari 30 detik. Server menganggap agen tersebut terputus.
Penyebab umum:
| Penyebab | Deskripsi |
|---|---|
| Deployment atau restart | Agen tidak tersedia sementara selama rolling update atau restart. |
| Overload agen | Penggunaan CPU atau memori tinggi pada mesin agen menghambat pengiriman heartbeat tepat waktu. |
Untuk mengatasi alert ini:
Periksa penggunaan sumber daya mesin agen (CPU, memori, jaringan) pada saat alert dipicu.
Jika pemutusan disebabkan oleh deployment atau restart, konfigurasikan SchedulerX untuk secara otomatis menjalankan ulang pekerjaan yang gagal sehingga pulih tanpa intervensi manual.
Jika agen secara konsisten mengalami overload, tingkatkan sumber daya mesin agen atau distribusikan beban kerja ke agen tambahan.