Jika kesalahan hung terjadi saat Anda menghapus cgroups di instance Elastic Compute Service (ECS), gunakan solusi dalam topik ini untuk memperbaiki masalah tersebut.
Deskripsi masalah
[3302742.447940] Kernel panic - not syncing: softlockup: hung tasks
[3302742.448677] CPU: 18 PID: 1 Comm: systemd Kdump: loaded Tainted: G OEL ------------ T 3.10.0-862.14.4.el7.x86_64 #1
[3302742.450167] Hardware name: Alibaba Cloud Alibaba Cloud ECS, BIOS 8a46cfe 04/01/2014
[3302742.462123] [] mem_cgroup_reparent_charges+0x16d/0x3c0
[3302742.463243] [] mem_cgroup_css_offline+0x84/0x140
[3302742.464327] [] cgroup_destroy_locked+0xea/0x370
[3302742.465414] [] cgroup_rmdir+0x22/0x40
[3302742.466434] [] vfs_rmdir+0xdc/0x150
[3302742.467449] [] do_rmdir+0x1f1/0x220
[3302742.468470] [] ? ____fput+0xe/0x10
[3302742.469495] [] ? task_work_run+0xc0/0xe0
[3302742.470578] [] SyS_rmdir+0x16/0x20
[3302742.471628] [] system_call_fastpath+0x22/0x27Penyebab
Saat Anda menghapus cgroups di instance, sistem secara berulang menghitung ukuran halaman memori yang digunakan ke dalam hierarki atas cgroups. Jika cgroups tersebut menggunakan sejumlah besar memori, sistem membutuhkan waktu lama untuk menyelesaikan perhitungan. Selama proses ini, sistem tidak memiliki titik pengujian penjadwalan, sehingga menyebabkan kesalahan softlockup.
Solusi
Sebelum melakukan operasi pada instance tempat masalah terjadi, kami sarankan Anda membuat snapshot untuk mencadangkan data. Hal ini mencegah hilangnya data akibat operasi yang tidak disengaja. Untuk informasi tentang cara membuat snapshot, lihat Buat snapshot.
- Jika instance Anda menjalankan sistem operasi CentOS, kami sarankan Anda meningkatkan versi kernel.
- Jalankan perintah berikut untuk meningkatkan versi kernel:
yum update kernel - Jalankan perintah berikut untuk me-restart instance:
reboot - Jalankan perintah berikut untuk memeriksa apakah versi kernel adalah 3.10.0-1160 atau yang lebih baru:
uname -r
- Jalankan perintah berikut untuk meningkatkan versi kernel:
- Jika instance Anda menjalankan sistem operasi Alibaba Cloud Linux, kesalahan softlockup tidak akan terjadi.
- Jika instance Anda menjalankan sistem operasi lain, kami sarankan Anda secara manual meningkatkan versi kernel ke 4.17 atau yang lebih baru.
Jika Anda memiliki permintaan atau umpan balik, ajukan tiket untuk menghubungi Alibaba Cloud.