Peristiwa sistem digunakan untuk mencatat dan memberi tahu informasi sumber daya cloud, seperti pelaksanaan tugas pemeliharaan, pengecualian sumber daya, dan perubahan status sumber daya. Anda dapat menggunakan peristiwa sistem untuk mendapatkan informasi tentang risiko dan anomali pada sumber daya Elastic Compute Service (ECS). Sebagai contoh, sebuah peristiwa sistem dihasilkan ketika suatu instance harus dimigrasi karena peningkatan di tingkat bawah atau ketika suatu instance di-restart karena pemeliharaan sistem. Anda dapat menanggapi dan menangani peristiwa sistem secepat mungkin untuk mencegah bisnis Anda terpengaruh oleh ketidaktersediaan atau penurunan kinerja sumber daya ECS. Topik ini memberikan ringkasan peristiwa sistem yang didukung oleh ECS, termasuk peristiwa pemeliharaan terjadwal, peristiwa pemeliharaan tak terduga, peristiwa penagihan instance, dan peristiwa perubahan status instance. Topik ini juga memberikan saran tentang cara menangani peristiwa sistem tersebut.
Format kode peristiwa ECS dan nama peristiwa CloudMonitor
Peristiwa sistem ECS disinkronkan ke CloudMonitor, memungkinkan Anda menyiapkan mekanisme O&M otomatis berdasarkan peristiwa sistem. Kode peristiwa ECS dan nama peristiwa CloudMonitor mengikuti konvensi penamaan tertentu.
Kode peristiwa ECS menunjukkan penyebab peristiwa dan dampaknya pada sumber daya, dengan format
<Penyebab Peristiwa>.<Dampak Peristiwa>.Nama peristiwa CloudMonitor menunjukkan jenis sumber daya, penyebab peristiwa, dampak peristiwa pada sumber daya, serta status peristiwa, dengan format
<Jenis Sumber Daya>:<Penyebab Peristiwa>.<Dampak Peristiwa>:<Status Peristiwa>.
Kode peristiwa ECS dan nama peristiwa CloudMonitor mungkin hanya mencakup beberapa dari informasi tersebut. Sebagai contoh, nama peristiwa CloudMonitor Disk:ErrorDetected:Executing menunjukkan bahwa disk rusak dan tidak mencakup informasi tentang dampak pada sumber daya.
Tabel berikut menjelaskan beberapa contoh kode peristiwa ECS dan nama peristiwa CloudMonitor.
Kode peristiwa ECS Undefined menunjukkan bahwa peristiwa ECS tidak ditampilkan di konsol ECS dan tidak dapat ditangani di konsol ECS atau dengan memanggil operasi API.
Kategori | Contoh kode peristiwa ECS | Contoh nama peristiwa CloudMonitor | Deskripsi |
Peristiwa pemeliharaan terjadwal | SystemMaintenance.Reboot | Instance:SystemMaintenance.Reboot:Inquiring |
|
Peristiwa pemeliharaan tak terduga | ErrorDetected | Disk:ErrorDetected:Executing |
|
Peristiwa perubahan status siklus hidup | Snapshot:CreateSnapshotCompleted | Snapshot:CreateSnapshotCompleted |
|
Peristiwa pemeliharaan terjadwal
Jika Anda melakukan operasi restart dalam sistem operasi instance tempat peristiwa sistem terjadi, tindakan pemeliharaan yang sesuai dengan peristiwa tidak akan berlaku. Semua operasi restart instance dalam topik ini dilakukan di konsol ECS atau dengan memanggil operasi API. Untuk informasi lebih lanjut, lihat Restart an instance atau RebootInstance.
Kode Peristiwa | Nama Peristiwa | Tingkat Keparahan Peristiwa | Nama Peristiwa CloudMonitor | Deskripsi dan Dampak Peristiwa | Saran Penanganan |
SystemMaintenance.Reboot | Instance Restart Due to System Maintenance | Critical |
| Peristiwa sistem ini dipicu 24 hingga 48 jam sebelum waktu pemeliharaan sistem yang dijadwalkan ketika Alibaba Cloud mendeteksi potensi risiko kegagalan perangkat keras atau perangkat lunak pada host dasar instance yang dapat menyebabkan instance di-restart. Catatan Perhatikan risiko berikut:
| Kami merekomendasikan Anda melakukan salah satu tindakan berikut untuk menangani peristiwa:
Catatan
|
SystemMaintenance.Stop | Instance Stopped Due to System Maintenance | Critical |
| Peristiwa sistem ini dipicu 24 hingga 48 jam sebelum waktu pemeliharaan sistem yang dijadwalkan ketika Alibaba Cloud mendeteksi potensi risiko kegagalan perangkat keras atau perangkat lunak pada host dasar instance yang dapat menyebabkan instance berhenti. | Kami merekomendasikan Anda melakukan salah satu tindakan berikut untuk menangani peristiwa:
Catatan Anda dapat memodifikasi atribut pemeliharaan instance untuk menentukan tindakan default yang diambil ketika peristiwa O&M terjadi pada instance. Untuk informasi lebih lanjut, lihat Modify instance maintenance attributes. |
SystemMaintenance.Redeploy | Instance Redeployment Due to System Maintenance | Critical |
| Peristiwa sistem ini dipicu 24 hingga 48 jam sebelum waktu pemeliharaan sistem yang dijadwalkan ketika Alibaba Cloud mendeteksi potensi risiko kegagalan perangkat keras atau perangkat lunak pada host dasar instance yang dapat menyebabkan instance redeployment. Penting Jika instance dilengkapi dengan SSD lokal atau HDD lokal, disk data pada instance diinisialisasi ulang dan data yang disimpan pada disk lokal dihapus. | Kami merekomendasikan Anda membuat persiapan, seperti memodifikasi file konfigurasi /etc/fstab dan mencadangkan data, dan kemudian melakukan salah satu tindakan berikut untuk menangani peristiwa:
Catatan
|
SystemMaintenance.IsolateErrorDisk | Damaged Disk Isolation Due to System Maintenance | Critical |
| Peristiwa sistem ini langsung dipicu ketika Alibaba Cloud mendeteksi kerusakan perangkat keras atau perangkat lunak pada disk lokal instance. Penting Prosedur untuk menangani disk lokal yang rusak pada instance bervariasi berdasarkan tipe instance. Untuk tipe instance tertentu, instance harus di-restart dan disk lokal yang rusak harus diisolasi. Untuk tipe instance lainnya, disk lokal yang rusak dapat diisolasi secara online dan kemudian diperbaiki. | Kami merekomendasikan Anda membuat persiapan, seperti memodifikasi file konfigurasi /etc/fstab dan mencadangkan data, dan kemudian memilih waktu yang tepat untuk mengotorisasi disk yang rusak agar diisolasi. Kemudian, disk lokal diisolasi secara online tanpa perlu me-restart instance terkait. Catatan Untuk informasi lebih lanjut, lihat bagian Skenario ③ dari topik "Skenario O&M dan peristiwa sistem untuk instance yang dilengkapi dengan disk lokal". |
SystemMaintenance.ReInitErrorDisk | Damaged Disk Re-initialization Due to System Maintenance | Critical |
| Peristiwa sistem ini langsung dipicu ketika Alibaba Cloud mengisolasi dan mengganti disk lokal pada host instance setelah Alibaba Cloud mendeteksi kerusakan perangkat keras atau perangkat lunak pada disk lokal. Dalam kebanyakan kasus, Alibaba Cloud mengisolasi dan mengganti disk lokal yang rusak dalam waktu lima hari kerja setelah Anda mengotorisasi Alibaba Cloud untuk mengisolasi disk lokal. Penting Prosedur untuk menangani disk lokal yang rusak pada instance bervariasi berdasarkan tipe instance. Untuk tipe instance tertentu, instance harus di-restart dan disk lokal yang rusak harus diisolasi. Untuk tipe instance lainnya, disk lokal yang rusak dapat diisolasi secara online dan kemudian diperbaiki. | Kami merekomendasikan Anda memilih waktu yang tepat untuk mengotorisasi disk lokal agar diperbaiki dan kemudian me-restart instance terkait setelah disk diperbaiki. Dalam hal ini, disk lokal diperbaiki secara offline. Anda harus me-restart instance terkait agar operasi pemulihan berlaku. Catatan Untuk informasi lebih lanjut, lihat bagian Skenario ③ dari topik "Skenario O&M dan peristiwa sistem untuk instance yang dilengkapi dengan disk lokal". |
SystemMaintenance.RebootAndIsolateErrorDisk | Damaged Disk Isolation and Instance Restart Due to System Maintenance | Critical |
| Peristiwa sistem ini langsung dipicu ketika Alibaba Cloud mendeteksi kerusakan perangkat keras atau perangkat lunak pada disk lokal instance dan gagal mengisolasi disk lokal secara online. Penting Prosedur untuk menangani disk lokal yang rusak pada instance bervariasi berdasarkan tipe instance. Untuk tipe instance tertentu, instance harus di-restart dan disk lokal yang rusak harus diisolasi. Untuk tipe instance lainnya, disk lokal yang rusak dapat diisolasi secara online dan kemudian diperbaiki. | Kami merekomendasikan Anda memilih waktu yang tepat untuk mengotorisasi disk yang rusak agar diisolasi dan me-restart instance terkait setelah disk diisolasi. Dalam hal ini, disk lokal diisolasi secara offline. Anda harus me-restart instance terkait agar operasi isolasi berlaku. Catatan Untuk informasi lebih lanjut, lihat bagian Skenario ③ dari topik "Skenario O&M dan peristiwa sistem untuk instance yang dilengkapi dengan disk lokal". |
SystemMaintenance.RebootAndReInitErrorDisk | Damaged Disk Re-initialization and Instance Restart Due to System Maintenance | Critical |
| Peristiwa sistem ini langsung dipicu ketika Alibaba Cloud mendeteksi kerusakan perangkat keras atau perangkat lunak pada disk lokal instance dan gagal memperbaiki disk lokal secara online. Penting Prosedur untuk menangani disk lokal yang rusak pada instance bervariasi berdasarkan tipe instance. Untuk tipe instance tertentu, instance harus di-restart dan disk lokal yang rusak harus diisolasi. Untuk tipe instance lainnya, disk lokal yang rusak dapat diisolasi secara online dan kemudian diperbaiki. | Kami merekomendasikan Anda memilih waktu yang tepat untuk mengotorisasi disk lokal agar diperbaiki dan me-restart instance terkait setelah disk diperbaiki. Dalam hal ini, disk lokal diperbaiki secara offline. Anda harus me-restart instance terkait agar operasi pemulihan berlaku. Catatan Untuk informasi lebih lanjut, lihat bagian Skenario ③ dari topik "Skenario O&M dan peristiwa sistem untuk instance yang dilengkapi dengan disk lokal". |
SystemMaintenance.StopAndRepair | In-place Repair of Instance Equipped with Local Disks | Critical |
| Peristiwa sistem ini dipicu 48 hingga 168 jam sebelum waktu pemeliharaan sistem yang dijadwalkan ketika Alibaba Cloud mendeteksi risiko kegagalan perangkat keras pada host dasar instance. | Kami merekomendasikan Anda memilih waktu yang tepat untuk mengotorisasi Alibaba Cloud memperbaiki atau me-redeploy instance yang dilengkapi dengan disk lokal. Catatan Untuk informasi lebih lanjut, lihat Skenario O&M dan peristiwa sistem untuk instance yang dilengkapi dengan disk lokal. |
SystemMaintenance.CleanReleasedDisks | Disk Cleanup After EBS Disk Hot Swapping Failure | Warning |
| Peristiwa sistem ini dipicu ketika Alibaba Cloud mendeteksi konfigurasi satu atau lebih disk cloud yang dilepaskan karena pembayaran terlambat dalam sistem operasi instance. | Kami merekomendasikan Anda memilih waktu yang tepat untuk mengotorisasi Alibaba Cloud membersihkan konfigurasi disk cloud yang dilepaskan. Penting Alibaba Cloud menghentikan instance pada waktu yang ditentukan dan kemudian membersihkan konfigurasi disk cloud. Setelah konfigurasi disk cloud dibersihkan, instance di-restart. |
Peristiwa O&M tak terduga
Kode Peristiwa | Nama Peristiwa | Tingkat Keparahan Peristiwa | Nama Peristiwa CloudMonitor | Deskripsi dan Dampak Peristiwa | Saran Penanganan |
SystemFailure.Reboot | Instance Restart Due to System Error | Critical |
| Peristiwa sistem ini langsung dipicu ketika Alibaba Cloud mendeteksi bahwa instance di-restart karena kegagalan perangkat keras atau perangkat lunak pada host dasar, seperti kerusakan perangkat keras CPU atau memori. | Kami merekomendasikan Anda menunggu hingga instance di-restart secara otomatis dan kemudian memeriksa apakah instance dan aplikasi berfungsi seperti yang diharapkan. Ketika instance sedang di-restart, Alibaba Cloud memigrasikan instance ke host yang sehat. Catatan Anda dapat memodifikasi atribut pemeliharaan instance untuk menentukan tindakan default yang diambil ketika peristiwa O&M terjadi pada instance. Untuk informasi lebih lanjut, lihat Modify instance maintenance attributes. |
InstanceFailure.Reboot | Instance Restart Due to OS Error | Critical |
| Peristiwa sistem ini langsung dipicu ketika Alibaba Cloud mendeteksi bahwa sistem operasi instance down karena masalah, seperti out-of-memory (OOM), layar biru, membeku, pencetakan log port serial terus-menerus, dan kernel panic. | Kami merekomendasikan Anda menunggu hingga instance di-restart secara otomatis dan kemudian memeriksa apakah instance dan aplikasi berfungsi seperti yang diharapkan. Anda dapat mengaktifkan layanan kdump sistem operasi untuk menganalisis masalah dan mencegah masalah tersebut terulang. Untuk informasi lebih lanjut, lihat How to enable the Kdump service for Linux instances dan Enable the Kernel Memory Dump feature for a Windows instance. |
SystemFailure.Stop | Instance Stop Due to System Error | Critical |
| Peristiwa sistem ini langsung dipicu ketika Alibaba Cloud mendeteksi bahwa instance dihentikan karena kegagalan perangkat keras atau perangkat lunak pada host dasar, seperti kerusakan perangkat keras CPU atau memori. | Kami merekomendasikan Anda menunggu hingga instance di-restart secara otomatis dan kemudian memulai instance. Ketika instance sedang dimulai, Alibaba Cloud memigrasikan instance ke host yang sehat. Catatan Anda dapat memodifikasi atribut pemeliharaan instance untuk menentukan tindakan default yang diambil ketika peristiwa O&M terjadi pada instance. Untuk informasi lebih lanjut, lihat Modify instance maintenance attributes. |
SystemFailure.Redeploy | Instance Redeployment Due to System Error | Critical |
| Peristiwa sistem ini langsung dipicu ketika Alibaba Cloud mendeteksi kegagalan perangkat keras atau perangkat lunak pada host dasar instance yang dilengkapi dengan disk lokal dan instance harus di-redeploy. Catatan Hanya instance yang bergantung pada dukungan perangkat keras host yang mendukung peristiwa ini, seperti instance yang dilengkapi dengan disk lokal atau mendukung Software Guard Extensions (SGX) komputasi rahasia. | Kami merekomendasikan Anda membuat persiapan, seperti memodifikasi file konfigurasi /etc/fstab dan mencadangkan data, dan kemudian melakukan salah satu tindakan berikut untuk menangani peristiwa:
Catatan Anda dapat memodifikasi atribut pemeliharaan instance untuk menentukan tindakan default yang diambil ketika peristiwa O&M terjadi pada instance. Untuk informasi lebih lanjut, lihat Modify instance maintenance attributes. |
SystemFailure.Delete | Automatic Cancellation of Bills Due to Instance Creation Failures | Critical |
| Peristiwa sistem ini langsung dipicu ketika Alibaba Cloud mendeteksi bahwa pesanan pembuatan instance ditempatkan tetapi instance gagal dibuat. | Kami merekomendasikan Anda menunggu hingga instance dilepaskan secara otomatis. Dalam kebanyakan kasus, instance dilepaskan secara otomatis dalam waktu 5 menit setelah instance gagal dibuat. Catatan Jika Anda sudah membayar pesanan, pembayaran akan dikembalikan setelah instance dilepaskan. Untuk memastikan bahwa instance dapat dibuat, kami merekomendasikan Anda melakukan tindakan berikut:
|
ErrorDetected | Local Disk Damage | Critical |
| Peristiwa sistem ini langsung dipicu ketika Alibaba Cloud mendeteksi kegagalan perangkat keras atau perangkat lunak pada disk lokal instance dan data tidak dapat dibaca dari disk atau ditulis ke disk. | Kami merekomendasikan Anda membuat persiapan, seperti memodifikasi file konfigurasi /etc/fstab dan mencadangkan data. Kemudian, pilih waktu untuk mengisolasi dan memperbaiki disk lokal yang rusak. Operasi yang didukung bervariasi berdasarkan tipe instance.
Catatan Untuk informasi lebih lanjut, lihat bagian Skenario ③ dari topik "Skenario O&M dan peristiwa sistem untuk instance yang dilengkapi dengan disk lokal". |
Stalled | Significant Block Storage Performance Impact | Critical |
| Peristiwa sistem ini langsung dipicu ketika Alibaba Cloud mendeteksi bahwa I/O hang terjadi pada disk cloud instance. Hal ini sangat memengaruhi kinerja disk dan mencegah disk memproses permintaan baca/tulis. | Kami merekomendasikan Anda mengisolasi baca/tulis pada disk cloud di lapisan aplikasi atau memisahkan instance ECS dari Server Load Balancer (SLB) terkait. |
Peristiwa Migrasi Instance karena Peningkatan di Lapisan Dasar
Kode Peristiwa | Nama Peristiwa | Tingkat Keparahan Peristiwa | Nama Peristiwa CloudMonitor | Deskripsi dan Dampak Peristiwa | Saran Penanganan |
SystemUpgrade.Migrate | Instance Migration Due to Upgrades at Underlying Layer | Critical | Undefined | Peristiwa sistem ini dipicu ketika instance terpengaruh oleh peningkatan dan perbaikan infrastruktur fisik di wilayah dan zona tempat instance berada. | Kami merekomendasikan Anda melihat detail peristiwa di konsol ECS dan memigrasikan instance yang terpengaruh sesuai petunjuk. Untuk informasi lebih lanjut, lihat Events related to instance migration due to upgrades at the underlying layer. |
Peristiwa Degradasi Performa Instance Burstable
Kode Peristiwa | Nama Peristiwa | Tingkat Keparahan Peristiwa | Nama Peristiwa CloudMonitor | Deskripsi dan Dampak Peristiwa | Saran Penanganan |
Instance:BurstablePerformanceRestricted | Burstable Instance Performance Degradation | Warning | Instance:BurstablePerformanceRestricted | Peristiwa sistem ini dipicu ketika semua kredit CPU yang diperoleh instance burstable habis terpakai. | Kami merekomendasikan Anda melakukan salah satu tindakan berikut untuk menangani peristiwa:
Jika Anda ingin menentukan ambang batas untuk memicu notifikasi tentang peristiwa ini, seperti ketika Anda ingin notifikasi peristiwa dikirim ketika kredit CPU yang diperoleh tetap kurang dari 10 selama 10 menit berturut-turut, Anda dapat mengonfigurasi aturan peringatan berbasis peristiwa untuk peristiwa ini di konsol CloudMonitor. Untuk informasi lebih lanjut, lihat Monitor burstable instances. |
Peristiwa Perubahan Status
Kode Peristiwa | Nama Peristiwa | Tingkat Keparahan Peristiwa | Nama Peristiwa CloudMonitor | Deskripsi dan Dampak Peristiwa | Saran Penanganan |
Instance:PreemptibleInstanceInterruption | Spot Instance Interruption | Warning | Instance:PreemptibleInstanceInterruption | Peristiwa sistem ini dipicu 5 menit sebelum instance spot direklaim. | Kami merekomendasikan Anda melakukan salah satu tindakan berikut:
|
Instance:ModifyInstanceSpec.Reboot | Instance Restart Due to Instance Type Change | Critical |
| Setelah tipe instance diubah, restart instance agar tipe instance baru berlaku. Jika Anda tidak me-restart instance dalam tujuh hari setelah pesanan baru berlaku, sistem akan memaksa me-restart instance agar tipe instance baru berlaku. | Kami merekomendasikan Anda melakukan salah satu tindakan berikut:
|
Instance:PerformanceModeChange | Performance Mode Switchover of Burstable Instance | Warning | Instance:PerformanceModeChange | Peristiwa sistem ini dipicu ketika instance burstable beralih antara mode tanpa batas dan mode standar. | Kami merekomendasikan Anda menentukan apakah akan memantau peristiwa. Jika Anda ingin memantau peristiwa, Anda dapat mengonfigurasi notifikasi untuk peristiwa ini di konsol CloudMonitor. Untuk informasi lebih lanjut, lihat Subscribe to ECS system event notifications. |
Instance:StateChange | Instance Status Change | Notification | Instance:StateChange | Peristiwa sistem ini dipicu ketika status instance berubah, seperti dari Running menjadi Stopping atau dari Stopping menjadi Stopped. | Kami merekomendasikan Anda menentukan apakah akan memantau peristiwa. Jika Anda ingin memantau peristiwa, Anda dapat mengonfigurasi notifikasi untuk peristiwa ini di konsol CloudMonitor. Untuk informasi lebih lanjut, lihat Subscribe to ECS system event notifications. |
Instance:AutoReactivateCompleted | Automatic Reactivation Completed | Notification | Instance:AutoReactivateCompleted | Peristiwa sistem ini dipicu ketika Anda menyelesaikan pembayaran terlambat di akun Anda dan instance diaktifkan kembali secara otomatis. | Kami merekomendasikan Anda menentukan apakah akan memantau peristiwa. Jika Anda ingin memantau peristiwa, Anda dapat mengonfigurasi notifikasi untuk peristiwa ini di konsol CloudMonitor. Untuk informasi lebih lanjut, lihat Subscribe to ECS system event notifications. |
Instance:LiveMigrationAcrossDDH | Instance Hot Migration Between Dedicated Hosts | Notification | Instance:LiveMigrationAcrossDDH | Peristiwa sistem ini dipicu ketika instance dimigrasi secara panas antara host khusus. | Kami merekomendasikan Anda menentukan apakah akan memantau peristiwa. Jika Anda ingin memantau peristiwa, Anda dapat mengonfigurasi notifikasi untuk peristiwa ini di konsol CloudMonitor. Untuk informasi lebih lanjut, lihat Subscribe to ECS system event notifications. |
Disk:DiskOperationCompleted | Disk Operations Completed | Notification | Disk:DiskOperationCompleted | Peristiwa sistem ini dipicu ketika disk pay-as-you-go dilekatkan atau dilepas secara manual. | Kami merekomendasikan Anda menentukan apakah akan memantau peristiwa. Jika Anda ingin memantau peristiwa, Anda dapat mengonfigurasi notifikasi untuk peristiwa ini di konsol CloudMonitor. Untuk informasi lebih lanjut, lihat Subscribe to ECS system event notifications. |
Disk:ConvertToPostpaidCompleted | Billing Method of Disks Switched to Pay-as-you-go | Notification | Disk:ConvertToPostpaidCompleted | Peristiwa sistem ini dipicu ketika disk berlangganan diubah menjadi disk pay-as-you-go. | Kami merekomendasikan Anda menentukan apakah akan memantau peristiwa. Jika Anda ingin memantau peristiwa, Anda dapat mengonfigurasi notifikasi untuk peristiwa ini di konsol CloudMonitor. Untuk informasi lebih lanjut, lihat Subscribe to ECS system event notifications. |
Snapshot:CreateSnapshotCompleted | Disk Snapshot Created | Notification | Snapshot:CreateSnapshotCompleted | Peristiwa sistem ini dipicu ketika snapshot dibuat untuk disk. | Kami merekomendasikan Anda menentukan apakah akan memantau peristiwa. Jika Anda ingin memantau peristiwa, Anda dapat mengonfigurasi notifikasi untuk peristiwa ini di konsol CloudMonitor. Untuk informasi lebih lanjut, lihat Subscribe to ECS system event notifications. |
Snapshot:SnapshotDeleted | Snapshot Deletion Completed | Notification | Snapshot:SnapshotDeleted | Peristiwa sistem ini dihasilkan ketika snapshot manual atau otomatis dihapus. | Tidak ada. |