Event sistem mencatat dan memberikan notifikasi mengenai sumber daya cloud, seperti eksekusi tugas operasi dan pemeliharaan (O&M), pengecualian sumber daya, serta perubahan status sumber daya. Anda dapat memanfaatkan event sistem untuk memperoleh informasi tentang risiko dan anomali pada sumber daya Elastic Compute Service (ECS) Anda. Misalnya, event sistem dihasilkan ketika sebuah instans harus dimigrasikan akibat peningkatan infrastruktur dasar, atau direstart untuk maintenance sistem. Tanggapi dan atasi event sistem secara tepat waktu guna mencegah dampak terhadap bisnis akibat penurunan ketersediaan atau performa sumber daya ECS. Topik ini merangkum event sistem yang didukung oleh ECS, termasuk event O&M terjadwal, event O&M tak terduga, event penagihan instans, dan event perubahan status instans, serta memberikan saran penanganan untuk setiap jenis event sistem.
Format kode event ECS dan nama event CloudMonitor
Event sistem ECS disinkronkan ke CloudMonitor, memungkinkan Anda menyiapkan mekanisme O&M otomatis berdasarkan event tersebut. Kode event ECS dan nama event CloudMonitor mengikuti konvensi penamaan tertentu sebagai berikut:
Kode event ECS: Memuat informasi mengenai penyebab event dan dampaknya terhadap sumber daya. Formatnya adalah
<Penyebab event>.<Dampak terhadap sumber daya>.Nama event CloudMonitor: Memuat informasi mengenai tipe sumber daya, penyebab event, dampak terhadap sumber daya, dan status event. Formatnya adalah
<Tipe sumber daya>:<Penyebab event>.<Dampak terhadap sumber daya>:<Status event>.
Tidak semua kode event ECS dan nama event CloudMonitor mencakup seluruh informasi tersebut. Sebagai contoh, nama event CloudMonitor Disk:ErrorDetected:Executing menunjukkan bahwa disk mengalami kerusakan dan tidak perlu menyertakan informasi lebih lanjut mengenai dampak terhadap sumber daya.
Tabel berikut menjelaskan beberapa contoh kode event ECS dan nama event CloudMonitor.
Jika kode event ECS contoh bernilai Undefined, event sistem tersebut tidak ditampilkan di Konsol ECS dan tidak dapat ditangani melalui Konsol ECS maupun dengan memanggil operasi OpenAPI.
Kategori | Contoh kode event ECS | Contoh nama event Cloud Monitor | Deskripsi |
Event O&M terjadwal | SystemMaintenance.Reboot | Instance:SystemMaintenance.Reboot:Inquiring |
|
Event O&M tak terduga | ErrorDetected | Disk:ErrorDetected:Executing |
|
Event perubahan siklus hidup | Snapshot:CreateSnapshotCompleted | Snapshot:CreateSnapshotCompleted |
|
Event O&M terjadwal
Merestart instans dari dalam sistem operasinya tidak menerapkan tindakan maintenance untuk event tersebut. Oleh karena itu, operasi restart dalam topik ini mengacu pada restart yang dilakukan melalui Konsol ECS atau dengan memanggil operasi OpenAPI. Untuk informasi lebih lanjut, lihat Restart an instance atau RebootInstance.
Kode event | Nama event | Tingkat keparahan event | Nama event CloudMonitor | Deskripsi dan dampak event | Saran untuk pengguna |
SystemMaintenance.Reboot | Instance restart because of system maintenance | Critical |
| Alibaba Cloud mendeteksi potensi risiko kegagalan perangkat lunak atau keras pada host infrastruktur dasar instans ECS. Risiko ini dapat menyebabkan instans ECS direstart, meskipun belum menjadi kegagalan aktual. Event sistem ini dikirimkan 24 hingga 48 jam sebelum maintenance sistem terjadwal. Catatan Risiko kegagalan meliputi hal-hal berikut:
| Pilih metode respons sesuai kebutuhan:
Catatan
|
SystemMaintenance.Stop | Instance stop because of system maintenance | Critical |
| Event sistem ini dikirimkan 24 hingga 48 jam sebelum maintenance sistem terjadwal ketika Alibaba Cloud mendeteksi potensi risiko kegagalan perangkat lunak atau keras pada host infrastruktur dasar instans ECS. Risiko ini dapat menyebabkan instans dimatikan dan dihentikan, meskipun belum menjadi kegagalan aktual. | Pilih metode respons sesuai kebutuhan:
Catatan Anda dapat memodifikasi properti maintenance instans untuk menentukan tindakan default yang diambil saat terjadi event O&M pada instans. Untuk informasi lebih lanjut, lihat Modify instance maintenance properties. |
SystemMaintenance.Redeploy | Instance redeployment because of system maintenance | Critical |
| Event sistem ini dikirimkan 24 hingga 48 jam sebelum maintenance sistem terjadwal ketika Alibaba Cloud mendeteksi potensi risiko kegagalan perangkat lunak atau keras pada host infrastruktur dasar instans ECS. Risiko ini dapat menyebabkan instans diredeploy, meskipun belum menjadi kegagalan aktual. Penting Untuk instans yang menggunakan SSD lokal atau HDD lokal, disk data akan diinisialisasi ulang dan data pada disk lokal akan dihapus. | Lakukan persiapan, seperti memodifikasi file konfigurasi /etc/fstab dan membuat backup data. Kemudian, pilih metode respons sesuai kebutuhan:
Catatan
|
SystemMaintenance.IsolateErrorDisk | Damaged disk isolation because of system maintenance | Critical |
| Event sistem ini dikirimkan segera ketika Alibaba Cloud mendeteksi kerusakan perangkat lunak atau keras pada disk lokal instans ECS. Penting Prosedur penanganan disk lokal yang rusak bervariasi tergantung tipe instans. Untuk beberapa tipe instans, instans harus direstart untuk mengisolasi disk yang rusak. Untuk tipe instans lainnya, disk yang rusak dapat diisolasi dan diperbaiki secara online. | Lakukan persiapan, seperti memodifikasi file konfigurasi /etc/fstab dan membuat backup data. Kemudian, pilih waktu yang tepat untuk memberikan otorisasi isolasi disk yang rusak. Disk tersebut diisolasi secara online tanpa perlu merestart instans. Catatan Untuk informasi lebih lanjut tentang proses O&M, lihat Scenario ③ for instances with local disks. |
SystemMaintenance.ReInitErrorDisk | Damaged disk re-initialization because of system maintenance | Critical |
| Event sistem ini dikirimkan segera setelah Alibaba Cloud mendeteksi kerusakan perangkat lunak atau keras pada disk lokal instans ECS dan mengganti disk lokal yang rusak pada host. Hal ini biasanya terjadi dalam lima hari kerja setelah Anda memberikan otorisasi isolasi disk. Penting Prosedur penanganan disk lokal yang rusak bervariasi tergantung tipe instans. Untuk beberapa tipe instans, instans harus direstart untuk mengisolasi disk yang rusak. Untuk tipe instans lainnya, disk yang rusak dapat diisolasi dan diperbaiki secara online. | Pilih waktu yang tepat untuk memberikan otorisasi pemulihan disk lokal. Disk tersebut dipulihkan secara online tanpa perlu merestart instans. Catatan Untuk informasi lebih lanjut tentang proses O&M, lihat Scenario ③ for instances with local disks. |
SystemMaintenance.RebootAndIsolateErrorDisk | Instance restart and damaged disk isolation because of system maintenance | Critical |
| Event sistem ini dikirimkan segera ketika Alibaba Cloud mendeteksi kerusakan perangkat lunak atau keras pada disk lokal instans ECS dan gagal mengisolasi disk tersebut secara online. Penting Prosedur penanganan disk lokal yang rusak bervariasi tergantung tipe instans. Untuk beberapa tipe instans, instans harus direstart untuk mengisolasi disk yang rusak. Untuk tipe instans lainnya, disk yang rusak dapat diisolasi dan diperbaiki secara online. | Pilih waktu yang tepat untuk memberikan otorisasi isolasi disk yang rusak, dan restart instans Anda sendiri. Disk tersebut diisolasi secara offline, yang memerlukan restart instans. Catatan Untuk informasi lebih lanjut tentang proses O&M, lihat Scenario ③ for instances with local disks. |
SystemMaintenance.RebootAndReInitErrorDisk | Instance restart and damaged disk re-initialization because of system maintenance | Critical |
| Event sistem ini dikirimkan segera ketika Alibaba Cloud mendeteksi kerusakan perangkat lunak atau keras pada disk lokal instans ECS dan gagal memulihkan disk lokal tersebut secara online. Penting Prosedur penanganan disk lokal yang rusak bervariasi tergantung tipe instans. Untuk beberapa tipe instans, instans harus direstart untuk mengisolasi disk yang rusak. Untuk tipe instans lainnya, disk yang rusak dapat diisolasi dan diperbaiki secara online. | Pilih waktu yang tepat untuk memberikan otorisasi pemulihan disk lokal, dan restart instans Anda sendiri. Disk tersebut dipulihkan secara offline, yang memerlukan restart instans. Catatan Untuk informasi lebih lanjut tentang proses O&M, lihat Scenario ③ for instances with local disks. |
SystemMaintenance.StopAndRepair | In-place repair event for an instance with local disks | Critical |
| Event sistem ini dikirimkan 48 hingga 168 jam sebelum maintenance sistem terjadwal ketika Alibaba Cloud mendeteksi risiko kegagalan perangkat keras pada host infrastruktur dasar instans ECS. | Pilih waktu yang tepat untuk memberikan otorisasi perbaikan atau redeploy instans dengan disk lokal. Catatan Untuk informasi lebih lanjut tentang proses O&M, lihat O&M scenarios and system events for instances with local disks. |
SystemMaintenance.CleanReleasedDisks | Cleanup event after EBS hot-plug failure | Warning |
| Event sistem ini dikirimkan ketika Alibaba Cloud mendeteksi informasi konfigurasi satu atau beberapa disk cloud yang dilepas karena pembayaran tertunda dalam sistem operasi instans ECS. | Pilih waktu yang tepat untuk memberikan otorisasi kepada Alibaba Cloud agar membersihkan informasi konfigurasi disk cloud yang telah dilepas. Penting Alibaba Cloud akan mematikan instans pada waktu yang Anda tentukan, membersihkan disk, lalu menghidupkan kembali instans tersebut. |
Event O&M tak terduga
Event Code | Nama event | Tingkat keparahan event | Nama event Cloud Monitor | Deskripsi dan dampak event | Saran penanganan |
SystemFailure.Reboot | Instance restart due to system error | Critical |
| Event sistem ini dikirimkan segera ketika Alibaba Cloud mendeteksi bahwa instans ECS direstart akibat kegagalan perangkat lunak atau keras tak terduga pada host infrastruktur dasar, seperti kerusakan perangkat keras CPU atau memori. | Tunggu instans secara otomatis direstart, lalu periksa apakah instans dan aplikasinya berjalan dengan benar. Selama restart, Alibaba Cloud memigrasikan instans ke host yang sehat. Catatan Anda dapat memodifikasi properti maintenance instans untuk menentukan tindakan default yang diambil saat terjadi event O&M pada instans. Untuk informasi lebih lanjut, lihat Modify instance maintenance properties. |
InstanceFailure.Reboot | Instance restart required due to an operating system error | Critical |
| Event sistem ini dikirimkan segera ketika Alibaba Cloud mendeteksi bahwa instans ECS mati akibat masalah internal sistem operasi, seperti kesalahan kehabisan memori (OOM), blue screen, membeku, pencetakan log port serial terus-menerus, atau kernel panic. | Tunggu instans secara otomatis direstart, lalu periksa apakah instans dan aplikasinya berjalan dengan benar. Anda dapat mengaktifkan layanan Kdump untuk sistem operasi guna mengidentifikasi penyebab crash dan mencegah terjadinya masalah serupa di masa depan. Untuk informasi lebih lanjut, lihat Enable the Kdump service for a Linux instance atau Enable the Kernel Memory Dump feature for a Windows instance. |
SystemFailure.Stop | Instance stop due to system error | Critical |
| Event sistem ini dikirimkan segera ketika Alibaba Cloud mendeteksi bahwa instans ECS dimatikan akibat kegagalan perangkat lunak atau keras pada host infrastruktur dasar, seperti kerusakan perangkat keras CPU atau memori. | Tunggu instans secara otomatis dihentikan, lalu hidupkan kembali instans tersebut. Saat Anda menghidupkan instans, Alibaba Cloud memigrasikan instans ke host yang sehat. Catatan Anda dapat memodifikasi properti maintenance instans untuk menentukan tindakan default yang diambil saat terjadi event O&M pada instans. Untuk informasi lebih lanjut, lihat Modify instance maintenance properties. |
SystemFailure.Redeploy | Instance redeployment due to system error | Critical |
| Event sistem ini dikirimkan segera ketika Alibaba Cloud mendeteksi bahwa instans dengan disk lokal harus diredeploy akibat kegagalan perangkat lunak atau keras pada host infrastruktur dasar. Catatan Jenis event ini hanya didukung untuk instans yang bergantung pada perangkat keras host, seperti instans yang memiliki disk lokal atau mendukung komputasi rahasia berbasis SGX. | Lakukan persiapan, seperti memodifikasi file konfigurasi /etc/fstab dan membuat backup data. Kemudian, pilih metode respons sesuai kebutuhan:
Catatan Anda dapat memodifikasi properti maintenance instans untuk menentukan tindakan default yang diambil saat terjadi event O&M pada instans. Untuk informasi lebih lanjut, lihat Modify instance maintenance properties. |
SystemFailure.Delete | Automatic bill cancellation due to instance creation failure | Critical |
| Event sistem ini dikirimkan segera ketika Alibaba Cloud mendeteksi bahwa pesanan pembuatan instans ECS berhasil tetapi instans gagal dibuat. | Tunggu sistem secara otomatis melepas instans. Instans biasanya dilepas dalam waktu lima menit setelah gagal dibuat. Catatan Jika Anda telah membayar pesanan tersebut, Anda akan menerima pengembalian dana setelah instans dilepas. Untuk meningkatkan tingkat keberhasilan pembuatan instans:
|
ErrorDetected | Alert for local disk damage | Critical |
| Event sistem ini dikirimkan segera ketika Alibaba Cloud mendeteksi kerusakan perangkat lunak atau keras tak terduga pada disk lokal instans ECS, sehingga disk tersebut tidak dapat dibaca atau ditulis. | Lakukan persiapan, seperti memodifikasi file konfigurasi /etc/fstab dan membuat backup data. Kemudian, pilih waktu yang tepat untuk mengisolasi disk yang rusak dan memulihkan disk lokal tersebut. Operasi yang didukung bervariasi tergantung tipe instans. Rincian sebagai berikut:
Catatan Untuk informasi lebih lanjut tentang proses O&M, lihat Scenario ③ for instances with local disks. |
Stalled | Disk performance is severely affected | Critical |
| Event sistem ini dikirimkan segera ketika Alibaba Cloud mendeteksi terjadinya hang I/O pada disk cloud yang terpasang pada instans ECS. Hal ini sangat memengaruhi performa disk dan mencegah disk dibaca atau ditulis. | Isolasi operasi baca-tulis pada disk cloud di lapisan aplikasi, atau sementara hapus instans dari Instance SLB. |
Event migrasi instans akibat peningkatan infrastruktur dasar
Event Code | Nama event | Tingkat keparahan event | Nama event Cloud Monitor | Deskripsi dan dampak event | Saran penanganan |
SystemUpgrade.Migrate | Instance migration required due to underlying upgrades | Critical | Undefined | Jika Alibaba Cloud melakukan peningkatan dan transformasi infrastruktur fisik, instans di wilayah dan zona terkait mungkin terdampak. Event sistem ini dikirimkan kepada Anda sebelumnya. | Login ke Konsol ECS untuk melihat detail event sistem dan migrasikan instans sesuai petunjuk. Untuk informasi lebih lanjut, lihat Instance migration due to underlying upgrades. |
Event pembatasan performa instans burstable
Event Code | Nama event | Tingkat keparahan event | Nama event Cloud Monitor | Deskripsi dan dampak event | Saran penanganan |
Instance:BurstablePerformanceRestricted | Burstable instance performance is restricted | Warning | Instance:BurstablePerformanceRestricted: Burstable instance performance is restricted | Event sistem ini dikirimkan segera ketika kredit CPU yang terakumulasi pada instans burstable habis. | Pilih metode respons sesuai kebutuhan:
Untuk menyesuaikan ambang batas pemicu notifikasi, misalnya menerima notifikasi ketika kredit CPU yang terakumulasi kurang dari 10 selama 10 menit berturut-turut, Anda dapat menetapkan aturan peringatan berbasis ambang batas di konsol Cloud Monitor. Untuk informasi lebih lanjut, lihat Monitor burstable instances. |
Event perubahan status
Kode event | Nama event | Tingkat keparahan event | Nama event Cloud Monitor | Deskripsi dan dampak event | Saran penanganan |
Instance:PreemptibleInstanceInterruption | Spot instance interruption notification | Warning | Instance:PreemptibleInstanceInterruption: Spot instance interruption notification | Event sistem ini dikirimkan 5 menit sebelum instans spot ditarik kembali. | Kami menyarankan Anda:
|
Instance:ModifyInstanceSpec.Reboot | Instance restart required for instance type change to take effect | Critical |
| Setelah tipe instans diubah, instans harus direstart agar konfigurasi baru berlaku. Jika Anda tidak merestart instans dalam waktu tujuh hari setelah pesanan baru berlaku, sistem akan memaksa merestart instans untuk menerapkan tipe instans baru. | Kami menyarankan Anda:
|
Instance:PerformanceModeChange | Performance mode switchover of burstable instance | Warning | Instance:PerformanceModeChange: Performance mode switchover of burstable instance | Event sistem ini dihasilkan ketika instans burstable beralih dari mode unlimited ke mode standar, atau dari mode standar ke mode unlimited. | Tentukan apakah perlu mengikuti event sistem ini sesuai kebutuhan. Jika ingin mengikuti event tersebut, Anda dapat menetapkan notifikasi event di konsol Cloud Monitor. Untuk informasi lebih lanjut, lihat Subscribe to ECS system event notifications. |
Instance:StateChange | Instance status change notification | Information | Instance:StateChange: Instance status change notification | Event sistem ini dihasilkan ketika status instans berubah, misalnya dari Running ke Stopping, atau dari Stopping ke Stopped. | Tentukan apakah perlu mengikuti event sistem ini sesuai kebutuhan. Jika ingin mengikuti event tersebut, Anda dapat menetapkan notifikasi event di konsol Cloud Monitor. Untuk informasi lebih lanjut, lihat Subscribe to ECS system event notifications. |
Instance:AutoReactivateCompleted | Automatic reboot completion | Information | Instance:AutoReactivateCompleted: Automatic reactivation completed | Event sistem ini dihasilkan ketika Anda telah membayar tagihan tertunda dan instans secara otomatis direstart. | Tentukan apakah perlu mengikuti event sistem ini sesuai kebutuhan. Jika ingin mengikuti event tersebut, Anda dapat menetapkan notifikasi event di konsol Cloud Monitor. Untuk informasi lebih lanjut, lihat Subscribe to ECS system event notifications. |
Instance:LiveMigrationAcrossDDH | Instance hot migration between dedicated hosts | Information | Instance:LiveMigrationAcrossDDH: Instance hot migration between dedicated hosts | Event sistem ini dihasilkan ketika instans mengalami migrasi panas. | Tentukan apakah perlu mengikuti event sistem ini sesuai kebutuhan. Jika ingin mengikuti event tersebut, Anda dapat menetapkan notifikasi event di konsol Cloud Monitor. Untuk informasi lebih lanjut, lihat Subscribe to ECS system event notifications. |
Disk:DiskOperationCompleted | Disk operation completed | Information | Disk:DiskOperationCompleted: Disk operation completed | Event sistem ini dihasilkan ketika disk berbayar sesuai penggunaan dipasang atau dilepas secara manual. | Tentukan apakah perlu mengikuti event sistem ini sesuai kebutuhan. Jika ingin mengikuti event tersebut, Anda dapat menetapkan notifikasi event di konsol Cloud Monitor. Untuk informasi lebih lanjut, lihat Subscribe to ECS system event notifications. |
Disk:ConvertToPostpaidCompleted | Disk converted to pay-as-you-go | Information | Disk:ConvertToPostpaidCompleted: Disk converted to pay-as-you-go | Event sistem ini dihasilkan ketika disk langganan dikonversi menjadi disk berbayar sesuai penggunaan. | Tentukan apakah perlu mengikuti event sistem ini sesuai kebutuhan. Jika ingin mengikuti event tersebut, Anda dapat menetapkan notifikasi event di konsol Cloud Monitor. Untuk informasi lebih lanjut, lihat Subscribe to ECS system event notifications. |
Snapshot:CreateSnapshotCompleted | Disk snapshot created | Information | Snapshot:CreateSnapshotCompleted: Disk snapshot created | Event sistem ini dihasilkan ketika snapshot untuk disk dibuat. | Tentukan apakah perlu mengikuti event sistem ini sesuai kebutuhan. Jika ingin mengikuti event tersebut, Anda dapat menetapkan notifikasi event di konsol Cloud Monitor. Untuk informasi lebih lanjut, lihat Subscribe to ECS system event notifications. |
Snapshot:SnapshotDeleted | Snapshot deletion completed event | Information | Snapshot:SnapshotDeleted: Snapshot deletion completed event | Event sistem ini dihasilkan ketika snapshot manual atau snapshot otomatis dihapus. | None |
Event risiko performa instans
Kode peristiwa | Nama event | Tingkat keparahan event | Nama event Cloud Monitor | Deskripsi dan dampak event | Saran penanganan |
Instance:CPUPerformanceReachLimit | Instance CPU performance reaches the upper limit of the instance type | Warning | Instance:CPUPerformanceReachLimit:Executed : Instance CPU performance reaches the upper limit of the instance type | Alibaba Cloud mendeteksi bahwa utilisasi CPU instans telah mencapai 100% atau batas atas tipe instansnya. Catatan Event dikirim jika batas atas CPU yang ditentukan untuk tipe instans tercapai dua kali dalam tiga menit terakhir. | Penggunaan CPU yang terus-menerus pada batas atas tipe instans dapat berdampak negatif pada bisnis Anda. Sesuaikan konfigurasi Anda sesuai kebutuhan. Untuk informasi lebih lanjut, lihat Discover and troubleshoot instance issues. |
Instance:StoragePerformanceReachLimit | Instance storage performance reaches the upper limit of the instance type | Warning | Instance:StoragePerformanceReachLimit:Executed : Instance storage performance reaches the upper limit of the instance type | Alibaba Cloud mendeteksi bahwa bandwidth disk atau IOPS instans telah mencapai batas atas tipe instansnya. Contoh:
Catatan Event ini tidak didukung untuk instans ECS generasi sebelum Generasi 6. Event dikirim jika batas atas performa penyimpanan yang ditentukan untuk tipe instans tercapai dua kali dalam tiga menit terakhir. | Performa penyimpanan yang terus-menerus pada batas atas tipe instans dapat berdampak negatif pada bisnis Anda. Sesuaikan konfigurasi Anda sesuai kebutuhan. Untuk informasi lebih lanjut, lihat Discover and troubleshoot instance issues. |
Instance:NetworkPerformanceReachLimit | Instance network performance reaches the upper limit of the instance type | Warning | Instance:NetworkPerformanceReachLimit:Executed : Instance network performance reaches the upper limit of the instance type | Alibaba Cloud mendeteksi bahwa performa jaringan instans telah mencapai batas atas tipe instansnya. Contoh:
Catatan Event dikirim jika batas atas performa jaringan yang ditentukan untuk tipe instans tercapai dua kali dalam tiga menit terakhir. | Performa jaringan yang terus-menerus pada batas atas tipe instans dapat berdampak negatif pada bisnis Anda. Sesuaikan konfigurasi Anda sesuai kebutuhan. Untuk informasi lebih lanjut, lihat Discover and troubleshoot instance issues. |
Instance:StatusCheckFailed | Instance status check failed | Warning |
| Alibaba Cloud mendeteksi pengecualian konektivitas untuk instans. Contoh:
| Alibaba Cloud telah mendeteksi pengecualian konektivitas untuk instans, yang memerlukan troubleshooting segera. Untuk informasi lebih lanjut, lihat Diagnose network connectivity. |