全部产品
Search
文档中心

Elastic Compute Service:Skenario O&M dan peristiwa sistem untuk instance dengan disk lokal

更新时间:Jul 06, 2025

Disk lokal tidak menyediakan ketersediaan data yang tinggi. Untuk meningkatkan pengalaman pengguna pada disk lokal, Alibaba Cloud menawarkan berbagai kemampuan O&M guna membantu Anda memantau dan menangani pengecualian yang terjadi pada disk lokal Anda. Topik ini menjelaskan skenario O&M umum serta peristiwa sistem untuk instance Elastic Compute Service (ECS) yang dilengkapi dengan disk lokal.

Lihat dan pantau peristiwa sistem untuk instance dengan disk lokal

  1. Lihat peristiwa sistem untuk instance dengan disk lokal.

  • Lihat acara sistem untuk instance yang dilengkapi dengan disk lokal di Konsol ECS atau menggunakan Alibaba Cloud CLI. Untuk informasi lebih lanjut, lihat Query and handle ECS system events.

  • Lihat peristiwa sistem untuk instance dengan disk lokal di konsol CloudMonitor. Untuk informasi lebih lanjut, lihat Lihat peristiwa sistem.

  1. Pantau peristiwa sistem untuk instance dengan disk lokal.

Untuk memastikan stabilitas layanan yang berjalan pada instance ECS dan mengotomatiskan O&M, kami sarankan Anda mengonfigurasi notifikasi peristiwa agar diberitahu tentang perubahan lingkungan bawah. Setelah Anda mengonfigurasi notifikasi peristiwa, sistem akan memberi tahu Anda melalui metode notifikasi yang telah ditentukan.

Skenario O&M umum dan peristiwa sistem terkait

Gambar berikut menunjukkan skenario O&M umum untuk instance ECS dengan disk lokal beserta peristiwa sistem yang relevan.

Catatan

Anda dapat memodifikasi atribut pemeliharaan instance untuk mengubah mode pemulihan otomatis (juga disebut tindakan pemeliharaan) untuk instance tersebut. Sebagai contoh, jika tindakan pemeliharaan untuk sebuah instance adalah Penyebaran Ulang Otomatis, instance tersebut akan disebar ulang secara otomatis. Untuk informasi lebih lanjut, lihat Modifikasi atribut pemeliharaan instance.

Untuk informasi tentang peristiwa sistem yang dipicu dalam skenario seperti yang ditunjukkan pada gambar sebelumnya, lihat bagian-bagian berikut dalam topik ini:

Catatan

Untuk memastikan kontinuitas bisnis, kami sarankan Anda mencadangkan data untuk instance ECS yang terpengaruh dan beralih ke instance lain sebelum menjalankan tugas O&M pada instance tersebut. Sebagai contoh, Anda dapat mengalihkan lalu lintas dari instance ECS yang terpengaruh, melepaskan asosiasi instance ECS dari Server Load Balancer (SLB), dan mencadangkan data disk dari instance ECS tersebut.

Skenario ①

Prosedur untuk menangani peristiwa sistem SystemMaintenance.Reboot:

  1. Anda akan diberitahu ketika sebuah instance dijadwalkan untuk direstart.

  2. Gunakan salah satu metode berikut untuk menangani peristiwa:

    • Jika Anda tidak ingin instance direstart dalam periode waktu yang dijadwalkan, tentukan titik waktu lain di mana Anda ingin instance direstart. Untuk informasi lebih lanjut, lihat Modifikasi waktu restart terjadwal.

    • Mulai ulang instance dalam jendela operasi pengguna. Untuk informasi lebih lanjut, lihat Restart an instance.

      Catatan

      Anda harus memulai ulang instance di konsol ECS atau dengan memanggil operasi RebootInstance. Anda tidak dapat memulai ulang instance dari dalam instance tersebut.

    • Tunggu hingga instance direstart secara otomatis.

  3. Periksa apakah instance dan aplikasi terus bekerja seperti yang diharapkan.

Untuk informasi tentang status peristiwa yang didukung oleh SystemMaintenance.Reboot, lihat Ringkasan. Untuk melihat gambar yang menunjukkan transisi tipikal antara status peristiwa, lihat bagian Status dan jendela peristiwa sistem dari topik "Ikhtisar".

Skenario ②

Prosedur untuk menangani peristiwa sistem SystemMaintenance.Redeploy:

  1. Anda akan diberitahu ketika sebuah instance dengan disk lokal dijadwalkan untuk disebar ulang.

  2. Buat persiapan seperti memodifikasi file konfigurasi /etc/fstab dan mencadangkan data.

    Untuk informasi tentang persiapan yang diperlukan, lihat bagian "Prasyarat" dari topik Sebar ulang instance yang memiliki disk lokal terpasang.

  3. Gunakan salah satu metode berikut untuk menangani peristiwa:

    Catatan

    Ketika sebuah instance dengan disk lokal disebar ulang, instance tersebut dipindahkan ke mesin fisik yang berbeda, dan disk lokal dari instance tersebut diinisialisasi ulang dan kehilangan semua datanya.

  4. Periksa apakah instance dan aplikasi terus bekerja seperti yang diharapkan. Jika ya, sinkronkan data berdasarkan kebutuhan bisnis Anda.

Untuk informasi tentang status peristiwa yang didukung oleh SystemMaintenance.Redeploy, lihat Ringkasan. Untuk gambar yang menunjukkan transisi tipikal antara status peristiwa, lihat bagian Status dan jendela peristiwa sistem dari topik "Ikhtisar".

Skenario ③

Prosedur untuk menangani peristiwa sistem SystemFailure.Reboot:

  1. Sistem merestart sebuah instance karena kesalahan sistem.

  2. Anda akan diberitahu ketika instance sedang direstart.

    Tunggu hingga instance direstart tanpa intervensi manual.

  3. Periksa apakah instance dan aplikasi terus bekerja seperti yang diharapkan.

Untuk informasi tentang status peristiwa yang didukung oleh SystemFailure.Reboot, lihat Ringkasan. Untuk gambar yang menunjukkan transisi tipikal antara status peristiwa, lihat bagian Status dan jendela peristiwa sistem dari topik "Ikhtisar".

Skenario ④

Prosedur untuk menangani peristiwa sistem SystemFailure.Redeploy:

  1. Anda akan diberitahu ketika sebuah instance dengan disk lokal dijadwalkan untuk disebar ulang.

  2. Buat persiapan seperti memodifikasi file konfigurasi /etc/fstab dan mencadangkan data.

    Untuk informasi tentang persiapan yang diperlukan, lihat bagian "Prasyarat" dari topik Sebar ulang instance yang memiliki disk lokal terpasang.

  3. Gunakan salah satu metode berikut untuk menangani peristiwa:

    Catatan

    Ketika sebuah instance dengan disk lokal disebar ulang, instance tersebut dipindahkan ke server fisik yang berbeda, dan disk lokal dari instance tersebut diinisialisasi ulang dan kehilangan semua datanya.

  4. Periksa apakah instance dan aplikasi terus bekerja seperti yang diharapkan. Jika ya, sinkronkan data berdasarkan kebutuhan bisnis Anda.

Untuk informasi tentang status peristiwa yang didukung oleh SystemFailure.Redeploy, lihat Ringkasan. Untuk gambar yang menunjukkan transisi tipikal antara status peristiwa, lihat bagian Status dan jendela peristiwa sistem dari topik "Ikhtisar".

Skenario ⑤

Dalam skenario ⑤, Anda dapat menyebar ulang instance yang terpengaruh ke host yang berbeda atau mengotorisasi penggantian disk lokal yang rusak. Perhatikan hal-hal berikut saat mengganti disk lokal yang rusak:

  • Hanya disk tertentu dari instance dengan disk lokal yang dapat diisolasi. Anda hanya dapat mengisolasi disk yang rusak jika peristiwa sistem melibatkan peristiwa atau operasi isolasi disk.

  • Isolasi disk dan pemeliharaan disk bersifat independen satu sama lain. Isolasi disk diperlukan untuk pemeliharaan disk, tetapi tidak dapat menjamin hasil dari pemeliharaan disk. Pemeliharaan disk lokal tidak didukung untuk semua instance. Anda hanya dapat memulai pemeliharaan disk ketika Anda menerima pemberitahuan pemulihan disk dari Alibaba Cloud.

  • Jika Anda ingin memulihkan disk lokal untuk sebuah instance, Anda dapat menyebar ulang instance tersebut. Namun, ketika instance disebar ulang, data yang tersimpan di disk lokal akan hilang. Untuk informasi lebih lanjut, lihat Sebar ulang instance yang memiliki disk lokal terpasang.

  • Ketika disk lokal yang rusak diganti, hanya data dari disk lokal yang diganti yang hilang. Data yang tersimpan di disk lokal lain pada instance tetap ada. Untuk mengganti disk lokal yang rusak pada sebuah instance, lakukan operasi berikut:

    1. Anda akan diberitahu ketika disk lokal pada sebuah instance rusak dan dijadwalkan untuk diisolasi.

    2. Buat persiapan seperti memodifikasi file konfigurasi /etc/fstab dan mencadangkan data.

    3. Jika disk sistem melibatkan peristiwa atau operasi isolasi disk yang rusak, otorisasi disk lokal yang rusak untuk diisolasi.

    4. Jika peristiwa sistem melibatkan peristiwa atau operasi reboot, restart instance.

    5. Alibaba Cloud melepas disk lokal yang rusak dari host tempat instance Anda berada, memasukkan disk baru, dan kemudian mengirimkan pemberitahuan pemulihan disk kepada Anda.

    6. Jika peristiwa sistem melibatkan peristiwa atau operasi pemulihan disk, otorisasi disk untuk dipulihkan.

    7. Jika peristiwa sistem melibatkan peristiwa atau operasi reboot, restart instance.

    Catatan

    Untuk mengganti disk lokal yang rusak, Anda harus bekerja sama dengan Alibaba Cloud. Untuk informasi lebih lanjut, lihat Isolasikan disk lokal yang rusak di konsol ECS dan Isolasikan disk lokal yang rusak menggunakan CLI Alibaba Cloud.

    Gambar berikut menunjukkan status peristiwa yang didukung oleh peristiwa sistem terkait disk lokal yang rusak dan transisi antara status peristiwa tersebut.

Skenario ⑥

Dalam skenario ⑥, Anda dapat menyebar ulang instance yang terpengaruh ke host yang berbeda atau mengotorisasi perbaikan di tempat untuk dilakukan. Perhatikan hal-hal berikut saat mengotorisasi perbaikan di tempat:

  • Perbaikan di tempat tidak dapat menjamin kehilangan data nol atau tingkat keberhasilan perbaikan 100%. Sebelum Anda mengotorisasi perbaikan di tempat, pastikan Anda telah mencadangkan semua data bisnis utama Anda.

  • Hanya disk tertentu pada instance yang dilengkapi dengan disk lokal yang dapat diperbaiki secara offline.

  • Di dalam jendela perbaikan, instance tidak dapat dimulai dan terus dibebankan berdasarkan metode penagihannya.

  • Perbaikan di tempat memerlukan 14 hari kerja untuk selesai. Di dalam jendela perbaikan, Anda dapat menyebar ulang atau melepaskan instance yang sedang diperbaiki untuk mengakhiri proses perbaikan.

  • Jika Anda ingin memulihkan disk lokal untuk sebuah instance, Anda dapat menyebar ulang instance tersebut. Namun, ketika instance disebar ulang, data yang tersimpan di disk lokal akan hilang. Untuk informasi lebih lanjut, lihat Sebar ulang instance yang memiliki disk lokal terpasang.

  • Prosedur untuk menangani peristiwa sistem SystemMaintenance.StopAndRepair:

    1. Anda menerima peristiwa sistem yang menunjukkan bahwa sebuah instance dengan disk lokal perlu diperbaiki di tempat.

    2. Gunakan salah satu metode berikut untuk menangani peristiwa:

      • Di dalam jendela operasi pengguna, hentikan instance dan otorisasi perbaikan di tempat untuk dilakukan.

      • Tunggu sistem menghentikan instance dan memperbaiki perangkat keras host.

    3. Alibaba Cloud memperbaiki perangkat keras host dan mengirimkan peristiwa penyelesaian perbaikan ketika perangkat keras diperbaiki.

    4. Periksa apakah instance dan aplikasi terus bekerja seperti yang diharapkan. Jika ya, sinkronkan data berdasarkan kebutuhan bisnis Anda.

Untuk informasi tentang status peristiwa yang didukung oleh SystemMaintenance.StopAndRepair, lihat Ringkasan. Untuk gambar yang menunjukkan transisi tipikal antara status peristiwa, lihat bagian Status dan jendela peristiwa sistem dari topik "Ikhtisar".

Referensi

Anda dapat memanggil operasi AcceptInquiredSystemEvent untuk menerima operasi default untuk peristiwa sistem dan mengotorisasi sistem untuk melakukan operasi tersebut.