Ketika sebuah disk lokal dari instance Elastic Compute Service (ECS) tidak dapat dibaca atau ditulis secara normal karena kegagalan perangkat keras, anomali data, atau alasan lainnya, Alibaba Cloud akan mengirimkan Anda sebuah event kerusakan disk lokal. Anda dapat mengisolasi atau memperbaiki disk lokal yang rusak melalui Konsol atau OpenAPI.
Mengisolasi atau memperbaiki disk menyebabkan hilangnya data pada disk lokal yang rusak, dan data tersebut tidak dapat dipulihkan. Cadangkan data Anda terlebih dahulu.
Selama isolasi atau perbaikan disk, Anda dapat memilih untuk menerapkan ulang instance dengan disk lokal kapan saja untuk segera memulihkan penggunaan penuh disk, tetapi operasi ini akan menyebabkan semua data disk hilang.
Prosedur operasi
Modifikasi File Konfigurasi: Untuk instance Linux, masuk ke instance dan modifikasi file konfigurasi /etc/fstab di sistem operasi, serta lepas disk lokal yang rusak untuk menghindari risiko membaca atau menulis ke disk yang salah selama penggantian disk.
Isolasikan Disk yang Rusak: Isolasikan disk lokal yang rusak. Setelah diisolasi, instance dapat terus beroperasi secara normal.
Ganti Disk: Alibaba Cloud mengganti disk yang rusak.
Pulihkan Disk: Masuk ke instance ECS untuk memodifikasi file konfigurasi /etc/fstab di sistem operasi dan pasang perangkat disk lokal baru.
Saat ini, hanya keluarga instans big data d1, d2, d3 seri dan keluarga instans SSD lokal i4 yang mendukung isolasi dan penggantian disk online. Keluarga instans SSD lokal i3 dan i2 mendukung isolasi disk lokal tetapi tidak mendukung penggantian disk lokal. Selain itu, apakah Anda perlu mengisolasi atau memulihkan disk lokal tergantung pada tingkat kerusakan pada disk lokal. Harap ikuti proses aktual yang ditampilkan di halaman.
Prosedur
Modifikasi file konfigurasi (hanya untuk Linux)
Tidak semua instance memerlukan modifikasi file konfigurasi. Jika sistem operasi instance Anda bukan Linux, lewati langkah ini. Jika itu adalah Linux, sebelum mengisolasi disk lokal yang rusak, Anda perlu memodifikasi file /etc/fstab dan melepas disk lokal yang rusak di sistem operasi:
Isolasikan disk yang rusak
Konsol ECS
Kunjungi Konsol ECS-Events.
Di panel navigasi kiri halaman Events, klik , dan klik Repair Disk di kolom Actions dari event target.

Di langkah Modifikasi Konfigurasi, konfirmasikan bahwa Anda telah menyelesaikan modifikasi file konfigurasi, dan klik Next.

Di langkah Isolate Damaged Disk, klik OK. Tunggu hingga isolasi selesai. Jika halaman panduan Anda menunjukkan langkah Instance Restart, Anda perlu me-restart instance.
CatatanJika langkah berikutnya tidak ditampilkan setelah beberapa menit, coba segarkan halaman.
Operasi API
Kueri peristiwa sistem.
Panggil DescribeInstanceHistoryEvents untuk menanyakan peristiwa sistem dalam status Inquiring (
Inquiring) di wilayah tertentu, dan catat EventId (EventId) dan nama peristiwa (Name) yang dikembalikan.Otorisasi dan eksekusi isolasi disk yang rusak.
Panggil AcceptInquiredSystemEvent untuk memberi otorisasi kepada Alibaba Cloud untuk melakukan operasi isolasi disk.
Ketika nama peristiwa adalah
SystemMaintenance.IsolateErrorDisk:Jika hanya RequestId yang dikembalikan, Anda tidak perlu me-restart instance. Tunggu Alibaba Cloud melakukan operasi penggantian disk.
Jika
code:SwitchToOffline.OnlineIsolateFaildikembalikan, Anda perlu me-restart instance.
Ketika nama peristiwa adalah
SystemMaintenance.RebootAndIsolateErrorDisk: Setelah memanggil AcceptInquiredSystemEvent, Anda perlu me-restart instance.
Setelah instance di-restart, disk lokal yang rusak yang diisolasi sementara diubah menjadi hard disk dummy 1 MiB. Anda perlu terus mengisolasi operasi baca dan tulis pada disk lokal yang rusak di lapisan aplikasi dan mempertahankan pengaturan nofail dan barrier di file /etc/fstab.
Ganti disk
Anda tidak perlu melakukan operasi apa pun. Harap tunggu Alibaba Cloud mengganti disk lokal yang rusak. Operasi penggantian diperkirakan selesai dalam lima hari kerja. Anda dapat memeriksa kemajuan pemrosesan di halaman Local Disk Events.
Pulihkan disk
Konsol ECS
Ketika Disk Repair Progress berubah menjadi To Be Restored, menunjukkan bahwa peristiwa berada di tahap Disk Restoration, klik Repair Disk di kolom Actions, lalu klik tombol Restore di jendela popup.

Jika halaman panduan Anda menunjukkan langkah Instance Restart, Anda perlu me-restart instance.
Ketika Disk Repair Progress berubah menjadi Handled, menunjukkan bahwa peristiwa telah sepenuhnya diproses.
API
Kueri peristiwa sistem.
Panggil DescribeInstanceHistoryEvents untuk menanyakan peristiwa sistem. Setelah Alibaba Cloud menyelesaikan penggantian disk, mereka akan menerbitkan peristiwa
SystemMaintenance.ReInitErrorDiskatauSystemMaintenance.RebootAndReInitErrorDisk.Otorisasi pemulihan disk.
Panggil AcceptInquiredSystemEvent untuk memberi otorisasi pelaksanaan operasi pemulihan disk.
Ketika nama peristiwa adalah
SystemMaintenance.ReinitErrorDisk:Jika hanya RequestId yang dikembalikan, Anda tidak perlu me-restart instance.
Jika
code=SwitchToOffline.OnlineReInitFaildikembalikan, Anda perlu me-restart instance.
Ketika nama peristiwa adalah
SystemMaintenance.RebootAndReinitErrorDisk: Setelah memanggil AcceptInquiredSystemEvent, Anda perlu me-restart instance.
Apa yang harus dilakukan selanjutnya
Setelah disk diperbaiki, periksa status instance ECS dan disk lokal Anda. Pada titik ini, disk lokal yang diganti adalah baru dan perlu diinisialisasi sebelum dapat digunakan. Untuk informasi lebih lanjut, lihat Inisialisasi Disk Data pada Instance Windows atau Inisialisasi Disk Data pada Instance Linux.