全部产品
Search
文档中心

Elastic Compute Service:Isolasikan atau perbaiki disk lokal

更新时间:Aug 09, 2025

Ketika sebuah disk lokal dari instance Elastic Compute Service (ECS) tidak dapat dibaca atau ditulis secara normal karena kegagalan perangkat keras, anomali data, atau alasan lainnya, Alibaba Cloud akan mengirimkan Anda sebuah event kerusakan disk lokal. Anda dapat mengisolasi atau memperbaiki disk lokal yang rusak melalui Konsol atau OpenAPI.

Penting

Mengisolasi atau memperbaiki disk menyebabkan hilangnya data pada disk lokal yang rusak, dan data tersebut tidak dapat dipulihkan. Cadangkan data Anda terlebih dahulu.

Selama isolasi atau perbaikan disk, Anda dapat memilih untuk menerapkan ulang instance dengan disk lokal kapan saja untuk segera memulihkan penggunaan penuh disk, tetapi operasi ini akan menyebabkan semua data disk hilang.

Prosedur operasi

  1. Modifikasi File Konfigurasi: Untuk instance Linux, masuk ke instance dan modifikasi file konfigurasi /etc/fstab di sistem operasi, serta lepas disk lokal yang rusak untuk menghindari risiko membaca atau menulis ke disk yang salah selama penggantian disk.

  2. Isolasikan Disk yang Rusak: Isolasikan disk lokal yang rusak. Setelah diisolasi, instance dapat terus beroperasi secara normal.

  3. Ganti Disk: Alibaba Cloud mengganti disk yang rusak.

  4. Pulihkan Disk: Masuk ke instance ECS untuk memodifikasi file konfigurasi /etc/fstab di sistem operasi dan pasang perangkat disk lokal baru.

Catatan

Saat ini, hanya keluarga instans big data d1, d2, d3 seri dan keluarga instans SSD lokal i4 yang mendukung isolasi dan penggantian disk online. Keluarga instans SSD lokal i3 dan i2 mendukung isolasi disk lokal tetapi tidak mendukung penggantian disk lokal. Selain itu, apakah Anda perlu mengisolasi atau memulihkan disk lokal tergantung pada tingkat kerusakan pada disk lokal. Harap ikuti proses aktual yang ditampilkan di halaman.

Prosedur

Modifikasi file konfigurasi (hanya untuk Linux)

Tidak semua instance memerlukan modifikasi file konfigurasi. Jika sistem operasi instance Anda bukan Linux, lewati langkah ini. Jika itu adalah Linux, sebelum mengisolasi disk lokal yang rusak, Anda perlu memodifikasi file /etc/fstab dan melepas disk lokal yang rusak di sistem operasi:

Modifikasi File Konfigurasi

  1. Hubungkan ke Instance Linux.

  2. Jika Anda telah mengonfigurasi pemasangan otomatis disk lokal saat startup di file /etc/fstab instance ECS Anda, tambahkan parameter nofail dan barrier untuk semua disk lokal di file konfigurasi untuk memastikan bahwa startup instance ECS tidak terpengaruh ketika pemasangan lokal gagal.

    Sebelum Modifikasi:

    UUID=cf4572d0-****-*** /path/to/mountpoint fstype defaults 0 0

    Setelah Modifikasi:

    UUID=cf4572d0-****-*** /path/to/mountpoint fstype defaults,nofail,barrier=0 0 0

    Parameter

    Deskripsi

    UUID

    UUID dari disk data lokal, yang dapat dikueri menggunakan perintah blkid.

    /path/to/mountpoint

    Titik pemasangan disk lokal, yang dapat dikueri menggunakan perintah blkid.

    fstype

    Tipe sistem file, yang dapat dikueri menggunakan perintah blkid.

    barrier

    Apakah akan mengaktifkan fungsi write barrier. 0 berarti dinonaktifkan, dan 1 berarti diaktifkan.

    nofail

    Kegagalan pemasangan disk tidak akan memengaruhi startup instance.

  3. Lepas disk lokal yang rusak.

    Penting

    Jika Anda tidak melakukan operasi pelepasan, setelah disk yang rusak diperbaiki, nama perangkat disk lokal akan berubah, yang dapat menyebabkan aplikasi membaca atau menulis ke disk yang salah.

    umount /path/to/mountpoint

Isolasikan disk yang rusak

Konsol ECS

  1. Kunjungi Konsol ECS-Events.

  2. Di panel navigasi kiri halaman Events, klik Local Disk-based Instance Events > Local Disk Damaged Events, dan klik Repair Disk di kolom Actions dari event target.image

  3. Di langkah Modifikasi Konfigurasi, konfirmasikan bahwa Anda telah menyelesaikan modifikasi file konfigurasi, dan klik Next.

    修改配置

  4. Di langkah Isolate Damaged Disk, klik OK. Tunggu hingga isolasi selesai. Jika halaman panduan Anda menunjukkan langkah Instance Restart, Anda perlu me-restart instance.image

    Catatan

    Jika langkah berikutnya tidak ditampilkan setelah beberapa menit, coba segarkan halaman.

Operasi API

  1. Kueri peristiwa sistem.

    Panggil DescribeInstanceHistoryEvents untuk menanyakan peristiwa sistem dalam status Inquiring (Inquiring) di wilayah tertentu, dan catat EventId (EventId) dan nama peristiwa (Name) yang dikembalikan.

  2. Otorisasi dan eksekusi isolasi disk yang rusak.

    Panggil AcceptInquiredSystemEvent untuk memberi otorisasi kepada Alibaba Cloud untuk melakukan operasi isolasi disk.

    • Ketika nama peristiwa adalah SystemMaintenance.IsolateErrorDisk:

      • Jika hanya RequestId yang dikembalikan, Anda tidak perlu me-restart instance. Tunggu Alibaba Cloud melakukan operasi penggantian disk.

      • Jika code:SwitchToOffline.OnlineIsolateFail dikembalikan, Anda perlu me-restart instance.

    • Ketika nama peristiwa adalah SystemMaintenance.RebootAndIsolateErrorDisk: Setelah memanggil AcceptInquiredSystemEvent, Anda perlu me-restart instance.

Catatan

Setelah instance di-restart, disk lokal yang rusak yang diisolasi sementara diubah menjadi hard disk dummy 1 MiB. Anda perlu terus mengisolasi operasi baca dan tulis pada disk lokal yang rusak di lapisan aplikasi dan mempertahankan pengaturan nofail dan barrier di file /etc/fstab.

Ganti disk

Anda tidak perlu melakukan operasi apa pun. Harap tunggu Alibaba Cloud mengganti disk lokal yang rusak. Operasi penggantian diperkirakan selesai dalam lima hari kerja. Anda dapat memeriksa kemajuan pemrosesan di halaman Local Disk Events.

Pulihkan disk

Konsol ECS

  1. Ketika Disk Repair Progress berubah menjadi To Be Restored, menunjukkan bahwa peristiwa berada di tahap Disk Restoration, klik Repair Disk di kolom Actions, lalu klik tombol Restore di jendela popup.

    image

  2. Jika halaman panduan Anda menunjukkan langkah Instance Restart, Anda perlu me-restart instance.

  3. Ketika Disk Repair Progress berubah menjadi Handled, menunjukkan bahwa peristiwa telah sepenuhnya diproses.

API

  1. Kueri peristiwa sistem.

    Panggil DescribeInstanceHistoryEvents untuk menanyakan peristiwa sistem. Setelah Alibaba Cloud menyelesaikan penggantian disk, mereka akan menerbitkan peristiwa SystemMaintenance.ReInitErrorDisk atau SystemMaintenance.RebootAndReInitErrorDisk.

  2. Otorisasi pemulihan disk.

    Panggil AcceptInquiredSystemEvent untuk memberi otorisasi pelaksanaan operasi pemulihan disk.

    • Ketika nama peristiwa adalah SystemMaintenance.ReinitErrorDisk:

      • Jika hanya RequestId yang dikembalikan, Anda tidak perlu me-restart instance.

      • Jika code=SwitchToOffline.OnlineReInitFail dikembalikan, Anda perlu me-restart instance.

    • Ketika nama peristiwa adalah SystemMaintenance.RebootAndReinitErrorDisk: Setelah memanggil AcceptInquiredSystemEvent, Anda perlu me-restart instance.

Apa yang harus dilakukan selanjutnya

Setelah disk diperbaiki, periksa status instance ECS dan disk lokal Anda. Pada titik ini, disk lokal yang diganti adalah baru dan perlu diinisialisasi sebelum dapat digunakan. Untuk informasi lebih lanjut, lihat Inisialisasi Disk Data pada Instance Windows atau Inisialisasi Disk Data pada Instance Linux.