すべてのプロダクト
Search
ドキュメントセンター

Elastic Compute Service:ローカルディスクの隔離または修復

最終更新日:Aug 09, 2025

ハードウェア障害、データ異常などの理由により、Elastic Compute Service (ECS) インスタンスのローカルディスクの読み取りまたは書き込みが正常にできない場合、Alibaba Cloud はローカルディスク破損イベントを送信します。 コンソールまたは OpenAPI を使用して、破損したローカルディスクを隔離または修復できます。

重要

ディスクの隔離または修復を行うと、破損したローカルディスクのデータが失われ、回復できなくなります。 事前に「データのバックアップ」をご参照ください。

ディスクの隔離または修復中は、いつでもローカルディスクを使用してインスタンスを再デプロイすることで、ディスクの完全な使用量を迅速に復元できますが、この操作を行うとすべてのディスクデータが失われます。

操作手順

  1. 構成ファイルの変更:Linux インスタンスの場合、インスタンスにログインしてオペレーティングシステムの /etc/fstab 構成ファイルを変更し、破損したローカルディスクデバイスをアンマウントして、ディスク交換中に誤ったディスクに読み取りまたは書き込みを行うリスクを回避する必要があります。

  2. 破損したディスクの隔離:破損したローカルディスクを隔離します。 隔離後、インスタンスは引き続き正常に動作できます。

  3. ディスクの交換:Alibaba Cloud は破損したディスクを交換します。

  4. ディスクの復元:ECS インスタンスにログインして、オペレーティングシステムの /etc/fstab 構成ファイルを変更し、新しいローカルディスクデバイスをマウントします。

説明

現在、ビッグデータインスタンスファミリー d1、d2、d3 シリーズとローカル SSD インスタンスファミリー i4 のみがオンラインディスクの隔離と交換をサポートしています。 ローカル SSD インスタンスファミリー i3 および i2 はローカルディスクの隔離をサポートしていますが、ローカルディスクの交換はサポートしていません。 さらに、ローカルディスクを隔離または復元する必要があるかどうかは、ローカルディスクの損傷の程度によって異なります。 ページに表示される実際の手順に従ってください。

手順

構成ファイルの変更 (Linux のみ)

すべてのインスタンスで構成ファイルの変更が必要なわけではありません。 インスタンスのオペレーティングシステムが Linux でない場合は、この手順をスキップしてください。 Linux の場合は、破損したローカルディスクを隔離する前に、/etc/fstab ファイルを変更し、オペレーティングシステムで破損したローカルディスクをアンマウントする必要があります:

構成ファイルの変更

  1. Linux インスタンスへの接続」をご参照ください。

  2. ECS インスタンスの /etc/fstab ファイルで起動時にローカルディスクの自動マウントを構成している場合は、構成ファイル内のすべてのローカルディスクに nofail パラメーターと barrier パラメーターを追加して、ローカルマウントが失敗した場合でも ECS インスタンスの起動に影響が出ないようにします。

    変更前:

    UUID=cf4572d0-****-*** /path/to/mountpoint fstype defaults 0 0

    変更後:

    UUID=cf4572d0-****-*** /path/to/mountpoint fstype defaults,nofail,barrier=0 0 0

    パラメーター

    説明

    UUID

    ローカルデータディスクの UUID。 blkid コマンドを使用してクエリできます。

    /path/to/mountpoint

    ローカルディスクのマウントポイント。 blkid コマンドを使用してクエリできます。

    fstype

    ファイルシステムの種類。 blkid コマンドを使用してクエリできます。

    barrier

    書き込みバリア機能を有効にするかどうか。 0 は無効、1 は有効を意味します。

    nofail

    ディスクマウントの失敗はインスタンスの起動に影響しません。

  3. 破損したローカルディスクをアンマウントします。

    重要

    アンマウント操作を実行しないと、破損したディスクが修復された後、ローカルディスクのデバイス名が変更され、アプリケーションが誤ったディスクに読み取りまたは書き込みを行う可能性があります。

    umount /path/to/mountpoint

破損したディスクの隔離

ECS コンソール

  1. ECS コンソール - イベント にアクセスします。

  2. [イベント] ページの左側のナビゲーションウィンドウで、[ローカルディスクベースのインスタンスイベント] > [ローカルディスク破損イベント] をクリックし、ターゲットイベントの [アクション] 列で [ディスクの修復] をクリックします。image

  3. [構成の変更] ステップで、構成ファイルの変更が完了したことを確認し、[次へ] をクリックします。

    修改配置

  4. [破損したディスクの隔離] ステップで、[OK] をクリックします。 隔離が完了するまで待ちます。 ガイドページに [インスタンスの再起動] ステップが表示されている場合は、インスタンスを再起動する必要があります。image

    説明

    数分経っても次のステップが表示されない場合は、ページを更新してみてください。

API 操作

  1. システムイベントをクエリします。

    DescribeInstanceHistoryEvents を呼び出して、指定したリージョンで Inquiring (Inquiring) 状態のシステムイベントをクエリし、返された EventId (EventId) とイベント名 (Name) を記録します。

  2. 破損したディスクの隔離を承認および実行します。

    AcceptInquiredSystemEvent を呼び出して、Alibaba Cloud がディスク隔離操作を実行することを承認します。

    • イベント名が SystemMaintenance.IsolateErrorDisk の場合:

      • RequestId のみが返された場合は、インスタンスを再起動する必要はありません。 Alibaba Cloud がディスク交換操作を実行するまで待ちます。

      • code:SwitchToOffline.OnlineIsolateFail が返された場合は、「インスタンスの再起動」を行う必要があります。

    • イベント名が SystemMaintenance.RebootAndIsolateErrorDisk の場合:AcceptInquiredSystemEvent を呼び出した後、「インスタンスの再起動」を行う必要があります。

説明

インスタンスが再起動されると、隔離された破損ローカルディスクは一時的に 1 MiB のダミーハードディスクに変換されます。 アプリケーション層で破損したローカルディスクに対する読み取りおよび書き込み操作を継続的に隔離し、/etc/fstab ファイルの nofail および barrier 設定を維持する必要があります。

ディスクの交換

操作は必要ありません。 Alibaba Cloud が破損したローカルディスクを交換するまでお待ちください。 交換操作は 5 営業日以内に完了する予定です。 ローカルディスクイベント ページで処理の進捗状況を確認できます。

ディスクの復元

ECS コンソール

  1. [ディスク修復の進捗状況][復元予定] に変わり、イベントが [ディスクの復元] ステージにあることを示している場合は、[アクション] 列の [ディスクの修復] をクリックし、ポップアップウィンドウの [復元] ボタンをクリックします。

    image

  2. ガイドページに [インスタンスの再起動] ステップが表示されている場合は、インスタンスを再起動する必要があります。

  3. [ディスク修復の進捗状況][処理済み] に変わると、イベントが完全に処理されたことを示します。

API

  1. システムイベントをクエリします。

    DescribeInstanceHistoryEvents を呼び出して、システムイベントをクエリします。 Alibaba Cloud がディスク交換を完了すると、SystemMaintenance.ReInitErrorDisk イベントまたは SystemMaintenance.RebootAndReInitErrorDisk イベントが発行されます。

  2. ディスクの復元を承認します。

    AcceptInquiredSystemEvent を呼び出して、ディスク復元操作の実行を承認します。

    • イベント名が SystemMaintenance.ReinitErrorDisk の場合:

      • RequestId のみが返された場合は、インスタンスを再起動する必要はありません。

      • code=SwitchToOffline.OnlineReInitFail が返された場合は、「インスタンスの再起動」を行う必要があります。

    • イベント名が SystemMaintenance.RebootAndReinitErrorDisk の場合:AcceptInquiredSystemEvent を呼び出した後、「インスタンスの再起動」を行う必要があります。

次のステップ

ディスクの修復後、ECS インスタンスとローカルディスクの状態を確認します。 この時点で、交換されたローカルディスクは新規であり、使用する前に初期化する必要があります。 詳細については、「データディスクの初期化 (Windows)」または「Linux インスタンスでのデータディスクの初期化」をご参照ください。