ハードウェア障害、データ異常などの理由により、Elastic Compute Service (ECS) インスタンスのローカルディスクの読み取りまたは書き込みが正常にできない場合、Alibaba Cloud はローカルディスク破損イベントを送信します。 コンソールまたは OpenAPI を使用して、破損したローカルディスクを隔離または修復できます。
ディスクの隔離または修復を行うと、破損したローカルディスクのデータが失われ、回復できなくなります。 事前に「データのバックアップ」をご参照ください。
ディスクの隔離または修復中は、いつでもローカルディスクを使用してインスタンスを再デプロイすることで、ディスクの完全な使用量を迅速に復元できますが、この操作を行うとすべてのディスクデータが失われます。
操作手順
構成ファイルの変更:Linux インスタンスの場合、インスタンスにログインしてオペレーティングシステムの /etc/fstab 構成ファイルを変更し、破損したローカルディスクデバイスをアンマウントして、ディスク交換中に誤ったディスクに読み取りまたは書き込みを行うリスクを回避する必要があります。
破損したディスクの隔離:破損したローカルディスクを隔離します。 隔離後、インスタンスは引き続き正常に動作できます。
ディスクの交換:Alibaba Cloud は破損したディスクを交換します。
ディスクの復元:ECS インスタンスにログインして、オペレーティングシステムの /etc/fstab 構成ファイルを変更し、新しいローカルディスクデバイスをマウントします。
現在、ビッグデータインスタンスファミリー d1、d2、d3 シリーズとローカル SSD インスタンスファミリー i4 のみがオンラインディスクの隔離と交換をサポートしています。 ローカル SSD インスタンスファミリー i3 および i2 はローカルディスクの隔離をサポートしていますが、ローカルディスクの交換はサポートしていません。 さらに、ローカルディスクを隔離または復元する必要があるかどうかは、ローカルディスクの損傷の程度によって異なります。 ページに表示される実際の手順に従ってください。
手順
構成ファイルの変更 (Linux のみ)
すべてのインスタンスで構成ファイルの変更が必要なわけではありません。 インスタンスのオペレーティングシステムが Linux でない場合は、この手順をスキップしてください。 Linux の場合は、破損したローカルディスクを隔離する前に、/etc/fstab ファイルを変更し、オペレーティングシステムで破損したローカルディスクをアンマウントする必要があります:
破損したディスクの隔離
ECS コンソール
ECS コンソール - イベント にアクセスします。
[イベント] ページの左側のナビゲーションウィンドウで、 をクリックし、ターゲットイベントの [アクション] 列で [ディスクの修復] をクリックします。

[構成の変更] ステップで、構成ファイルの変更が完了したことを確認し、[次へ] をクリックします。

[破損したディスクの隔離] ステップで、[OK] をクリックします。 隔離が完了するまで待ちます。 ガイドページに [インスタンスの再起動] ステップが表示されている場合は、インスタンスを再起動する必要があります。
説明数分経っても次のステップが表示されない場合は、ページを更新してみてください。
API 操作
システムイベントをクエリします。
DescribeInstanceHistoryEvents を呼び出して、指定したリージョンで Inquiring (
Inquiring) 状態のシステムイベントをクエリし、返された EventId (EventId) とイベント名 (Name) を記録します。破損したディスクの隔離を承認および実行します。
AcceptInquiredSystemEvent を呼び出して、Alibaba Cloud がディスク隔離操作を実行することを承認します。
イベント名が
SystemMaintenance.IsolateErrorDiskの場合:RequestId のみが返された場合は、インスタンスを再起動する必要はありません。 Alibaba Cloud がディスク交換操作を実行するまで待ちます。
code:SwitchToOffline.OnlineIsolateFailが返された場合は、「インスタンスの再起動」を行う必要があります。
イベント名が
SystemMaintenance.RebootAndIsolateErrorDiskの場合:AcceptInquiredSystemEvent を呼び出した後、「インスタンスの再起動」を行う必要があります。
インスタンスが再起動されると、隔離された破損ローカルディスクは一時的に 1 MiB のダミーハードディスクに変換されます。 アプリケーション層で破損したローカルディスクに対する読み取りおよび書き込み操作を継続的に隔離し、/etc/fstab ファイルの nofail および barrier 設定を維持する必要があります。
ディスクの交換
操作は必要ありません。 Alibaba Cloud が破損したローカルディスクを交換するまでお待ちください。 交換操作は 5 営業日以内に完了する予定です。 ローカルディスクイベント ページで処理の進捗状況を確認できます。
ディスクの復元
ECS コンソール
[ディスク修復の進捗状況] が [復元予定] に変わり、イベントが [ディスクの復元] ステージにあることを示している場合は、[アクション] 列の [ディスクの修復] をクリックし、ポップアップウィンドウの [復元] ボタンをクリックします。

ガイドページに [インスタンスの再起動] ステップが表示されている場合は、インスタンスを再起動する必要があります。
[ディスク修復の進捗状況] が [処理済み] に変わると、イベントが完全に処理されたことを示します。
API
システムイベントをクエリします。
DescribeInstanceHistoryEvents を呼び出して、システムイベントをクエリします。 Alibaba Cloud がディスク交換を完了すると、
SystemMaintenance.ReInitErrorDiskイベントまたはSystemMaintenance.RebootAndReInitErrorDiskイベントが発行されます。ディスクの復元を承認します。
AcceptInquiredSystemEvent を呼び出して、ディスク復元操作の実行を承認します。
イベント名が
SystemMaintenance.ReinitErrorDiskの場合:RequestId のみが返された場合は、インスタンスを再起動する必要はありません。
code=SwitchToOffline.OnlineReInitFailが返された場合は、「インスタンスの再起動」を行う必要があります。
イベント名が
SystemMaintenance.RebootAndReinitErrorDiskの場合:AcceptInquiredSystemEvent を呼び出した後、「インスタンスの再起動」を行う必要があります。
次のステップ
ディスクの修復後、ECS インスタンスとローカルディスクの状態を確認します。 この時点で、交換されたローカルディスクは新規であり、使用する前に初期化する必要があります。 詳細については、「データディスクの初期化 (Windows)」または「Linux インスタンスでのデータディスクの初期化」をご参照ください。