本番サイトで、火災や地震などの不可抗力によるイベントや、ソフトウェアやハードウェアの障害などの機器の障害が発生すると、アプリケーションが短期間で実行できなくなる可能性があります。 そこで Elastic Compute Service (ECS) ディザスタリカバリは、単一ゾーンの障害に対して要求される目標復旧時間 (RTO) および目標復旧時点 (RPO) でリカバリするために、アプリケーションデータをバックアップし、別のゾーンでアプリケーションを実行する、クロスゾーンディザスターリカバリを提供します。

準備

クロスゾーンのディザスタリカバリを実装する前に、本番環境とは異なるゾーンを宛先ゾーンとして選択し、宛先ゾーンに仮想プライベートクラウド (VPC) を作成してから、VPC でレプリケーションネットワークおよび復元ネットワーク用に個別に VSwitch を作成する必要があります。

ステップ 1:ディザスタリカバリサイトペアの作成

ディザスタリカバリサイトペアを作成し、プライマリサイトの ECS インスタンスにクロスゾーンのディザスタリカバリ保護を提供するには、次の手順に従います。

  1. Hybrid Backup Recovery (HBR) コンソールにログインします。
  2. 左側のナビゲーションペインで、 [ディザスタリカバリ] > [ECS ディザスタリカバリ] の順に選択します。
  3. [サイトペア情報] タブで、右上隅にある [追加] をクリックします。
  4. 表示される [ディザスタリカバリサイトペアの作成 (継続的データレプリケーション)] ダイアログボックスで、[タイプ] を [ゾーン間] に設定し、プライマリサイトおよびセカンダリサイトのリージョン、VPC、およびゾーンを選択します。
    ゾーン間
  5. [作成] をクリックします。

ステップ 2:保護する ECS インスタンスの追加

保護する ECS インスタンスを追加するには、次の手順に従います。

  1. [保護されたサーバー] タブをクリックします。 このタブで、右上隅のドロップダウンリストから、ステップ 1 で作成したディザスタリカバリサイトペアを選択します。
  2. [保護されたサーバー] タブで、[追加] をクリックします。 表示される [保護されたサーバーの追加] ダイアログボックスで、保護する ECS インスタンスを少なくとも 1 つ選択し、[OK] をクリックします。 最大 10 個の ECS インスタンスを選択できます。
    追加された 1 つ以上の ECS インスタンスの [サーバーステータス] 列に表示されるステータスが [エージェントのインストール中] であり、それが次に [初期化済み] に変わることを確認します。

    ECS インスタンスのステータスが [初期化済み] でない場合は、[操作] 列で [詳細] > [サーバー操作] > [サーバーの再起動] を選択して、インスタンスを初期化します。

ステップ 3:レプリケーションの開始

ECS インスタンスをクラウドに複製し、リアルタイムレプリケーションを維持するには、次の手順に従います。

  1. [保護されたサーバー] タブで複製する ECS インスタンスを見つけ、[操作] 列で [詳細] > [フェイルオーバー] > [レプリケーションの開始] を選択します。
  2. 表示される [レプリケーションの有効化] ダイアログボックスで、[復元ポイントポリシー][SSD の使用][レプリケーションネットワーク][復元ネットワーク]、および [レプリケーション中断後の自動再起動] を設定します。
    レプリケーションおよび復元ネットワークに使用される VSwitch は、同じゾーンにある必要があります。
    レプリケーションの有効化
  3. [開始] をクリックします。
    次に、ECS インスタンスのステータスが [レプリケーションの有効化中][初期完全同期]、および [レプリケーション中] の順に変わります。
    • レプリケーションの有効化中:ECS ディザスタリカバリは、ECS インスタンスのデータをスキャンして、全体的なデータ量を評価しています。 このプロセスは通常数分続きます。
    • 初期完全同期:ECS ディザスタリカバリは、ECSインスタンスの有効なデータを Alibaba Cloud にレプリケーションしています。 レプリケーション期間は、インスタンス上の有効なデータの量やネットワーク帯域幅などの要因によって異なります。 [サーバーステータス] 列のプログレスバーに、レプリケーションの進行状況が表示されます。
    • レプリケーション中:ECS インスタンス上のすべての有効なデータが完全なレプリケーションによって Alibaba Cloud にレプリケートされた後、Aliyun Replication Service (AReS) は ECS インスタンス上のディスク上で実行されるすべての書き込み操作を監視し、増分データをリアルタイムで継続的に Alibaba Cloud に複製します。

(オプション) ディザスタリカバリ演習の実行

ECS インスタンスが [レプリケーション中] 状態になった後、ECS インスタンスでディザスタリカバリ演習を実行できます。

ディザスタリカバリ演習はディザスタリカバリの重要な部分です。 クラウド上で保護された ECS インスタンスを実行して、関連するアプリケーションの正当性を検証できます。 これには次の機能が備わっています。

  • 保護されたアプリケーションをクラウドで実行できるかどうかを簡単に確認できます。
  • ディザスタリカバリプロセスに精通し、プライマリサイトで障害が発生したときにフェイルオーバーをスムーズに実行できるようにします。

ディザスタリカバリ演習を実行するには、次の手順に従います。

  1. [保護されたサーバー] タブでターゲット ECS インスタンスを見つけ、[操作] 列で [ディザスタリカバリ演習] をクリックします。
  2. 表示される [フェイルオーバーのテスト] ダイアログボックスで、[復元ネットワーク][IP アドレス][ECS 仕様の使用][ハードディスクタイプ][復元ポイント][エラスティックパブリックネットワーク IP]、および [フェイルオーバー後にスクリプトを実行] を設定します。
    • HBR は、各 ECS インスタンスの過去 24 時間に 24 の復元ポイントを自動的に保持します。
    • [ECS 仕様を使用] を選択しない場合は、vCPU の数とメモリ容量を指定する必要があります。
  3. [開始] をクリックします。
    次に、Alibaba Cloud は指定された時間にバックグラウンドで ECS インスタンスを実行します。 バックグラウンドで実行されるディザスタリカバリ演習は、リアルタイムのデータレプリケーションには影響しません。
  4. ディザスタリカバリ演習が数分以内に完了したら、[ディザスタリカバリ情報] 列のリンクをクリックして、復元されたデータとアプリケーションを確認します。
  5. 確認が完了したら、[操作] 列の [テストフェイルオーバー環境のクリア] をクリックします。 次に、復元された ECS インスタンスが削除されます。
    復元された ECS インスタンスが確認されたら、コストを削減するために、復元された ECS インスタンスをできるだけ早く削除することをお勧めします。

ステップ 4:フェイルオーバーの実行

定期的なディザスタリカバリ演習により、いつでもクラウド上でビジネスを実行できることを確認できます。 プライマリサイトで重大なエラーが発生した場合、コアビジネスをクラウドですぐに再開する必要があるでしょう。 この場合、フェイルオーバーを実行する必要があります。

警告 フェイルオーバーは、保護された ECS インスタンスに重大なエラーが発生した場合に適用できます。 フェイルオーバー中、ECS ディザスタリカバリはリアルタイムのデータレプリケーションを停止します。 保護された ECS インスタンスの保護を再開するには、データレプリケーションを再開し、ECS インスタンスのすべての有効なデータを Alibaba Cloud に再度レプリケートする必要があります。

フェイルオーバーを実行するには、次の手順に従います。

  1. [保護されたサーバー] タブでターゲット ECS インスタンスを見つけ、[操作] 列の [詳細] > [フェイルオーバー] > [フェイルオーバー] を選択します。
  2. 表示される [フェイルオーバー] ダイアログボックスで、[復元ネットワーク][IP アドレス][ECS 仕様の使用][ハードディスクタイプ][復元ポイント][エラスティックパブリックネットワーク IP]、および [フェイルオーバー後にスクリプトを実行] を設定します。
    重要 ECS インスタンスを現在の時点に復元できるのは 1 回だけです。
  3. [開始] をクリックします。
  4. フェイルオーバーが完了したら、[復元されたインスタンス ID/名前] 列のリンクをクリックし、復元されたデータとアプリケーションを確認します。
    • 現在の時点に復元した後でアプリケーションが正常に実行される場合は、[操作] 列で [詳細] > [フェイルオーバー] > [フェイルオーバーのコミット] を選択します。
      フェイルオーバーを完了するか、復元ポイントを変更し、保護された ECS インスタンスから復元されたアプリケーションが正常を実行していることを確認したら、フェイルオーバーをコミットして、フェイルオーバー中に使用されていたクラウドリソースを解放し、リソースを節約できます。
    • 現在の時点に復元した後でアプリケーションが要件を満たしていない場合、たとえば、復元されたデータベースのデータがソースデータベースのデータと一致していない、またはソース ECS インスタンスのダーティデータが復元先のリージョンの復元された ECS インスタンスに同期されている場合、[操作] 列で [詳細] > [フェイルオーバー] > [復元ポイントの変更] を選択して、フェールオーバーをコミットする前に復元ポイントを変更します。
    復元ポイントを変更する手順はフェイルオーバーの場合と同様ですが、現在の時点より前の復元ポイントを選択する必要がある点が異なります。

ステップ 5:逆レプリケーションの実行

あるゾーン (ゾーン A) の保護された ECS インスタンス上のアプリケーションを別のゾーン (ゾーン B) にレプリケーションした後、逆レプリケーションを実行して、ゾーン B からゾーン A にアプリケーションを複製することもできます。

  1. [保護されたサーバー] タブでターゲット ECS インスタンスを見つけ、[操作] 列の [詳細] > [フェイルバック] > [逆登録] を選択します。 表示されるダイアログボックスで、ECS インスタンスで逆登録を実行することを確認します。
  2. [操作] 列で [詳細] > [フェイルバック] > [逆レプリケーションの開始] を選択します。
  3. 表示される [逆レプリケーションの開始] ダイアログボックスで、[元のマシンの復元][レプリケーションネットワーク]、および [復元ネットワーク] を設定します。
    警告 クロスリージョンディザスタリカバリとクロスゾーンディザスタリカバリにより、アプリケーションを複製して元の ECS インスタンスに戻すことができます。 ただし、アプリケーションを複製して元の ECS インスタンスに戻すと、元の ECS インスタンスのデータは上書きされます。 慎重に操作を実行する必要があります。
  4. [開始] をクリックします。
  5. ECS インスタンスが [逆レプリケーション有効] 状態になった後、[操作] 列の [詳細] > [フェイルバック] > [フェイルバック] を選択します。
  6. 表示される [フェイルバック] ダイアログボックスで、[CPU][メモリ][復元ネットワーク][IP アドレス]、および [復元後にスクリプトを実行] を設定し、[開始]をクリックします。
  7. フェールバックが完了したら、[操作] 列で [詳細] > [フェイルオーバー] > [登録] を選択し、保護された ECS インスタンスを再度登録します。