データセンターの火災や停電などの不可抗力な事象、またはソフトウェアやハードウェアの損傷などの機器の障害により、本番サイトを迅速に復旧できない場合は、Elastic Compute Service (ECS) のディザスタリカバリサービスを利用できます。このサービスは、アプリケーション全体をバックアップし、単一ゾーンの障害を管理するためのクロスゾーンディザスタリカバリを提供します。これにより、ビジネスにおける中核的な目標復旧時間 (RTO) と目標復旧時点 (RPO) のメトリックを達成できます。
事前準備
クロスゾーンディザスタリカバリを実装する前に、別のゾーンを選択して VPC を作成します。次に、宛先ゾーンにレプリケーション vSwitch と復旧 vSwitch を作成します。
ステップ 1:ディザスタリカバリサイトペアの作成
事前準備が完了したら、次の手順に従って、ソース ECS インスタンスのクロスゾーンディザスタリカバリを有効にします。
Cloud Backup コンソールにログインします。
を選択します。
[継続的レプリケーションディザスタリカバリに切り替え] をクリックします。
[ディザスタリカバリセンター] ページの右上隅にある [+ 追加] をクリックします。
[サイトペアの作成] パネルで、[タイプ] を [クロスゾーンディザスタリカバリ] に設定し、事前準備で作成した VPC を選択します。

[作成] をクリックします。
ステップ 2:保護対象サーバーの追加
継続的レプリケーション用のディザスタリカバリサイトペアが作成されたら、次の手順に従って、保護するサーバーを追加します。
[保護対象サーバー] タブで、ステップ 1 で作成したサイトペアを選択します。
[+ 追加] をクリックし、保護する ECS インスタンスを選択してから、[OK] をクリックします。
保護する ECS インスタンスは 1~10 台選択できます。
サーバーのステータスが [クライアントインストール中] から [初期化済み] に変わります。サーバーのステータスが [初期化済み] に変わらない場合は、 をクリックして、クライアントの初期化を完了します。
ステップ 3:レプリケーションの開始
ディザスタリカバリレプリケーションを開始して、サーバーをクラウドにコピーし、リアルタイムレプリケーションを維持します。レプリケーションを開始するには、次の手順を実行します。
[保護対象サーバー] タブをクリックします。レプリケーションするサーバーの [操作] 列で、 を選択します。
[レプリケーションの開始] パネルで、次のパラメーターを設定し、[開始] をクリックします。
パラメーター
説明
復旧ポイントポリシー
復旧ポイントを作成する間隔を選択します。Cloud Backup は、この間隔で毎日復旧ポイントを作成します。単位は時間です。
ハードディスクタイプ
Ultra ディスク、ESSD、SSD をサポートしています。
ネットワークのコピー
レプリケーションネットワークを選択します。Cloud Backup は、このネットワークを使用してディザスタリカバリデータをクラウドにレプリケーションします。
デフォルトでは、Cloud Backup はセカンダリサイトの VPC から利用可能な vSwitch を読み取ります。レプリケーションネットワークと復旧ネットワークは同じ vSwitch を使用できます。復旧に同じネットワークを使用すると、より高速になります。レプリケーションネットワークと復旧ネットワークが異なるゾーンにある場合、RTO は増加します。[復旧ネットワーク] と同じゾーンにレプリケーションネットワークを設定することを推奨します。
復旧ネットワーク
復旧ネットワークを選択します。ディザスタリカバリ中、Cloud Backup はこのネットワークを使用してデータを復元します。たとえば、災害復旧訓練やフェールオーバー中に作成された ECS インスタンスはこのネットワークを使用します。
デフォルトでは、Cloud Backup はセカンダリサイトの VPC から利用可能な vSwitch を読み取ります。レプリケーションネットワークと復旧ネットワークは同じ vSwitch を使用できます。復旧に同じネットワークを使用すると、より高速になります。レプリケーションネットワークと復旧ネットワークが異なるゾーンにある場合、RTO は増加します。[レプリケーションネットワーク] と同じゾーンに復旧ネットワークを設定することを推奨します。
レプリケーション中断後の自動再開
レプリケーションが中断された場合にレプリケーションタスクを自動的に再開するかどうかを指定します。このオプションを選択すると、自動再開が有効になります。
ディザスタリカバリレプリケーションプロセスは、[レプリケーションの開始]、[完全レプリケーション]、[リアルタイムレプリケーション中] の 3 つのステージを経ます。
[レプリケーションの開始]:ECS ディザスタリカバリサービスは、システムデータをスキャンし、合計データボリュームを見積もります。このステージは通常、数分かかります。
[完全レプリケーション]:ECS ディザスタリカバリサービスは、すべての有効なサーバーデータを Alibaba Cloud に転送します。このステージに必要な時間は、データボリュームやネットワーク帯域幅などの要因によって異なります。コンソールの進捗横棒グラフにレプリケーションの進捗が表示されます。
[リアルタイムレプリケーション中]:完全レプリケーションが完了すると、データの完全なコピーが Alibaba Cloud で利用可能になります。その後、Aliyun Replication Service (AReS) はサーバー上のすべてのディスク書き込み操作をモニターし、リアルタイムで継続的に Alibaba Cloud にレプリケーションします。
(任意) 災害復旧訓練の実行
サーバーがリアルタイムレプリケーション状態になった後、災害復旧訓練を実行できます。
災害復旧訓練は、保護対象サーバーをクラウドで起動し、アプリケーションが正しく動作することを確認します。これは、ディザスタリカバリプロセス全体の重要な部分です。その主な目的は次のとおりです。
保護対象のアプリケーションがクラウドで正常に起動できることを確認します。
オペレーターがディザスタリカバリプロセスに習熟していることを確認します。この習熟により、プライマリサイトで障害が発生した場合にスムーズなスイッチオーバーを実行できます。
災害復旧訓練を実行するには、次の手順を実行します。
[保護対象サーバー] タブで、訓練対象のサーバーを見つけます。[操作] 列で、[災害復旧訓練] をクリックします。
[災害復旧訓練] パネルで、[復旧ネットワーク]、[IP アドレス]、[ECS 仕様の使用]、[ハードディスクタイプ]、[復旧ポイント]、[EIP]、および [切り替え後スクリプト] を設定します。その後、[開始] をクリックします。
説明Cloud Backup は、サーバーごとに過去 24 時間の最新の復旧ポイントを 24 個自動的に保持します。
ECS 仕様を使用しない場合は、CPU とメモリの情報も入力する必要があります。
その後、Alibaba Cloud は選択された時点に基づいてバックグラウンドでサーバーを起動します。訓練中、リアルタイムのデータレプリケーションは影響を受けません。
数分後、災害復旧訓練が完了します。[災害復旧訓練情報] の下のリンクをクリックして、データとアプリケーションを検証します。
訓練環境をクリアします。
検証後、サーバーを見つけます。[操作] 列で、[訓練環境のクリア] をクリックします。復元された ECS インスタンスは削除されます。
説明訓練中に復元された ECS インスタンスを検証した後、コストを削減するために、できるだけ早く訓練環境をクリアしてください。
ステップ 4:フェールオーバーの実行
定期的な災害復旧訓練により、ビジネスをいつでもクラウドで開始できることが保証されます。プライマリサイトで重大な障害が発生し、クラウドでコアサービスを直ちに再起動する必要がある場合は、フェールオーバーを実行する必要があります。
フェールオーバーは、保護対象サーバーに重大な障害が発生した場合の操作です。この操作により、リアルタイムレプリケーションプロセスが停止します。サーバーの保護を継続するには、レプリケーションを再開し、完全レプリケーションを完了する必要があります。
フェールオーバーを実行するには、次の手順を実行します。
[保護対象サーバー] タブで、フェールオーバーするサーバーを見つけます。[操作] 列で、 を選択します。
[フェールオーバー] パネルで、[復旧ネットワーク]、[IP アドレス]、[ECS 仕様の使用]、[ハードディスクタイプ]、[復旧ポイント]、[EIP]、および [切り替え後スクリプト] を設定します。その後、[開始] をクリックします。
重要[現在時刻] の復旧ポイントは一度しか使用できません。
フェールオーバーが完了したら、[フェールオーバー/フェイルバック情報] の下のリンクをクリックして、データとアプリケーションを確認します。
現在の時点でアプリケーションが正常に実行されている場合は、 を選択します。
説明フェールオーバーまたは復旧ポイントの切り替えが完了し、復元されたアプリケーションがビジネスを引き継いだことを確認したら、フェールオーバー操作を完了します。この操作により、クラウドでディザスタリカバリレプリケーションに使用されるリソースがクリーンアップされ、コストが節約されます。
現在の時点でのアプリケーションの状態が、データベースの整合性の問題や、ソースリージョンから汚染されたデータが同期されたなどの理由で要件を満たさない場合は、フェールオーバーを確認する前に を選択します。
説明復旧ポイントを変更する操作は、フェールオーバーと似ています。より前の復旧ポイントを選択するだけです。
ステップ 5:逆方向レプリケーションの実行
保護対象サーバー上のアプリケーションが、あるゾーン (例:ゾーン A) から別のゾーン (例:ゾーン B) にレプリケーションされた後、ゾーン B からゾーン A への逆方向レプリケーションを実行できます。
逆方向レプリケーションを実行するには、次の手順に従います。
[保護対象サーバー] タブで、逆方向レプリケーションの対象となるサーバーを見つけます。[操作] 列で、 を選択し、保護対象サーバーの逆登録を確認します。
[操作] 列で、 を選択します。
[逆方向レプリケーションの開始] パネルで、[インプレースリストア] を実行するかどうかを選択します。[レプリケーションネットワーク] と [復旧ネットワーク] を選択します。その後、[開始] をクリックします。
警告クロスリージョンおよびクロスゾーンのディザスタリカバリは、インプレースリストアをサポートしています。インプレースリストアを使用すると、ECS ホスト上のデータがクリアされます。このオプションは注意して使用してください。
サーバーが逆方向のリアルタイムレプリケーション状態になったら、[操作] 列で を選択します。
[フェイルバック] パネルで、[CPU] と [メモリ] の情報を入力します。[復旧ネットワーク] と [IP アドレス] を選択します。[復旧後スクリプト] を編集します。
フェイルバックが完了したら、[操作] 列で を選択して、保護対象サーバーを再度登録します。