ApsaraMQ for RocketMQ は、フォールトドリル機能を提供します。この機能は、ゾーンレベルのディザスタリカバリプロシージャをシミュレートして、サービスの可用性と安定性を向上させるのに役立ちます。
背景情報
ゾーン (AZ) の障害により、そのゾーンのサービスインスタンスが利用できなくなり、部分的または全体的なサービス中断につながる可能性があります。ApsaraMQ for RocketMQ は、マルチゾーンデプロイメントをサポートし、フォールトドリル機能を提供します。ApsaraMQ for RocketMQ インスタンスのゾーンの 1 つでサービスを停止および再開して、ゾーン障害をシミュレートできます。これにより、潜在的な脆弱性を事前に特定して解決し、実際の障害発生時にもサービスが安定して稼働することを保証できます。
制限事項
この機能は、ApsaraMQ for RocketMQ 5.x シリーズの Platinum Edition インスタンスでのみ利用可能です。
注意事項
フォールトドリルの実行中に、以下の状況が発生する可能性があります。
クライアント接続が中断され、再接続されることがあります。
積み上げメッセージの配信が遅延することがあります。
サービス再開後に重複メッセージが表示されることがあります。
シーケンシャルトピックのメッセージが一時的に順不同で配信されることがあります。
クラスターに十分な容量があることを確認してください。ゾーン内のサービスが停止した後に残りの容量が不足すると、サービス中断が発生する可能性があります。
インスタンスに対してドリルタスクが実行されている間は、インスタンスのスペックアップ、スペックダウン、または編集はできません。
操作フロー
プロシージャ
ステップ 1: ドリルタスクの作成
ApsaraMQ for RocketMQ コンソールにログインします。トップメニューバーで、中国 (杭州) などのリージョンを選択します。
左側のナビゲーションウィンドウで、 を選択します。
[フォールトドリル] ページで、[タスクの作成] をクリックします。
[タスクの作成] パネルで、次のパラメーターを設定し、[OK] をクリックします。
タスク名: ドリルタスクの名前を入力します。
インスタンス: ドリル対象のインスタンスを選択します。
ステップ 2: サービスの停止
[フォールトドリル] ページで、対象タスクの名前をクリックします。
[フォールトドリル] 詳細ページで、ゾーンを選択し、[サービスの停止] をクリックします。
ステップ 3: アプリケーションサービスの検証
アプリケーションサービスの可用性を検証します。問題を特定して修正します。
ステップ 4: サービスの再開
[フォールトドリル] ページで、対象タスクの名前をクリックします。
[フォールトドリル] 詳細ページで、[サービスの再開] をクリックします。
ステップ 5: ドリルの終了
[フォールトドリル] ページで、対象タスクの名前をクリックします。
[フォールトドリル] 詳細ページで、[ドリルの終了] をクリックします。