全部產品
Search
文件中心

ApsaraMQ for RocketMQ:故障演練

更新時間:Aug 13, 2025

雲訊息佇列 RocketMQ 版支援故障演練功能,能夠類比可用性區域層級的容災過程,協助您提升服務的高可用性和穩定性。

背景資訊

可用性區域(AZ)故障可能導致部署在該地區的服務執行個體不可用,從而引發局部乃至全域服務中斷或者不可用等問題。雲訊息佇列 RocketMQ 版支援多可用性區域部署,並提供故障演練功能。通過選擇雲訊息佇列 RocketMQ 版執行個體其中一個可用性區域進行服務的停止與恢複,類比可用性區域故障,主動識別服務系統的脆弱環節,從而提前修複相關問題,實現防患於未然,確保在真實故障發生時,服務能夠正常穩定運行。

使用限制

雲訊息佇列 RocketMQ 版5.x系列鉑金版支援。

注意事項

  • 在故障演練過程中可能會出現以下幾種情況:

    • 用戶端串連中斷,並進行重連。

    • 堆積訊息的投遞會延遲。

    • 服務恢複後出現訊息重複的情況。

    • 順序Topic中的訊息可能會出現短暫亂序的情況。

  • 請確保叢集的容量充足,以避免在可用性區域節點服務停止後,剩餘容量無法滿足業務需求的問題。

  • 當執行個體已建立演練任務且演練尚未結束時,該執行個體的升降配和編輯功能將被禁用。

操作流程

操作步驟

步驟一:建立演練任務

  1. 登入雲訊息佇列 RocketMQ 版控制台,在頂部功能表列選擇地區,如華東1(杭州)

  2. 在左側導覽列選擇RocketMQ Copilot > 故障演練

  3. 故障演練頁面,單擊建立任務

  4. 建立任務面板,配置以下參數,然後單擊確定

    • 任務名稱:輸入演練任務名稱。

    • 執行個體:選擇需要演練的執行個體。

步驟二:停止服務

  1. 故障演練頁面,單擊目標任務名稱。

  2. 故障演練詳情頁面,選擇一個可用性區域,然後單擊停止服務

步驟三:驗證應用服務

驗證應用服務的可用性,識別問題並進行修複。

步驟四:恢複服務

  1. 故障演練頁面,單擊目標任務名稱。

  2. 故障演練詳情頁面,單擊恢複服務

步驟五:結束演練

  1. 故障演練頁面,單擊目標任務名稱。

  2. 故障演練詳情頁面,單擊結束演練