雲訊息佇列 RocketMQ 版支援故障演練功能,能夠類比可用性區域層級的容災過程,協助您提升服務的高可用性和穩定性。
背景資訊
可用性區域(AZ)故障可能導致部署在該地區的服務執行個體不可用,從而引發局部乃至全域服務中斷或者不可用等問題。雲訊息佇列 RocketMQ 版支援多可用性區域部署,並提供故障演練功能。通過選擇雲訊息佇列 RocketMQ 版執行個體其中一個可用性區域進行服務的停止與恢複,類比可用性區域故障,主動識別服務系統的脆弱環節,從而提前修複相關問題,實現防患於未然,確保在真實故障發生時,服務能夠正常穩定運行。
使用限制
僅雲訊息佇列 RocketMQ 版5.x系列鉑金版支援。
注意事項
在故障演練過程中可能會出現以下幾種情況:
用戶端串連中斷,並進行重連。
堆積訊息的投遞會延遲。
服務恢複後出現訊息重複的情況。
順序Topic中的訊息可能會出現短暫亂序的情況。
請確保叢集的容量充足,以避免在可用性區域節點服務停止後,剩餘容量無法滿足業務需求的問題。
當執行個體已建立演練任務且演練尚未結束時,該執行個體的升降配和編輯功能將被禁用。
操作流程
操作步驟
步驟一:建立演練任務
登入雲訊息佇列 RocketMQ 版控制台,在頂部功能表列選擇地區,如華東1(杭州)。
在左側導覽列選擇。
在故障演練頁面,單擊建立任務。
在建立任務面板,配置以下參數,然後單擊確定。
任務名稱:輸入演練任務名稱。
執行個體:選擇需要演練的執行個體。
步驟二:停止服務
在故障演練頁面,單擊目標任務名稱。
在故障演練詳情頁面,選擇一個可用性區域,然後單擊停止服務。
步驟三:驗證應用服務
驗證應用服務的可用性,識別問題並進行修複。
步驟四:恢複服務
在故障演練頁面,單擊目標任務名稱。
在故障演練詳情頁面,單擊恢複服務。
步驟五:結束演練
在故障演練頁面,單擊目標任務名稱。
在故障演練詳情頁面,單擊結束演練。