作為一款典型的分布式中介軟體產品,雲訊息佇列 RocketMQ 版被廣泛應用於業務核心鏈路中,每條訊息都關聯著核心業務資料的變化,通過可觀測能力及時發現問題、定位問題、解決問題對於業務運行是一項重要的保障能力。本文介紹雲訊息佇列 RocketMQ 版可觀測體系的主要功能。
雲訊息佇列 RocketMQ 版的可觀測體系主要由指標(Metrics)、軌跡(Tracing)和日誌(Logging)組成。
雲訊息佇列 RocketMQ 版中定義了詳細的Metrics指標,這些指標覆蓋生產者、消費者、服務端及訊息收發關鍵介面和流程的統計資料,並支援從執行個體、Topic和Group等多個維度進行彙總展示,協助您即時監控訊息業務或雲訊息佇列 RocketMQ 版服務的運行狀態。
和4.x版本相比,雲訊息佇列 RocketMQ 版服務端5.x版本增加了訊息堆積情境相關指標、關鍵介面的耗時指標、錯誤分布指標、儲存讀寫流量等指標,協助您更好地監控異常情境。
在分布式應用中,雲訊息佇列 RocketMQ 版作為全鏈路中非同步解耦的關鍵服務,提供的Tracing資料可有效將業務上下遊資訊串聯起來,協助您更好地排查異常,定位問題。
和4.x版本相比,雲訊息佇列 RocketMQ 版服務端5.x版本支援OpenTelemetry開源標準,提供更加豐富的軌跡指標,針對消費情境、進階訊息類型情境等細化軌跡內容,為問題定位提供更多關鍵資訊。
雲訊息佇列 RocketMQ 版為不同的異常情況定義唯一的錯誤碼及錯誤資訊,並劃分不同的錯誤層級,您可以根據用戶端返回的錯誤碼資訊快速擷取異常原因。
和4.x版本相比,雲訊息佇列 RocketMQ 版服務端5.x版本統一了ErrorCode和ErrorMessage,異常日誌中增加了RequestID、資源資訊,細化了錯誤資訊,保證日誌內容明確可靠。