服務執行個體隔離與診斷可以有效地應對線上故障(例如記憶體泄露),提升微服務系統整體穩定性。當服務提供者的某些執行個體出現異常時,MSE治理中心將異常執行個體的流量隔離,並結合阿里雲Application Real-Time Monitoring Service (ARMS)所提供的記憶體快照產生能力,及時產生異常執行個體的線上環境記憶體快照,協助您進行後續問題分析與診斷。
前提條件
使用服務執行個體隔離與診斷功能,需要滿足以下條件:
當前僅支援Java語言相關的Dubbo 2.6.x、2.7.x和Spring Cloud E及以上版本應用。
如果Spring Cloud應用的配置項
spring.cloud.xxxx.discovery.fail-fast被設定為false,則不支援對該應用的上線與下線狀態進行判斷。產生異常執行個體的記憶體快照需要將執行個體接入阿里雲Application Real-Time Monitoring Service (ARMS)。具體操作,請參見接入指南。
操作步驟
登入MSE治理中心控制台,並在頂部功能表列選擇地區。
在左側導覽列,選擇治理中心 > 应用治理。
在应用列表頁面,單擊目標應用的資源卡片。
在左側導覽列,單擊节点详情頁簽,選擇異常執行個體,單擊操作下方的服务下线,並在微服务下线彈框中單擊确定,即可將執行個體從註冊中心移除。
執行個體從註冊中心移除後,若該執行個體已無新請求,可通過阿里雲應用監控服務ARMS提供的建立記憶體快照功能,給異常執行個體建立記憶體快照,以便後續進一步的問題排查。
在對應節點的操作列下方單擊去创建内存快照,在提示彈框單擊确定。

進入應用監控系統後,在應用詳情頁面單擊右上方建立記憶體快照,然後在彈框頁面建立記憶體快照中單擊儲存給異常執行個體建立記憶體快照。

相關文檔
如果您想瞭解更多關於記憶體快照建立和查看的資訊,請參見記憶體快照。