一站式雲端產品觀測服務
雲端監控2.0作為阿里雲一站式全棧智能可觀測平台,無縫融合日誌(SLS)、指標(CMS)與鏈路追蹤(ARMS),將指標、鏈路、日誌、事件等可觀測數據集中呈現於統一視圖。基於UModel建模與觀測圖譜,實現資源自動關聯與智能診斷,提供從用戶體驗到基礎設施的端到端可觀測能力。
全棧可觀測性
統一接入日誌、指標、鏈路、事件,實現雲端產品、應用程式及基礎設施的全棧監控,簡化運行維護流程。
統一儲存與分析
基於數據湖技術統一儲存可觀測數據,支援SPL統一查詢語言,提升檢索與分析效率,打破數據孤島。
自動關聯與圖譜分析
基於UModel構建觀測圖譜,自動識別資源關係,實現跨域數據關聯,快速定位問題根源。
智能運行維護
基於高質量數據與觀測圖譜,構建AIOps平台,並借助大型語言模型、領域模型與演算法,提供多種智能運行維護能力。
產品總覽
產品功能
運行維護監控
雲端產品監控
提供雲端產品核心指標監控、基本警報功能及資源視圖,滿足雲端產品運行維護需求。
網絡分析與監控
模擬用戶存取,監控網站可用性、回應速度,提前發現外部訪問問題。
事件中心
統一管理雲端產品系統事件與運行維護事件,支援事件匯總、通知及響應。
事件響應
整合警報與事件,實現故障響應、協同處理及事後回顧的全流程管理。
儀表板
支援自訂可視化儀表板,集中展示關鍵指標,輔助運行維護決策。
可觀測可視化Grafana版
提供託管Grafana服務,支援靈活儀表板配置及多種數據來源整合。
可觀測監控Prometheus版
兼容開源Prometheus,提供托管式監控及多集群統一管理能力。
應用程式可觀測性
應用程式監控
支援應用程式效能全鏈路監控,包括調用鏈追蹤、調用延遲分析及依賴關係圖。
AI應用可觀測性
專為大型語言模型應用設計,監控推理延遲、詞元消耗等關鍵指標。
用戶體驗監控
收集前端效能數據,監控頁面載入、JavaScript錯誤及用戶互動體驗。
雲端產品分析
容器分析
提供ACK/K8s集群的資源使用、工作負載及事件分析,提升容器運行維護效率。
SLS分析
對日誌服務進行效能及使用分析,提升日誌採集及查詢效率。
OSS分析
監控OSS存取情況、請求分佈及效能指標,保障儲存服務穩定性。
Redis分析
分析Tair/Redis實例的命中率、連線數和耗時操作,提升系統效能。
RDS分析
提供資料庫查詢延遲、工作階段等待及效能趨勢分析,有助優化資料庫。
AI訓練服務分析
監控AI訓練資源使用情況,支援GPU使用率及任務調度分析。
ECS分析
對ECS實例進行CPU、記憶體、網絡等多方面效能分析及異常預警。
AWS分析
跨雲監控AWS資源,於混合雲環境中實現統一觀測能力。
安全與審計
應用程式安全
基於RASP技術,在應用程式運行時提供防護,偵測並攔截攻擊行為。
日誌審計
集中審計操作日誌與安全事件,滿足合規審計及風險追蹤需求。
成本管家
分析雲端資源使用成本,提供優化建議,降低不必要支出。
數據探索
指標探索
支援使用PromQL/SPL查詢時間序列指標,靈活分析效能趨勢及異常。
數據探索
透過統一平台,掌握日誌、指標與鏈路等可觀測數據。
UModel探索
以可視化方式呈現UModel實體關係圖譜,有助了解資源關聯與依賴關係。
日誌分析
使用SPL語言檢索、統計及分析日誌,快速追蹤問題來源。
產品優勢
一站式整合觀測
雲端監控2.0深度整合原有雲端監控(CMS)、日誌服務(SLS)及應用程式實時監控服務(ARMS)核心能力,將指標、日誌、鏈路、事件等多種數據來源匯總於統一平台。無需部署與維護多套獨立監控工具,即可在統一平台上實現從底層基礎設施到上層應用的全方位端到端觀測,顯著降低可觀測系統的複雜度和管理成本。
數據統一建模
基於UModel實現觀測對象統一建模與關聯分析,打破數據孤島,提升問題定位效率。
AI驅動智能診斷
整合機器學習與大型語言模型能力,支援異常偵測、根源分析及自然語言查詢,降低使用門檻。
開放兼容,擁抱開源生態
雲端監控2.0全面擁抱開源技術生態,原生支援Prometheus、Grafana、OpenTelemetry、Elasticsearch等業界主流標準與工具。不論是雲端原生應用還是混合雲環境,均可確保現有監控資源與技術棧能順利遷移及接入,實現無縫、統一的可觀測性。
付費類型:全額預付