阿里雲可觀測監控 Prometheus 版全面對接開源 Prometheus 生態,支援類型豐富的組件監控,提供多種開箱即用的預置監控大盤,且提供全面託管的 Prometheus 服務。
Prometheus是一套開源的監控警示系統。主要特點包括多維資料模型、靈活查詢語句PromQL以及資料視覺效果展示等。更多資訊,請參見Prometheus官方文檔。
什麼是Prometheus執行個體
Prometheus執行個體是阿里雲可觀測監控 Prometheus 版服務提供的管理Prometheus資料擷取和資料存放區分析的邏輯單元,每個Prometheus執行個體提供對應的Prometheus資料擷取配置、時序資料庫執行個體、Dashboard監控大盤和警示配置等。
為什麼選擇可觀測監控 Prometheus 版

阿里雲提供的可觀測監控 Prometheus 版,完全相容開源 Promethues 協議和查詢文法,是雲端式上提供的 Prometheus 服務,可以協助客戶構建開放和穩定的統一監控系統。
一、資料擷取
阿里雲可觀測監控 Prometheus 版提供覆蓋使用者端應用、服務端應用、容器、主機、自建組件、雲端服務等全棧的指標採集能力,也支援通過相容開源 Prometheus 標準 Remote Write 協議方式整合使用者自建 Prometheus 資料,另外也支援基於 SDK 寫入自訂指標。
使用者端&應用:ARMS 使用者端應用(ARMS RUM)和服務端應用(ARMS APM)指標資料預設寫入了 Prometheus,針對應用中的自訂指標可以通過 Prometheus SDK 或者基於 OpenTelemetry SDK 的方式實現自訂指標寫入。
容器:阿里雲提供的Container Service包括ACK、ASK、ACS 等預設整合了可觀測監控 Prometheus 版,通過自研的指標採集探針Prometheus Agent 可以實現容器基礎監控指標的採集,也支援基於 ServiceMonitor、PodMonitor 等方式實現自訂指標採集。針對自建的 Kubernetes 或者其他雲廠商提供的 Kubernetes 服務,可以基於ACK One 的註冊叢集進行納管後,實現與ACK 相同方式的容器指標採集能力。
主機:針對於虛擬機器主機監控,可觀測監控 Prometheus 版支援通過託管的 Prometheus Agent,採集主機的CPU、記憶體、磁碟、網路等作業系統監控指標,也支援採集進程、容器相關監控指標,另外,在 ECS 上也可通過類似 node- exporter 的 textfile 方式實現自訂指標採集。對於自建 IDC 或者其他雲廠商提供的虛擬機器主機服務,可以通過部署開源node-exporter和開源 Prometheus 組件實現資料擷取後,通過 Remote Write 方式將資料統一匯總到 可觀測監控 Prometheus 版。
雲端服務:可觀測監控 Prometheus 版也支援白屏方式接入阿里雲CloudMonitor資料,實現對雲端服務監控指標的採集,並且 Prometheus 雲產品接入能力還會自動將雲產品的執行個體名稱、執行個體標籤等資訊富化到雲產品的監控指標上,提供更多維度彙總、過濾和警示路由能力。
自訂指標:可觀測監控 Prometheus 版本身也相容開源 Prometheus 和 Opentelemetry Metric 寫入協議,使用者可以基於 SDK 方式實現自訂指標寫入。
二、資料存放區
阿里雲可觀測監控 Prometheus 版資料存放區支援階層式存放區能力,標準儲存資料到期後支援自動轉存到Archive Storage中,滿足使用者對指標長周期儲存和低成本需求。
可觀測監控 Prometheus 版標準儲存支援不同儲存時間長度選擇,按資料寫入量或資料上報量計費。
如果您有更長周期的儲存時間長度需求,可以開啟Archive Storage能力。開啟Archive Storage能力後,標準資料超過儲存時間長度後會自動轉存至Archive Storage,Archive Storage按儲存量進行計費。
三、資料消費
阿里雲可觀測監控 Prometheus 版可以實現指標資料統一採集和統一儲存,滿足多種資料消費的情境。
統一可視化:可觀測監控 Prometheus 版面向雲產品和常見開源組件,提供了豐富的開箱即用的大盤,使用者可以將內建的大盤匯入可觀測可視化 Grafana 版,也可以基於 Grafana 服務自訂大盤;另外基於 Prometheus HTTP API 也可以對接阿里雲資料視覺效果平台 Datav,構建更生動的可視化大屏。
彙總檢視:可觀測監控 Prometheus 版提供的彙總檢視能力支援跨執行個體和跨帳號 Prometheus 執行個體彙總查詢,能夠滿足使用者跨帳號的統一監控。
資料處理:可觀測監控 Prometheus 版提供 Recording Rule 的預彙總能力,相容開源的 Recording Rule 的規則,基於 Recording Rule 提供指標資料的降採樣、降維度等能力,降低資料成本,提高資料查詢能力。
統一警示&響應:可觀測監控 Prometheus 版預設內建了雲產品和常見開源組件的警示規則,也支援基於 PromQL 自訂警示規則,另外也支援匯入開源 Prometheus 的 AlertRule 規則。警示規則產生警示事件後會統一寫入 ARMS 警示管理中心,基於ARMS 警示管理能力可以實現警示通知、指派、升級等響應動作。
CloudLens:針對核心監控情境基於CloudLens提供基於日誌、指標、事件的統一可觀測能力,滿足客戶對雲產品的全方位可觀測需求。
資料分析:可觀測監控 Prometheus 版 100% 相容 PromQL 文法,支援使用者基於 PromQL 進行自訂分析和探索,同時提供指標管理能力協助使用者洞察指標的分布和高基數情況。
資料匯出:可觀測監控 Prometheus 版支援即時投遞能力,可以將指標資料即時投遞到 Kafka、MaxCompute、自建 Prometheus 中。
產品優勢
整合便利:一站式的解決方案,簡化可觀測性系統的搭建和維護工作。
成本最佳化:相比自建方案,阿里雲可觀測性服務提供更經濟高效的解決方案。
深度整合阿里雲生態:無縫對接阿里雲其他服務,例如ECS、Kubernetes服務ACK等。
專業支援與服務:享受阿里雲專業的支援人員和SLA保障。