全部產品
Search
文件中心

:容器事件監控接入

更新時間:Nov 26, 2024

本文介紹容器事件監控如何接入可觀測監控 Prometheus 版以及如何查看監控大盤和設定警示規則。事件監控是Kubernetes中的一種監控方式,可以彌補資源監控在即時性、準確性和情境上的不足。您可以通過使用NPD(node-problem-detector),結合SLS的Kubernetes事件中心,配置NPD叢集檢查項以及例外狀況事件離線功能,使用DingTalk、SLS離線Kubernetes事件及EventBridge離線Kubernetes事件,即時監控叢集的異常與問題。

前提條件

步驟一:接入容器事件監控

  1. 登入Prometheus控制台,在左側導覽列單擊接入中心

  2. 單擊容器事件監控卡片,選擇待接入的Container Service叢集,然後根據控制台指引完成組件接入。

    說明

    Prometheus服務接入容器事件監控後,完整的資料接入大概需要1~2分鐘左右。資料未完整接入前,監控大盤不顯示資料。

步驟二:查看監控大盤

可觀測監控 Prometheus 版預設內建了很多容器監控大盤,包括叢集概覽、核心組件、Node、Pod等監控能力,在Container Service控制台、ARMS控制台、Prometheus控制台都有透出。您可以通過以下方式查看監控大盤。

  1. 登入Prometheus控制台,在左側導覽列單擊接入管理

  2. 接入管理頁面,單擊大盤查詢頁簽。在容器環境中選擇待查看的叢集,即可查看對應的監控大盤。3.jpg

步驟三:設定警示

  1. 登入Prometheus控制台,在左側導覽列單擊接入管理

  2. 接入管理頁面,單擊已接入環境頁簽。選擇容器環境,然後單擊目標環境名稱,進入容器環境詳情頁面。

  3. 組件管理頁簽,查看Prometheus內建的警示通知。5.jpg

  4. 內建的警示規則會產生警示事件,但是不會進行警示通知。如果您希望將警示通知發送到郵件或其他平台,可以單擊編輯配置通知方式。

    在警示配置頁面,您也可以自訂警示閾值、期間、警示內容等,警示詳細配置,請參見建立Prometheus警示規則

    2.jpg

採集指標說明

指標名稱

類型

指標描述

eventer_events_error_total

COUNTER

錯誤類型的事件

eventer_events_normal_total

COUNTER

正常類型的事件

eventer_events_warning_total

COUNTER

異常類型的事件

eventer_exporter_duration_milliseconds

SUMMARY

匯出事件以毫秒為單位的時間。

eventer_manager_last_time_seconds

GAUGE

自Unix時代以來,eventer housekeep的最後一次時間(以秒為單位)。

eventer_scraper_duration_milliseconds

SUMMARY

抓取事件所花費的時間(以毫秒為單位)。

eventer_scraper_events_total_number

COUNTER

事件總數

eventer_scraper_last_time_seconds

GAUGE

自Unix時代以來的最後一次事件時間(以秒為單位)。