Grafana是開源的資料視覺效果平台,可以產生各種可視化儀錶,簡化監控的複雜度。本文介紹如何使用Grafana查看SLO相關指標。
前提條件
操作步驟
您可以通過Grafana控制台匯入儀錶盤資料,查看SLO相關指標。
- 執行以下命令,在ACK叢集中安裝Grafana應用。
# 添加倉庫資訊。 helm repo add grafana https://grafana.github.io/helm-charts helm repo update # 安裝Grafana應用。 helm install -n monitoring asm-grafana grafana/grafana - 執行以下命令,擷取Grafana控制台的登入密碼。
kubectl get secret --namespace monitoring asm-grafana -o jsonpath="{.data.admin-password}" | base64 --decode ; echo - 執行以下命令,將asm-grafana服務轉寄到本地連接埠。
kubectl --namespace monitoring port-forward svc/asm-grafana 3000:80 - 單擊https://localhost:9093,訪問Grafana控制台。
- 在Grafana控制台左側導覽列,單擊
表徵圖,在Configuration頁面的Data sources頁簽,單擊Add data source。 - 在Settings頁簽的HTTP地區,配置URL為http://ack-prometheus-operator-prometheus:9090,其他配置項保持預設,然後單擊Save。

- 在左側導覽列,單擊,將儀錶盤模板內容粘貼到Import via panel json文字框,然後單擊Load。
樣本效果如下。關於SLO的相關概念,請參見服務等級目標SLO概述。
- 在地區①,可以查看當前正在貢獻燃燒率的SLO。
- 在地區②,可以查看所有燃燒率大於1的SLO的燃燒率變化情況。
- 在地區③,可以查看配置的SLO資訊。
指標 說明 Objective 目標值為99%。 Current burning budget % 當前燃燒率為50%。錯誤率為(1 - 99%) * 50% = 0.5%。 Remaining error budget(month) 剩餘錯誤預算百分比(以自然月計算)為93.3%。 Remaining error budget (30d window) 剩餘錯誤預算百分比(30天滾動視窗)為-243%。 錯誤預算為負,說明在此滾動視窗內服務不滿足SLO。服務最終是否滿足SLO,以合規期最後一天的剩餘錯誤預算為準。
Warning alert 是否觸發了警告層級的警示。本文為已觸發(FIRING)。 Critical alert 是否觸發了緊急層級的警示。本文為未觸發(OK)。 說明 剩餘錯誤預算百分比由異常時間段和正常時間段計算比率得到。上圖中兩個錯誤預算剩餘百分比相差較大,是因為兩者在計算指標平均值時採用了不同的大小視窗做平均。前者是1小時而後者是5分鐘,後者分割的時間段更多。在正常環境下,不同分割方法的正常時間段和異常時間段是等比增加的,但在本樣本中測試請求主要都是異常請求,其他時間基本無請求。無請求的時間段不參與平均,導致只有異常時間段增加。在正常環境下兩者數值相近。 - 在地區④,可以查看SLI的變化曲線、月度錯誤預算的變化曲線和燃燒率水平變化。