全部產品
Search
文件中心

Alibaba Cloud Service Mesh:使用Grafana查看SLO

更新時間:Jun 30, 2024

Grafana是開源的資料視覺效果平台,可以產生各種可視化儀錶,簡化監控的複雜度。本文介紹如何使用Grafana查看SLO相關指標。

前提條件

操作步驟

您可以通過Grafana控制台匯入儀錶盤資料,查看SLO相關指標。

  1. 執行以下命令,在ACK叢集中安裝Grafana應用。
    # 添加倉庫資訊。
    helm repo add grafana https://grafana.github.io/helm-charts
    helm repo update
    # 安裝Grafana應用。
    helm install -n monitoring asm-grafana grafana/grafana
  2. 執行以下命令,擷取Grafana控制台的登入密碼。
    kubectl get secret --namespace monitoring asm-grafana -o jsonpath="{.data.admin-password}" | base64 --decode ; echo
  3. 執行以下命令,將asm-grafana服務轉寄到本地連接埠。
    kubectl --namespace monitoring port-forward svc/asm-grafana 3000:80
  4. 單擊https://localhost:9093,訪問Grafana控制台。
    登入時,使用者名稱為admin,登入密碼由步驟2擷取。
  5. 在Grafana控制台左側導覽列,單擊設定表徵圖,在Configuration頁面的Data sources頁簽,單擊Add data source
  6. Settings頁簽的HTTP地區,配置URLhttp://ack-prometheus-operator-prometheus:9090,其他配置項保持預設,然後單擊Save
    HTTP
  7. 在左側導覽列,單擊Dashboard > Import,將儀錶盤模板內容粘貼到Import via panel json文字框,然後單擊Load
    Import
    樣本效果如下。關於SLO的相關概念,請參見服務等級目標SLO概述樣本效果
    • 在地區①,可以查看當前正在貢獻燃燒率的SLO。
    • 在地區②,可以查看所有燃燒率大於1的SLO的燃燒率變化情況。
    • 在地區③,可以查看配置的SLO資訊。
      指標說明
      Objective目標值為99%。
      Current burning budget %當前燃燒率為50%。錯誤率為(1 - 99%) * 50% = 0.5%。
      Remaining error budget(month)剩餘錯誤預算百分比(以自然月計算)為93.3%。
      Remaining error budget (30d window)剩餘錯誤預算百分比(30天滾動視窗)為-243%。

      錯誤預算為負,說明在此滾動視窗內服務不滿足SLO。服務最終是否滿足SLO,以合規期最後一天的剩餘錯誤預算為準。

      Warning alert是否觸發了警告層級的警示。本文為已觸發(FIRING)。
      Critical alert是否觸發了緊急層級的警示。本文為未觸發(OK)。
      說明 剩餘錯誤預算百分比由異常時間段和正常時間段計算比率得到。上圖中兩個錯誤預算剩餘百分比相差較大,是因為兩者在計算指標平均值時採用了不同的大小視窗做平均。前者是1小時而後者是5分鐘,後者分割的時間段更多。在正常環境下,不同分割方法的正常時間段和異常時間段是等比增加的,但在本樣本中測試請求主要都是異常請求,其他時間基本無請求。無請求的時間段不參與平均,導致只有異常時間段增加。在正常環境下兩者數值相近。
    • 在地區④,可以查看SLI的變化曲線、月度錯誤預算的變化曲線和燃燒率水平變化。