All Products
Search
Document Center

Alibaba Cloud Service Mesh:Gunakan Grafana untuk melihat SLO

Last Updated:Jul 02, 2025

Grafana adalah platform visualisasi data open source yang memungkinkan Anda melihat berbagai metrik pemantauan pada dasbor dengan mudah. Topik ini menjelaskan cara menggunakan Grafana untuk melihat metrik yang terkait dengan tujuan tingkat layanan (SLO).

Prasyarat

Prosedur

Langkah-langkah berikut menunjukkan cara mengimpor data dasbor dan melihat metrik terkait SLO di konsol Grafana:

  1. Jalankan perintah berikut untuk menginstal aplikasi Grafana di kluster Container Service for Kubernetes (ACK):
    # Tambahkan informasi repositori.
    helm repo add grafana https://grafana.github.io/helm-charts
    helm repo update
    # Instal aplikasi Grafana.
    helm install -n monitoring asm-grafana grafana/grafana
  2. Jalankan perintah berikut untuk mendapatkan kata sandi untuk masuk ke konsol Grafana:
    kubectl get secret --namespace monitoring asm-grafana -o jsonpath="{.data.admin-password}" | base64 --decode ; echo
  3. Jalankan perintah berikut untuk meneruskan semua lalu lintas dari port lokal ke layanan asm-grafana:
    kubectl --namespace monitoring port-forward svc/asm-grafana 3000:80
  4. Klik https://localhost:9093 untuk masuk ke konsol Grafana.
    Nama pengguna untuk masuk ke konsol Grafana adalah admin. Kata sandinya diperoleh di Langkah2.
  5. Di bilah navigasi sebelah kiri, klik ikon The Settings icon. Di halaman Configuration, klik tab Data sources. Kemudian, klik Add data source.
  6. Di halaman yang muncul, klik tab Settings. Di bagian HTTP, atur parameter URL menjadi http://ack-prometheus-operator-prometheus:9090, pertahankan pengaturan default parameter lainnya, lalu klik Save.
    HTTP
  7. Di bilah navigasi sebelah kiri, pilih Dashboard > Import, tempelkan konten dari template dasbor ke dalam kotak teks Import via panel json, lalu klik Load.
    Import
    Gambar berikut menunjukkan efek tampilan. Untuk informasi lebih lanjut tentang konsep-konsep terkait SLO, lihat Ikhtisar SLO.Display effect
    • Di area ①, Anda dapat melihat SLO yang anggaran kesalahannya sedang dikonsumsi.
    • Di area ②, Anda dapat melihat SLO yang laju pembakarannya melebihi 1.
    • Di area ③, Anda dapat melihat konfigurasi SLO.
      MetricDeskripsi
      TujuanTujuan. Dalam contoh ini, tujuannya adalah 99%.
      Anggaran kesalahan saat ini %Laju pembakaran saat ini. Dalam contoh ini, nilainya adalah 50%. Tingkat kesalahan = (1 - 99%) x 50% = 0,5%
      Sisa anggaran kesalahan (bulan)Sisa anggaran kesalahan untuk bulan kalender. Dalam contoh ini, nilainya adalah 93,3%.
      Sisa anggaran kesalahan (jendela 30 hari)Sisa anggaran kesalahan untuk jendela bergulir 30 hari. Dalam contoh ini, nilainya adalah -243%.

      Sisa anggaran kesalahan negatif berarti bahwa layanan tidak mencapai SLO dalam jendela bergulir. Apakah layanan akhirnya mencapai SLO ditentukan oleh sisa anggaran kesalahan pada hari terakhir periode kepatuhan.

      Peringatan peringatanMenunjukkan apakah peringatan tingkat peringatan dipicu. Dalam contoh ini, nilainya adalah FIRING, yang menunjukkan bahwa peringatan tingkat peringatan dipicu.
      Peringatan kritisMenunjukkan apakah peringatan tingkat kritis dipicu. Dalam contoh ini, nilainya adalah OK, yang menunjukkan bahwa tidak ada peringatan tingkat kritis yang dipicu.
      Catatan Sisa anggaran kesalahan dihitung berdasarkan rasio periode waktu ketika kesalahan terjadi terhadap periode waktu ketika tidak ada kesalahan. Perbedaan antara kedua sisa anggaran kesalahan tersebut besar karena mereka dihitung berdasarkan nilai metrik rata-rata di jendela waktu dengan ukuran berbeda. Jendela waktu untuk metrik Sisa anggaran kesalahan (bulan) adalah satu jam dan untuk metrik Sisa anggaran kesalahan (jendela 30 hari) adalah lima menit. Jendela waktu untuk metrik Sisa anggaran kesalahan (jendela 30 hari) dibagi menjadi lebih banyak segmen waktu. Dalam kondisi normal, periode waktu ketika kesalahan terjadi dan ketika tidak ada kesalahan proporsional meningkat tanpa memandang segmen jendela waktu. Namun, dalam contoh ini, sebagian besar permintaan uji adalah permintaan kesalahan dan tidak ada permintaan yang dilakukan di periode waktu lainnya. Periode waktu ketika tidak ada permintaan yang dilakukan tidak diperhitungkan dalam perhitungan. Oleh karena itu, hanya periode waktu ketika kesalahan terjadi yang meningkat. Dalam kondisi normal, kedua sisa anggaran kesalahan memiliki nilai yang serupa.
    • Di area ④, Anda dapat melihat bagaimana anggaran kesalahan bulanan dan laju pembakaran SLI berubah.