Metrik dan dasbor kube-controller-manager - Container Service for Kubernetes

Lihat metrik workqueue kube-controller-manager, sumber daya, dan Kube API melalui dasbor pemantauan.

Konsep Utama

Workqueue

Istilah Workqueue

Controller yang dikelola oleh kube-controller-manager, seperti Node Controller, StatefulSet Controller, dan Deployment Controller, menggunakan Workqueue untuk memproses pembaruan resource. Ketika suatu event terjadi—misalnya pembuatan, pembaruan, atau penghapusan Pod—controller menempatkan identifikasi resource (misalnya nama Pod dan namespace) ke dalam Workqueue. Sebuah work loop kemudian mengambil dan memproses identifikasi tersebut.

Sebelum memulai

Akses dasbor

Lihat Dasbor pemantauan untuk komponen lapisan kontrol kluster.

Daftar metrik

Tabel berikut mencantumkan metrik kube-controller-manager.

Metric Type Descriptionmemory

Metric	Type	Description
workqueue_adds_total	Counter	Total event yang ditambahkan ke Workqueue.
workqueue_depth	Gauge	Kedalaman Workqueue saat ini. Nilai tinggi yang berkelanjutan menunjukkan bahwa controller tidak dapat memproses tugas dengan cukup cepat, sehingga menyebabkan penumpukan antrian.
workqueue_queue_duration_seconds_bucket	Histogram	Waktu tunggu item di Workqueue. Ambang batas bucket: {10^-8, 10^-7, 10^-6, 10^-5, 10^-4, 10^-3, 10^-2, 10^-1, 1, 10}. Satuan: detik.
memory_utilization_byte	Gauge	Penggunaan memory. Satuan: byte.
cpu_utilization_core	Gauge	Pemanfaatan CPU. Satuan: core.
resource_utilization_level	Gauge	Tingkat pemanfaatan resource. resource: Jenis resource. Nilai yang valid: `cpu` dan `memory`. utilization_level: Tingkat pemanfaatan. Nilai yang valid: `high` (pemanfaatan ≥ 80%) dan `normal` (pemanfaatan < 80%). container: Kontainer target. Nilai yang valid: `kube-apiserver`, `kube-scheduler`, `kube-controller-manager`, `cloud-controller-manager`, dan `etcd`.
rest_client_requests_total	Counter	Total permintaan HTTP berdasarkan kode status, metode, dan host.
rest_client_request_duration_seconds_bucket	Histogram	Latensi permintaan HTTP berdasarkan verb dan URL.

Catatan

Metrik pemanfaatan resource berikut ini tidak lagi digunakan. Hapus semua alert atau aturan pemantauan yang bergantung pada metrik ini:

cpu_utilization_ratio: CPU utilization.
memory_utilization_ratio: Memory utilization.

Penggunaan dashboard

Konfigurasikan quantile permintaan dan interval pengambilan sampel PromQL pada dashboard. Bagian berikut menjelaskan setiap grafik beserta kueri PromQL-nya.

Workqueue

Tampilan dashboard

Grafik

Name	PromQL	Description
Workqueue Add Rate	sum(rate(workqueue_adds_total{job="ack-kube-controller-manager"}[$interval])) by (name)	Laju event yang ditambahkan ke Workqueue.
Workqueue Depth	sum(rate(workqueue_depth{job="ack-kube-controller-manager"}[$interval])) by (name)	Rata-rata laju perubahan kedalaman Workqueue.
Workqueue Processing Latency	histogram_quantile($quantile, sum(rate(workqueue_queue_duration_seconds_bucket{job="ack-kube-controller-manager"}[5m])) by (name, le))	Waktu tunggu suatu item di dalam Workqueue.

Sumber Daya

Tampilan Dashboard

gambar

Bagan

Chart name	PromQL	Description
Memory Utilization	memory_utilization_byte{container="kube-controller-manager"}	Pemanfaatan memori. Satuan: byte.
CPU Utilization	cpu_utilization_core{container="kube-controller-manager"}*1000	Pemanfaatan CPU. Satuan: millicore.
Memory Resource Utilization Level	resource_utilization_level{resource="memory",container="kube-controller-manager",utilization_level="high"} resource_utilization_level{resource="memory",container="kube-controller-manager",utilization_level="normal"}	Jika `resource_utilization_level{utilization_level="high",...}` bernilai 1, tingkat pemanfaatan resource kontainer ≥ 80%. Jika `resource_utilization_level{utilization_level="normal",...}` bernilai 1, tingkat pemanfaatan resource kontainer < 80%.
CPU Resource Utilization Level	resource_utilization_level{resource="cpu",container="kube-controller-manager",utilization_level="high"} resource_utilization_level{resource="cpu",container="kube-controller-manager",utilization_level="normal"}

Kube API

Tampilan dashboard

Grafik

Chart name	PromQL	Description
Kube API Request QPS	sum(rate(rest_client_requests_total{job="ack-kube-controller-manager",code=~"2.."}[$interval])) by (method,code) sum(rate(rest_client_requests_total{job="ack-kube-controller-manager",code=~"3.."}[$interval])) by (method,code) sum(rate(rest_client_requests_total{job="ack-kube-controller-manager",code=~"4.."}[$interval])) by (method,code) sum(rate(rest_client_requests_total{job="ack-kube-controller-manager",code=~"5.."}[$interval])) by (method,code)	QPS permintaan HTTP dari kube-controller-manager ke kube-apiserver, berdasarkan metode dan kode status.
Kube API Request Latency	histogram_quantile($quantile, sum(rate(rest_client_request_duration_seconds_bucket{job="ack-kube-controller-manager"}[$interval])) by (verb,url,le))	Latensi permintaan HTTP dari kube-controller-manager ke kube-apiserver, berdasarkan verb dan URL.

Referensi

Untuk metrik dan dashboard komponen lapisan kontrol lainnya, lihat Metrik pemantauan untuk komponen kube-apiserver, Metrik pemantauan untuk komponen etcd, Metrik pemantauan untuk komponen kube-scheduler, dan Metrik pemantauan untuk komponen cloud-controller-manager.