Aktifkan Container Monitoring Pro Edition untuk kluster ACK - ARMS

Managed Service for Prometheus menyediakan layanan terkelola Prometheus dan layanan pemantauan kontainer. Layanan pemantauan kontainer dikenai biaya yang mencakup biaya skala kluster pemantauan dan biaya instans Prometheus. Layanan ini tersedia dalam dua versi: Dasar dan Pro. Topik ini menjelaskan operasi, rincian penagihan, fitur, dasbor yang didukung, serta aturan peringatan default dari versi Pro pemantauan kontainer.

Jenis kluster yang mendukung Edisi Pro

ACK managed Pro cluster
ACK Lingjun cluster
Cluster khusus ACK

Prasyarat

Versi Pro pemantauan kontainer memerlukan Managed Service for Prometheus. Anda harus terlebih dahulu mengaktifkan Managed Service for Prometheus (bayar sesuai penggunaan berdasarkan volume tulis tautan aktivasi, bayar sesuai penggunaan berdasarkan volume pelaporan tautan aktivasi), lalu mengaktifkan versi Pro pemantauan kontainer.

Rincian penagihan versi Pro pemantauan kontainer

Item penagihan

Deskripsi penagihan

Metode penagihan

Siklus penagihan

Biaya skala kluster pemantauan

Penggunaan OCU dihitung berdasarkan skala node kluster kontainer, dengan setiap 10 node kluster dikonversi menjadi 1 OCU.

Catatan

OCU: Observability Capacity Unit adalah unit penagihan baru yang diperkenalkan oleh Alibaba Cloud Native Observability. Unit ini secara otomatis menghitung penggunaan OCU berdasarkan penggunaan sumber daya per jam. Harga OCU adalah 0,023 USD/unit.

Bayar sesuai penggunaan: Biaya harian skala kluster kontainer = Jumlah total unit OCU per jam × harga unit OCU

Catatan

Unit OCU per jam = Jumlah maksimum node dalam siklus penagihan saat ini dibagi 10, dibulatkan ke atas

Siklus penagihan adalah per jam. Managed Service for Prometheus menghitung jumlah maksimum node kluster untuk setiap jam pada hari sebelumnya setelah pukul 00.00, kemudian menghitung unit OCU per jam sesuai aturan penagihan, mengakumulasi unit OCU per jam untuk menghitung total jumlah OCU pada hari sebelumnya, mengalikannya dengan harga unit OCU, dan menghasilkan biaya pemantauan skala kluster kontainer secara harian.

Biaya instans Prometheus

Untuk informasi selengkapnya, lihat Penagihan instans Prometheus.

Cara menggunakan versi Pro pemantauan kontainer

Metode 1: Pilih versi Pro pemantauan kontainer saat integrasi

Pada halaman Integration Center, pilih Container Cluster Monitoring.
Pada panel Container Cluster Monitoring, pilih kluster layanan kontainer yang akan diintegrasikan, lalu pilih Container Monitoring Pro Version sebagai versi, dan klik OK.

Metode 2: Tingkatkan dari versi dasar ke versi Pro pemantauan kontainer

Penting

Setelah ditingkatkan ke versi Pro pemantauan kontainer, Anda tidak dapat menurunkan spesifikasi kembali ke versi dasar.

Pada halaman Provisioning, pilih Integrated Environments > Container Environment.
Klik Upgrade pada kolom Operation untuk pemantauan kontainer yang akan ditingkatkan. Pada kotak dialog, klik Confirm.

Perbedaan antara versi dasar dan versi Pro

Kategori	Versi dasar	Versi Pro
Periode penyimpanan metrik dasar kluster kontainer	7 hari	90 hari
Pengumpul Prometheus	Agen yang diterapkan di kluster pengguna (replika tunggal default menggunakan sumber daya kluster sebesar 3 core, 4 GB), memerlukan pengelolaan mandiri.	Menyediakan Agen pengumpulan terkelola, pengguna tidak lagi menanggung biaya sumber daya Agen, menyediakan SLA tingkat produksi sebesar 99,95%.
Dasbor pemantauan	Dasbor pemantauan dasar bawaan.	Dasbor pemantauan komprehensif bawaan.

Dasbor yang didukung oleh versi Pro pemantauan kontainer

Tipe	Nama Dasbor
Ikhtisar pemantauan	Ikhtisar pemantauan kluster
Ikhtisar pemantauan	Dasbor namespace kluster
Komponen inti kluster	ACK Pro API server
	ACK Pro ETCD
	ACK Pro Scheduler
	ACK Pro Cloud Controller Manager
	ACK Pro Kube Controller Manager
Pemantauan node	Ikhtisar pool node
Pemantauan node	Detail pemantauan node kluster
Pemantauan aplikasi	Pemantauan aplikasi tanpa status
	Pemantauan aplikasi berstatus
	Pemantauan aplikasi set proses daemon
	Pemantauan Pod kluster
Pemantauan jaringan	Pemantauan komponen CoreDNS
Pemantauan jaringan	Pemantauan lalu lintas Ingress kluster
Pemantauan penyimpanan	Pemantauan komponen penyimpanan CSI – dimensi kluster
	Pemantauan komponen penyimpanan CSI – dimensi node
	Pemantauan IO Pod (Level Pod)
	Pemantauan IO Penyimpanan Frontend (Level Kluster)
Pemantauan GPU	Pemantauan GPU kluster – dimensi kluster
	Pemantauan GPU kluster – dimensi node
	Pemantauan GPU kluster – dimensi Pod aplikasi
Analisis biaya/optimasi sumber daya	Profil sumber daya
Lainnya	Pemantauan IO Penyimpanan Backend (Level Kluster)
	k8s-reclaimed-resource
	Pemantauan mandiri Prometheus kluster
	Ikhtisar Virtual Node(ECI)

Aturan peringatan default

Nama/ID aturan peringatan	Kelompok peringatan	Template
Penggunaan CPU node lebih besar dari 75%	Node	Node {{ $labels.instance }} penggunaan CPU lebih besar dari 75%, penggunaan CPU saat ini {{ printf "%.2f" $value }}%
Penggunaan CPU node lebih besar dari 85%	Node	Node {{ $labels.instance }} penggunaan CPU lebih besar dari 85%, penggunaan CPU saat ini {{ printf "%.2f" $value }}%
Penggunaan memori node lebih besar dari 75%	Node	Node {{ $labels.instance }} penggunaan memori lebih besar dari 75%, penggunaan memori saat ini {{ printf "%.2f" $value }}%
Penggunaan memori node lebih besar dari 85%	Node	Node {{ $labels.instance }} penggunaan memori lebih besar dari 85%, penggunaan memori saat ini {{ printf "%.2f" $value }}%
Anomali node	Node	Node {{$labels.node}} telah berada dalam status tidak tersedia selama lebih dari 10 menit
Penggunaan disk lebih besar dari 95%	Node	Node {{ $labels.instance }} disk {{ $labels.device }} penggunaan melebihi 95%, penggunaan disk saat ini {{ printf "%.2f" $value }}%
Ketersediaan Pod Deployment kurang dari 50%	Beban kerja	Namespace: {{$labels.namespace}} / Deployment: {{$labels.deployment}} ketersediaan Pod kurang dari 50%, jumlah Pod tidak tersedia saat ini {{ $value }}
Eksekusi Job gagal	Beban kerja	Namespace: {{$labels.namespace}}/Job: {{$labels.job_name}} eksekusi gagal
Pod gagal memulai karena waktu habis	Beban kerja	Namespace: {{$labels.namespace}}/Pod: {{$labels.pod_name}} belum berhasil dimulai selama lebih dari 15 menit, alasan menunggu {{$labels.reason}}
Status Pod tidak normal	Beban kerja	Namespace: {{$labels.namespace}}/Pod: {{$labels.pod_name}} telah berada dalam status {{$labels.phase}} selama lebih dari 10 menit
Pod sering restart	Beban kerja	Namespace: {{$labels.namespace}}/Pod: {{$labels.pod_name}} telah melakukan restart lebih dari {{ $labels.metrics_params_value}} kali dalam {{$labels.metrics_params_time}} menit, jumlah restart saat ini {{ $value }}
Penggunaan CPU kontainer melebihi 85%	Beban kerja	Namespace: {{$labels.namespace}} / Pod: {{$labels.pod_name}} / Kontainer: {{$labels.container}} penggunaan CPU lebih besar dari 85%, nilai saat ini {{ printf "%.2f" $value }}%
Penggunaan CPU kontainer melebihi 75%	Beban kerja	Namespace: {{$labels.namespace}} / Pod: {{$labels.pod_name}} / Kontainer: {{$labels.container}} penggunaan CPU lebih besar dari 75%, nilai saat ini {{ printf "%.2f" $value }}%
Penggunaan memori kontainer melebihi 75%	Beban kerja	Namespace: {{$labels.namespace}} / Pod: {{$labels.pod_name}} / Kontainer: {{$labels.container}} penggunaan memori lebih besar dari 75%, nilai saat ini {{ printf "%.2f" $value }}%
Penggunaan memori kontainer melebihi 85%	Beban kerja	Namespace: {{$labels.namespace}} / Pod: {{$labels.pod_name}} / Kontainer: {{$labels.container}} penggunaan memori lebih besar dari 85%, nilai saat ini {{ printf "%.2f" $value }}%