Integrasikan Managed Service for Prometheus untuk mengumpulkan metrik dari lapisan kontrol, node, dan aplikasi di kluster ACK Anda, serta tingkatkan manajemen kinerja kluster dengan dasbor visual dan peringatan real-time.
Pilih versi
Managed Service for Prometheus terintegrasi penuh dengan ekosistem Prometheus open-source dan menyediakan layanan pemantauan yang sepenuhnya dikelola. Layanan ini mengelola masalah-masalah mendasar seperti penyimpanan data, visualisasi data, dan operasi serta pemeliharaan (O&M) sistem.
Edisi Pro (Direkomendasikan): Menyimpan metrik selama 90 hari dan menyediakan collector yang sepenuhnya dikelola. Edisi ini menawarkan Service-Level Agreement (SLA) tingkat produksi sebesar 99,95%. Edisi ini juga mencakup dasbor Grafana yang dapat dikustomisasi dan aturan peringatan pra-konfigurasi untuk berbagai komponen Container Service.
Edisi Dasar: Menyimpan metrik selama 7 hari dan hanya menyediakan dasbor pemantauan dasar. Anda harus memelihara collector sendiri.
Aktifkan pemantauan Prometheus
Aktifkan pemantauan untuk kluster yang sudah ada
(Opsional) Untuk kluster khusus ACK, Anda harus terlebih dahulu memberikan otorisasi untuk kebijakan pemantauan kepada kluster.
Pada halaman Kluster, klik nama kluster target. Di panel navigasi sebelah kiri pada halaman detail kluster, pilih .
Pada halaman Prometheus Monitoring, pilih versi pemantauan kontainer dan klik Install.
Setelah Anda mengaktifkan pemantauan, metrik dasar default akan dikumpulkan secara otomatis. Untuk informasi tentang pengumpulan metrik kustom, lihat Kumpulkan metrik kustom. Anda juga dapat melihat beberapa dasbor pemantauan prasetel pada halaman ini, seperti Cluster Monitoring Overview, Node Monitoring, Application Monitoring, Network Monitoring, dan Storage Monitoring.
Aktifkan pemantauan saat membuat kluster
ACK managed cluster Pro Edition:
Pada halaman Component Configuration, di bagian Container Monitoring, pilih Container Cluster Monitoring Pro Edition atau Container Cluster Monitoring Basic Edition. Untuk informasi lebih lanjut, lihat Buat kluster ACK yang dikelola.
Mode Otomatis untuk hosting cerdas mengaktifkan Container Monitoring Basic Edition secara default.
Kluster khusus ACK Edisi Dasar, kluster ACS, dan kluster ACK Serverless:
Pada halaman Component Configurations pada wizard pembuatan kluster, di bagian Container Monitoring, pilih Use Managed Service For Prometheus untuk menginstal Container Monitoring Basic Edition.
Setelah pemantauan diaktifkan, metrik dasar default akan dikumpulkan secara otomatis. Untuk mengumpulkan metrik kustom, lihat Kumpulkan metrik kustom. Pada halaman detail kluster target, di panel navigasi sebelah kiri, pilih . Anda kemudian dapat melihat dasbor pemantauan pra-konfigurasi seperti Cluster Monitoring Overview, Node Monitoring, Application Monitoring, Network Monitoring, dan Storage Monitoring.
Konfigurasi notifikasi peringatan
Anda dapat mengonfigurasi aturan peringatan untuk metrik utama. Jika terjadi anomali, notifikasi akan dikirim secara otomatis melalui saluran seperti email, pesan teks, atau DingTalk.
Masuk ke Konsol ARMS. Di panel navigasi sebelah kiri, pilih .
Pada halaman Notification Recipient, pilih metode notifikasi dan buat penerima notifikasi peringatan.
Di panel navigasi sebelah kiri Konsol ARMS, pilih .
Pada halaman Prometheus Alert Rules, klik Create Prometheus Alert Rule.
Untuk informasi lebih lanjut, lihat Konfigurasi aturan peringatan Prometheus.
Kumpulkan metrik pemantauan kustom
Pemantauan Prometheus mendukung beberapa cara untuk mengumpulkan metrik kustom, seperti QPS permintaan dan latensi pemrosesan. Untuk informasi lebih lanjut, lihat Kelola aturan pengumpulan kustom untuk lingkungan kontainer.
Nonaktifkan pemantauan Prometheus
Pada halaman detail kluster target, di panel navigasi sebelah kiri, klik Component Management.
Pada halaman Component Management, klik tab Log and Monitoring. Temukan komponen ack-arms-prometheus dan klik Uninstall. Pada kotak dialog yang muncul, klik OK.
Penagihan
Biaya pemantauan berdasarkan ukuran kluster: Edisi Dasar gratis. Edisi Pro ditagih berdasarkan skema bayar sesuai penggunaan berdasarkan jumlah node dalam kluster.
Biaya instans Prometheus: Pengumpulan metrik dasar tidak dikenai biaya. Pengumpulan metrik kustom ditagih berdasarkan skema bayar sesuai penggunaan berdasarkan faktor-faktor seperti penulisan data, laporan data, volume penyimpanan, dan periode retensi.
Untuk aturan penagihan dan harga lengkap, lihat Penagihan Pemantauan Kontainer.
Metrik dasar default
Setelah fitur pemantauan Prometheus diaktifkan, metrik dasar untuk pemantauan kontainer dikumpulkan secara otomatis. Untuk informasi lebih lanjut tentang metrik dasar, lihat Deskripsi Metrik.
Pemantauan sumber daya dasar untuk kontainer (kubelet).
Pemantauan status aplikasi untuk kluster (kube-state-metrics).
Pemantauan sumber daya dasar untuk node kluster (node-exporter).
Pemantauan GPU untuk node kluster (ack-gpu-exporter).
Fitur pemantauan komponen lapisan kontrol untuk kluster yang dikelola memantau metrik untuk API Server, etcd, kube-scheduler, kube-controller-manager, dan cloud-controller-manager.
Metrik pemantauan dasar untuk CoreDNS kluster.
Metrik pemantauan dasar untuk Ingress-Controller kluster.
Metrik dasar yang dilaporkan secara otomatis setelah Anda mengaktifkan fitur tertentu:
Setelah Anda mengaktifkan Container Storage Monitoring Overview, metrik untuk komponen csi-plugin dilaporkan.
Setelah Anda mengaktifkan fitur Cost Insight, metrik untuk komponen ack-cost-exporter dilaporkan.
Setelah Anda mengaktifkan pemantauan kolokasi beban kerja multi-jenis dan profil sumber daya, metrik untuk komponen ack-koordinator dilaporkan.
FAQ
Halaman Pemantauan Prometheus menampilkan "No related monitoring dashboard found"
Jika Anda mengaktifkan pemantauan Prometheus dan melihat pesan No Related Monitoring Dashboard Found pada halaman untuk kluster target, ikuti prosedur berikut untuk menyelesaikan masalah tersebut.

Instal ulang komponen pemantauan Prometheus.
Instal ulang komponen:
Setelah memastikan bahwa pencopotan instalasi telah selesai, klik Install, lalu klik OK pada kotak dialog.
Setelah instalasi selesai, kembali ke halaman Pemantauan Prometheus untuk memeriksa apakah masalah telah terselesaikan.
Jika masalah masih berlanjut, lanjutkan ke langkah berikutnya.
Periksa koneksi instans Prometheus.
Di panel navigasi sebelah kiri Konsol ARMS, klik Provisioning.
Pada tab Connected Environments, periksa daftar Container Environment untuk mencari lingkungan kontainer dengan nama yang sama dengan kluster Anda.
Jika tidak ada lingkungan kontainer yang sesuai: Lihat Hubungkan menggunakan konsol ARMS atau Prometheus.
Jika Anda memiliki lingkungan kontainer, klik Probe Settings di kolom Actions untuk lingkungan target guna membuka halaman Probe Settings.
Periksa apakah agen yang diinstal berjalan sebagaimana mestinya.
Bagaimana cara menyesuaikan durasi penyimpanan metrik?
Untuk informasi lebih lanjut, lihat Sesuaikan durasi penyimpanan metrik.
Bagaimana cara melihat versi komponen ack-arms-prometheus?
Pada halaman Kluster, klik nama kluster target. Di panel navigasi sebelah kiri, klik Component Management.
Pada halaman Component Management, klik tab Log and Monitoring dan temukan komponen ack-arms-prometheus.
Versi saat ini ditampilkan di bawah komponen. Jika tersedia versi yang lebih baru, klik Upgrade di sebelah nomor versi.
CatatanOpsi Upgrade hanya tersedia jika komponen yang diinstal bukan versi terbaru.
Mengapa saya tidak dapat menerapkan pemantauan GPU?
Jika node GPU memiliki taint, penerapan pemantauan GPU mungkin gagal. Anda dapat melakukan langkah-langkah berikut untuk melihat taint pada node GPU.
Jalankan perintah berikut untuk melihat taint pada node GPU target.
Jika node GPU memiliki taint kustom, Anda dapat menemukan entri terkait taint. Topik ini menggunakan contoh taint dengan
keybernilaitest-key,valuebernilaitest-value, daneffectbernilaiNoSchedule:kubectl describe node cn-beijing.47.100.***.***Output yang diharapkan:
Taints:test-key=test-value:NoScheduleTangani taint pada node GPU dengan salah satu cara berikut:
Jalankan perintah berikut untuk menghapus taint dari node GPU.
kubectl taint node cn-beijing.47.100.***.*** test-key=test-value:NoSchedule-Deklarasikan toleransi terhadap taint pada node GPU agar pod dapat dijadwalkan ke node yang memiliki taint tersebut.
# 1. Jalankan perintah berikut untuk mengedit ack-prometheus-gpu-exporter. kubectl edit daemonset -n arms-prom ack-prometheus-gpu-exporter # 2. Tambahkan bidang berikut ke file YAML untuk mendeklarasikan toleransi terhadap taint. # Bidang lainnya dihilangkan. # Bidang tolerations ditambahkan di atas bidang containers dan berada pada level yang sama dengan bidang containers. tolerations: - key: "test-key" operator: "Equal" value: "test-value" effect: "NoSchedule" containers: # Bidang lainnya dihilangkan.
Bagaimana cara menghapus ARMS-Prometheus secara lengkap dan manual?
Jika Anda hanya menghapus namespace Managed Service for Prometheus, konfigurasi sisa akan tetap ada, yang dapat menyebabkan kegagalan saat instalasi ulang. Anda dapat melakukan operasi berikut untuk menghapus konfigurasi sisa ARMS-Prometheus secara lengkap.
Hapus namespace arms-prom.
kubectl delete namespace arms-promHapus ClusterRoles.
kubectl delete ClusterRole arms-kube-state-metrics kubectl delete ClusterRole arms-node-exporter kubectl delete ClusterRole arms-prom-ack-arms-prometheus-role kubectl delete ClusterRole arms-prometheus-oper3 kubectl delete ClusterRole arms-prometheus-ack-arms-prometheus-role kubectl delete ClusterRole arms-pilot-prom-k8s kubectl delete ClusterRole gpu-prometheus-exporter kubectl delete ClusterRole o11y:addon-controller:role kubectl delete ClusterRole arms-aliyunserviceroleforarms-clusterroleHapus ClusterRoleBindings.
kubectl delete ClusterRoleBinding arms-node-exporter kubectl delete ClusterRoleBinding arms-prom-ack-arms-prometheus-role-binding kubectl delete ClusterRoleBinding arms-prometheus-oper-bind2 kubectl delete ClusterRoleBinding arms-kube-state-metrics kubectl delete ClusterRoleBinding arms-pilot-prom-k8s kubectl delete ClusterRoleBinding arms-prometheus-ack-arms-prometheus-role-binding kubectl delete ClusterRoleBinding gpu-prometheus-exporter kubectl delete ClusterRoleBinding o11y:addon-controller:rolebinding kubectl delete ClusterRoleBinding arms-kube-state-metrics-agent kubectl delete ClusterRoleBinding arms-node-exporter-agent kubectl delete ClusterRoleBinding arms-aliyunserviceroleforarms-clusterrolebindingHapus Roles dan RoleBindings.
kubectl delete Role arms-pilot-prom-spec-ns-k8s kubectl delete Role arms-pilot-prom-spec-ns-k8s -n kube-system kubectl delete RoleBinding arms-pilot-prom-spec-ns-k8s kubectl delete RoleBinding arms-pilot-prom-spec-ns-k8s -n kube-system
Bagaimana cara menguninstall Managed Service for Prometheus menggunakan Helm?
Jika Anda menerapkan layanan secara manual menggunakan Helm, atau jika sumber daya sisa tetap ada karena masalah lingkungan atau versi Helm, Anda harus menggunakan metode ini untuk menguninstall layanan tersebut.
Pada halaman Kluster, klik nama kluster target. Di panel navigasi sebelah kiri pada halaman detail kluster, pilih .
Pada halaman Helm, temukan komponen arms-prometheus dan klik Delete di kolom Actions. Kemudian, pilih Purge Release Record dan ikuti petunjuk untuk menghapus aplikasi.
Terjadi kesalahan "xxx in use" saat menginstal komponen ack-arms-prometheus
Pada halaman Kluster, klik nama kluster target. Di panel navigasi sebelah kiri pada halaman detail kluster, pilih .
Pada halaman Helm, verifikasi apakah ack-arms-prometheus ada.
Hapus ack-arms-prometheus dari halaman Helm lalu instal ulang di halaman Component Management. Untuk informasi lebih lanjut, lihat Kelola komponen.
Tidak ditemukan:
Jika
ack-arms-prometheustidak ditemukan, ini menunjukkan bahwa sumber daya sisa masih ada akibat penghapusan Helm Releaseack-arms-prometheus. Anda kemudian harus menghapus ARMS-Prometheus secara manual dan lengkap.
Pemasangan komponen ack-arms-prometheus gagal setelah muncul pesan "Component Not Installed"
Periksa apakah komponen ack-arms-prometheus sudah terinstal.
Pada halaman Kluster, klik nama kluster target. Di panel navigasi sebelah kiri pada halaman detail kluster, pilih .
Pada halaman Helm, verifikasi apakah ack-arms-prometheus ada.
Hapus ack-arms-prometheus dari halaman Helm lalu instal ulang di halaman Component Management. Untuk informasi lebih lanjut, lihat Kelola komponen.
Tidak ditemukan:
Jika
ack-arms-prometheustidak ditemukan, ini menunjukkan bahwa sumber daya sisa masih ada akibat penghapusan Helm Releaseack-arms-prometheus. Anda kemudian harus menghapus ARMS-Prometheus secara manual dan lengkap.
Periksa log ack-arms-prometheus untuk mencari kesalahan.
Di panel navigasi sebelah kiri pada halaman detail kluster, pilih .
Di bagian atas halaman Stateless, atur Namespace menjadi arms-prom lalu klik arms-prometheus-ack-arms-prometheus.
Klik tab Log dan periksa log untuk mencari kesalahan.
Periksa apakah terjadi kesalahan selama instalasi agen.
Masuk ke Konsol ARMS. Di panel navigasi sebelah kiri, klik Provisioning.
Pada tab Connected Environments, temukan lingkungan kontainer target di daftar Container Environment. Di kolom Actions, klik Probe Settings untuk membuka halaman Probe Settings.
Bagaimana cara memberikan izin pemantauan untuk kluster khusus ACK?
Pada halaman Kluster, klik nama kluster target. Di panel navigasi sebelah kiri, klik Cluster Information.
Pada tab Basic Information, klik tautan KubernetesWorkerRole-*** di sebelah kanan Worker RAM Role. Pada halaman peran RAM, klik tab Permission Management. Di kolom Access Policy, klik k8sWorkerRole****.
Pada halaman detail kebijakan akses, klik tab Policy Document, lalu klik Edit Policy Document.
Di editor skrip, tambahkan aturan otorisasi berikut ke bidang Statement lalu klik OK.
{ "Version": "1", "Statement": [ { "Action": [ "arms:Describe*", "arms:List*", "arms:Get*", "arms:Search*", "arms:Check*", "arms:Query*", "arms:ListEnvironments", "arms:DescribeAddonRelease", "arms:InstallAddon", "arms:DeleteAddonRelease", "arms:ListEnvironmentDashboards", "arms:ListAddonReleases", "arms:CreateEnvironment", "arms:UpdateEnvironment", "arms:InitEnvironment", "arms:DescribeEnvironment", "arms:InstallEnvironmentFeature", "arms:ListEnvironmentFeatures", "cms:CreateIntegrationPolicy", "cms:ListAddonReleases", "cms:UpdateAddonRelease", "cms:CreateAddonRelease", "cms:GetPrometheusInstance", "cms:ListIntegrationPolicyStorageRequirements" ], "Resource": "*", "Effect": "Allow" } ] }
Referensi
Tingkatkan Alibaba Cloud Prometheus Monitoring dari Edisi Dasar ke Edisi Pro.