全部产品
Search
文档中心

Container Service for Kubernetes:Menghubungkan dan mengonfigurasi Managed Service for Prometheus

更新时间:Nov 18, 2025

Integrasikan Managed Service for Prometheus untuk mengumpulkan metrik dari lapisan kontrol, node, dan aplikasi di kluster ACK Anda, serta tingkatkan manajemen kinerja kluster dengan dasbor visual dan peringatan real-time.

Pilih versi

Managed Service for Prometheus terintegrasi penuh dengan ekosistem Prometheus open-source dan menyediakan layanan pemantauan yang sepenuhnya dikelola. Layanan ini mengelola masalah-masalah mendasar seperti penyimpanan data, visualisasi data, dan operasi serta pemeliharaan (O&M) sistem.

  • Edisi Pro (Direkomendasikan): Menyimpan metrik selama 90 hari dan menyediakan collector yang sepenuhnya dikelola. Edisi ini menawarkan Service-Level Agreement (SLA) tingkat produksi sebesar 99,95%. Edisi ini juga mencakup dasbor Grafana yang dapat dikustomisasi dan aturan peringatan pra-konfigurasi untuk berbagai komponen Container Service.

  • Edisi Dasar: Menyimpan metrik selama 7 hari dan hanya menyediakan dasbor pemantauan dasar. Anda harus memelihara collector sendiri.

Aktifkan pemantauan Prometheus

Aktifkan pemantauan untuk kluster yang sudah ada

  1. (Opsional) Untuk kluster khusus ACK, Anda harus terlebih dahulu memberikan otorisasi untuk kebijakan pemantauan kepada kluster.

  2. Pada halaman Kluster, klik nama kluster target. Di panel navigasi sebelah kiri pada halaman detail kluster, pilih Operations Management > Prometheus Monitoring.

  3. Pada halaman Prometheus Monitoring, pilih versi pemantauan kontainer dan klik Install.

    Setelah Anda mengaktifkan pemantauan, metrik dasar default akan dikumpulkan secara otomatis. Untuk informasi tentang pengumpulan metrik kustom, lihat Kumpulkan metrik kustom. Anda juga dapat melihat beberapa dasbor pemantauan prasetel pada halaman ini, seperti Cluster Monitoring Overview, Node Monitoring, Application Monitoring, Network Monitoring, dan Storage Monitoring.

Aktifkan pemantauan saat membuat kluster

  • ACK managed cluster Pro Edition:

    Pada halaman Component Configuration, di bagian Container Monitoring, pilih Container Cluster Monitoring Pro Edition atau Container Cluster Monitoring Basic Edition. Untuk informasi lebih lanjut, lihat Buat kluster ACK yang dikelola.

    Mode Otomatis untuk hosting cerdas mengaktifkan Container Monitoring Basic Edition secara default.
  • Kluster khusus ACK Edisi Dasar, kluster ACS, dan kluster ACK Serverless:

    Pada halaman Component Configurations pada wizard pembuatan kluster, di bagian Container Monitoring, pilih Use Managed Service For Prometheus untuk menginstal Container Monitoring Basic Edition.

    Setelah pemantauan diaktifkan, metrik dasar default akan dikumpulkan secara otomatis. Untuk mengumpulkan metrik kustom, lihat Kumpulkan metrik kustom. Pada halaman detail kluster target, di panel navigasi sebelah kiri, pilih Operations Management > Prometheus Monitoring. Anda kemudian dapat melihat dasbor pemantauan pra-konfigurasi seperti Cluster Monitoring Overview, Node Monitoring, Application Monitoring, Network Monitoring, dan Storage Monitoring.

Konfigurasi notifikasi peringatan

Anda dapat mengonfigurasi aturan peringatan untuk metrik utama. Jika terjadi anomali, notifikasi akan dikirim secara otomatis melalui saluran seperti email, pesan teks, atau DingTalk.

  1. Masuk ke Konsol ARMS. Di panel navigasi sebelah kiri, pilih Alert Management > Notification Objects.

  2. Pada halaman Notification Recipient, pilih metode notifikasi dan buat penerima notifikasi peringatan.

  3. Di panel navigasi sebelah kiri Konsol ARMS, pilih Prometheus Monitoring > Prometheus Alert Rules.

  4. Pada halaman Prometheus Alert Rules, klik Create Prometheus Alert Rule.

    Untuk informasi lebih lanjut, lihat Konfigurasi aturan peringatan Prometheus.

Kumpulkan metrik pemantauan kustom

Pemantauan Prometheus mendukung beberapa cara untuk mengumpulkan metrik kustom, seperti QPS permintaan dan latensi pemrosesan. Untuk informasi lebih lanjut, lihat Kelola aturan pengumpulan kustom untuk lingkungan kontainer.

Nonaktifkan pemantauan Prometheus

  1. Pada halaman detail kluster target, di panel navigasi sebelah kiri, klik Component Management.

  2. Pada halaman Component Management, klik tab Log and Monitoring. Temukan komponen ack-arms-prometheus dan klik Uninstall. Pada kotak dialog yang muncul, klik OK.

Penagihan

  • Biaya pemantauan berdasarkan ukuran kluster: Edisi Dasar gratis. Edisi Pro ditagih berdasarkan skema bayar sesuai penggunaan berdasarkan jumlah node dalam kluster.

  • Biaya instans Prometheus: Pengumpulan metrik dasar tidak dikenai biaya. Pengumpulan metrik kustom ditagih berdasarkan skema bayar sesuai penggunaan berdasarkan faktor-faktor seperti penulisan data, laporan data, volume penyimpanan, dan periode retensi.

Untuk aturan penagihan dan harga lengkap, lihat Penagihan Pemantauan Kontainer.

Metrik dasar default

Setelah fitur pemantauan Prometheus diaktifkan, metrik dasar untuk pemantauan kontainer dikumpulkan secara otomatis. Untuk informasi lebih lanjut tentang metrik dasar, lihat Deskripsi Metrik.

  • Pemantauan sumber daya dasar untuk kontainer (kubelet).

  • Pemantauan status aplikasi untuk kluster (kube-state-metrics).

  • Pemantauan sumber daya dasar untuk node kluster (node-exporter).

  • Pemantauan GPU untuk node kluster (ack-gpu-exporter).

  • Fitur pemantauan komponen lapisan kontrol untuk kluster yang dikelola memantau metrik untuk API Server, etcd, kube-scheduler, kube-controller-manager, dan cloud-controller-manager.

  • Metrik pemantauan dasar untuk CoreDNS kluster.

  • Metrik pemantauan dasar untuk Ingress-Controller kluster.

  • Metrik dasar yang dilaporkan secara otomatis setelah Anda mengaktifkan fitur tertentu:

FAQ

Halaman Pemantauan Prometheus menampilkan "No related monitoring dashboard found"

Jika Anda mengaktifkan pemantauan Prometheus dan melihat pesan No Related Monitoring Dashboard Found pada halaman Operations Management > Prometheus Monitoring untuk kluster target, ikuti prosedur berikut untuk menyelesaikan masalah tersebut.

image

  1. Instal ulang komponen pemantauan Prometheus.

    1. Nonaktifkan pemantauan Prometheus.

    2. Instal ulang komponen:

      1. Setelah memastikan bahwa pencopotan instalasi telah selesai, klik Install, lalu klik OK pada kotak dialog.

      2. Setelah instalasi selesai, kembali ke halaman Pemantauan Prometheus untuk memeriksa apakah masalah telah terselesaikan.

        Jika masalah masih berlanjut, lanjutkan ke langkah berikutnya.

  2. Periksa koneksi instans Prometheus.

    1. Di panel navigasi sebelah kiri Konsol ARMS, klik Provisioning.

    2. Pada tab Connected Environments, periksa daftar Container Environment untuk mencari lingkungan kontainer dengan nama yang sama dengan kluster Anda.

      • Jika tidak ada lingkungan kontainer yang sesuai: Lihat Hubungkan menggunakan konsol ARMS atau Prometheus.

      • Jika Anda memiliki lingkungan kontainer, klik Probe Settings di kolom Actions untuk lingkungan target guna membuka halaman Probe Settings.

        Periksa apakah agen yang diinstal berjalan sebagaimana mestinya.

Bagaimana cara menyesuaikan durasi penyimpanan metrik?

Untuk informasi lebih lanjut, lihat Sesuaikan durasi penyimpanan metrik.

Bagaimana cara melihat versi komponen ack-arms-prometheus?

  1. Pada halaman Kluster, klik nama kluster target. Di panel navigasi sebelah kiri, klik Component Management.

  2. Pada halaman Component Management, klik tab Log and Monitoring dan temukan komponen ack-arms-prometheus.

    Versi saat ini ditampilkan di bawah komponen. Jika tersedia versi yang lebih baru, klik Upgrade di sebelah nomor versi.

    Catatan

    Opsi Upgrade hanya tersedia jika komponen yang diinstal bukan versi terbaru.

Mengapa saya tidak dapat menerapkan pemantauan GPU?

Jika node GPU memiliki taint, penerapan pemantauan GPU mungkin gagal. Anda dapat melakukan langkah-langkah berikut untuk melihat taint pada node GPU.

  1. Jalankan perintah berikut untuk melihat taint pada node GPU target.

    Jika node GPU memiliki taint kustom, Anda dapat menemukan entri terkait taint. Topik ini menggunakan contoh taint dengan key bernilai test-key, value bernilai test-value, dan effect bernilai NoSchedule:

    kubectl describe node cn-beijing.47.100.***.***

    Output yang diharapkan:

    Taints:test-key=test-value:NoSchedule
  2. Tangani taint pada node GPU dengan salah satu cara berikut:

    • Jalankan perintah berikut untuk menghapus taint dari node GPU.

      kubectl taint node cn-beijing.47.100.***.*** test-key=test-value:NoSchedule-
    • Deklarasikan toleransi terhadap taint pada node GPU agar pod dapat dijadwalkan ke node yang memiliki taint tersebut.

      # 1. Jalankan perintah berikut untuk mengedit ack-prometheus-gpu-exporter.
      kubectl edit daemonset -n arms-prom ack-prometheus-gpu-exporter
      
      # 2. Tambahkan bidang berikut ke file YAML untuk mendeklarasikan toleransi terhadap taint.
      # Bidang lainnya dihilangkan.
      # Bidang tolerations ditambahkan di atas bidang containers dan berada pada level yang sama dengan bidang containers.
      tolerations:
      - key: "test-key"
        operator: "Equal"
        value: "test-value"
        effect: "NoSchedule"
      containers:
       # Bidang lainnya dihilangkan.

Bagaimana cara menghapus ARMS-Prometheus secara lengkap dan manual?

Jika Anda hanya menghapus namespace Managed Service for Prometheus, konfigurasi sisa akan tetap ada, yang dapat menyebabkan kegagalan saat instalasi ulang. Anda dapat melakukan operasi berikut untuk menghapus konfigurasi sisa ARMS-Prometheus secara lengkap.

  • Hapus namespace arms-prom.

    kubectl delete namespace arms-prom
  • Hapus ClusterRoles.

    kubectl delete ClusterRole arms-kube-state-metrics
    kubectl delete ClusterRole arms-node-exporter
    kubectl delete ClusterRole arms-prom-ack-arms-prometheus-role
    kubectl delete ClusterRole arms-prometheus-oper3
    kubectl delete ClusterRole arms-prometheus-ack-arms-prometheus-role
    kubectl delete ClusterRole arms-pilot-prom-k8s
    kubectl delete ClusterRole gpu-prometheus-exporter
    kubectl delete ClusterRole o11y:addon-controller:role
    kubectl delete ClusterRole arms-aliyunserviceroleforarms-clusterrole
  • Hapus ClusterRoleBindings.

    kubectl delete ClusterRoleBinding arms-node-exporter
    kubectl delete ClusterRoleBinding arms-prom-ack-arms-prometheus-role-binding
    kubectl delete ClusterRoleBinding arms-prometheus-oper-bind2
    kubectl delete ClusterRoleBinding arms-kube-state-metrics
    kubectl delete ClusterRoleBinding arms-pilot-prom-k8s
    kubectl delete ClusterRoleBinding arms-prometheus-ack-arms-prometheus-role-binding
    kubectl delete ClusterRoleBinding gpu-prometheus-exporter
    kubectl delete ClusterRoleBinding o11y:addon-controller:rolebinding
    kubectl delete ClusterRoleBinding arms-kube-state-metrics-agent
    kubectl delete ClusterRoleBinding arms-node-exporter-agent
    kubectl delete ClusterRoleBinding arms-aliyunserviceroleforarms-clusterrolebinding
  • Hapus Roles dan RoleBindings.

    kubectl delete Role arms-pilot-prom-spec-ns-k8s
    kubectl delete Role arms-pilot-prom-spec-ns-k8s -n kube-system
    kubectl delete RoleBinding arms-pilot-prom-spec-ns-k8s
    kubectl delete RoleBinding arms-pilot-prom-spec-ns-k8s -n kube-system

Bagaimana cara menguninstall Managed Service for Prometheus menggunakan Helm?

Jika Anda menerapkan layanan secara manual menggunakan Helm, atau jika sumber daya sisa tetap ada karena masalah lingkungan atau versi Helm, Anda harus menggunakan metode ini untuk menguninstall layanan tersebut.

  1. Pada halaman Kluster, klik nama kluster target. Di panel navigasi sebelah kiri pada halaman detail kluster, pilih Applications > Helm.

  2. Pada halaman Helm, temukan komponen arms-prometheus dan klik Delete di kolom Actions. Kemudian, pilih Purge Release Record dan ikuti petunjuk untuk menghapus aplikasi.

Terjadi kesalahan "xxx in use" saat menginstal komponen ack-arms-prometheus

  1. Pada halaman Kluster, klik nama kluster target. Di panel navigasi sebelah kiri pada halaman detail kluster, pilih Applications > Helm.

  2. Pada halaman Helm, verifikasi apakah ack-arms-prometheus ada.

Pemasangan komponen ack-arms-prometheus gagal setelah muncul pesan "Component Not Installed"

  • Periksa apakah komponen ack-arms-prometheus sudah terinstal.

    1. Pada halaman Kluster, klik nama kluster target. Di panel navigasi sebelah kiri pada halaman detail kluster, pilih Applications > Helm.

    2. Pada halaman Helm, verifikasi apakah ack-arms-prometheus ada.

  • Periksa log ack-arms-prometheus untuk mencari kesalahan.

    1. Di panel navigasi sebelah kiri pada halaman detail kluster, pilih Workloads > Stateless.

    2. Di bagian atas halaman Stateless, atur Namespace menjadi arms-prom lalu klik arms-prometheus-ack-arms-prometheus.

    3. Klik tab Log dan periksa log untuk mencari kesalahan.

  • Periksa apakah terjadi kesalahan selama instalasi agen.

    1. Masuk ke Konsol ARMS. Di panel navigasi sebelah kiri, klik Provisioning.

    2. Pada tab Connected Environments, temukan lingkungan kontainer target di daftar Container Environment. Di kolom Actions, klik Probe Settings untuk membuka halaman Probe Settings.

Bagaimana cara memberikan izin pemantauan untuk kluster khusus ACK?

  1. Pada halaman Kluster, klik nama kluster target. Di panel navigasi sebelah kiri, klik Cluster Information.

  2. Pada tab Basic Information, klik tautan KubernetesWorkerRole-*** di sebelah kanan Worker RAM Role. Pada halaman peran RAM, klik tab Permission Management. Di kolom Access Policy, klik k8sWorkerRole****.

  3. Pada halaman detail kebijakan akses, klik tab Policy Document, lalu klik Edit Policy Document.

  4. Di editor skrip, tambahkan aturan otorisasi berikut ke bidang Statement lalu klik OK.

    {
        "Version": "1",
        "Statement": [
            {
                "Action": [
                    "arms:Describe*",
                    "arms:List*",
                    "arms:Get*",
                    "arms:Search*",
                    "arms:Check*",
                    "arms:Query*",
                    "arms:ListEnvironments",
                    "arms:DescribeAddonRelease",
                    "arms:InstallAddon",
                    "arms:DeleteAddonRelease",
                    "arms:ListEnvironmentDashboards",
                    "arms:ListAddonReleases",
                    "arms:CreateEnvironment",
                    "arms:UpdateEnvironment",
                    "arms:InitEnvironment",
                    "arms:DescribeEnvironment",
                    "arms:InstallEnvironmentFeature",
                    "arms:ListEnvironmentFeatures",
                    "cms:CreateIntegrationPolicy",
                    "cms:ListAddonReleases",
                    "cms:UpdateAddonRelease",
                    "cms:CreateAddonRelease",
                    "cms:GetPrometheusInstance",
                    "cms:ListIntegrationPolicyStorageRequirements"
                ],
                "Resource": "*",
                "Effect": "Allow"
            }
        ]
    }

Referensi

Tingkatkan Alibaba Cloud Prometheus Monitoring dari Edisi Dasar ke Edisi Pro.