Artikel ini menjelaskan situasi observabilitas Kubernetes cluster, tantangan dalam observabilitas multi-cloud Kubernetes cluster, serta solusi untuk mengatasinya. Artikel ini juga memberikan contoh penggunaan Managed Service for Prometheus Alibaba Cloud dan ACK One registered clusters untuk memantau dan mengelola multi-cloud Kubernetes cluster.
Situasi saat ini dari observabilitas Kubernetes cluster
Kubernetes telah menjadi alat manajemen dan orkestrasi kontainer yang umum digunakan di industri komputasi awan. Di sisi lain, Prometheus telah terbukti sebagai solusi standar untuk pemantauan Kubernetes cluster melalui berbagai iterasi.
Prometheus mengumpulkan dan menyimpan metrik dari lapisan sistem pemantauan, aplikasi, dan bisnis. Selain itu, Prometheus menggunakan Grafana untuk menampilkan metrik dan mengirimkan peringatan. Kombinasi Prometheus dan Grafana memungkinkan Anda mengumpulkan, menyimpan, menampilkan, dan mengonfigurasi peringatan untuk metrik pemantauan Kubernetes cluster, membantu mengidentifikasi masalah, menganalisis penyebabnya, serta melindungi aplikasi cloud-native. Solusi ini telah menjadi standar industri untuk pemantauan Kubernetes cluster.
Berikut adalah dua solusi utama untuk mengelola Kubernetes cluster:
Solusi 1: Membangun sistem pemantauan
Anda dapat membangun sistem pemantauan menggunakan Prometheus dan Grafana untuk lingkungan produksi. Namun, pada tahap awal, diperlukan investasi besar dalam tenaga kerja untuk mengintegrasikan modul fungsional seperti pengumpulan, penyimpanan, tampilan, dan peringatan, termasuk deduplikasi peringatan. Pada tahap akhir, biaya operasi dan pemeliharaan (O&M) akan meningkat secara signifikan.
Solusi 2: Gunakan layanan pemantauan yang disediakan oleh vendor layanan cloud
Anda dapat menggunakan layanan pemantauan dari vendor cloud seperti Managed Service for Prometheus. Layanan ini mendukung dua metode penagihan: langganan dan bayar sesuai pemakaian. Ini mengurangi biaya awal pembuatan sistem pemantauan serta menyediakan dukungan teknis O&M untuk menurunkan biaya operasional.
Tantangan untuk observabilitas multi-cloud Kubernetes cluster
Perusahaan semakin banyak menerapkan layanan yang lebih kompleks di cloud. Dalam beberapa skenario, Kubernetes cluster mungkin digunakan di berbagai layanan cloud atau wilayah, sehingga menimbulkan tantangan operasional untuk multi-cloud Kubernetes cluster.
Berikut adalah dua solusi utama untuk memantau multi-cloud Kubernetes cluster:
Solusi 1: Bangun sistem pemantauan berdasarkan sistem Prometheus yang dikelola sendiri dan Grafana
Jika menggunakan solusi ini, Anda akan menghadapi tantangan berikut:
Pembangunan sistem pemantauan mandiri memerlukan integrasi modul fungsional seperti pengumpulan, penyimpanan, tampilan, dan peringatan di tahap awal. Pada tahap akhir, dibutuhkan lebih banyak personel O&M, yang meningkatkan biaya operasional.
Database seri waktu (TSDB) Prometheus open source menggunakan penyimpanan SSD. Data disimpan secara terpisah di situs tunggal, yang dapat menyebabkan kehilangan data.
Kemampuan pengumpulan Prometheus open source terbatas. Karena operasi satu bagian, Prometheus tidak mendukung penskalaan otomatis. Selama jam sibuk, kinerja pengumpulan metrik pemantauan dapat terganggu.
Solusi 2: Gunakan layanan Prometheus yang disediakan oleh vendor layanan cloud
Jika menggunakan solusi ini, Anda akan menghadapi tantangan berikut:
Banyak vendor cloud: Setiap vendor menyediakan kemampuan pemantauan dan metode akses yang berbeda, meningkatkan biaya pembelajaran.
Manajemen terdesentralisasi: Layanan Prometheus yang berbeda tidak dapat dikelola secara seragam, menyebabkan inefisiensi dan beban kerja O&M yang berulang. Anda mungkin juga kesulitan mengidentifikasi masalah bisnis dengan cepat.
Dalam solusi-solusi sebelumnya, Anda tidak dapat menanyakan atau menganalisis metrik yang tersebar atau mengonfigurasi peringatan untuk metrik tersebut secara seragam.
Manfaat Managed Service for Prometheus
Untuk mengatasi tantangan-tantangan tersebut, ACK One registered clusters menyediakan kemampuan manajemen seragam untuk Kubernetes cluster dari vendor cloud pihak ketiga, membantu Anda mengelola multi-cloud Kubernetes cluster secara efisien. Managed Service for Prometheus menyediakan sistem pemantauan lengkap dengan kemampuan pengumpulan metrik, tampilan Grafana, dan peringatan. Layanan ini mendukung metode penagihan bayar sesuai pemakaian dan langganan untuk meningkatkan efisiensi pemantauan serta mengurangi biaya O&M.
Kombinasi ACK One registered clusters dan Managed Service for Prometheus membantu Anda mengatasi tantangan-tantangan sebelumnya dan memantau multi-cloud Kubernetes cluster secara sederhana dan efisien. Berikut adalah manfaat utamanya:
Kemampuan kuat: Kombinasi Managed Service for Prometheus dan ACK One registered clusters menyelesaikan masalah seperti manajemen tersebar, kesulitan konstruksi sistem pemantauan, efisiensi O&M rendah, ketidakmampuan menanyakan metrik bersama, dan peringatan tersebar. Anda dapat mengimplementasikan manajemen seragam, konfigurasi, query, dan peringatan untuk pemantauan multi-cloud Kubernetes cluster dengan efisiensi tinggi dan biaya O&M rendah. Tim O&M dapat fokus pada bisnis tanpa melakukan pekerjaan berulang.
Biaya lebih rendah: Managed Service for Prometheus menyediakan pengumpulan metrik dasar secara gratis untuk memenuhi persyaratan pemantauan dasar pada Kubernetes cluster. Untuk cluster skala kecil, Anda dapat menggunakan metode penagihan bayar sesuai pemakaian untuk memantau bisnis dengan biaya minimum. Untuk informasi tentang metode penagihan bayar sesuai pemakaian Managed Service for Prometheus, lihat Bayar sesuai pemakaian. Untuk cluster skala besar, Anda dapat menggunakan metode penagihan langganan, yang dapat mengurangi biaya pemantauan hingga 67%.
Penggunaan sumber daya lebih efisien: Dengan menggunakan Managed Service for Prometheus, Anda hanya perlu menerapkan agen ringan di cluster Kubernetes Anda. Agen ini mendukung penskalaan otomatis. Misalnya, jika cluster Kubernetes Anda memiliki 2 core dan 4 GB memori, Anda dapat mengumpulkan hingga 6 juta metrik. Untuk mengurangi beban pada API Server cluster Kubernetes yang disebabkan oleh modul penemuan layanan Prometheus open source, Managed Service for Prometheus telah mengoptimalkan modul penemuan layanan. Optimasi ini meminimalkan penggunaan sumber daya, memaksimalkan pengumpulan metrik pemantauan dari cluster Kubernetes, serta melindungi operasional bisnis Anda.
Keuntungan 1: peningkatan performa
Item | Managed Service for Prometheus | Sistem Prometheus yang dikelola sendiri |
Ketersediaan tinggi | Managed Service for Prometheus menyediakan ketersediaan tinggi dan mendukung penskalaan horizontal. Anda dapat menerapkan beberapa replika untuk komponen pengumpulan dan penyimpanan. | Sistem Prometheus yang dikelola sendiri menyediakan ketersediaan rendah dan tidak mendukung penskalaan horizontal. Anda hanya dapat menjalankan satu proses pada satu waktu. |
Penyimpanan data | Penyimpanan berbasis cloud memiliki kapasitas penyimpanan tak terbatas. | Kapasitas penyimpanan terbatas. |
Visualisasi data | Grafana terintegrasi ke dalam konsol Application Real-Time Monitoring Service (ARMS) dan template pemantauan umum tersedia langsung dari kotak. | Anda harus menerapkan Grafana dan mengonfigurasi dasbor sendiri. |
Peringatan | Managed Service for Prometheus terintegrasi dengan sub-layanan Manajemen Peringatan ARMS untuk meningkatkan efisiensi dan akurasi peringatan. | Anda harus menginstal plug-in AlertManager sendiri. |
Kinerja pengumpulan satu replika (CPU 2-core, 4 GB memori) | 6 juta titik data | 1 juta titik data |
Kinerja kueri data (600 juta titik waktu) | 8 hingga 10 detik | 180 detik |
Kemampuan lainnya | Managed Service for Prometheus menyediakan kemampuan pra-agregasi, downsampling, dan GlobalView. | Tidak didukung |
Keuntungan 2: kueri multi-cluster Prometheus teragregasi
ARMS menyediakan instance agregasi virtual untuk beberapa instance Prometheus atau cluster Prometheus yang dikelola sendiri. Instance ini dapat digunakan untuk menanyakan metrik Prometheus, mengelola sumber data Grafana, dan mengelola peringatan secara seragam.
Untuk mengelola data tersebar dari Prometheus open source, Managed Service for Prometheus memungkinkan Anda mengonfigurasi beberapa alamat sumber data di Grafana. Tanpa ini, status aplikasi di berbagai wilayah sulit dianalisis secara keseluruhan karena isolasi sumber data.
Anda tidak perlu menerapkan Prometheus Server di setiap wilayah atau menerapkan sejumlah besar komponen Thanos. Cukup gunakan Remote Write untuk melaporkan data ke Managed Service for Prometheus.
Managed Service for Prometheus menyediakan kemampuan kueri global, terdistribusi, stabil, dan berperforma tinggi. Penskalaan horizontal dan vertikal dapat dilakukan kapan saja untuk sejumlah besar kueri.
Kueri multi-cluster Prometheus teragregasi dapat diimplementasikan langsung tanpa komponen tambahan selain Managed Service for Prometheus, membantu Anda mengurangi biaya O&M.
Keuntungan 3: instalasi ringan
Dibandingkan dengan Prometheus open source, Managed Service for Prometheus mudah diterapkan. Anda hanya perlu menginstal agen ringan di cluster Kubernetes. Penyimpanan backend dapat dihosting untuk menghemat penggunaan sumber daya cluster bisnis.
Keuntungan 4: integrasi Managed Service for Grafana
Alibaba Cloud Managed Service for Grafana adalah platform visualisasi data O&M cloud-native yang menyediakan kemampuan pemeliharaan nol dan startup cepat. Berikut adalah manfaat utamanya:
Secara default, sumber data dari berbagai layanan Alibaba Cloud seperti Managed Service for Prometheus dan Simple Log Service terintegrasi. Sumber data pihak ketiga atau buatan pengguna didukung, memungkinkan Anda membangun dasbor O&M terintegrasi dengan cepat.
Managed Service for Grafana menyediakan instans eksklusif, jaminan SLA, dan O&M yang andal. Layanan ini juga memastikan ketersediaan tinggi dan elastisitas sistem pemantauan dengan biaya pemeliharaan lebih rendah.
Managed Service for Grafana mendukung Single Sign-On (SSO) Alibaba Cloud dan sistem akun yang dikelola sendiri untuk manajemen halus sumber data dan dasbor tanpa mengorbankan keamanan data.
Managed Service for Grafana dapat menyelesaikan masalah berikut:
Kesulitan dalam agregasi data: Data pemantauan dari berbagai layanan cloud sulit diagregasi dan disatukan, meningkatkan kesulitan O&M.
Kesulitan dalam O&M: Metrik inti dalam grafik pemantauan berbagai layanan cloud harus dikonfigurasi ulang.
Kesulitan dalam manajemen peringatan: Aturan peringatan berbagai layanan cloud tersebar dan sulit dikelola.
Managed Service for Grafana dapat memberikan kemampuan berikut:
Integrasi default: Managed Service for Grafana terintegrasi dengan layanan utama Alibaba Cloud seperti layanan komputasi elastis dan layanan database secara default.
Dasbor seragam: Sistem dasbor seragam dibangun di seluruh sumber data untuk mengoptimalkan visualisasi O&M.
Peringatan seragam: Anda dapat dengan mudah membangun sistem peringatan terintegrasi untuk meningkatkan efisiensi manajemen peringatan.
Keuntungan 5: integrasi Manajemen Peringatan
Secara default, Managed Service for Prometheus terintegrasi dengan Manajemen Peringatan. Manajemen Peringatan memiliki fitur berikut:
Globalisasi
Anda dapat mengglobalisasi templat aturan peringatan untuk mengonfigurasi peringatan untuk peristiwa global.
Anda dapat mengglobalisasi kontak dan kebijakan notifikasi dengan pengaturan sederhana.
Pengumpulan peristiwa dengan efisiensi manajemen lebih tinggi
Anda dapat mengintegrasikan Manajemen Peringatan dengan layanan pemantauan umum Alibaba Cloud atau layanan pemantauan pihak ketiga untuk manajemen terpusat.
Manajemen Peringatan menyediakan kemampuan penanganan peristiwa peringatan yang stabil. Anda dapat menangani peristiwa peringatan 24/7.
Manajemen Peringatan memastikan latensi rendah untuk menangani sejumlah besar peristiwa peringatan.
Notifikasi peringatan tepat waktu dan akurat
Anda dapat mengonfigurasi kebijakan notifikasi dan mengompres peristiwa peringatan, mengurangi beban kerja O&M.
Anda dapat memilih satu atau lebih metode notifikasi berdasarkan urgensi peringatan, seperti email, SMS, panggilan telepon, atau DingTalk.
Anda dapat mengonfigurasi kebijakan eskalasi untuk mengirim notifikasi ke kontak beberapa kali jika peringatan tetap tidak ditangani untuk waktu yang lama.
Manajemen peringatan efisien
Kontak dapat menggunakan DingTalk untuk menangani peringatan kapan saja.
Peringatan menggunakan format umum, memungkinkan kontak menganalisis peringatan dengan lebih baik.
Beberapa kontak dapat bekerja sama melalui DingTalk untuk menangani peringatan.
Pengolahan ulang peristiwa peringatan
Anda dapat menggunakan alur pemrosesan peristiwa untuk mengatur prosedur sederhana dan memproses peristiwa peringatan yang dilaporkan oleh sumber peringatan.
Anda dapat menduplikasi, mengompres, denoise, dan membungkam peringatan yang dilaporkan oleh sumber peringatan, mengonvergen peringatan dan mengurangi badai peringatan.
Manajemen konfigurasi peringatan
Manajemen Peringatan menyediakan template pemantauan yang berisi metrik inti umum dari Kubernetes cluster. Fitur templat peringatan menghasilkan dan mengirim templat peringatan secara otomatis, memungkinkan Anda mengonfigurasi beberapa peringatan sekaligus.
Manajemen Peringatan menyediakan wizard konfigurasi peringatan visual dan pratinjau. Anda dapat melihat dan mengonfigurasi kondisi dan peristiwa peringatan secara real-time dengan presisi.
Anda dapat melihat statistik peringatan, menganalisis hasil penanganan peringatan secara real-time, meningkatkan efisiensi penanganan peringatan, dan memantau status bisnis.
Contoh: Pantau multi-cloud Kubernetes cluster Managed Service for Prometheus
Prasyarat
Cluster terhubung ke Alibaba Cloud melalui Internet atau jaringan internal. Untuk informasi lebih lanjut, lihat FAQ tentang cluster terdaftar.
Langkah 1: Buat ACK One registered cluster
Masuk ke Konsol ACK. Di panel navigasi kiri, klik Clusters.
Di halaman Clusters, klik Create Kubernetes Cluster.
Di pojok kanan atas halaman Clusters, klik Create Kubernetes Cluster.
Di halaman yang muncul, klik tab ACK One Registered Cluster, atur parameter yang diperlukan, dan klik Create Cluster. Untuk informasi lebih lanjut, lihat Daftarkan cluster Kubernetes eksternal.
Anda dapat melihat cluster terdaftar di halaman Clusters.

Langkah 2: Kelola multi-cloud Kubernetes cluster di ACK One registered cluster
Dalam contoh ini, Tencent Kubernetes Engine (TKE) digunakan untuk menjelaskan cara mengelola cluster TKE di ACK One registered cluster dan menangkap serta menampilkan metrik di Managed Service for Prometheus.
Di halaman Clusters ACK console, temukan cluster terdaftar yang Anda buat di Langkah 1: Buat ACK One Registered Cluster dan klik Details di kolom Actions.
Klik tab Connection Information. Kemudian, klik Obtain Temporary Kubeconfig atau Obtain Long-term Kubeconfig sesuai kebutuhan. Di kotak dialog yang muncul, klik tab Internal Access atau Public Access, lalu klik Copy di sebelah kanan untuk menyalin informasi koneksi cluster.
Masuk ke Konsol TKE Tencent Cloud. Di halaman Clusters, klik nama cluster TKE. Di pojok kanan atas halaman, klik Create Resource in YAML. Di kotak dialog yang muncul, tempelkan kredensial cluster yang Anda salin di langkah sebelumnya ke editor, lalu klik OK. Periksa status Deployment dan ack-cluster-agent di halaman Clusters. Jika Deployment dan ack-cluster-agent berjalan sesuai harapan, instalasi berhasil.
Masuk ke ACK console. Di halaman Clusters, periksa status cluster ACK One registered yang Anda buat di Langkah 1: Buat ACK One Registered Cluster. Jika cluster ACK One registered dalam status Berjalan, cluster TKE telah dikelola.
Langkah 3: Instal agen Prometheus (ack-arms-prometheus)
Untuk informasi lebih lanjut, lihat Aktifkan Managed Service for Prometheus untuk cluster terdaftar.
Langkah 4: Lihat data pemantauan
Secara default, Managed Service for Prometheus terintegrasi dengan dasbor Grafana untuk memungkinkan Anda melihat data pemantauan seperti dasbor Deployment dan dasbor DaemonSet. Anda dapat melakukan langkah-langkah berikut untuk melihat data pemantauan pada dasbor:
Masuk ke Konsol Prometheus. Di panel navigasi kiri, klik Instances.
Klik instans Prometheus yang memantau cluster ACK One registered yang dibuat di Langkah 1: Buat ACK One Registered Cluster.
Di panel navigasi kiri, klik Dashboards. Di halaman Dashboards, Anda dapat mengklik nama dasbor untuk melihat detail metrik.
Langkah 5: Lihat peringatan
Secara default, Managed Service for Prometheus mengaktifkan pemantauan metrik inti untuk Kubernetes cluster. Ini mencegah kesalahan yang mungkin terjadi jika Anda secara manual mengaktifkan Managed Service for Prometheus. Selain itu, Managed Service for Prometheus terintegrasi dengan berbagai templat peringatan dengan metrik inti. Anda dapat menggunakan templat peringatan ini berdasarkan kebutuhan bisnis tanpa perlu menulis kode PromQL. Untuk melihat peringatan, ikuti langkah-langkah berikut:
Masuk ke Konsol Prometheus. Di panel navigasi kiri, klik Instances.
Klik instans Prometheus yang memantau cluster ACK One registered yang dibuat di Langkah 1: Buat ACK One Registered Cluster.
Di panel navigasi kiri, klik Alert Rules. Di halaman Prometheus Alert Rules, lihat peringatan.
Aktivasi
ACK One registered clusters: Untuk informasi tentang cara mengaktifkan cluster ACK One registered, lihat Daftarkan cluster Kubernetes eksternal.
Managed Service for Prometheus: Managed Service for Prometheus menyediakan metode penagihan langganan. Dibandingkan dengan metode penagihan bayar sesuai pemakaian, metode penagihan langganan menghemat setidaknya 67% dari biaya Anda.