Cost Insights membantu Anda mendeteksi risiko stabilitas, kinerja, dan biaya pada workload kluster ACK sebelum eskalasi terjadi. Fitur ini melacak penggunaan resource di seluruh Pod dan menyediakan tampilan khusus untuk Pod Burstable dan BestEffort, sehingga Anda dapat mengidentifikasi workload yang salah konfigurasi dan segera mengambil tindakan.
Prasyarat
Sebelum memulai, pastikan Anda telah:
Mengaktifkan Cost Insights. Untuk informasi selengkapnya, lihat Enable cost insights.
Mengaktifkan Managed Service for Prometheus untuk kluster Anda. Untuk informasi selengkapnya, lihat Managed Service for Prometheus.
Mengapa konfigurasi resource penting
Kubernetes menetapkan kelas quality of service (QoS) untuk setiap Pod berdasarkan request dan limit resource-nya. Ketika sebuah node mengalami tekanan resource, Kubernetes menggunakan kelas QoS tersebut untuk menentukan Pod mana yang akan dievict terlebih dahulu.
Guaranteed
Pod memiliki request dan limit resource yang sama untuk setiap kontainer. Pod jenis ini memiliki stabilitas dan kinerja tertinggi serta merupakan yang terakhir dievict.
Burstable
Pod memiliki request resource tetapi tidak memiliki limit resource. Pod ini dapat mengonsumsi seluruh resource node. Saat eviction diperlukan, Kubernetes akan lebih dulu mengevict Pod BestEffort, lalu Pod Burstable.
BestEffort
Pod tidak memiliki request maupun limit resource. Pod ini hanya berjalan saat node memiliki resource idle dan merupakan yang pertama dievict ketika resource menjadi tidak mencukupi.
Resource yang salah konfigurasi—baik tidak dikonfigurasi, terlalu rendah, maupun terlalu tinggi—menimbulkan risiko nyata:
| Configuration | Resource | Risk |
|---|---|---|
| Not configured | CPU | Stabilitas dan kinerja terganggu; workload dapat menjadi tidak responsif akibat kekurangan resource CPU. |
| Not configured | Memory | Stabilitas terganggu; workload berisiko dihentikan karena kekurangan memori. |
| Under-configured | CPU | Kinerja terganggu; workload berjalan lambat atau menjadi tidak responsif. |
| Under-configured | Memory | Stabilitas terganggu; workload berisiko dihentikan karena kekurangan memori. |
| Over-configured | CPU | Rendahnya utilisasi resource menyebabkan biaya yang tidak perlu. |
| Over-configured | Memory | Rendahnya utilisasi resource menyebabkan biaya yang tidak perlu. |
Identifikasi risiko menggunakan Stability & Efficiency Analysis
Halaman Stability & Efficiency Analysis di dalam Cost Insights menyediakan tiga tampilan analisis untuk mengevaluasi risiko resource di seluruh kluster.
Akses halaman
Masuk ke ACK console. Di panel navigasi kiri, klik Clusters.
Pada halaman Clusters, temukan kluster yang ingin Anda kelola dan klik namanya. Di panel kiri, pilih Cost Suite > Cost Insights.
Pada tab Cluster Dimension, buka halaman Stability & Efficiency Analysis. Halaman ini menampilkan ikhtisar jumlah Pod berdasarkan kelas QoS dan total penggunaan resource-nya.

Lihat utilisasi resource semua Pod
Daftar Cluster pod resource usage analysis secara default menampilkan informasi dasar dan utilisasi resource (Usage/Request) untuk semua Pod di kluster. Urutkan atau filter daftar ini untuk mengidentifikasi workload yang berada di ekstrem:
Utilisasi rendah — Pod tersebut over-provisioned, sehingga Anda mungkin membayar resource yang tidak pernah digunakan.
Utilisasi tinggi — Pod tersebut under-configured, yang dapat menyebabkan masalah kinerja atau stabilitas tergantung pada apakah bottleneck-nya berasal dari CPU atau memori.
Utilisasi di atas 100% — penggunaan melebihi jumlah yang direquest, yang dapat memengaruhi stabilitas workload.
Contoh: Gambar berikut menunjukkan Pod yang diurutkan berdasarkan utilisasi memori secara menurun. Semua Pod yang ditampilkan melebihi 100% utilisasi memori dan perlu ditinjau lebih lanjut untuk menentukan apakah penyesuaian konfigurasi diperlukan.

Lihat konfigurasi resource Pod Burstable
Daftar Burstable Pod-Resource Usage Analysis menampilkan request dan limit CPU serta memori untuk setiap Pod Burstable. Karena Pod Burstable tidak memiliki batas atas resource, tidak adanya limit dapat diam-diam menurunkan kinerja seluruh kluster:
No CPU limit — Pod dapat mengonsumsi CPU tanpa batas, berpotensi membuat workload lain kekurangan resource dan menyebabkan ketidakresponsifan.
No memory limit — Pod dapat menghabiskan memori node, sehingga menempatkan workload lain pada risiko terminasi.
Contoh: Gambar berikut menunjukkan Pod Burstable tanpa limit CPU. Pod ini dapat menurunkan kinerja kluster atau dievict akibat persaingan sumber daya.

Identifikasi Pod BestEffort yang tidak diharapkan
Daftar Best Effort Pod-Resource Usage Analysis menampilkan semua Pod BestEffort di kluster. Pod BestEffort memiliki risiko eviction tertinggi dan harus ditinjau dengan cermat. Filter dan urutkan daftar ini untuk menemukan Pod yang seharusnya tidak berjalan dengan kualitas BestEffort.
Contoh: Jika layanan bisnis kritis berjalan sebagai Pod BestEffort, sesuaikan konfigurasi resource-nya agar dinaikkan ke kelas QoS yang lebih tinggi.

Langkah selanjutnya
Setelah mengidentifikasi risiko menggunakan Cost Insights, gunakan fitur berikut untuk mengatasinya:
Resource profiling — dapatkan rekomendasi CPU dan memori tingkat kontainer berdasarkan data penggunaan historis.
Dynamic resource overcommitment — optimalkan efektivitas biaya kluster dengan overcommitting resource berdasarkan pola penggunaan aktual.