全部产品
Search
文档中心

Container Service for Kubernetes:Dasbor penskalaan node

更新时间:Jul 02, 2025

Dengan seringnya ekspansi kluster dan penskalaan node, pemecahan masalah secara manual tidak lagi memadai untuk menemukan penyebab kegagalan penskalaan atau melacak masalah historis. Pengguna kesulitan mengidentifikasi anomali yang hanya dapat dideteksi melalui pengumpulan dan analisis data jangka panjang. Topik ini menjelaskan cara memecahkan masalah dengan cepat menggunakan grafik pada dasbor penskalaan node, yang menampilkan informasi rinci tentang pod, node, dan perubahan terkait.

Prasyarat

  • Untuk menggunakan dasbor penskalaan node, ajukan tiket.
  • Pusat acara Kubernetes harus diaktifkan untuk kluster Anda. Untuk informasi lebih lanjut, lihat Pemantauan Acara.
  • Fitur log audit harus diaktifkan untuk kluster. Untuk informasi lebih lanjut, lihat Bekerja dengan Audit Kluster.

Detail dasbor penskalaan node

Dasbor penskalaan node terdiri dari empat area. Bagian berikut menjelaskan data yang ditampilkan di setiap area.

Area gambaran umum

Lima grafik di area gambaran umum menampilkan data penting terkait penskalaan node bagi insinyur O&M.
  • Jumlah total node: jumlah total node dalam kluster, yang mencerminkan kapasitas kluster.
  • Jumlah node yang tersedia: jumlah node KubeletReady dalam kluster. Jika angka ini berbeda dari jumlah total node, beberapa node tidak dalam keadaan KubeletNotReady. Node tersebut mungkin sedang ditambahkan ke kluster atau telah gagal. Perhatikan node-node ini dengan cermat.
  • Skalabilitas kluster: menunjukkan apakah kluster dapat diskalakan. Jika NO ditampilkan, jumlah node yang tidak dalam keadaan Ready melebihi batas atas yang ditentukan. Dalam skenario ini, kluster tidak dapat melakukan aktivitas penambahan skala.
  • Aktivitas penambahan skala terbaru: jumlah aktivitas penambahan skala node yang dilakukan dalam rentang waktu tertentu.
  • Aktivitas pengurangan skala terbaru: jumlah aktivitas pengurangan skala node yang dilakukan dalam rentang waktu tertentu.

Detail pod

Grafik berikut ditampilkan di area detail pod:
  • Tren pod yang tidak dapat dijadwalkan: menampilkan tren pod dalam keadaan Pending seiring waktu. Jumlah pod yang tidak dapat dijadwalkan biasanya menunjukkan kebutuhan kluster untuk menambah node.
  • Tren pod yang dievakuasi: menampilkan tren pod yang sedang dievakuasi seiring waktu. Jika pod pada suatu node dievakuasi, hal ini menunjukkan bahwa konsumsi sumber daya pada node tersebut telah mencapai ambang batas.

Detail node

  • Tren status node: menampilkan jumlah total node, jumlah node dalam keadaan KubeletReady, dan jumlah node dalam keadaan KubeletNotReady. Node KubeletNotReady tidak termasuk node yang ditambahkan ke kluster dalam 10 menit terakhir.
  • Tren penambahan skala node dan tren pengurangan skala node: menampilkan tren aktivitas penambahan skala dan pengurangan skala node seiring waktu. Jumlah aktivitas penambahan skala sama dengan jumlah event ScaledUpGroup yang dihasilkan. Event ScaledUpGroup dihasilkan setiap kali cluster-autoscaler melakukan aktivitas penambahan skala. Jumlah aktivitas pengurangan skala sama dengan jumlah event ScaleDown yang dihasilkan. Event ScaleDown dihasilkan setiap kali cluster-autoscaler melakukan aktivitas pengurangan skala.

Daftar aktivitas penskalaan

Daftar aktivitas penskalaan menampilkan semua event terkait aktivitas penskalaan untuk membantu Anda dengan cepat menemukan aktivitas penskalaan dan memecahkan masalah.

Bekerja dengan dasbor penskalaan node

Mengidentifikasi masalah

  • Periksa apakah ada node abnormal: Pastikan jumlah total node sama dengan jumlah node yang tersedia. Jika tidak sama, beberapa node dalam kluster abnormal.
  • Periksa apakah kluster memiliki ukuran yang tepat: Sebagian besar beban kerja online memiliki jam puncak dan jam lembur. Fitur auto scaling dirancang untuk memungkinkan kluster Kubernetes secara otomatis menyesuaikan skalanya sesuai dengan fluktuasi beban kerja. Lihat bagian Detail Node, analisis statistik yang dikumpulkan dalam rentang waktu tertentu, lalu bandingkan dengan riwayat fluktuasi beban kerja. Jika kluster tidak dapat menyesuaikan skalanya selama jam puncak dan jam lembur seperti yang diharapkan, optimalkan konfigurasi penskalaan sesuai.

Memecahkan masalah

  • Pending ada di kluster tetapi node tidak diperluas. Lihat grafik skalabilitas kluster dan periksa apakah kluster dapat diskalakan.
    • Jika kluster tidak dapat diskalakan, cluster-autoscaler tidak dapat melakukan aktivitas penambahan skala. Dalam hal ini, pecahkan masalah tersebut.
    • Jika kluster dapat diskalakan, cari nama pod yang memicu aktivitas penambahan skala atau event NotTriggerScaleUp dalam daftar aktivitas penskalaan sebelumnya. Kemudian, periksa penyebab kegagalan penambahan skala di bidang reason.
  • Periksa waktu ketika pod memicu aktivitas penambahan skala: Cari nama pod yang memicu aktivitas penambahan skala atau event NotTriggerScaleUp dalam daftar aktivitas penskalaan sebelumnya, lalu periksa waktu aktivitas penambahan skala dipicu.
  • Periksa penyebab kegagalan penambahan skala: Cari event FailedToScaleUpGroup dalam daftar aktivitas penskalaan sebelumnya dan periksa alasan mengapa cluster-autoscaler gagal melakukan aktivitas penambahan skala di bidang reason.
  • Periksa waktu ketika node memicu aktivitas pengurangan skala: Cari nama node yang memicu aktivitas pengurangan skala atau event ScaleDown dalam daftar aktivitas penskalaan sebelumnya, lalu periksa waktu aktivitas pengurangan skala dipicu.
  • Periksa penyebab kegagalan pengurangan skala: Cari nama node yang memicu aktivitas pengurangan skala atau event ScaleDownFailed dalam daftar aktivitas penskalaan sebelumnya, lalu periksa penyebab kegagalan pengurangan skala.