全部产品
Search
文档中心

Container Compute Service:Diagnostik Pod

更新时间:Jul 02, 2025

Container Intelligence Service (CIS) dari Container Compute Service (ACS) menyediakan fitur diagnostik pod untuk membantu Anda mendiagnosis pod. Topik ini menjelaskan item diagnostik pod dan solusi untuk memperbaiki masalah pod.

CIS mengembangkan sistem diagnostik berdasarkan pengalaman ahli dan melatih model diagnostik berbasis AI menggunakan sejumlah besar data. Fitur diagnostik pod menyediakan dua mode: mode ahli dan mode AI, untuk membantu menemukan penyebab utama masalah. Diagnostik pod mencakup item diagnostik dan analisis penyebab utama.

  • Diagnostic items: mencakup diagnostik pod dan komponen kluster.

  • Root cause: menemukan penyebab utama masalah dan memberikan saran untuk memperbaikinya. Fitur diagnostik pod mengumpulkan informasi kluster, mengidentifikasi anomali, lalu melakukan diagnostik mendalam.

Penting

Saat menggunakan fitur diagnostik pod, sistem menjalankan program pengumpulan data di kluster untuk menghasilkan hasil diagnostik. Informasi yang dikumpulkan mencakup versi sistem, status beban kerja, Docker, kubelet, serta informasi kesalahan utama dalam log sistem. Program pengumpulan data tidak mengumpulkan informasi bisnis atau data sensitif.

Skenario

Tabel berikut menjelaskan skenario diagnostik pod dan diagnostik berbantuan AI.

Kategori

Skenario

Diagnostik Pod

Pod tidak diproses oleh penjadwal.

Pod tidak dapat dijadwalkan karena tidak memenuhi persyaratan batasan penjadwalan.

Pod telah dijadwalkan tetapi tidak diproses oleh kubelet.

Pod sedang menunggu volume mencapai status Siap.

Pod dievakuasi.

Kontainer bersandbox dalam pod gagal dibuat.

Pod tetap berada dalam status Terminating.

Kesalahan out-of-memory (OOM) terjadi pada kontainer dalam pod.

Kontainer dalam pod keluar secara tidak normal.

Kontainer dalam pod tetap berada dalam status CrashLoopBackOff.

Kontainer dalam pod tidak siap.

Pod gagal menarik gambar kontainer.

Kesalahan timeout terjadi saat pod menarik gambar kontainer.

Diagnostik berbantuan AI

Status pod tidak normal.

Kesalahan OOM terjadi pada pod.

Kontainer dalam pod keluar secara tidak normal.

Konfigurasi ConfigMaps atau Secrets pod tidak valid.

Pod gagal melewati pemeriksaan kesehatan.

Konfigurasi persistent volume claims (PVCs) pod tidak valid.

Kesalahan terjadi saat pod menarik gambar kontainer.

Prosedur

Fitur diagnostik kluster mengumpulkan informasi tentang kluster, mengidentifikasi anomali, lalu melakukan diagnostik mendalam. Mode ahli dan mode AI digunakan untuk membantu menemukan penyebab utama masalah. Hasil diagnostik dihasilkan melalui langkah-langkah berikut: identifikasi anomali, pengumpulan data, pemeriksaan item diagnostik, dan analisis penyebab utama.

image.png

  • Anomaly identification: mengumpulkan data dasar seperti status pod dan aliran peristiwa kluster, lalu menganalisis anomali berdasarkan data tersebut.

  • Data collection: mengumpulkan dan mendiagnosis data terkait konteks berdasarkan hasil identifikasi anomali.

  • Diagnostic item check: memeriksa apakah metrik kunci normal berdasarkan data yang dikumpulkan.

  • Root cause analysis: menganalisis penyebab utama masalah berdasarkan data yang dikumpulkan dan hasil pemeriksaan item diagnostik.

Hasil diagnostik

Hasil diagnostik mencakup hasil analisis penyebab utama dan hasil pemeriksaan item diagnostik. Hasil analisis penyebab utama mencakup detected anomalies, root cause, dan suggestions for fixes. Hasil pemeriksaan item diagnostik mencakup hasil pemeriksaan setiap item diagnostik. Pemeriksaan item diagnostik digunakan untuk menemukan penyebab yang mungkin tidak teridentifikasi oleh analisis penyebab utama.

Catatan

Item diagnostik dapat bervariasi berdasarkan konfigurasi kluster. Item diagnostik aktual ditampilkan pada halaman diagnostik yang berlaku.

Item diagnostik Pod

Kategori

Deskripsi

Pod

Mendiagnosis masalah umum pod, termasuk status pod dan penarikan gambar.

ClusterComponent

Mendiagnosis masalah umum kluster, termasuk ketersediaan server API dan layanan DNS.

Pod

Item diagnostik

Deskripsi

Solusi

Jumlah restart kontainer

Menunjukkan jumlah kali kontainer dalam pod di-restart.

Periksa status dan log pod. Untuk informasi lebih lanjut, lihat Pemecahan masalah Pod.

Kegagalan unduhan gambar kontainer

Periksa apakah pod lain di node pod saat ini gagal mengunduh gambar kontainer.

Periksa status dan log pod. Untuk informasi lebih lanjut, lihat Pemecahan masalah Pod.

Penjadwalan Pod

Periksa apakah pod dijadwalkan.

Periksa status dan log pod. Untuk informasi lebih lanjut, lihat Pemecahan masalah Pod.

ClusterComponent

Item diagnostik

Deskripsi

Solusi

Ketersediaan Layanan API

Memeriksa apakah Layanan API kluster tersedia.

Jalankan perintah kubectl get apiservice untuk memeriksa ketersediaan Layanan API kluster. Jika Layanan API tidak tersedia, jalankan perintah kubectl describe apiservice untuk melihat informasi tentang Layanan API dan mengidentifikasi penyebabnya.

Titik akhir layanan DNS

Memeriksa jumlah titik akhir CoreDNS.

Periksa status dan log pod CoreDNS.

Alamat IP kluster pod CoreDNS

Memeriksa apakah alamat IP kluster dialokasikan ke pod CoreDNS. Jika alamat IP kluster tidak dialokasikan ke pod CoreDNS, pemutusan layanan mungkin terjadi.

Periksa status dan log pod CoreDNS.