Container Intelligence Service (CIS) dari Container Compute Service (ACS) menyediakan fitur diagnostik pod untuk membantu Anda mendiagnosis pod. Topik ini menjelaskan item diagnostik pod dan solusi untuk memperbaiki masalah pod.
CIS mengembangkan sistem diagnostik berdasarkan pengalaman ahli dan melatih model diagnostik berbasis AI menggunakan sejumlah besar data. Fitur diagnostik pod menyediakan dua mode: mode ahli dan mode AI, untuk membantu menemukan penyebab utama masalah. Diagnostik pod mencakup item diagnostik dan analisis penyebab utama.
Diagnostic items: mencakup diagnostik pod dan komponen kluster.
Root cause: menemukan penyebab utama masalah dan memberikan saran untuk memperbaikinya. Fitur diagnostik pod mengumpulkan informasi kluster, mengidentifikasi anomali, lalu melakukan diagnostik mendalam.
Saat menggunakan fitur diagnostik pod, sistem menjalankan program pengumpulan data di kluster untuk menghasilkan hasil diagnostik. Informasi yang dikumpulkan mencakup versi sistem, status beban kerja, Docker, kubelet, serta informasi kesalahan utama dalam log sistem. Program pengumpulan data tidak mengumpulkan informasi bisnis atau data sensitif.
Skenario
Tabel berikut menjelaskan skenario diagnostik pod dan diagnostik berbantuan AI.
Kategori | Skenario |
Diagnostik Pod | Pod tidak diproses oleh penjadwal. |
Pod tidak dapat dijadwalkan karena tidak memenuhi persyaratan batasan penjadwalan. | |
Pod telah dijadwalkan tetapi tidak diproses oleh kubelet. | |
Pod sedang menunggu volume mencapai status Siap. | |
Pod dievakuasi. | |
Kontainer bersandbox dalam pod gagal dibuat. | |
Pod tetap berada dalam status Terminating. | |
Kesalahan out-of-memory (OOM) terjadi pada kontainer dalam pod. | |
Kontainer dalam pod keluar secara tidak normal. | |
Kontainer dalam pod tetap berada dalam status CrashLoopBackOff. | |
Kontainer dalam pod tidak siap. | |
Pod gagal menarik gambar kontainer. | |
Kesalahan timeout terjadi saat pod menarik gambar kontainer. | |
Diagnostik berbantuan AI | Status pod tidak normal. |
Kesalahan OOM terjadi pada pod. | |
Kontainer dalam pod keluar secara tidak normal. | |
Konfigurasi ConfigMaps atau Secrets pod tidak valid. | |
Pod gagal melewati pemeriksaan kesehatan. | |
Konfigurasi persistent volume claims (PVCs) pod tidak valid. | |
Kesalahan terjadi saat pod menarik gambar kontainer. |
Prosedur
Fitur diagnostik kluster mengumpulkan informasi tentang kluster, mengidentifikasi anomali, lalu melakukan diagnostik mendalam. Mode ahli dan mode AI digunakan untuk membantu menemukan penyebab utama masalah. Hasil diagnostik dihasilkan melalui langkah-langkah berikut: identifikasi anomali, pengumpulan data, pemeriksaan item diagnostik, dan analisis penyebab utama.

Anomaly identification: mengumpulkan data dasar seperti status pod dan aliran peristiwa kluster, lalu menganalisis anomali berdasarkan data tersebut.
Data collection: mengumpulkan dan mendiagnosis data terkait konteks berdasarkan hasil identifikasi anomali.
Diagnostic item check: memeriksa apakah metrik kunci normal berdasarkan data yang dikumpulkan.
Root cause analysis: menganalisis penyebab utama masalah berdasarkan data yang dikumpulkan dan hasil pemeriksaan item diagnostik.
Hasil diagnostik
Hasil diagnostik mencakup hasil analisis penyebab utama dan hasil pemeriksaan item diagnostik. Hasil analisis penyebab utama mencakup detected anomalies, root cause, dan suggestions for fixes. Hasil pemeriksaan item diagnostik mencakup hasil pemeriksaan setiap item diagnostik. Pemeriksaan item diagnostik digunakan untuk menemukan penyebab yang mungkin tidak teridentifikasi oleh analisis penyebab utama.
Item diagnostik dapat bervariasi berdasarkan konfigurasi kluster. Item diagnostik aktual ditampilkan pada halaman diagnostik yang berlaku.
Item diagnostik Pod
Kategori | Deskripsi |
Mendiagnosis masalah umum pod, termasuk status pod dan penarikan gambar. | |
Mendiagnosis masalah umum kluster, termasuk ketersediaan server API dan layanan DNS. |
Pod
Item diagnostik | Deskripsi | Solusi |
Jumlah restart kontainer | Menunjukkan jumlah kali kontainer dalam pod di-restart. | Periksa status dan log pod. Untuk informasi lebih lanjut, lihat Pemecahan masalah Pod. |
Kegagalan unduhan gambar kontainer | Periksa apakah pod lain di node pod saat ini gagal mengunduh gambar kontainer. | Periksa status dan log pod. Untuk informasi lebih lanjut, lihat Pemecahan masalah Pod. |
Penjadwalan Pod | Periksa apakah pod dijadwalkan. | Periksa status dan log pod. Untuk informasi lebih lanjut, lihat Pemecahan masalah Pod. |
ClusterComponent
Item diagnostik | Deskripsi | Solusi |
Ketersediaan Layanan API | Memeriksa apakah Layanan API kluster tersedia. | Jalankan perintah |
Titik akhir layanan DNS | Memeriksa jumlah titik akhir CoreDNS. | Periksa status dan log pod CoreDNS. |
Alamat IP kluster pod CoreDNS | Memeriksa apakah alamat IP kluster dialokasikan ke pod CoreDNS. Jika alamat IP kluster tidak dialokasikan ke pod CoreDNS, pemutusan layanan mungkin terjadi. | Periksa status dan log pod CoreDNS. |