Diagnosis dan perbaikan masalah pod - Container Service for Kubernetes

Container Intelligence Service menyediakan fitur diagnostik pod untuk membantu Anda mengatasi masalah pod. Topik ini menjelaskan item diagnostik dan solusi yang sesuai.

Container Intelligence Service menggabungkan pengetahuan ahli dengan model AI untuk mendiagnosis masalah dan mengidentifikasi akar penyebabnya. Diagnostik pod mencakup pemeriksaan diagnostik dan analisis akar penyebab.

Pemeriksaan diagnostik: Memeriksa Pod, node, komponen node, komponen kluster, dan ECS controller manager.
Akar penyebab: Memberikan akar penyebab yang teridentifikasi beserta rekomendasi perbaikannya. Diagnostik pod mengumpulkan informasi dari kluster dan node untuk mengidentifikasi anomali, lalu melakukan diagnosis mendalam berdasarkan temuan tersebut.

Penting

Fitur diagnostik menjalankan program pengumpulan data di node kluster Anda untuk mengumpulkan hasil pemeriksaan. Informasi yang dikumpulkan mencakup versi sistem, status workload, Docker, kubelet, serta informasi error penting dari log sistem. Program pengumpulan data tidak mengumpulkan informasi bisnis atau data sensitif apa pun milik Anda.

Skenario abnormal yang didukung

Tabel berikut mencantumkan skenario abnormal khas yang dicakup oleh diagnostik Pod dan diagnostik berbantuan AI.

Kategori	Skenario abnormal
Diagnostik Pod	Penjadwal tidak memproses Pod.
	Pod tidak dapat dijadwalkan karena melanggar batasan penjadwalan.
	Kubelet tidak memproses Pod yang telah dijadwalkan.
	Pod sedang menunggu volume menjadi siap.
	Pod dievict.
	Pod dievict karena ruang disk pada node tidak mencukupi.
	Pod dievict karena memori pada node tidak mencukupi.
	Pod dievict karena inode pada node tidak mencukupi.
	Kontainer sandbox untuk Pod gagal dibuat.
	Pod terjebak dalam status Terminating.
	Kontainer dalam Pod mengalami error OOM.
	Kontainer dalam Pod keluar secara tak terduga.
	Kontainer dalam Pod berada dalam status CrashLoopBackOff.
	Kontainer dalam Pod berstatus NotReady.
	Pod gagal menarik gambar.
	Pod mengalami timeout saat menarik gambar.
Diagnostik berbantuan AI	Status Pod abnormal.
	Pod mengalami event OOM.
	Kontainer dalam Pod keluar secara tak terduga.
	Pod memiliki kesalahan konfigurasi ConfigMap atau Secret.
	Pod gagal dalam pemeriksaan kesehatan.
	Pod memiliki kesalahan konfigurasi PersistentVolumeClaim (PVC).
	Pod gagal menarik gambar.

Proses diagnostik

Fitur diagnostik kluster mengumpulkan informasi dari kluster dan node untuk mengidentifikasi anomali, lalu melakukan diagnosis mendalam. Fitur ini mengintegrasikan expert mode dan AI mode guna mengidentifikasi root cause masalah. Setiap diagnosis melalui empat tahap—anomaly identification, data collection, diagnostic item check, dan root cause analysis—untuk menghasilkan temuan.

Anomaly identification: Mengumpulkan data dasar, seperti node status, pod status, dan cluster event streams, untuk menganalisis anomali secara cepat.
Data Collection: Mengumpulkan data kontekstual berdasarkan hasil anomaly identification. Misalnya, untuk diagnosis node, ini mencakup informasi node dari Kubernetes, informasi ECS yang sesuai, serta status proses seperti Docker dan kubelet.
Diagnostic item check: Mengevaluasi metrik kunci berdasarkan data yang dikumpulkan. Misalnya, diagnostic items untuk diagnosis node mencakup status proses Docker dan status ECS. Diagnostic items spesifik bervariasi tergantung jenis diagnosis, dan hasilnya mencantumkan setiap item yang diperiksa beserta deskripsinya.
Root Cause Analysis: Untuk beberapa masalah, sistem secara otomatis menganalisis akar penyebab berdasarkan data yang dikumpulkan dan hasil pemeriksaan item diagnostik.

Hasil diagnostik

Hasil terbagi menjadi dua jenis:

Root cause analysis results: mencakup anomali yang terdeteksi, akar penyebab yang teridentifikasi, dan saran perbaikan.
Diagnostic item check results: mencakup hasil pemeriksaan per item. Hasil ini dapat mengungkap penyebab yang mungkin terlewat oleh analisis akar penyebab.

Item diagnostik bervariasi tergantung konfigurasi kluster dan mencerminkan konfigurasi aktual kluster Anda.

Kategori diagnostik

Kategori	Deskripsi
Pod	Mendiagnosis masalah umum Pod, termasuk status Pod, penarikan gambar, dan konektivitas jaringan.
Node	Mendiagnosis masalah umum node, termasuk status node, status jaringan, log kernel, status proses inti, dan ketersediaan layanan.
NodeComponent	Mendiagnosis status komponen inti node, termasuk plugin jaringan dan penyimpanan.
ClusterComponent	Mendiagnosis masalah umum kluster, termasuk ketersediaan layanan API, ketersediaan DNS, dan status gateway NAT.
ECSControllerManager	Mendiagnosis masalah umum instance ECS, termasuk status, konektivitas jaringan, sistem operasi, dan I/O disk.

Pod

Parameter	Deskripsi	Solusi
Jumlah restart kontainer	Memeriksa berapa kali kontainer dalam Pod telah direstart.	Periksa status dan log Pod. Untuk informasi lebih lanjut, lihat Troubleshooting Pod.
Pengunduhan gambar kontainer yang diblokir	Memeriksa apakah pengunduhan gambar kontainer diblokir untuk Pod lain pada node yang sama.
Validitas Secret penarikan gambar	Memeriksa apakah Secret yang digunakan Pod untuk menarik gambar masih valid.
Konektivitas dari Pod ke Pod CoreDNS	Memeriksa konektivitas dari Pod ke Pod CoreDNS.	Periksa konektivitas jaringan dari Pod ke CoreDNS.
Konektivitas dari Pod ke Layanan CoreDNS	Memeriksa konektivitas dari Pod ke Layanan CoreDNS.	Periksa konektivitas jaringan dari Pod ke CoreDNS.
Konektivitas dari Pod ke server DNS jaringan host	Memeriksa konektivitas dari Pod ke server DNS pada jaringan host.	Periksa konektivitas dari Pod ke server DNS pada jaringan host.
Proses kontainer dalam status D	Memeriksa apakah proses kontainer dalam Pod berada dalam status D (uninterruptible sleep).	Proses kontainer dalam status D biasanya terjebak pada I/O disk. Coba mulai ulang Instance ECS. Jika masalah berlanjut, kirimkan tiket.
Status inisialisasi Pod	Memeriksa apakah Pod diinisialisasi dengan benar.	Periksa status dan log Pod. Untuk informasi lebih lanjut, lihat Troubleshooting Pod.
Status penjadwalan Pod	Memeriksa apakah Pod dijadwalkan dengan benar.	Periksa status dan log Pod. Untuk informasi lebih lanjut, lihat Troubleshooting Pod.

Node

Jika masalah tetap berlanjut setelah menerapkan solusi yang disarankan, kumpulkan log node dan submit a ticket.

Item diagnostik	Yang dideteksi	Perbaikan
Error konektivitas ke server API Kubernetes	Apakah node dapat menjangkau server API kluster. Kehilangan konektivitas mencegah node menerima penugasan workload.	Periksa konfigurasi kluster. Lihat Troubleshoot ACK clusters.
AUFS mount hang	Apakah terjadi AUFS mount hang pada node.	Submit a ticket.
Error BufferIOError	Apakah error BufferIOError muncul di kernel node.	Submit a ticket.
Kebocoran cgroup	Apakah terjadi kebocoran cgroup. Kebocoran cgroup dapat mengganggu pengumpulan data pemantauan dan menyebabkan kegagalan startup kontainer.	Login ke node dan hapus direktori cgroup yang terpengaruh.
Status proses chronyd abnormal	Apakah proses chronyd berjalan normal. Proses chronyd yang abnormal mengganggu sinkronisasi jam, sehingga memengaruhi operasi yang sensitif terhadap waktu.	Jalankan `systemctl restart chronyd` untuk me-restart proses.
Penarikan gambar oleh containerd	Apakah runtime containerd dapat menarik gambar sebagaimana mestinya.	Periksa konfigurasi jaringan node dan pengaturan gambar.
Status containerd	Apakah runtime containerd sedang berjalan.	Submit a ticket.
Ketersediaan pod CoreDNS	Apakah node dapat menjangkau alamat IP pod CoreDNS. Pod CoreDNS yang tidak dapat dijangkau menyebabkan kegagalan resolusi DNS untuk workload pada node ini.	Periksa apakah node dapat mengakses alamat IP pod CoreDNS. Lihat Apa yang harus saya lakukan jika beban kueri DNS tidak seimbang di antara pod CoreDNS?.
Status gambar	Apakah gambar utuh. Gambar yang rusak mencegah kontainer dimulai.	Submit a ticket.
Status overlay2 gambar	Apakah sistem file overlay2 dalam gambar rusak.	Submit a ticket.
Waktu sistem	Apakah jam sistem akurat.	Tidak ada.
Startup kontainer Docker	Apakah kontainer Docker gagal dimulai.	Submit a ticket.
Penarikan gambar Docker	Apakah node dapat menarik gambar Docker sebagaimana mestinya.	Periksa konfigurasi jaringan node dan pengaturan gambar.
Status Docker	Apakah runtime Docker sedang berjalan.	Submit a ticket.
Waktu startup Docker	Waktu startup Dockerd.	Tidak ada.
Error hang Docker	Apakah terjadi error hang Docker pada node. Hang Docker dapat menyebabkan kontainer berhenti merespons.	Jalankan `systemctl restart docker` untuk me-restart Docker.
Keberadaan instance ECS	Apakah instance ECS dasar ada.	Periksa status instance ECS. Lihat FAQ tentang node dan node pool.
Status instance ECS	Apakah instance ECS dalam kondisi sehat.	Periksa status instance ECS. Lihat FAQ tentang node dan node pool.
Error Ext4FsError	Apakah error Ext4FsError muncul di kernel node.	Submit a ticket.
Sistem file node read-only	Apakah sistem file node menjadi read-only. Hal ini biasanya menunjukkan kegagalan disk dan memblokir semua operasi tulis, sehingga memengaruhi workload.	Jalankan `fsck` untuk memperbaiki sistem file, lalu restart node.
Waktu hardware	Apakah jam hardware dan jam sistem tersinkronisasi. Perbedaan lebih dari 2 menit dapat menyebabkan error komponen.	Jalankan `hwclock --systohc` untuk menyinkronkan waktu sistem ke jam hardware.
DNS	Apakah nama domain dapat di-resolve pada node.	Lihat Troubleshooting DNS.
Error kernel oops	Apakah error oops muncul di kernel node. Error ini menunjukkan jalur kode yang tidak terduga dan dapat menyebabkan ketidakstabilan.	Submit a ticket.
Versi kernel	Apakah versi kernel sudah usang. Kernel yang usang mungkin memiliki masalah stabilitas yang sudah diketahui.	Perbarui kernel node. Lihat FAQ tentang node dan node pool.
Ketersediaan DNS	Apakah node dapat menjangkau IP cluster kube-dns untuk menggunakan layanan DNS kluster.	Periksa status dan log pod CoreDNS. Lihat Troubleshooting DNS.
Status Kubelet	Apakah kubelet berjalan normal. Kubelet yang gagal mencegah node mengelola pod.	Periksa log kubelet. Lihat Troubleshoot ACK clusters.
Waktu startup Kubelet	Waktu startup kubelet.	Tidak ada.
Utilisasi CPU	Apakah utilisasi CPU node terlalu tinggi.	Tidak ada.
Utilisasi memori	Apakah utilisasi memori node terlalu tinggi.	Tidak ada.
Fragmentasi memori	Apakah terjadi fragmentasi memori pada node. Fragmentasi mengurangi memori kontigu dan dapat menurunkan performa workload.	Login ke node dan jalankan `echo 3 \> /proc/sys/vm/drop_caches` untuk membersihkan cache.
Memori swap	Apakah memori swap diaktifkan. Kubernetes mengharuskan swap dinonaktifkan; mengaktifkannya dapat menyebabkan kubelet berperilaku tidak terduga.	Login ke node dan nonaktifkan memori swap.
Pemuatan driver perangkat jaringan	Apakah driver VirtIO pada perangkat jaringan dimuat dengan benar.	Submit a ticket.
Utilisasi CPU node yang terlalu tinggi	Apakah utilisasi CPU tinggi selama seminggu terakhir. Jika banyak pod dijadwalkan ke node dengan utilisasi CPU yang konsisten tinggi, konflik sumber daya dapat menyebabkan gangguan layanan.	Atur permintaan dan batas sumber daya secara tepat untuk menghindari overload node.
Keberadaan IP privat node	Apakah node memiliki alamat IP privat yang ditetapkan. Tanpa IP privat, node tidak dapat berkomunikasi dalam kluster.	Hapus node dari kluster lalu tambahkan kembali. Jangan lepas instance ECS saat menghapusnya. Lihat Remove a node dan Add existing ECS instances.
Utilisasi memori node yang terlalu tinggi	Apakah utilisasi memori tinggi selama seminggu terakhir. Utilisasi memori tinggi yang dikombinasikan dengan penjadwalan pod berat dapat menyebabkan error out-of-memory (OOM) dan gangguan layanan.	Atur permintaan dan batas sumber daya secara tepat untuk menghindari overload node.
Status node	Apakah node berada dalam status Ready.	Restart node. Lihat FAQ tentang node dan node pool.
Kemampuan penjadwalan node	Apakah node ditandai sebagai unschedulable. Node yang unschedulable tidak menerima penugasan pod baru.	Periksa konfigurasi penjadwalan node. Lihat Node draining and scheduling status.
Error OOM	Apakah terjadi error out-of-memory (OOM) pada node. Error OOM dapat menyebabkan pod dan proses sistem dihentikan.	Submit a ticket.
Pemeriksaan runtime	Apakah runtime kontainer node sesuai dengan runtime yang dikonfigurasi kluster. Ketidaksesuaian dapat menyebabkan pod gagal dimulai.	Lihat Dapatkah saya mengubah runtime kontainer kluster dari containerd ke Docker?.
Versi OS usang	Apakah versi OS node memiliki bug atau masalah stabilitas yang diketahui. Versi OS usang dapat menyebabkan runtime Docker dan containerd mengalami malfungsi.	Perbarui versi OS.
Akses Internet	Apakah node dapat menjangkau internet.	Periksa apakah SNAT diaktifkan untuk kluster. Lihat Enable an existing ACK cluster to access the internet.
Error RCUStallError	Apakah error RCUStallError muncul di kernel node. Error ini menunjukkan bahwa core CPU terjebak dalam bagian kritis read-copy-update (RCU), yang dapat menyebabkan node hang.	Submit a ticket.
Versi OS	Versi OS yang digunakan node. Versi OS usang dapat mencegah kluster beroperasi normal.	Tidak ada.
Kebocoran proses runc	Apakah terjadi kebocoran proses runc. Kebocoran proses runc dapat menyebabkan node secara berkala masuk ke status NotReady.	Identifikasi proses runc yang bocor dan hentikan secara manual.
Error SoftLockupError	Apakah error SoftLockupError muncul di kernel node. Error ini menunjukkan bahwa core CPU tidak merespons interupsi, yang dapat menyebabkan ketidakstabilan node.	Submit a ticket.
Hang systemd	Apakah terjadi hang systemd. Systemd yang hang dapat mencegah layanan dimulai atau dihentikan, sehingga memengaruhi stabilitas node.	Login ke node dan jalankan `systemctl daemon-reexec` untuk me-restart systemd.
Versi systemd usang	Apakah versi systemd memiliki bug yang diketahui. Versi usang dapat menyebabkan Docker dan containerd mengalami malfungsi.	Perbarui versi systemd. Lihat systemd.
Proses hang	Apakah terdapat proses hang pada node. Proses hang mengonsumsi sumber daya tanpa kemajuan dan menurunkan performa node.	Submit a ticket.
Error unregister_netdevice	Apakah error unregister_netdevice muncul di kernel node. Error ini dapat menyebabkan kebocoran sumber daya kernel dan ketidakstabilan jaringan.	Submit a ticket.

NodeComponent

Item diagnostik	Yang dideteksi	Perbaikan
Status komponen CNI	Apakah plugin Container Network Interface (CNI) berjalan sebagaimana mestinya. Plugin CNI yang gagal menyebabkan jaringan pod di node berhenti.	Periksa status komponen jaringan kluster. Lihat FAQ tentang manajemen jaringan.
Status komponen CSI	Apakah plugin Container Storage Interface (CSI) berjalan sebagaimana mestinya. Plugin CSI yang gagal mencegah pod memasang volume.	Periksa status komponen penyimpanan kluster. Lihat FAQ tentang CSI.

ClusterComponent

Item diagnostik	Yang dideteksi	Perbaikan
Versi aliyun-acr-credential-helper	Apakah versi komponen aliyun-acr-credential-helper sudah usang.	Perbarui aliyun-acr-credential-helper. Lihat Use the aliyun-acr-credential-helper component to pull images without using a secret.
Ketersediaan Layanan API	Apakah Layanan API kluster tersedia. Layanan API yang tidak tersedia memblokir operasi manajemen workload.	Jalankan `kubectl get apiservice` untuk memeriksa ketersediaan. Jika tidak tersedia, jalankan `kubectl describe apiservice` untuk mengidentifikasi penyebabnya.
Blok CIDR pod yang tersedia tidak mencukupi	Apakah jumlah blok CIDR pod yang tersedia dalam kluster Flannel kurang dari lima. Setiap node memerlukan satu blok CIDR pod; jika semua blok telah digunakan, node baru tidak dapat bergabung ke kluster.	Submit a ticket.
Endpoint CoreDNS	Jumlah endpoint CoreDNS aktif. Terlalu sedikit endpoint mengurangi ketersediaan DNS.	Periksa status dan log pod CoreDNS. Lihat Troubleshooting DNS.
Alamat IP cluster CoreDNS	Apakah alamat IP cluster ditetapkan ke pod CoreDNS. Tanpa IP cluster, permintaan DNS tidak dapat menjangkau CoreDNS, sehingga menyebabkan kegagalan DNS di seluruh layanan.	Periksa status dan log pod CoreDNS. Lihat Troubleshooting DNS.
Status gateway NAT	Apakah gateway NAT kluster berfungsi normal. Gateway NAT yang gagal memblokir trafik internet arah keluar dari node tanpa IP publik.	Login ke NAT Gateway console dan periksa apakah gateway terkunci karena pembayaran tertunda.
Laju drop koneksi bersamaan yang terlalu tinggi pada gateway NAT	Apakah gateway NAT menjatuhkan laju koneksi bersamaan yang sangat tinggi secara abnormal. Laju drop tinggi menunjukkan gateway telah mencapai kapasitas koneksi maksimumnya.	Tingkatkan gateway NAT. Lihat FAQ about upgrading standard Internet NAT gateways to enhanced Internet NAT gateways.

ECSControllerManager

Item diagnostik	Yang dideteksi	Perbaikan
Pembayaran tertunda terkait komponen instance ECS	Apakah disk atau bandwidth jaringan instance dibatasi karena pembayaran tertunda. Pembatasan sumber daya dapat menyebabkan kegagalan workload.	Isi ulang akun Anda untuk memulihkan akses.
Pembayaran tertunda terkait instance ECS	Apakah instance ECS bayar sesuai penggunaan telah ditangguhkan karena pembayaran tertunda.	Isi ulang akun Anda, lalu restart instance.
Status NIC instance ECS	Apakah kartu antarmuka jaringan (NIC) instance berfungsi normal. NIC yang abnormal menyebabkan kehilangan konektivitas jaringan.	Mulai ulang instance.
Status startup instance ECS	Apakah instance dapat di-boot secara normal.	Jika boot gagal, buat instance baru.
Status sistem manajemen backend instance ECS	Apakah sistem manajemen backend instance beroperasi normal.	Mulai ulang instance.
Status CPU instance ECS	Apakah terjadi konflik sumber daya CPU atau kegagalan binding CPU pada lapisan dasar instance. Konflik sumber daya CPU dapat mencegah instance memperoleh sumber daya CPU dan menurunkan performa.	Restart instance.
Split lock pada CPU instance ECS	Apakah terjadi split lock pada CPU instance ECS. Split lock dapat sangat menurunkan performa CPU.	Lihat Detecting and handling split locks.
Status mitigasi DDoS untuk instance ECS	Apakah alamat IP publik instance sedang mengalami serangan DDoS.	Beli layanan anti-DDoS. Lihat Comparison of Alibaba Cloud Anti-DDoS solutions.
Kemampuan baca/tulis disk cloud terbatas	Apakah throughput baca/tulis disk cloud sedang dikendalikan aliran. Pengendalian aliran terjadi ketika IOPS maksimum tercapai, sehingga menyebabkan operasi I/O melambat atau mengantri.	Lihat Block storage performance.
Pemuatan disk instance ECS	Apakah disk cloud dapat disambungkan saat instance dimulai.	Hentikan instance lalu mulai lagi.
Kedaluwarsa instance ECS	Apakah instance langganan telah kedaluwarsa. Instance yang kedaluwarsa akan dihentikan dan sumber dayanya menjadi tidak tersedia.	Perpanjang instance. Lihat Renew a subscription instance.
Crash OS instance ECS	Apakah terjadi crash OS dalam 48 jam terakhir.	Tinjau log sistem untuk mengidentifikasi penyebabnya. Lihat View system logs and screenshots.
Status host instance ECS	Apakah server fisik yang meng-host instance mengalami kegagalan. Kegagalan host dapat menurunkan performa instance.	Restart instance.
Pemuatan gambar instance ECS	Apakah instance dapat memuat gambarnya selama inisialisasi.	Restart instance.
Hang I/O pada disk instance ECS	Apakah terjadi hang I/O pada disk sistem. Hang I/O disk dapat menyebabkan sistem operasi tidak merespons.	Periksa metrik disk. Lihat View the monitoring data of a cloud disk. Untuk Alibaba Cloud Linux 2, lihat Detect I/O hangs of file systems and block layers.
Batas atas bandwidth instance ECS	Apakah total bandwidth instance telah mencapai maksimum untuk tipe instansnya. Saat batas tercapai, throughput jaringan dibatasi dan paket mungkin di-drop.	Tingkatkan ke tipe instans dengan bandwidth lebih tinggi. Lihat Overview of instance configuration changes.
Batas atas bandwidth burst instance ECS	Apakah bandwidth burst instance telah melebihi maksimum yang diizinkan untuk tipe instansnya.	Tingkatkan ke tipe instans dengan bandwidth lebih tinggi. Lihat Overview of instance configuration changes.
Pemuatan NIC instance ECS	Apakah NIC dapat dimuat pada instance. Jika NIC gagal dimuat, instance kehilangan konektivitas jaringan.	Mulai ulang instance.
Pembentukan sesi NIC pada instance ECS	Apakah sesi dapat dibentuk ke NIC. Jika NIC tidak dapat membentuk sesi atau telah mencapai batas sesinya, konektivitas atau throughput jaringan terpengaruh.	Mulai ulang instance.
Operasi kunci pada instance ECS	Apakah operasi terbaru pada instance—seperti memulai, menghentikan, atau meningkatkan—telah selesai dengan sukses.	Ulangi operasi yang gagal.
Kehilangan paket pada NIC instance ECS	Apakah terjadi kehilangan paket inbound atau outbound pada NIC. Kehilangan paket menyebabkan error jaringan dan dapat mengganggu layanan.	Mulai ulang instance.
Degradasi performa instance ECS	Apakah performa instance mengalami degradasi sementara karena masalah perangkat lunak atau keras.	Lihat peristiwa historis atau log sistem instance untuk mengidentifikasi penyebabnya. Lihat View historical system events.
Performa instance ECS terganggu	Apakah performa instance berkurang. Kredit CPU yang tidak mencukupi menyebabkan instans burstable kembali ke kinerja dasar.	Instance ECS hanya dapat memberikan kinerja dasar karena kredit CPU yang tersedia tidak mencukupi.
Pengubahan ukuran disk instance ECS	Apakah disk telah diubah ukurannya tetapi OS belum memperluas sistem file. Ruang disk tambahan tidak tersedia hingga sistem file diubah ukurannya.	OS tidak secara otomatis mengubah ukuran sistem file setelah pengubahan ukuran disk. Jika disk tetap tidak dapat digunakan, ubah ukurannya lagi.
Permohonan sumber daya instance ECS	Apakah sumber daya CPU dan memori fisik yang cukup tersedia untuk instance. Jika sumber daya tidak mencukupi, instance tidak dapat dimulai.	Tunggu beberapa menit lalu coba mulai instance lagi. Jika masalah berlanjut, buat instance di wilayah berbeda.
Status OS instance ECS	Apakah terjadi panic kernel, error OOM, atau kegagalan internal pada OS instance. Hal ini sering disebabkan oleh pengaturan yang salah konfigurasi atau program pengguna.	Mulai ulang instans tersebut.
Status virtualisasi instance ECS	Apakah terdapat pengecualian pada lapisan virtualisasi dasar. Pengecualian ini dapat menyebabkan instance berhenti merespons atau ditangguhkan secara tak terduga.	Restart instance.