Mendiagnosis dan menyelesaikan masalah Pod - Container Service for Kubernetes

Container Service for Kubernetes (ACK) menyediakan fitur diagnostik pod untuk membantu Anda mendiagnosis pod yang tidak normal. Topik ini menjelaskan pemeriksaan diagnostik dan perbaikan yang direkomendasikan.

Platform layanan kontainer menyediakan sistem diagnosis gangguan yang menggabungkan pengetahuan ahli dengan model AI yang dilatih menggunakan data skala besar. Fitur diagnosis pod mengintegrasikan kedua pendekatan ini untuk melakukan analisis mendalam dan mengidentifikasi akar penyebabnya. Diagnosis pod terdiri dari item pemeriksaan diagnostik dan akar penyebab diagnostik.

Item pemeriksaan diagnostik: Termasuk pemeriksaan pod, pemeriksaan node, pemeriksaan NodeComponent, pemeriksaan ClusterComponent, dan pemeriksaan ECSControllerManager.
Akar penyebab diagnostik: Akar penyebab yang teridentifikasi beserta solusi yang direkomendasikan. Fitur diagnosis pod mengumpulkan informasi dari kluster dan nodenya, mengidentifikasi anomali, lalu melakukan diagnosis mendalam terhadapnya.

Penting

Fitur diagnosis gangguan menjalankan program pengumpulan data pada node kluster Anda untuk mengumpulkan hasil pemeriksaan. Informasi yang dikumpulkan mencakup versi sistem, status komponen seperti Docker dan Kubelet, beban node, serta pesan kesalahan penting dari log sistem. Program ini tidak mengumpulkan informasi bisnis atau data sensitif Anda.

Skenario pengecualian yang didukung

Tabel berikut mencantumkan skenario pengecualian yang dicakup oleh diagnostik Pod dan diagnostik berbantuan AI.

Kategori	Deskripsi
Diagnostik Pod	Pod tidak diproses oleh scheduler.
	Pod tidak dapat dijadwalkan karena tidak memenuhi batasan penjadwalan.
	Pod telah dijadwalkan tetapi tidak diproses oleh kubelet.
	Pod sedang menunggu volume siap.
	Sebuah Pod telah dikeluarkan.
	Pod dievict karena ruang disk pada node tidak mencukupi.
	Pod dievict karena memori pada node tidak mencukupi.
	Pod dievict karena inode pada node tidak mencukupi.
	Pembuatan kontainer sandbox pod gagal.
	Pod terjebak dalam status Terminating.
	Kontainer dalam pod mengalami error OOM.
	Kontainer dalam pod keluar secara tidak terduga.
	Kontainer dalam pod berada dalam status CrashLoopBackOff.
	Kontainer dalam pod belum siap.
	Pod gagal menarik gambar kontainer.
	Pod mengalami timeout saat menarik gambar kontainer.
Diagnostik berbantuan AI	Pod berada dalam status tidak normal.
	Pod mengalami error OOM.
	Kontainer dalam pod keluar secara tidak terduga.
	Konfigurasi ConfigMap atau Secret untuk pod tidak valid.
	Pod gagal dalam pemeriksaan kesehatan.
	Konfigurasi persistent volume claim untuk pod tidak valid.
	Pod gagal menarik gambar kontainer.

Proses diagnosis

Diagnosis kluster mengumpulkan informasi dari kluster dan nodenya untuk mengidentifikasi anomali, lalu melakukan diagnosis mendalam. Diagnosis ini menggabungkan pengalaman ahli dengan kecerdasan berbasis AI untuk mengidentifikasi akar penyebabnya. Proses diagnosis terdiri dari empat tahap: deteksi anomali, pengumpulan data, penilaian item pemeriksaan, dan analisis akar penyebab. Proses ini menghasilkan laporan diagnostik setelah selesai.

节点诊断

Deteksi anomali: Mengumpulkan data dasar, seperti status Node, status Pod, dan aliran Event kluster, untuk mengidentifikasi anomali secara cepat.
Pengumpulan data: Mengumpulkan data kontekstual berdasarkan anomali yang terdeteksi. Misalnya, diagnosis node mengumpulkan informasi tentang node di K8s, detail instans ECS terkait, dan status proses seperti Docker dan Kubelet.
Penilaian item pemeriksaan: Mengevaluasi metrik utama dari data yang dikumpulkan untuk menentukan apakah nilainya normal. Misalnya, item pemeriksaan untuk diagnosis node mencakup status proses Docker dan status ECS. Setiap jenis diagnosis memiliki serangkaian item pemeriksaan yang sesuai. Hasilnya mencakup daftar item tersebut dan penjelasan untuk masing-masing.
Analisis akar penyebab: Menganalisis data yang dikumpulkan dan hasil item pemeriksaan untuk secara otomatis mengidentifikasi akar penyebab bila memungkinkan.

Hasil diagnostik

Hasil dibagi menjadi dua jenis:

Root cause analysis results: mencakup anomali yang terdeteksi, akar penyebab yang diidentifikasi, dan saran perbaikan.
Diagnostic item check results: mencakup hasil pemeriksaan setiap item diagnostik. Hasil ini dapat mengungkap penyebab yang mungkin terlewat oleh analisis akar penyebab.

Item diagnostik bervariasi tergantung konfigurasi kluster. Item yang ditampilkan pada halaman diagnostik mencerminkan konfigurasi aktual kluster Anda.

Item diagnostik Pod

Kategori	Deskripsi
Pod	Mendiagnosis masalah umum Pod, termasuk status Pod, penarikan gambar, dan konektivitas jaringan.
Node	Mendiagnosis masalah umum Node, termasuk status Node, status jaringan, log kernel, proses inti, dan ketersediaan layanan.
NodeComponent	Mendiagnosis komponen inti Node, termasuk komponen jaringan dan volume.
ClusterComponent	Mendiagnosis masalah umum kluster, termasuk ketersediaan API Service, ketersediaan DNS, dan status Gateway NAT.
ECSControllerManager	Mendiagnosis masalah umum instans ECS, termasuk status instans ECS, konektivitas jaringan, sistem operasi, dan I/O disk.

Pod

Parameter	Deskripsi	Solusi
Jumlah restart kontainer Pod	Menghitung jumlah restart kontainer dalam pod.	Periksa status dan log pod. Untuk informasi lebih lanjut, lihat Troubleshoot pod issues.
Pemblokiran penarikan gambar kontainer	Memeriksa apakah pod lain pada node yang sama juga gagal menarik gambar kontainer.	Periksa status dan log pod. Untuk informasi lebih lanjut, lihat Troubleshoot pod issues.
Validitas Secrets penarikan gambar	Memeriksa apakah Secrets yang digunakan pod untuk menarik gambar kontainer valid.	Periksa status dan log pod. Untuk informasi lebih lanjut, lihat Troubleshoot pod issues.
Validitas variabel lingkungan pod GPU	Memeriksa apakah variabel lingkungan NVIDIA_VISIBLE_DEVICES diatur dalam pod, karena hal ini dapat bertentangan dengan kubelet.	Periksa status dan log pod. Untuk informasi lebih lanjut, lihat Troubleshoot pod issues.
Konektivitas ke pod CoreDNS	Memverifikasi apakah pod dapat terhubung ke pod CoreDNS.	Periksa konektivitas jaringan dari pod ke pod CoreDNS.
Konektivitas ke Layanan CoreDNS	Memverifikasi apakah pod dapat terhubung ke Layanan CoreDNS.	Periksa konektivitas jaringan dari pod ke Layanan CoreDNS.
Konektivitas ke server DNS jaringan host	Memverifikasi apakah pod dapat terhubung ke server DNS pada jaringan host.	Periksa konektivitas jaringan dari pod ke server DNS pada jaringan host.
Status D proses kontainer	Memeriksa apakah proses kontainer berada dalam status D (uninterruptible sleep). Status ini biasanya disebabkan oleh proses yang menunggu I/O disk.	Proses dalam status D biasanya sedang menunggu I/O disk. Coba restart instans ECS host.
Status inisialisasi Pod	Memeriksa apakah pod telah berhasil diinisialisasi.	Periksa status dan log pod. Untuk informasi lebih lanjut, lihat Troubleshoot pod issues.
Permintaan resource GPU	Memeriksa apakah pod meminta resource GPU. Hal ini membantu menentukan apakah ketiadaan permintaan resource menjadi alasan pod tidak dapat menggunakan GPU.	Pod tidak meminta resource GPU. Jika GPU diperlukan, periksa konfigurasi pod.
Status penjadwalan Pod	Memeriksa apakah pod telah dijadwalkan ke suatu node.	Jika pod belum dijadwalkan, periksa konfigurasinya.

Node

Jika masalah masih berlanjut setelah Anda menerapkan perbaikan yang disarankan, kumpulkan log node dan submit a ticket.

Item diagnostik	Apa yang dideteksi	Perbaikan
Kesalahan konektivitas ke server API Kubernetes	Apakah node dapat menjangkau server API kluster. Hilangnya konektivitas mencegah node menerima penugasan workload.	Periksa konfigurasi kluster. Untuk informasi lebih lanjut, lihat Troubleshoot ACK clusters.
AUFS mount hangs	Apakah terjadi AUFS mount hangs pada node.	Submit a ticket.
Error BufferIOError	Apakah error BufferIOError ada dalam kernel node.	Submit a ticket.
Kebocoran cgroup	Apakah terjadi kebocoran cgroup. Jika ada, kebocoran cgroup dapat mengganggu pengumpulan data pemantauan dan menyebabkan kegagalan startup kontainer.	Masuk ke node dan hapus direktori cgroup yang terpengaruh.
Status proses chronyd tidak normal	Apakah proses chronyd berjalan normal. Proses chronyd yang tidak normal mengganggu sinkronisasi jam sistem, yang dapat memengaruhi operasi yang sensitif terhadap waktu.	Jalankan `systemctl restart chronyd` untuk me-restart proses.
Penarikan gambar oleh containerd	Apakah runtime containerd dapat menarik gambar seperti yang diharapkan.	Periksa konfigurasi jaringan node dan pengaturan gambar.
Status containerd	Apakah runtime containerd sedang berjalan.	Submit a ticket.
Ketersediaan pod CoreDNS	Apakah node dapat menjangkau alamat IP pod CoreDNS. Pod CoreDNS yang tidak dapat dijangkau menyebabkan kegagalan resolusi DNS untuk workload pada node ini.	Periksa apakah node dapat mengakses alamat IP pod CoreDNS. Untuk informasi lebih lanjut, lihat What do I do if the DNS query load is not balanced among CoreDNS pods?.
Status gambar	Apakah gambar utuh. Gambar yang rusak mencegah kontainer dimulai.	Submit a ticket.
Status overlay2 gambar	Apakah sistem file overlay2 dalam gambar rusak.	Submit a ticket.
Waktu sistem	Apakah jam sistem akurat.	Tidak ada.
Startup kontainer Docker	Apakah kontainer Docker gagal dimulai.	Submit a ticket.
Penarikan gambar Docker	Apakah node dapat menarik gambar Docker seperti yang diharapkan.	Periksa konfigurasi jaringan node dan pengaturan gambar.
Status Docker	Apakah runtime Docker sedang berjalan.	Submit a ticket.
Waktu startup Docker	Waktu startup Dockerd.	Tidak ada.
Error hang Docker	Apakah terjadi error hang Docker pada node. Hang Docker dapat menyebabkan kontainer berhenti merespons.	Jalankan `systemctl restart docker` untuk me-restart Docker.
Keberadaan instans ECS	Apakah instans ECS dasar ada.	Periksa status instans ECS. Untuk informasi lebih lanjut, lihat FAQ about nodes and node pools.
Status instans ECS	Apakah instans ECS berada dalam kondisi sehat.	Periksa status instans ECS. Untuk informasi lebih lanjut, lihat FAQ about nodes and node pools.
Error Ext4FsError	Apakah error Ext4FsError ada dalam kernel node.	Submit a ticket.
Sistem file node read-only	Apakah sistem file node menjadi read-only. Hal ini biasanya menunjukkan kegagalan disk. Sistem file read-only memblokir semua operasi tulis dan memengaruhi workload yang sedang berjalan.	Jalankan `fsck` untuk memperbaiki sistem file, lalu restart node.
Waktu hardware	Apakah jam hardware dan jam sistem sinkron. Perbedaan lebih dari 2 menit dapat menyebabkan error komponen.	Jalankan `hwclock --systohc` untuk menyinkronkan waktu sistem ke jam hardware.
DNS	Apakah nama domain dapat di-resolve pada node.	Untuk informasi lebih lanjut, lihat DNS troubleshooting.
Error kernel oops	Apakah error oops ada dalam kernel node. Error kernel oops menunjukkan jalur kode yang tidak terduga dan dapat menyebabkan ketidakstabilan.	Submit a ticket.
Versi kernel	Apakah versi kernel sudah usang. Kernel yang usang mungkin memiliki masalah stabilitas yang diketahui.	Perbarui kernel node. Untuk informasi lebih lanjut, lihat FAQ about nodes and node pools.
Ketersediaan DNS	Apakah node dapat menjangkau IP cluster kube-dns untuk menggunakan layanan DNS kluster.	Periksa status dan log pod CoreDNS. Untuk informasi lebih lanjut, lihat DNS troubleshooting.
Status Kubelet	Apakah kubelet berjalan normal. Kubelet yang gagal mencegah node mengelola pod.	Periksa log kubelet. Untuk informasi lebih lanjut, lihat Troubleshoot ACK clusters.
Waktu startup Kubelet	Waktu startup kubelet.	Tidak ada.
Utilisasi CPU	Apakah utilisasi CPU node terlalu tinggi.	Tidak ada.
Utilisasi memori	Apakah utilisasi memori node terlalu tinggi.	Tidak ada.
Fragmentasi memori	Apakah terjadi fragmentasi memori pada node. Fragmentasi mengurangi memori kontigu yang tersedia dan dapat memengaruhi kinerja workload.	Masuk ke node dan jalankan `echo 3 \> /proc/sys/vm/drop_caches` untuk mengosongkan cache.
Memori swap	Apakah memori swap diaktifkan. Kubernetes mengharuskan swap dinonaktifkan; mengaktifkannya dapat menyebabkan kubelet berperilaku tidak terduga.	Masuk ke node dan nonaktifkan memori swap.
Pemuatan driver perangkat jaringan	Apakah driver VirtIO pada perangkat jaringan dimuat dengan benar.	Submit a ticket.
Utilisasi CPU node terlalu tinggi	Apakah utilisasi CPU tinggi selama seminggu terakhir. Jika banyak pod dijadwalkan ke node dengan utilisasi CPU yang konsisten tinggi, konflik sumber daya dapat menyebabkan gangguan layanan.	Atur permintaan dan batas resource secara tepat untuk menghindari kelebihan beban pada node.
Keberadaan IP privat node	Apakah node memiliki alamat IP privat yang ditetapkan. Tanpa IP privat, node tidak dapat berkomunikasi dalam kluster.	Hapus node dari kluster lalu tambahkan kembali. Jangan lepaskan instans ECS saat menghapusnya. Untuk informasi lebih lanjut, lihat Remove a node dan Add existing ECS instances.
Utilisasi memori node terlalu tinggi	Apakah utilisasi memori tinggi selama seminggu terakhir. Utilisasi memori tinggi yang dikombinasikan dengan penjadwalan pod yang padat dapat menyebabkan error kehabisan memori (OOM) dan gangguan layanan.	Atur permintaan dan batas resource secara tepat untuk menghindari kelebihan beban pada node.
Status node	Apakah node berada dalam status Ready.	Restart node. Untuk informasi lebih lanjut, lihat FAQ about nodes and node pools.
Kemampuan penjadwalan node	Apakah node ditandai sebagai tidak dapat dijadwalkan. Node yang tidak dapat dijadwalkan tidak menerima penugasan pod baru.	Periksa konfigurasi penjadwalan node. Untuk informasi lebih lanjut, lihat Node draining and scheduling status.
Error OOM	Apakah terjadi error kehabisan memori (OOM) pada node. Error OOM dapat menyebabkan pod dan proses sistem dihentikan.	Submit a ticket.
Pemeriksaan runtime	Apakah runtime kontainer node sesuai dengan runtime yang dikonfigurasi kluster. Ketidaksesuaian dapat menyebabkan pod gagal dimulai.	Untuk informasi lebih lanjut, lihat Can I change the container runtime of a cluster from containerd to Docker?.
Versi OS usang	Apakah versi OS node memiliki bug atau masalah stabilitas yang diketahui. Versi OS yang usang dapat menyebabkan runtime Docker dan containerd mengalami malfungsi.	Perbarui versi OS.
Akses Internet	Apakah node dapat menjangkau internet.	Periksa apakah SNAT diaktifkan untuk kluster. Untuk informasi lebih lanjut, lihat Enable an existing ACK cluster to access the internet.
Error RCUStallError	Apakah error RCUStallError ada dalam kernel node. Error ini menunjukkan bahwa inti CPU terjebak dalam bagian kritis read-copy-update (RCU), yang dapat menyebabkan node hang.	Submit a ticket.
Versi OS	Versi OS yang digunakan node. Versi OS yang usang dapat mencegah kluster beroperasi secara normal.	Tidak ada.
Kebocoran proses runc	Apakah terjadi kebocoran proses runc. Kebocoran proses runc dapat menyebabkan node secara berkala masuk ke status NotReady.	Identifikasi proses runc yang bocor dan hentikan secara manual.
Error SoftLockupError	Apakah error SoftLockupError ada dalam kernel node. Error ini menunjukkan bahwa inti CPU tidak merespons interupsi, yang dapat menyebabkan ketidakstabilan node.	Submit a ticket.
Hang systemd	Apakah terjadi hang systemd. Systemd yang hang dapat mencegah layanan dimulai atau dihentikan, memengaruhi stabilitas node.	Masuk ke node dan jalankan `systemctl daemon-reexec` untuk me-restart systemd.
Versi systemd usang	Apakah versi systemd memiliki bug yang diketahui. Versi systemd yang usang memiliki masalah stabilitas yang dapat menyebabkan Docker dan containerd mengalami malfungsi.	Perbarui versi systemd. Untuk informasi lebih lanjut, lihat systemd.
Proses hang	Apakah ada proses hang pada node. Proses hang mengonsumsi sumber daya tanpa membuat kemajuan dan dapat menurunkan kinerja node.	Submit a ticket.
Error unregister_netdevice	Apakah error unregister_netdevice ada dalam kernel node. Error ini dapat menyebabkan kebocoran sumber daya kernel dan ketidakstabilan jaringan.	Submit a ticket.

NodeComponent

Item diagnostik	Apa yang dideteksi	Perbaikan
Status komponen CNI	Apakah plug-in Container Network Interface (CNI) berjalan seperti yang diharapkan. Plug-in CNI yang gagal menyebabkan jaringan pod berhenti bekerja pada node.	Periksa status komponen jaringan kluster. Untuk informasi lebih lanjut, lihat FAQ about network management.
Status komponen CSI	Apakah plug-in Container Storage Interface (CSI) berjalan seperti yang diharapkan. Plug-in CSI yang gagal mencegah pod memasang volume.	Periksa status komponen penyimpanan kluster. Untuk informasi lebih lanjut, lihat FAQ about CSI.

ClusterComponent

Item diagnostik	Apa yang dideteksi	Perbaikan
Versi aliyun-acr-credential-helper	Apakah versi komponen aliyun-acr-credential-helper sudah usang.	Perbarui aliyun-acr-credential-helper. Untuk informasi lebih lanjut, lihat Use the aliyun-acr-credential-helper component to pull images without using a secret.
Ketersediaan API Service	Apakah API Service kluster tersedia. API Service yang tidak tersedia memblokir operasi manajemen workload.	Jalankan `kubectl get apiservice` untuk memeriksa ketersediaan. Jika tidak tersedia, jalankan `kubectl describe apiservice` untuk mengidentifikasi penyebabnya.
Blok CIDR pod yang tersedia tidak mencukupi	Apakah jumlah blok CIDR pod yang tersedia dalam kluster Flannel kurang dari lima. Setiap node memerlukan satu blok CIDR pod; jika semua blok digunakan, node baru tidak dapat bergabung ke kluster.	Submit a ticket.
Endpoint CoreDNS	Jumlah endpoint CoreDNS aktif. Terlalu sedikit endpoint mengurangi ketersediaan DNS.	Periksa status dan log pod CoreDNS. Untuk informasi lebih lanjut, lihat DNS troubleshooting.
Alamat IP cluster CoreDNS	Apakah alamat IP cluster ditetapkan ke pod CoreDNS. Tanpa IP cluster, permintaan DNS tidak dapat menjangkau CoreDNS, menyebabkan kegagalan DNS di seluruh layanan.	Periksa status dan log pod CoreDNS. Untuk informasi lebih lanjut, lihat DNS troubleshooting.
Status gateway NAT	Apakah gateway NAT kluster berfungsi normal. Gateway NAT yang gagal memblokir trafik internet arah keluar dari node tanpa IP publik.	Masuk ke NAT Gateway console dan periksa apakah gateway dikunci karena pembayaran tertunda.
Laju drop koneksi bersamaan yang terlalu tinggi pada gateway NAT	Apakah gateway NAT menjatuhkan laju koneksi bersamaan yang tidak normal tinggi. Laju drop tinggi menunjukkan gateway telah mencapai kapasitas koneksi maksimumnya.	Tingkatkan gateway NAT. Untuk informasi lebih lanjut, lihat FAQ about upgrading standard Internet NAT gateways to enhanced Internet NAT gateways.

ECSControllerManager

Item diagnostik	Apa yang dideteksi	Perbaikan
Pembayaran tertunda terkait komponen instans ECS	Apakah disk atau bandwidth jaringan instans ECS dibatasi karena pembayaran tertunda. Pembatasan sumber daya dapat menyebabkan workload gagal.	Isi ulang akun Anda untuk memulihkan akses.
Pembayaran tertunda terkait instans ECS	Apakah instans ECS bayar sesuai penggunaan ditangguhkan karena pembayaran tertunda.	Isi ulang akun Anda, lalu restart instans.
Status NIC instans ECS	Apakah kartu antarmuka jaringan (NIC) instans ECS berfungsi normal. NIC yang tidak normal menyebabkan kehilangan konektivitas jaringan.	Restart instans.
Status startup instans ECS	Apakah instans dapat di-boot secara normal.	Jika boot gagal, buat instans baru.
Status sistem manajemen backend instans ECS	Apakah sistem manajemen backend instans ECS beroperasi normal.	Restart instans.
Status CPU instans ECS	Apakah terjadi konflik CPU atau kegagalan binding CPU pada lapisan dasar instans ECS. Konflik CPU dapat mencegah instans memperoleh sumber daya CPU dan menurunkan kinerja.	Restart instans.
Split lock pada CPU instans ECS	Apakah terjadi split lock pada CPU instans ECS. Split lock dapat sangat menurunkan kinerja CPU.	Untuk informasi lebih lanjut, lihat Detecting and handling split locks.
Status mitigasi DDoS untuk instans ECS	Apakah alamat IP publik instans sedang mengalami Serangan DDoS.	Beli layanan Anti-DDoS. Untuk informasi lebih lanjut, lihat Comparison of Alibaba Cloud Anti-DDoS solutions.
Kemampuan baca/tulis disk cloud terbatas	Apakah throughput baca/tulis disk cloud sedang dikendalikan alirannya. Pengendalian aliran terjadi ketika IOPS maksimum disk tercapai, menyebabkan operasi I/O melambat atau mengantri.	Untuk informasi lebih lanjut tentang pemantauan metrik disk, lihat Block storage performance.
Pemuatan disk instans ECS	Apakah disk cloud dapat disambungkan saat instans dimulai.	Hentikan instans lalu mulai lagi.
Kedaluwarsa instans ECS	Apakah instans berlangganan telah kedaluwarsa. Instans yang kedaluwarsa dihentikan dan sumber dayanya menjadi tidak tersedia.	Perpanjang instans. Untuk informasi lebih lanjut, lihat Renew a subscription instance.
Instance ECS mengalami crash sistem operasi	Apakah terjadi crash OS pada instans ECS dalam 48 jam terakhir.	Tinjau log sistem untuk mengidentifikasi penyebabnya. Untuk informasi lebih lanjut, lihat View system logs and screenshots.
Status host instans ECS	Apakah server fisik yang menampung instans ECS mengalami kegagalan. Kegagalan host dapat membuat instans berada dalam status tidak normal dan menurunkan kinerjanya.	Restart instans.
Pemuatan gambar instans ECS	Apakah instans dapat memuat gambarnya selama inisialisasi.	Restart instans.
Hang I/O pada disk instans ECS	Apakah terjadi hang I/O pada disk sistem. Hang I/O disk dapat menyebabkan sistem operasi tidak merespons.	Periksa metrik disk. Untuk informasi lebih lanjut, lihat View the monitoring data of a cloud disk. Untuk Alibaba Cloud Linux 2, lihat Detect I/O hangs of file systems and block layers.
Batas atas bandwidth instans ECS	Apakah bandwidth total instans telah mencapai maksimum untuk tipe instansnya. Saat batas tercapai, throughput jaringan dibatasi dan paket mungkin dijatuhkan.	Tingkatkan ke tipe instans dengan bandwidth lebih tinggi. Untuk informasi lebih lanjut, lihat Overview of instance configuration changes.
Batas atas bandwidth burst instans ECS	Apakah bandwidth burst instans telah melebihi maksimum yang diizinkan untuk tipe instansnya.	Tingkatkan ke tipe instans dengan bandwidth lebih tinggi. Untuk informasi lebih lanjut, lihat Overview of instance configuration changes.
Pemuatan NIC instans ECS	Apakah NIC dapat dimuat pada instans. Jika NIC gagal dimuat, instans kehilangan konektivitas jaringan.	Restart instans.
Pembentukan sesi NIC pada instans ECS	Apakah sesi dapat dibentuk ke NIC. Jika NIC tidak dapat membentuk sesi atau telah mencapai batas sesinya, konektivitas atau throughput jaringan terpengaruh.	Restart instans.
Operasi kunci pada instans ECS	Apakah operasi terbaru pada instans — seperti memulai, menghentikan, atau meningkatkan — selesai dengan sukses.	Ulangi operasi yang gagal.
Kehilangan paket pada NIC instans ECS	Apakah terjadi kehilangan paket inbound atau outbound pada NIC. Kehilangan paket menyebabkan error jaringan dan dapat mengganggu layanan yang sedang berjalan.	Restart instans.
Degradasi kinerja instans ECS	Apakah kinerja instans mengalami degradasi sementara karena masalah perangkat lunak atau keras.	Lihat peristiwa historis atau log sistem instans untuk mengidentifikasi penyebabnya. Untuk informasi lebih lanjut, lihat View historical system events.
Kinerja instans ECS terganggu	Apakah kinerja instans berkurang. Kredit CPU yang tidak mencukupi menyebabkan instans burstable kembali ke kinerja dasar.	Instans ECS hanya dapat memberikan kinerja dasar karena kredit CPU yang tersedia tidak mencukupi.
Pengubahan ukuran disk instans ECS	Apakah disk telah diubah ukurannya tetapi OS belum memperluas sistem file. Ruang disk tambahan tidak tersedia hingga sistem file diubah ukurannya.	Setelah disk diubah ukurannya, sistem operasi tidak dapat mengubah ukuran sistem file secara otomatis. Jika disk tidak dapat digunakan setelah diubah ukurannya, ubah ukuran disk lagi.
Permohonan resource instans ECS	Apakah sumber daya CPU dan memori fisik yang cukup tersedia untuk instans. Jika sumber daya tidak mencukupi, instans tidak dapat dimulai.	Tunggu beberapa menit dan coba mulai instans lagi. Jika masalah berlanjut, buat instans di wilayah berbeda.
Status OS instans ECS	Apakah terjadi panic kernel, error OOM, atau kegagalan internal pada OS instans. Gangguan ini sering disebabkan oleh pengaturan instans atau program pengguna yang salah konfigurasi.	Restart instans.
Status virtualisasi instans ECS	Apakah ada pengecualian pada layanan inti lapisan virtualisasi dasar. Pengecualian lapisan virtualisasi dapat menyebabkan instans berhenti merespons atau ditangguhkan secara tidak terduga.	Restart instans.