全部产品
Search
文档中心

Container Service for Kubernetes:Diagnostik Pod

更新时间:Jul 06, 2025

Container Intelligence Service menyediakan fitur diagnostik pod untuk membantu Anda mendiagnosis pod. Topik ini menjelaskan item diagnostik pod serta solusi untuk memperbaiki masalah pada pod.

Container Intelligence Service mengembangkan sistem diagnostik berdasarkan pengalaman ahli dan melatih model diagnostik bantuan AI. Fitur diagnostik pod membantu mengidentifikasi penyebab utama masalah, mencakup item diagnostik serta penyebab utama yang terkait.

  • Diagnostic items: mencakup pod, node, komponen node, komponen kluster, dan Elastic Compute Service (ECS) controller manager.

  • Root cause: menemukan penyebab utama masalah dan memberikan saran untuk perbaikan. Fitur diagnostik pod mengumpulkan informasi tentang kluster dan node, mengidentifikasi anomali, lalu melakukan diagnostik mendalam.

Penting

Saat menggunakan fitur diagnostik pod, ACK menjalankan program pengumpulan data di setiap node dalam kluster untuk mengumpulkan hasil diagnostik. Informasi yang dikumpulkan mencakup versi sistem, status beban kerja, Docker, kubelet, serta informasi kesalahan utama dalam log sistem. Program pengumpulan data tidak mengumpulkan informasi bisnis atau data sensitif.

Skenario

Tabel berikut menjelaskan skenario diagnostik pod dan diagnostik bantuan AI.

Kategori

Skenario

Diagnostik Pod

Pod tidak diproses oleh penjadwal.

Pod tidak dapat dijadwalkan karena tidak memenuhi persyaratan batasan untuk penjadwalan.

Pod dijadwalkan tetapi tidak diproses oleh kubelet.

Pod sedang menunggu volume mencapai keadaan Siap.

Pod dievakuasi.

Pod dievakuasi karena ruang disk tidak mencukupi.

Pod dievakuasi karena ruang memori tidak mencukupi pada node.

Pod dievakuasi karena indeks disk tidak mencukupi.

Kontainer sandbox dalam pod gagal dibuat.

Pod tetap dalam keadaan Terminating.

Kesalahan out-of-memory (OOM) terjadi pada kontainer dalam pod.

Kontainer dalam pod keluar secara tidak normal.

Kontainer dalam pod tetap dalam keadaan CrashLoopBackOff.

Kontainer dalam pod belum siap.

Pod gagal menarik gambar kontainer.

Kesalahan timeout terjadi saat pod menarik gambar kontainer.

Diagnostik bantuan AI

Status pod tidak normal.

Kesalahan OOM terjadi pada pod.

Kontainer dalam pod keluar secara tidak normal.

Konfigurasi ConfigMaps atau Secrets dari pod tidak valid.

Pod gagal melewati pemeriksaan kesehatan.

Konfigurasi persistent volume claims (PVCs) dari pod tidak valid.

Kesalahan terjadi saat pod menarik gambar kontainer.

Prosedur

Fitur diagnostik kluster mengumpulkan informasi tentang kluster dan node, mengidentifikasi anomali, lalu melakukan diagnostik mendalam. Mode ahli dan mode AI digunakan untuk membantu menemukan penyebab utama masalah. Hasil diagnostik dihasilkan melalui langkah-langkah berikut: identifikasi anomali, pengumpulan data, pemeriksaan item diagnostik, dan analisis penyebab utama.

Node diagnostics

  • Anomaly identification: mengumpulkan data dasar seperti status node, status pod, dan aliran acara kluster, serta menganalisis anomali berdasarkan data tersebut.

  • Data collection: mengumpulkan dan mendiagnosis data terkait konteks berdasarkan hasil identifikasi anomali. Sebagai contoh, ACK mengumpulkan informasi node dalam Kubernetes, informasi ECS, status proses Docker, dan status proses kubelet.

  • Diagnostic item check: memeriksa apakah metrik kunci normal berdasarkan data yang dikumpulkan. Sebagai contoh, item diagnostik node mencakup status proses Docker dan status ECS. Diagnostik node diklasifikasikan ke dalam beberapa kategori. ACK mencantumkan item diagnostik dari kategori berbeda dan memberikan deskripsi setiap item diagnostik.

  • Root cause analysis: menganalisis penyebab utama masalah berdasarkan data yang dikumpulkan dan hasil pemeriksaan item diagnostik.

Hasil diagnostik

Hasil diagnostik mencakup hasil analisis penyebab utama dan hasil pemeriksaan item diagnostik. Hasil analisis penyebab utama mencakup detected anomalies, root cause, suggestions for fixes. Hasil pemeriksaan item diagnostik mencakup hasil pemeriksaan setiap item diagnostik. Pemeriksaan item diagnostik digunakan untuk menemukan penyebab yang mungkin tidak diidentifikasi oleh analisis penyebab utama.

Catatan

Item diagnostik dapat bervariasi berdasarkan konfigurasi kluster. Item diagnostik aktual pada halaman diagnostik harus diutamakan.

Item diagnostik pod

Kategori

Deskripsi

Pod

Mendiagnosis masalah pod umum, termasuk status pod, penarikan gambar, dan konektivitas jaringan.

Node

Mendiagnosis masalah node umum, termasuk status node, status jaringan, log kernel, proses kernel, dan ketersediaan layanan.

Komponen Node

Mendiagnosis status komponen node utama, termasuk komponen jaringan dan volume.

Komponen Kluster

Mendiagnosis masalah kluster umum, termasuk ketersediaan server API dan layanan DNS serta status gateway NAT.

ECSControllerManager

Mendiagnosis masalah instance ECS umum, termasuk status instance ECS, koneksi jaringan, sistem operasi, dan I/O disk.

Pod

Item diagnostik

Deskripsi

Solusi

Jumlah restart kontainer

Menunjukkan jumlah kali kontainer dalam pod di-restart.

Periksa status dan log pod. Untuk informasi lebih lanjut, lihat Pemecahan Masalah Pod.

Kegagalan unduhan gambar kontainer

Periksa apakah pod lain di node pod saat ini gagal mengunduh gambar kontainer.

Validitas Secrets yang digunakan oleh pod untuk menarik gambar kontainer

Periksa validitas Secrets yang digunakan oleh pod untuk menarik gambar kontainer.

Konektivitas antara pod dan CoreDNS pods

Periksa konektivitas antara pod dan CoreDNS pods.

Periksa konektivitas antara pod dan CoreDNS pods.

Konektivitas antara pod dan CoreDNS Service

Periksa konektivitas antara pod dan CoreDNS Service.

Konektivitas antara pod dan server DNS di jaringan host

Periksa konektivitas antara pod dan server DNS di jaringan host.

Periksa konektivitas antara pod dan server DNS di jaringan host.

Status proses kontainer D dalam pod

Periksa apakah proses kontainer dalam pod berada dalam keadaan D.

Dalam banyak kasus, proses kontainer sedang menunggu I/O disk jika proses kontainer berada dalam keadaan D. Mulai ulang instance ECS yang sesuai untuk menyelesaikan masalah ini. Jika masalah tetap ada, submit a ticket.

Inisialisasi Pod

Periksa apakah pod diinisialisasi.

Periksa status dan log pod. Untuk informasi lebih lanjut, lihat Pemecahan masalah Pod.

Penjadwalan Pod

Periksa apakah pod dijadwalkan.

Periksa status dan log pod. Untuk informasi lebih lanjut, lihat Pemecahan masalah Pod.

Node

Jika masalah berikut terus berlanjut setelah Anda mengadopsi solusi yang dijelaskan dalam tabel berikut, kumpulkan log node lalu submit a ticket.

Item diagnostik

Deskripsi

Solusi

Kesalahan konektivitas ke server API Kubernetes

Memeriksa apakah node dapat terhubung ke server API Kubernetes dari kluster.

Periksa konfigurasi kluster. Untuk informasi lebih lanjut, lihat Pemecahan masalah kluster ACK.

Penggantungan mount AUFS

Memeriksa apakah penggantungan mount AUFS terjadi.

submit a ticket.

Kesalahan BufferIOError

Memeriksa apakah kesalahan BufferIOError terjadi di kernel node.

submit a ticket.

Kelebihan cgroup

Memeriksa apakah kelebihan cgroup terjadi pada node.

Kelebihan cgroup dapat mengganggu pengumpulan data pemantauan dan menyebabkan kegagalan startup kontainer. Masuk ke node dan hapus direktori cgroup.

Status proses chronyd abnormal

Memeriksa apakah proses chronyd pada node berada dalam keadaan abnormal. Jika proses chronyd pada node berada dalam keadaan abnormal, sinkronisasi jam sistem mungkin terpengaruh.

Jika proses chronyd pada node berada dalam keadaan abnormal, sinkronisasi jam sistem mungkin terpengaruh. Jalankan perintah systemctl restart chronyd untuk memulai ulang proses chronyd.

Penarikan gambar oleh containerd

Memeriksa apakah runtime containerd dapat menarik gambar sesuai harapan.

Periksa konfigurasi jaringan node dan gambar.

Status containerd

Memeriksa status runtime containerd.

submit a ticket.

Ketersediaan pod CoreDNS

Memeriksa apakah node dapat mengakses alamat IP pod CoreDNS.

Periksa apakah node dapat mengakses alamat IP pod CoreDNS. Untuk informasi lebih lanjut, lihat Apa yang harus saya lakukan jika beban kueri DNS tidak seimbang di antara pod CoreDNS?.

Status gambar

Memeriksa apakah gambar rusak.

submit a ticket.

Status overlay2 gambar

Memeriksa apakah file sistem overlay2 dalam gambar rusak.

Jika file sistem overlay2 dalam gambar rusak.

Waktu sistem

Memeriksa apakah waktu sistem benar.

Tidak ada.

Startup kontainer Docker

Memeriksa apakah kontainer Docker gagal dimulai.

submit a ticket.

Penarikan gambar Docker

Memeriksa apakah node dapat menarik gambar Docker sesuai harapan.

Periksa konfigurasi jaringan node dan gambar.

Status Docker

Memeriksa status Docker.

submit a ticket.

Waktu startup Docker

Memeriksa waktu startup Docker.

Tidak ada.

Kesalahan Hang Docker

Memeriksa apakah terjadi kesalahan hang Docker pada node.

Jalankan perintah systemctl restart docker untuk memulai ulang Docker.

Keberadaan instance ECS

Memeriksa keberadaan instance ECS.

Periksa status instance ECS. Untuk informasi lebih lanjut, lihat FAQ tentang node dan pool node.

Status Instance ECS

Memeriksa status instance ECS.

Periksa status instance ECS. Untuk informasi lebih lanjut, lihat FAQ tentang Node dan Pool Node.

Kesalahan Ext4FsError

Memeriksa apakah kesalahan Ext4FsError terjadi di kernel node.

submit a ticket.

Sistem file node hanya-baca

Dalam banyak kasus, sistem file node menjadi hanya-baca akibat kegagalan disk. Anda tidak dapat menulis data ke sistem file yang hanya-baca, sehingga operasional bisnis Anda mungkin terpengaruh.

Gunakan perintah fsck untuk memperbaiki sistem file node, lalu mulai ulang node tersebut.

Waktu Perangkat Keras

Periksa konsistensi antara waktu perangkat keras dan waktu sistem. Jika selisih waktu melebihi 2 menit, kemungkinan terjadi kesalahan komponen.

Jalankan perintah hwclock --systohc untuk menyinkronkan waktu sistem dengan jam perangkat keras.

DNS

Memeriksa apakah nama domain dapat diselesaikan pada node.

Periksa apakah nama domain dapat diselesaikan pada node. Untuk informasi lebih lanjut, lihat Pemecahan Masalah DNS.

Kesalahan Kernel Oops

Memeriksa keberadaan kesalahan oops di kernel node.

submit a ticket.

Versi Kernel

Periksa apakah versi kernel sudah usang karena versi yang usang dapat menyebabkan kegagalan sistem.

Perbarui kernel node. Untuk informasi lebih lanjut, lihat FAQ tentang Node dan Pool Node.

Ketersediaan DNS

Memeriksa apakah node dapat mengakses alamat IP kluster layanan kube-dns untuk menggunakan layanan DNS yang disediakan oleh kluster.

Periksa status dan log pod CoreDNS. Untuk informasi lebih lanjut, lihat Pemecahan Masalah DNS.

Status Kubelet

Memeriksa status kubelet.

Periksa log kubelet. Untuk detail lebih lanjut, lihat Pemecahan Masalah Kluster ACK.

Waktu Startup Kubelet

Memeriksa waktu startup Kubelet.

Tidak ada.

Pemanfaatan CPU

Periksa apakah pemanfaatan CPU node terlalu tinggi.

Tidak ada.

Pemanfaatan memori

Memeriksa apakah pemanfaatan memori node terlalu tinggi.

Tidak ada.

Fragmen memori

Memeriksa apakah fragmen memori ada pada node.

Jika fragmen memori ada pada node, masuk ke node dan jalankan perintah echo 3 > /proc/sys/vm/drop_caches dan hapus cache.

Memori swap

Memeriksa apakah memori swap diaktifkan untuk node.

Memori swap tidak dapat diaktifkan. Masuk ke node dan nonaktifkan memori swap.

Pemuatan driver perangkat jaringan

Memeriksa pemuatan driver VirtIO pada perangkat jaringan.

Kesalahan terjadi selama pemuatan driver VirtIO pada perangkat jaringan.

Pemanfaatan CPU node yang terlalu tinggi

Memeriksa pemanfaatan CPU node dalam seminggu terakhir. Jika pemanfaatan CPU node tinggi dan sejumlah besar pod dijadwalkan ke node, pod bersaing untuk sumber daya. Ini meningkatkan pemanfaatan CPU dan dapat menyebabkan gangguan layanan.

Untuk menghindari gangguan layanan, atur permintaan sumber daya dan batas ke nilai yang tepat untuk menghindari menjalankan sejumlah besar pod yang berlebihan pada node.

Keberadaan IP node privat

Memeriksa apakah alamat IP node privat ada.

Jika alamat IP node privat tidak ada, hapus node dan tambahkan node ke kluster lagi. Jangan lepaskan instance ECS saat Anda menghapus node. Untuk informasi lebih lanjut tentang cara menghapus node dari kluster, lihat Hapus node. Untuk informasi lebih lanjut tentang cara menambahkan node ke kluster, lihat Tambahkan instance ECS yang ada.

Pemanfaatan memori node yang terlalu tinggi

Memeriksa pemanfaatan memori node dalam seminggu terakhir. Jika pemanfaatan memori node tinggi dan sejumlah besar pod dijadwalkan ke node, pod bersaing untuk sumber daya. Ini meningkatkan pemanfaatan memori, menyebabkan kesalahan out of memory (OOM), dan dapat menyebabkan gangguan layanan.

Untuk menghindari gangguan layanan, atur permintaan sumber daya dan batas ke nilai yang tepat untuk menghindari menjalankan sejumlah besar pod yang berlebihan pada node.

Status Node

Memeriksa apakah node berada dalam status Siap.

Mulai ulang node. Untuk informasi lebih lanjut, lihat FAQ tentang Node dan Pool Node.

Penjadwalan node

Memeriksa apakah node tidak dapat dijadwalkan.

Jika node tidak dapat dijadwalkan, periksa konfigurasi penjadwalan node. Untuk informasi lebih lanjut, lihat Drainase node dan status penjadwalan.

Kesalahan OOM

Periksa apakah kesalahan OOM terjadi pada node.

submit a ticket.

Pemeriksaan Runtime

Memeriksa apakah runtime node sesuai dengan runtime kluster.

Untuk informasi lebih lanjut, lihat Bisakah saya mengubah runtime kontainer kluster dari containerd ke Docker?.

Versi OS yang sudah usang

Periksa apakah versi OS yang digunakan oleh node memiliki bug yang diketahui atau sudah usang dengan potensi masalah stabilitas. Masalah tersebut dapat menyebabkan komponen Docker dan containerd tidak berfungsi dengan baik.

Perbarui versi OS.

Akses Internet

Memeriksa apakah node dapat mengakses Internet.

Periksa apakah SNAT diaktifkan untuk kluster. Untuk detail lebih lanjut, lihat Aktifkan kluster ACK yang ada untuk mengakses Internet.

Kesalahan RCUStallError

Memeriksa apakah kesalahan RCUStallError terjadi di kernel node.

submit a ticket.

Versi OS

Periksa versi OS yang digunakan oleh node. Jika node menggunakan versi OS yang sudah usang, kluster mungkin tidak berfungsi secara normal.

Tidak ada.

Kelebihan proses runc

Jika terjadi kelebihan proses runc pada node, node tersebut mungkin secara berkala masuk ke status NotReady.

Jika terjadi kelebihan proses runc, periksa proses runc yang bocor dan hentikan proses tersebut secara manual.

Kesalahan SoftLockupError

Memeriksa apakah kesalahan SoftLockupError terjadi di kernel node.

submit a ticket.

Systemd Hang

Periksa apakah terjadi systemd hang pada node.

Jika terjadi systemd hang pada node, akses node tersebut dan jalankan perintah systemctl daemon-reexec untuk me-restart systemd.

Versi systemd yang sudah usang

Periksa apakah versi systemd yang digunakan oleh node memiliki bug yang diketahui. Versi systemd yang sudah usang dapat mengalami masalah stabilitas, yang berpotensi menyebabkan komponen Docker dan containerd tidak berfungsi dengan baik.

Perbarui versi systemd. Untuk informasi lebih lanjut, lihat systemd.

Proses Tergantung

Memeriksa keberadaan proses tergantung pada node.

submit a ticket.

Kesalahan unregister_netdevice

Memeriksa apakah kesalahan unregister_netdevice terjadi di kernel node.

submit a ticket.

NodeComponent

Item diagnostik

Deskripsi

Solusi

Status komponen CNI

Memeriksa apakah plug-in Container Network Interface (CNI) berjalan sesuai harapan.

Periksa status komponen jaringan yang digunakan oleh kluster. Untuk informasi lebih lanjut, lihat FAQ tentang manajemen jaringan.

Status komponen CSI

Memeriksa apakah plug-in Container Storage Interface (CSI) berjalan sesuai harapan.

Periksa status komponen volume yang digunakan oleh kluster. Untuk informasi lebih lanjut, lihat FAQ tentang CSI.

ClusterComponent

Item Diagnostik

Deskripsi

Solusi

Versi aliyun-acr-credential-helper

Memeriksa apakah versi aliyun-acr-credential-helper yang digunakan oleh kluster sudah usang.

Jika versi aliyun-acr-credential-helper yang digunakan oleh kluster sudah usang, perbarui aliyun-acr-credential-helper. Untuk informasi lebih lanjut, lihat Gunakan komponen aliyun-acr-credential-helper untuk menarik gambar tanpa menggunakan rahasia.

Ketersediaan Layanan API

Memeriksa apakah Layanan API kluster tersedia.

Jalankan perintah kubectl get apiservice untuk memeriksa ketersediaan Layanan API kluster. Jika Layanan API tidak tersedia, jalankan perintah kubectl describe apiservice untuk melihat informasi tentang Layanan API dan mengidentifikasi penyebabnya.

Blok CIDR pod yang tersedia tidak mencukupi

Memeriksa apakah jumlah blok CIDR pod yang tersedia dalam kluster dengan Flannel terpasang kurang dari lima. Setiap node dalam kluster dilampirkan ke blok CIDR pod. Jika semua blok CIDR pod digunakan, node baru yang ditambahkan ke kluster tidak dapat berfungsi dengan benar.

submit a ticket.

Endpoint CoreDNS

Memeriksa jumlah endpoint CoreDNS.

Periksa status dan log pod CoreDNS. Untuk informasi lebih lanjut, lihat Pemecahan masalah DNS.

Alamat IP kluster CoreDNS

Memeriksa apakah alamat IP kluster dialokasikan ke pod CoreDNS. Jika alamat IP kluster tidak dialokasikan ke pod CoreDNS, gangguan layanan mungkin terjadi.

Periksa status dan log pod CoreDNS. Untuk informasi lebih lanjut, lihat Pemecahan masalah DNS.

Status gateway NAT

Memeriksa status gateway NAT yang digunakan oleh kluster.

Masuk ke Konsol Gateway NAT untuk memeriksa apakah gateway NAT terkunci karena pembayaran tertunda.

Tingkat penurunan koneksi bersamaan yang terlalu tinggi pada gateway NAT

Memeriksa apakah tingkat penurunan koneksi bersamaan pada gateway NAT tinggi.

Jika tingkat tersebut tinggi, tingkatkan gateway NAT. Untuk informasi lebih lanjut, lihat FAQ tentang peningkatan gateway NAT Internet standar ke gateway NAT Internet yang ditingkatkan.

ECSControllerManager

Item Diagnostik

Deskripsi

Solusi

Pembayaran Tertunda Terkait Komponen Instance ECS

Memeriksa apakah disk atau lebar pita jaringan instance ECS tidak tersedia karena pembayaran tertunda di akun Anda.

Jika disk atau lebar pita jaringan instance ECS tidak tersedia karena pembayaran tertunda, isi ulang akun Anda.

Pembayaran Tertunda Terkait Instance ECS

Memeriksa apakah instance ECS pay-as-you-go ditangguhkan karena pembayaran tertunda.

Jika instance ECS pay-as-you-go ditangguhkan karena pembayaran tertunda, isi ulang akun Anda terlebih dahulu lalu mulai ulang instance.

Status NIC Instance ECS

Memeriksa apakah NIC instance ECS berfungsi dengan benar.

Jika NIC instance ECS tidak berfungsi dengan benar, mulai ulang instance.

Status Startup Instance ECS

Memeriksa apakah operasi boot dapat dilakukan pada instance secara normal.

Jika operasi boot tidak dapat dilakukan pada instance secara normal, buat instance lain.

Status Sistem Manajemen Backend Instance ECS

Memeriksa apakah sistem manajemen backend instance ECS bekerja sesuai harapan.

Jika sistem manajemen backend instance ECS tidak bekerja sesuai harapan, mulai ulang instance.

Status CPU Instance ECS

Memeriksa apakah persaingan CPU atau kegagalan pengikatan CPU terjadi di lapisan bawah instance ECS.

Jika persaingan CPU ada, instance mungkin gagal mendapatkan CPU atau menghadapi masalah lain. Mulai ulang instance.

Kunci Terpisah di CPU Instance ECS

Memeriksa apakah kunci terpisah terjadi di CPU instance ECS.

Kunci terpisah terjadi di CPU instance ECS. Untuk informasi lebih lanjut, lihat Deteksi dan Penanganan Kunci Terpisah.

Status Mitigasi DDoS untuk Instance ECS

Memeriksa apakah alamat IP publik instance mengalami serangan DDoS.

Jika alamat IP instance ECS mengalami serangan DDoS, beli layanan Anti-DDoS lainnya. Untuk informasi lebih lanjut, lihat Perbandingan Solusi Anti-DDoS Alibaba Cloud.

Kemampuan Baca/Tulis Disk Cloud yang Terbatas

Memeriksa apakah kemampuan baca/tulis disk cloud dibatasi.

Jika IOPS baca dan tulis maksimum disk telah tercapai, operasi baca dan tulis pada disk dibatasi. Untuk informasi lebih lanjut tentang cara melihat metrik disk, lihat Performa Penyimpanan Blok.

Pemuatan Disk Instance ECS

Memeriksa apakah disk cloud dapat dilampirkan ke instance ECS saat instance diinisialisasi oleh sistem.

Jika instance gagal dimulai karena disk cloud gagal dilampirkan ke instance, hentikan instance lalu mulai instance lagi.

Kedaluwarsa Instance ECS

Memeriksa apakah langganan instance telah kedaluwarsa.

Jika instance ECS telah kedaluwarsa, perpanjang instance. Untuk informasi lebih lanjut, lihat Perpanjang Instance Langganan.

OS Instance ECS Mengalami Crash

Memeriksa apakah crash OS terjadi pada instance ECS.

Jika crash OS terjadi pada instance ECS dalam 48 jam terakhir, selidiki log sistem untuk mengidentifikasi penyebabnya. Untuk informasi lebih lanjut, lihat Lihat Log Sistem dan Tangkapan Layar.

Status Host Instance ECS

Memeriksa apakah kegagalan terjadi pada server fisik tempat instance ECS ditempatkan.

Jika kegagalan terjadi pada server fisik tempat instance ECS ditempatkan, instance mungkin dalam keadaan abnormal dan performanya menurun. Mulai ulang instance.

Pemuatan Gambar Instance ECS

Memeriksa apakah instance ECS dapat memuat gambar saat sistem menginisialisasi instance.

Instance ECS gagal memuat gambar karena masalah terkait sistem dan gambar. Mulai ulang instance.

Hang I/O pada Disk Instance ECS

Memeriksa apakah hang I/O terjadi pada disk sistem instance ECS.

Jika hang I/O terjadi pada disk sistem instance ECS, periksa metrik disk. Untuk informasi lebih lanjut, lihat Lihat Data Pemantauan Disk Cloud. Untuk informasi tentang cara memecahkan masalah hang I/O pada Alibaba Cloud Linux 2, lihat Deteksi Hang I/O Sistem File dan Lapisan Blok.

Batas Bandwidth Instance ECS

Memeriksa apakah total bandwidth instance ECS telah mencapai bandwidth maksimum yang diizinkan untuk tipe instance.

Jika total bandwidth instance ECS telah mencapai bandwidth maksimum yang diizinkan untuk tipe instance, tingkatkan instance ke tipe instance yang menyediakan kemampuan bandwidth lebih tinggi. Untuk informasi lebih lanjut, lihat Ikhtisar Perubahan Konfigurasi Instance.

Batas Atas Bandwidth Burst Instance ECS

Memeriksa apakah bandwidth burst instance melebihi batas atas bandwidth burst yang diizinkan untuk tipe instance.

Jika bandwidth burst instance melebihi batas atas bandwidth burst yang diizinkan untuk tipe instance, tingkatkan instance ke tipe instance yang menyediakan bandwidth lebih tinggi. Untuk informasi lebih lanjut, lihat Ikhtisar Perubahan Konfigurasi Instance.

Pemuatan NIC Instance ECS

Memeriksa apakah NIC instance ECS dapat dimuat.

Jika NIC tidak dapat dimuat, konektivitas jaringan instance terpengaruh. Mulai ulang instance.

Pembuatan Sesi NIC pada Instance ECS

Memeriksa apakah sesi dapat dibuat ke NIC instance ECS.

Jika sesi tidak dapat dibuat ke NIC atau jika jumlah maksimum sesi yang didukung oleh NIC tercapai, konektivitas jaringan atau throughput instance terpengaruh. Mulai ulang instance.

Operasi Utama pada Instance ECS

Memeriksa apakah operasi yang baru-baru ini Anda lakukan pada instance berhasil. Operasi ini mencakup memulai dan menghentikan instance serta meningkatkan konfigurasi instance.

Jika operasi yang baru-baru ini Anda lakukan pada instance gagal, lakukan operasi tersebut lagi.

Kehilangan Paket pada NIC Instance ECS

Memeriksa apakah kehilangan paket masuk atau keluar terjadi pada NIC instance ECS.

Jika kehilangan paket masuk atau keluar terjadi pada NIC instance ECS, mulai ulang instance.

Penurunan Performa Instance ECS

Memeriksa apakah performa instance sementara menurun karena masalah perangkat lunak atau perangkat keras.

Jika performa instance menurun, waktu ketika performa menurun akan ditampilkan. Anda dapat melihat acara sistem historis atau log sistem instance untuk mengidentifikasi penyebab penurunan performa. Untuk informasi lebih lanjut, lihat Lihat Acara Sistem Historis.

Performa Instance ECS Terganggu

Memeriksa apakah performa instance ECS terganggu.

Instance ECS hanya dapat memberikan performa dasar karena kredit CPU yang tersedia tidak mencukupi.

Penyesuaian Ukuran Disk Instance ECS

Memeriksa apakah disk instance ECS diubah ukurannya.

Setelah disk diubah ukurannya, sistem operasi tidak dapat menyesuaikan ukuran sistem file. Jika disk tidak dapat digunakan setelah diubah ukurannya, sesuaikan ukuran disk lagi.

Aplikasi Sumber Daya Instance ECS

Memeriksa apakah sumber daya fisik yang diperlukan oleh instance ECS, termasuk sumber daya CPU dan memori, mencukupi.

Jika sumber daya fisik yang diperlukan oleh instance ECS tidak mencukupi, instance tidak dapat dimulai. Tunggu beberapa menit dan mulai instance lagi. Anda juga dapat membuat instance ECS di wilayah lain.

Status OS Instance ECS

Memeriksa apakah kernel panics, kesalahan OOM, atau kegagalan internal terjadi dalam OS instance ECS.

Kegagalan ini mungkin disebabkan oleh konfigurasi instance yang tidak tepat atau program pengguna dalam OS instance. Mulai ulang instance.

Status Virtualisasi Instance ECS

Memeriksa apakah pengecualian ada pada layanan inti di lapisan virtualisasi bawah instance.

Jika pengecualian ada, instance mungkin tidak merespons atau tiba-tiba ditangguhkan. Mulai ulang instance.