Container Service for Kubernetes (ACK) menyediakan suite AIOps untuk menyederhanakan manajemen serta operasi & pemeliharaan (O&M) kluster Kubernetes. Suite ini mencakup pemeriksaan kluster, inspeksi kluster, dan diagnostik kluster guna membantu Anda melakukan troubleshooting masalah serta meningkatkan efisiensi O&M. Topik ini menjelaskan manfaat dan fitur suite AIOps.
Manfaat
Suite AIOps mencakup fitur-fitur berikut.
|
Feature |
Benefit |
|
Sebelum operasi O&M, cluster check mengevaluasi apakah kluster memenuhi persyaratan, sehingga meningkatkan tingkat keberhasilan operasi. |
|
|
Konfigurasikan aturan inspeksi terjadwal untuk secara rutin mengidentifikasi potensi risiko dalam kluster. |
|
|
Mendiagnosis Pod, node, Ingress, memori, dan Service guna menyederhanakan troubleshooting. |
Suite AIOps mendukung kluster ACK yang dikelola, kluster khusus ACK, dan kluster ACK Serverless Pro.
Cluster check
Cluster check mencakup operasi O&M utama seperti upgrade kluster, migrasi kluster, instalasi add-on, upgrade add-on, dan upgrade kelompok node. Pemeriksaan dipicu secara otomatis sebelum operasi tersebut, dan Anda hanya dapat melanjutkan setelah pemeriksaan berhasil. Item yang gagal akan menampilkan akar penyebab beserta saran perbaikan. Lihat Cluster Check.
Cluster inspection
Cluster inspection membantu Anda:
-
Memindai status kluster untuk mengidentifikasi potensi risiko.
-
Memeriksa secara berkala penggunaan resource, kuota resource, sertifikat kluster, dan versi add-on, serta menampilkan hasilnya secara visual.
-
Menampilkan tingkat keparahan anomali dan memberikan solusi untuk memelihara kluster secara efisien.
Berdasarkan praktik manajemen kluster yang luas, ACK telah mengumpulkan pengalaman inspeksi kluster yang kaya dari berbagai kasus penggunaan. Cluster Inspections.
Cluster diagnostics
Mendiagnosis Pod, node, Ingress, memori, dan Service di kluster Anda hanya dengan beberapa klik.
|
Item |
Description |
|
Mendiagnosis masalah umum Pod seperti kegagalan startup, kegagalan pengambilan image, dan exception. Menampilkan akar penyebab serta saran perbaikan. |
|
|
Mendiagnosis masalah umum node seperti NotReady, jaringan, dan isu waktu proses (runtime). Menampilkan akar penyebab serta saran perbaikan. |
|
|
Mendiagnosis masalah umum Service seperti event exception, kuota server backend Server Load Balancer (SLB), dan kuota jumlah instance SLB. Menampilkan akar penyebab serta saran perbaikan. |
|
|
Mengumpulkan data pemeriksaan komponen Ingress, parameter startup, log error Pod, dan instance SLB untuk melakukan troubleshooting masalah akses aplikasi. |
|
|
Mendiagnosis masalah memori umum di kluster ACK seperti kebocoran memori, fragmentasi memori, dan kebocoran cgroup. Menampilkan akar penyebab, saran perbaikan, serta penggunaan memori keseluruhan dalam bentuk grafik. |