Ikhtisar operasi pada node pekerja K8s yang didukung ACK - Container Service for Kubernetes

Masuk, drain, hapus, dan pantau node pekerja dari halaman Nodes di konsol ACK.

Untuk membuka halaman Nodes:

Masuk ke konsol OOS atau konsol ACK. Di panel navigasi sebelah kiri, klik Clusters.
Pada halaman Clusters, klik nama kluster tersebut. Di panel navigasi sebelah kiri, pilih Nodes > Nodes.

Masuk ke node

Untuk troubleshooting, pemantauan performa, atau menjalankan skrip kustom, akses instans ECS yang mendasari node tersebut.

Pada kolom Actions, pilih More > Workbench Connection atau More > VNC Connection.

Lihat Metode untuk menghubungkan ke instans ECS untuk opsi lainnya.

ContainerOS tidak mendukung login langsung atau SSH untuk mencegah operasi yang tidak dapat dilacak dan mengurangi risiko keamanan. Untuk maintenance, gunakan kontainer administratif ContainerOS.

Drain node

Draining mengosongkan Pod dari sebuah node dan menandainya sebagai unschedulable.

Pada kolom Actions, pilih More > Node Draining dan ikuti petunjuknya.

Sebelum melakukan drain pada node:

Pastikan node lain memiliki sumber daya yang cukup untuk Pod yang dievakuasi.
Verifikasi aturan afinitas Pod dan kebijakan penjadwalan memungkinkan penjadwalan ulang ke node lain.
Pod yang dikelola oleh DaemonSet tidak dievakuasi selama proses draining.

Atur status penjadwalan node

Lakukan operasi ini selama jam sepi, karena dapat memengaruhi workload yang sedang berjalan.

Pilih node tersebut, lalu klik Set Scheduling Status di bagian bawah. Baca tindakan pencegahan dalam kotak dialog dan ikuti petunjuknya.

Node yang tidak dapat dijadwalkan (unschedulable) akan diberi label SchedulingDisabled. Pod yang sudah ada tetap melayani traffic, tetapi tidak ada Pod baru yang dijadwalkan. Pod yang dikelola oleh DaemonSet tidak dihapus.

Hapus node

Hapus node selama jam sepi untuk meminimalkan dampak terhadap workload.

Untuk menghapus satu node: pada kolom Actions, pilih More > Remove dan ikuti petunjuknya.
Untuk menghapus beberapa node: pilih node tersebut, klik Batch Remove di bagian bawah, dan ikuti petunjuknya.

Lihat Hapus node untuk informasi tindakan pencegahan.

Pantau sumber daya node

Klik Monitor pada kolom Actions untuk menginstal komponen pemantauan dan mengaktifkan Managed Service for Prometheus (Prometheus), yang menyediakan dasbor sumber daya untuk node tersebut.

Konfigurasikan aturan alert di Prometheus.
Buat aturan alert PromQL kustom untuk kondisi node yang tidak normal. Lihat Praktik terbaik untuk mengonfigurasi aturan alert di Prometheus.

Mendiagnosis kegagalan node

Klik Exception Diagnosis pada kolom Actions untuk memicu inspeksi otomatis dan menerima rencana perbaikan.

Lihat Diagnostik node untuk skenario yang didukung dan rencana perbaikan.

Kelola label dan taint node

Pada halaman Nodes, klik Manage Labels and Taints untuk mengonfigurasi label dan taint yang mengontrol penjadwalan Pod.

Lihat Kelola label dan taint node.

Jalankan operasi batch pada node

Terapkan aksi yang sama ke beberapa node pekerja sekaligus, seperti memperbarui kernel OS atau menginstal paket pemantauan, keamanan, dan audit.

Pilih node target, klik Batch Operations di bagian bawah, dan ikuti panduan konsol.

Catatan: Operasi batch tidak didukung pada kluster dengan Auto Mode diaktifkan.

Lihat Kelola node secara batch.

Lihat detail node

Lihat penggunaan sumber daya

Pada kolom Actions, pilih More > Details untuk melihat penggunaan dan status sumber daya node secara sekilas.

Metrik CPU dan memori:

Metric	Rumus
CPU request	Jumlah CPU yang direquest oleh semua Pod pada node / CPU allocatable node
CPU utilization	Jumlah CPU yang digunakan oleh semua Pod pada node / CPU allocatable node
Memory request	Jumlah memori yang direquest oleh semua Pod pada node / memori allocatable node
Memory utilization	Jumlah memori yang digunakan oleh semua Pod pada node / memori allocatable node

Sumber daya allocatable = Kapasitas sumber daya - Sumber daya yang dicadangkan - Ambang batas eviction. Lihat Kebijakan pencadangan sumber daya.

Tampilan Details juga mencakup:

Informasi dasar: nama node, alamat IP, ID instans, versi runtime kontainer, sistem operasi, dan versi kernel, dll.
Alokasi sumber daya: request dan limit CPU serta memori untuk semua Pod pada node
Status node: kondisi saat ini dan riwayat event
Event node: catatan event terbaru
Daftar Pod: semua Pod yang berjalan pada node

Periksa konfigurasi node mentah

Pada kolom Actions, pilih More > View in YAML untuk melihat YAML lengkap node, berguna untuk inspeksi mendalam dan troubleshooting.

Langkah selanjutnya

Gunakan resource profiling untuk rekomendasi sumber daya kontainer berdasarkan penggunaan historis. Buat aplikasi tanpa status menggunakan Deployment untuk mengonfigurasi request dan limit sumber daya.
Konfigurasikan label node dan node selector untuk menjadwalkan Pod ke node tertentu.
Lakukan upgrade atau downgrade konfigurasi node pekerja untuk menskalakan sumber daya.
Pasang data disk ke node untuk penyimpanan tambahan bagi runtime kontainer dan kubelet.
Ubah ukuran sistem disk atau data disk node.
Upgrade node (versi kubelet dan runtime kontainer) dikelola di tingkat kelompok node. Perbarui kelompok node untuk menerapkan upgrade versi.