Topik ini merangkum operasi umum untuk mengelola node pekerja di Konsol Container Service for Kubernetes (ACK). Anda dapat merujuk ke topik ini untuk panduan operasi terperinci dan catatan penggunaan terkait.
Sebagian besar operasi dapat diakses melalui halaman Nodes.
Masuk ke Konsol ACK. Di panel navigasi kiri, klik Clusters.
Pada halaman Clusters, klik nama kluster yang ingin Anda kelola. Di panel navigasi kiri, pilih .
Log Masuk Node
Untuk skenario seperti pemecahan masalah node, pemantauan kinerja, atau menjalankan skrip kustom, Anda dapat masuk ke instance ECS yang sesuai dengan node tersebut.
Koneksi Workbench: Pada kolom Actions daftar node, pilih .
Koneksi VNC: Pada kolom Actions daftar node, pilih .
Untuk metode koneksi jarak jauh tambahan ke instance ECS, lihat Metode untuk menghubungkan ke instance ECS.
Jika sistem operasi Anda adalah ContainerOS, demi mengurangi risiko keamanan, ContainerOS tidak mendukung logon langsung untuk operasi yang tidak dapat dilacak dan tidak memiliki fungsi SSH. Untuk operasi pemeliharaan yang diperlukan, lihat Memelihara node ContainerOS.
Pengosongan node dan status penjadwalan
Pengosongan node
Pada kolom Actions daftar node, pilih , lalu ikuti petunjuk di layar untuk mengosongkan node. Proses ini mengungsikan Pod yang ada dari node dan menandainya sebagai tidak dapat dijadwalkan, sehingga tidak ada Pod baru yang akan dijadwalkan di atasnya.
Perhatikan tindakan pencegahan berikut:
Pastikan sumber daya yang cukup tersedia di node lain dalam kluster untuk mencegah Pod aplikasi menjadi tidak dapat dijadwalkan.
Verifikasi aturan afinitas node dan kebijakan penjadwalan untuk Pod pada node yang akan dihapus guna memastikan Pod tersebut tetap dapat dijadwalkan di node lain setelah penghapusan.
Pod yang dikelola oleh DaemonSet tidak akan dievakuasi.
Mengubah status penjadwalan node
Dari daftar node, pilih node yang diinginkan, lalu klik Set Scheduling Status di bagian bawah halaman. Baca dengan cermat tindakan pencegahan dalam kotak dialog, lalu ikuti petunjuk di layar untuk menyelesaikan operasi.
Perhatikan tindakan pencegahan berikut:
Lakukan operasi ini di luar jam sibuk karena dapat memengaruhi operasi bisnis.
Begitu node ditetapkan sebagai tidak dapat dijadwalkan, node tersebut akan diberi label SchedulingDisabled. Meskipun Pod yang ada di node tersebut akan terus melayani eksternal, Pod baru tidak akan dijadwalkan ke node ini.
Pod yang dikelola oleh DaemonSet tidak akan dihapus.
Penghapusan node
Jika Anda tidak lagi memerlukan node pekerja, Anda dapat menghapusnya dari kelompok node atau kluster melalui Konsol ACK selama jam non-sibuk. Pada kolom Actions daftar node, pilih atau pilih node tersebut dan klik Batch Remove di bagian bawah halaman. Kemudian, ikuti petunjuk di layar untuk menyelesaikan proses.
Untuk informasi terkait tindakan pencegahan dan detail fitur, lihat Menghapus node.
Pemantauan node
Pada kolom Actions daftar node, klik Monitor, lalu ikuti petunjuk di layar untuk menginstal komponen serta mengaktifkan Alibaba Cloud Prometheus guna melihat dasbor sumber daya node. Untuk informasi lebih lanjut tentang mengonfigurasi peringatan pemantauan dengan Alibaba Cloud Prometheus, lihat Mengonfigurasi aturan peringatan di Prometheus.
Untuk informasi tentang cara membuat aturan peringatan kustom menggunakan Prometheus Query Language (PromQL) untuk status node yang tidak normal, lihat Status node tidak normal.
Diagnostik kesalahan node
Pada kolom Actions daftar node, klik Exception Diagnosis untuk node yang tidak normal guna melakukan inspeksi node dan mendapatkan solusi perbaikan yang sesuai. Untuk informasi tentang skenario diagnostik yang didukung, item inspeksi, dan solusi perbaikan, lihat Diagnostik node.
Mengelola label dan taint node
Untuk mengelola dan menjadwalkan sumber daya kluster menggunakan label dan taint, buka halaman Nodes, klik Manage Labels And Taints, lalu ikuti petunjuk di layar untuk mengonfigurasi nama dan nilai label atau taint. Untuk informasi lebih lanjut, lihat Mengelola label dan taint node.
Lihat informasi node
Pada kolom Actions daftar node, pilih untuk melihat templat YAML dari node tersebut.
Pada kolom Actions daftar node, klik Details untuk melihat informasi node.
Penggunaan CPU dan memori
CPU request = jumlah(Sumber daya CPU yang diminta oleh semua Pod di node)/Jumlah total sumber daya CPU di node
Penggunaan CPU = jumlah(Sumber daya CPU yang digunakan oleh semua Pod di node)/Jumlah total sumber daya CPU di node
Memory request = jumlah(Sumber daya memori yang diminta oleh semua Pod di node)/Jumlah total sumber daya memori di node
Penggunaan memori = jumlah(Sumber daya memori yang digunakan oleh semua Pod di node)/Jumlah total sumber daya memori di node
CatatanSumber daya yang dapat dialokasikan = Kapasitas sumber daya - Sumber daya yang dicadangkan - Ambang batas evakuasi. Untuk informasi lebih lanjut, lihat Kebijakan pencadangan sumber daya.
Informasi dasar node
Mencakup nama node, alamat IP, ID instans, versi runtime kontainer, sistem operasi, kernel, dll.
Informasi lainnya
Rincian alokasi sumber daya CPU dan memori node (Request dan Limit), status node, daftar Pod, event node, dan lainnya.
Kelola node secara batch
Anda dapat mengelola node pekerja di kluster Anda secara batch untuk meningkatkan efisiensi O&M, seperti menginstal pembaruan keamanan kernel sistem operasi atau menginstal paket pemantauan, keamanan, dan audit kustom. Sebelum menggunakan fitur ini, pastikan Anda telah mengaktifkan CloudOps Orchestration Service (OOS) di Konsol OOS. OOS mendukung eksekusi tugas otomatis melalui templat.
Fitur ini tidak didukung di kluster yang mengaktifkan mode manajemen cerdas.
Pada halaman Nodes, pilih node target, klik Batch O&M di bagian bawah daftar node, pilih operasi O&M target dalam kotak dialog, lalu klik OK.
Operasi O&M batch berikut didukung:
Menginstal pembaruan keamanan kernel sistem operasi.
Menginstal paket kustom.
Menginstal atau menguninstall paket YUM atau APT.
Menjalankan skrip shell.
Pada antarmuka OSS yang muncul secara otomatis, rujuk ke Membuat eksekusi dan ikuti petunjuk di layar untuk mengonfigurasi informasi dasar tugas dan parameter terkait, lalu klik Create untuk menyelesaikan pembuatan dan pengiriman eksekusi.
Setelah eksekusi OOS dibuat, Anda akan diarahkan secara otomatis ke halaman Execution Management di Konsol OOS. Klik nama ID eksekusi yang dibuat untuk melihat status eksekusi, langkah-langkah, hasil, dan lainnya. Untuk informasi lebih lanjut tentang eksekusi tugas, lihat Ikhtisar eksekusi.
Referensi
Untuk informasi lebih lanjut tentang cara mengonfigurasi sumber daya untuk Pod aplikasi, lihat Membuat aplikasi tanpa status menggunakan Deployment.
Konfigurasikan label node dan selector node untuk menjadwalkan Pod aplikasi ke node tertentu. Untuk informasi lebih lanjut, lihat Menjadwalkan Pod aplikasi ke node yang ditentukan.
Untuk panduan tentang menambah atau mengurangi sumber daya node pekerja, lihat Meningkatkan atau menurunkan spesifikasi konfigurasi node pekerja.
Untuk menambahkan disk data ke node guna menyimpan sumber daya seperti runtime kontainer dan kubelet, lihat Melampirkan disk data ke node.
Untuk informasi lebih lanjut tentang cara mengubah ukuran disk data atau disk sistem, lihat Mengubah ukuran disk sistem atau disk data node.
Peningkatan node, termasuk versi kubelet dan runtime, dikelola di tingkat kelompok node. Untuk informasi lebih lanjut, lihat Memperbarui kelompok node.