全部产品
Search
文档中心

Container Service for Kubernetes:Tinjauan penskalaan node

更新时间:Jul 02, 2025

Cluster Edge dari Container Service for Kubernetes (ACK) mengelola berbagai sumber daya node, baik online maupun offline. Ini mencakup node Elastic Compute Service (ECS) lintas wilayah, node pusat data, node dari penyedia layanan cloud lainnya, serta node server di lokasi seperti pabrik, toko ritel, kendaraan bermotor, dan kapal. Dalam skenario di mana sumber daya node offline tidak memadai, fitur auto scaling secara mulus memperluas node cloud untuk cluster Edge ACK, meningkatkan kemampuan penjadwalan. Penskalaan dinamis ini menghemat sumber daya dan biaya secara signifikan.

Sebelum Anda memulai

Untuk menggunakan solusi penskalaan node dari ACK secara efektif dan memilih solusi yang sesuai dengan kebutuhan bisnis Anda, kami merekomendasikan membaca topik ini sebelum mengaktifkan fitur penskalaan node.

Sebelum melanjutkan, pastikan Anda memahami istilah penskalaan manual, auto scaling, penskalaan horizontal, dan penskalaan vertikal. Untuk informasi lebih lanjut, lihat dokumentasi resmi Kubernetes.

Cara kerjanya

Penskalaan node di Kubernetes berbeda dari model penskalaan tradisional berbasis ambang batas pemanfaatan sumber daya. Biasanya, Anda perlu menyesuaikan masalah penskalaan node setelah memigrasikan bisnis dari pusat data atau sistem orkestrasi lain ke Kubernetes.

Bagaimana Ambang Penskalaan Ditentukan?

Pemanfaatan sumber daya node panas dalam cluster biasanya lebih tinggi dibandingkan node lainnya.

  • Jika penskalaan dipicu berdasarkan rata-rata pemanfaatan sumber daya node dalam cluster, beban node panas tersebar ke node lain. Akibatnya, sumber daya tidak dapat diperluas dengan cepat ketika pemanfaatan sumber daya node panas melebihi ambang batas.

  • Jika penskalaan dipicu berdasarkan pemanfaatan sumber daya tertinggi, pemborosan sumber daya sering terjadi, berdampak buruk pada seluruh cluster.

Bagaimana Beban Dikurangi Setelah Node Ditambahkan?

Dalam cluster Kubernetes, pod adalah unit terkecil yang dapat diterapkan untuk aplikasi. Pod ditempatkan di node yang berbeda. Ketika pemanfaatan sumber daya pod tinggi, bahkan jika node atau cluster diperluas, jumlah pod yang diterapkan atau batas sumber daya pod tetap tidak berubah. Dalam hal ini, beban node tidak dapat diseimbangkan ke node baru yang ditambahkan.

Bagaimana Penskalaan Node Dipicu dan Dilakukan?

Jika penskalaan dipicu berdasarkan pemanfaatan sumber daya, pod dengan permintaan sumber daya besar dan penggunaan rendah mungkin dihapus paksa. Ketika cluster berisi banyak pod seperti itu, sumber daya yang dapat dijadwalkan habis, menyebabkan beberapa pod menjadi tidak dapat dijadwalkan.

Bagaimana Aktivitas Scale-Out Dipicu?

Model penskalaan node mendengarkan pod yang gagal dijadwalkan untuk menentukan apakah aktivitas scale-out diperlukan. Ketika pod gagal dijadwalkan karena sumber daya tidak mencukupi, model penskalaan node mulai mensimulasikan penjadwalan pod, memilih kumpulan node dengan fitur auto scaling diaktifkan yang dapat menyediakan sumber daya yang diperlukan, dan menambahkan node dalam kumpulan node ke cluster.

Catatan

Simulasi penjadwalan memperlakukan setiap kumpulan node dengan fitur auto scaling diaktifkan sebagai node abstraksi. Jenis instans yang ditentukan dalam konfigurasi kumpulan node diabstraksi menjadi kapasitas CPU, memori, dan GPU dari node. Selain itu, label dan taint kumpulan node dipetakan ke label dan taint node. Penjadwal menambahkan node abstraksi ke daftar yang dapat dijadwalkan selama simulasi penjadwalan. Ketika kondisi penjadwalan terpenuhi, penjadwal menghitung jumlah node yang diperlukan dan menambahkan node dalam kumpulan node ke cluster.

Bagaimana Aktivitas Scale-In Dipicu?

Model penskalaan node hanya melakukan scale-in pada node dalam kumpulan node dengan fitur auto scaling diaktifkan. Model ini tidak dapat mengelola node statis, termasuk node yang tidak berada dalam kumpulan node dengan fitur auto scaling diaktifkan. Model penskalaan node mencocokkan setiap node dengan kondisi scale-in. Ketika pemanfaatan sumber daya node lebih rendah dari ambang scale-in, aktivitas scale-in dipicu. Kemudian, model penskalaan node mencoba mensimulasikan penghapusan paksa pod pada node untuk memeriksa apakah node dapat dikosongkan. Pod Non-DaemonSet dalam namespace kube-system dan PodDisruptionBudget pod melewati node dan memilih node kandidat lainnya. Node dikosongkan sebelum dihapus. Setelah pod pada node dihapus paksa ke node lain, node dihapus.

Bagaimana Saya Dapat Meningkatkan Tingkat Keberhasilan Auto Scaling?

Tingkat keberhasilan auto scaling bergantung pada faktor-faktor berikut:

  • Apakah kondisi penjadwalan terpenuhi

    Setelah membuat kumpulan node dengan fitur auto scaling diaktifkan, konfirmasikan kebijakan penjadwalan pod yang sesuai dengan kumpulan node. Jika tidak dapat mengonfirmasi kebijakan tersebut, konfigurasikan nodeSelector untuk memilih label kumpulan node dan melakukan simulasi penjadwalan.

  • Apakah sumber daya mencukupi

    Setelah simulasi penjadwalan selesai, sistem secara otomatis memilih kumpulan node dengan fitur auto scaling diaktifkan dan menambahkan node dalam kumpulan node ke cluster. Namun, inventaris jenis instans Elastic Compute Service (ECS) yang ditentukan dalam konfigurasi kumpulan node memengaruhi tingkat keberhasilan aktivitas scale-out. Oleh karena itu, kami merekomendasikan menentukan beberapa jenis instans di zona berbeda untuk meningkatkan tingkat keberhasilan.

Bagaimana Saya Dapat Mempercepat Auto Scaling?

  • Metode 1: Gunakan mode swift untuk mempercepat auto scaling. Setelah kumpulan node dengan fitur auto scaling diaktifkan menyelesaikan aktivitas scale-out dan scale-in, kumpulan node beroperasi dalam mode swift. Untuk informasi lebih lanjut, lihat Aktifkan auto scaling node.

  • Metode 2: Gunakan citra kustom berbasis Alibaba Cloud Linux 3 untuk meningkatkan efisiensi pengiriman sumber daya di lapisan Infrastructure as a Service (IaaS) sebesar 50%. Untuk informasi lebih lanjut, lihat Buat citra kustom.

Solusi penskalaan node

Model penskalaan node menskalakan sumber daya di lapisan sumber daya. Ketika ukuran cluster tidak dapat memenuhi persyaratan penjadwalan pod, model ini secara otomatis menskalakan sumber daya node untuk memberikan kapasitas penjadwalan tambahan. Penskalaan node dikelola oleh komponen cluster-autoscaler, yang secara berkala memantau dan memelihara status cluster untuk mengidentifikasi kondisi yang memenuhi persyaratan penskalaan, sehingga menyesuaikan jumlah node cluster secara otomatis.

Kecepatan dan efisiensi penskalaan

  • Aktivitas penskalaan membutuhkan waktu 60 detik dalam mode standar dan 50 detik dalam mode swift.

  • Ketika durasi aktivitas penskalaan mencapai 1 menit, auto scaling menghadapi hambatan performa. Efisiensi auto scaling akan berfluktuasi berdasarkan jumlah kumpulan node dan skenario penskalaan. Misalnya, jika jumlah kumpulan node melebihi 100, durasi aktivitas penskalaan meningkat menjadi 100 hingga 150 detik.

  • Menggunakan model polling, dan dibatasi oleh ketergantungan pada pemeliharaan status cluster, latensi minimum adalah 5 detik.

Catatan penggunaan

Kuota dan batasan

  • Anda dapat menambahkan hingga 200 entri rute kustom ke tabel rute virtual private cloud (VPC). Untuk meningkatkan batas kuota, masuk ke konsol Pusat Kuota dan ajukan aplikasi. Untuk informasi lebih lanjut tentang kuota sumber daya lainnya dan cara meningkatkan batas kuota, lihat bagian Kuota layanan cloud dependen dari topik "Kuota dan batasan".

  • Kami merekomendasikan mengonfigurasi jumlah maksimum node dalam kumpulan node dengan fitur auto scaling diaktifkan secara tepat. Pastikan bahwa sumber daya dependen dan kuota mencukupi untuk jumlah node yang ditentukan, seperti blok CIDR VPC dan vSwitches. Jika tidak, aktivitas scale-out mungkin gagal. Untuk informasi lebih lanjut tentang jumlah maksimum node yang didukung oleh kumpulan node dengan fitur auto scaling diaktifkan, lihat Aktifkan auto scaling node. Untuk informasi lebih lanjut tentang cara merencanakan jaringan ACK, lihat Perencanaan jaringan cluster ACK yang dikelola.

  • Fitur penskalaan node tidak mendukung node berlangganan. Jika Anda ingin membuat kumpulan node dengan fitur auto scaling diaktifkan, jangan atur metode penagihan kumpulan node ke berlangganan. Jika Anda ingin mengaktifkan fitur auto scaling untuk kumpulan node yang ada, pastikan bahwa kumpulan node tidak memiliki node berlangganan.

  • Fitur penskalaan node tidak kompatibel dengan SideCar Containers. Terapkan beban kerja menggunakan SideCar Containers ke kumpulan node dengan auto scaling dinonaktifkan.

Pemeliharaan sumber daya dependen

Jika elastic IP addresses (EIPs) terkait dengan node ECS yang ditambahkan oleh fitur penskalaan node, jangan langsung hapus node ECS di konsol ECS. Jika tidak, EIP tidak dapat dilepaskan secara otomatis.

Bacaan lebih lanjut

Jika Anda mengalami masalah saat menggunakan penskalaan node, lihat FAQ penskalaan node untuk pemecahan masalah.

Perluas untuk Melihat Indeks FAQ Penskalaan Node

Kategori

Subkategori

Masalah

Perilaku penskalaan auto scaling node

Batasan

Perilaku scale-out

Perilaku scale-in

Dukungan tambahan

Apakah cluster-autoscaler mendukung CRD?

Perilaku penskalaan kustom

Gunakan pod untuk mengelola penskalaan

Gunakan node untuk mengelola penskalaan

Pertanyaan terkait cluster-autoscaler