Solusi penskalaan untuk workload dan sumber daya komputasi di kluster ACK - Container Service for Kubernetes

Catatan penggunaan

Sebelum mengonfigurasi penskalaan workload dan penskalaan node, pahami terlebih dahulu solusi komunitas seperti Horizontal Pod Autoscaler (HPA), Vertical Pod Autoscaler (VPA), dan Cluster Autoscaling.
Jika kluster Anda memiliki lebih dari 500 node atau 10.000 pod, lihat Rencanakan laju penskalaan untuk memastikan stabilitas kluster dan lapisan kontrol.

Penskalaan workload dan penskalaan sumber daya komputasi

Penyesuaian skala otomatis ACK beroperasi pada dua lapisan:

Penskalaan workload: Menyesuaikan jumlah pod atau alokasi sumber daya per pod pada lapisan penjadwalan. Sebagai contoh, HPA menskalakan pod aplikasi berdasarkan perubahan lalu lintas.
Penskalaan sumber daya komputasi: Menyesuaikan sumber daya kluster melalui penskalaan node dan penskalaan node virtual berdasarkan penjadwalan pod dan penggunaan sumber daya.

Kombinasikan kedua lapisan tersebut untuk meningkatkan pemanfaatan sumber daya sekaligus memenuhi kebutuhan penjadwalan pod.

Penskalaan workload solutions

Untuk penskalaan sementara, jalankan kubectl scale untuk menyesuaikan jumlah pod secara manual. Untuk penskalaan otomatis, pilih salah satu solusi penskalaan workload berikut.

Solusi	Deskripsi	Metrik penskalaan	Skenario	Referensi
HPA	HPA memperluas kapasitas pod saat beban puncak dan mengurangi kapasitas saat beban rendah untuk mengoptimalkan biaya. Cocok untuk sebagian besar skenario.	Metrik sumber daya seperti pemanfaatan CPU dan memori Metrik kustom	Ideal untuk layanan online dengan fluktuasi lalu lintas yang sering, seperti e-commerce, pendidikan daring, dan layanan keuangan.	Gunakan Horizontal Pod Autoscaler (HPA)
CronHPA	CronHPA menskalakan pod sesuai jadwal pratinjau mirip Crontab dengan dukungan zona waktu dan tanggal. Tanggal tertentu seperti hari libur dapat dikecualikan. Kompatibel dengan HPA.	Penskalaan terjadwal	Ideal untuk aplikasi dengan pola lalu lintas yang dapat diprediksi atau tugas terjadwal.	Gunakan CronHPA Buat CronHPA kompatibel dengan HPA
VPA	VPA memantau konsumsi sumber daya pod, merekomendasikan alokasi CPU dan memori, serta menyesuaikan alokasi tanpa mengubah jumlah replika.	VPA merekomendasikan dan secara opsional menyesuaikan permintaan dan batas CPU serta memori untuk pod.	Ideal untuk alokasi sumber daya yang stabil, seperti aplikasi berstatus dan penerapan monolitik berskala besar. VPA biasanya berlaku saat pod pulih dari anomali.	Vertical Pod Autoscaler (VPA)
Kubernetes-based Event Driven Autoscaling (KEDA)	KEDA memungkinkan penskalaan otomatis berbasis event untuk workload dari berbagai sumber event.	Jumlah event, seperti panjang antrian.	Ideal untuk pekerjaan offline berbasis event yang memerlukan penskalaan instan, seperti transkoding video dan audio, pekerjaan berbasis event, dan pemrosesan aliran.	Penskalaan otomatis berbasis event
Advanced Horizontal Pod Autoscaler (AHPA)	AHPA mempelajari pola fluktuasi workload dari metrik historis untuk memprediksi permintaan sumber daya dan mengaktifkan penskalaan prediktif.	Metrik sumber daya seperti pemanfaatan CPU, memori, dan GPU Metrik lalu lintas seperti permintaan per detik (QPS) dan waktu respons (RT) Metrik kustom lainnya	Ideal untuk pola lalu lintas periodik, seperti siaran langsung, pendidikan daring, dan gaming.	Prediksi Penyesuaian Skala Otomatis (AHPA)

Kontroler UnitedDeployment mengelola workload jenis yang sama di beberapa subset dengan penyesuaian replika per subset. Gabungkan dengan solusi penskalaan di atas untuk penskalaan fleksibel di berbagai jenis sumber daya komputasi. Lihat Terapkan penskalaan workload berdasarkan kontroler UnitedDeployment.

Penskalaan sumber daya komputasi

Komponen penskalaan sumber daya komputasi mendeteksi pod yang tertunda dan menyediakan node ECS atau instance kontainer elastis untuk memenuhi kebutuhan penjadwalan.

Untuk perbandingan penskalaan node, lihat Penskalaan node.

Penting

Statistik pengiriman sumber daya dalam tabel berikut bersifat teoretis. Nilai aktual dapat bervariasi tergantung lingkungan.

Solusi	Deskripsi	Skenario	Efisiensi pengiriman sumber daya	Referensi
Node auto scaling	ACK secara otomatis menskalakan node ketika sumber daya kluster tidak dapat memenuhi penjadwalan pod.	Cocok untuk semua skenario, terutama layanan online, tugas pembelajaran mendalam, dan penskalaan skala kecil. Direkomendasikan untuk kluster dengan kurang dari 20 kelompok node penskalaan otomatis atau kelompok node dengan kurang dari 100 node.	Waktu yang dibutuhkan untuk menambahkan 100 node ke kluster: Mode standar: 120 detik. Mode cepat: 60 detik. Mode standar dengan image yang mendukung quick boot (Qboot): 90 detik. Mode standar dengan image yang mendukung Quick Boot (Qboot): 45 detik.	Aktifkan node autoscaling
Node instant scaling	Node instant scaling menawarkan penskalaan lebih cepat, tingkat keberhasilan pengiriman lebih tinggi, dan pemantauan kesehatan inventaris instance ECS dibandingkan node auto scaling. Lihat Perbandingan solusi.	Cocok untuk semua skenario, terutama kluster berskala besar yang memerlukan penskalaan lebih cepat, penskalaan multi-tipe-instans dan multi-zona, atau penjadwalan lanjutan seperti batasan penyebaran topologi. Kluster dianggap besar jika ada kelompok node penskalaan otomatis dengan lebih dari 100 node atau kluster memiliki lebih dari 20 kelompok node penskalaan otomatis.	Waktu yang dibutuhkan untuk menambahkan 100 node ke kluster: ContainerOS dalam mode cepat: 45 detik. Mode standar: 103 detik. Belum didukung	Aktifkan node instant scaling Lihat status kesehatan node instant scaling
Virtual nodes	Virtual nodes menghilangkan manajemen node dan perencanaan kapasitas. Kluster mendukung hingga 50.000 pod pada virtual nodes, dengan hingga 10.000 pod dapat dibuat dalam 1 menit selama skala keluar.	Cocok untuk semua skenario, terutama tugas, tugas terjadwal, komputasi data, aplikasi AI, dan lonjakan workload.	Waktu yang dibutuhkan untuk membuat 1.000 pod dalam kluster: Saat caching image dinonaktifkan: 30 detik. Saat caching image diaktifkan: 15 detik.	Jadwalkan pod untuk berjalan di ECI

Penagihan

Penyesuaian skala otomatis itu sendiri gratis. Komponen penskalaan berjalan sebagai pod, sehingga kluster Anda harus memiliki setidaknya satu node. Anda dikenai biaya untuk node yang ditambahkan melalui penyesuaian skala otomatis. Lihat Ikhtisar penagihan.

FAQ

Lihat FAQ Penyesuaian Skala Otomatis.

Klik untuk melihat indeks FAQ node auto scaling

Kategori	Subkategori	Tautan
Perilaku penskalaan node auto scaling	Batasan yang diketahui
	Perilaku skala keluar	Kebijakan penjadwalan apa yang digunakan cluster-autoscaler untuk menentukan apakah pod yang tidak dapat dijadwalkan dapat dijadwalkan ke kelompok node dengan penskalaan otomatis diaktifkan? Sumber daya apa saja yang dapat disimulasikan oleh cluster-autoscaler untuk analisis penjadwalan? Mengapa add-on node auto scaling gagal melakukan skala keluar node? Bagaimana autoscaler menghitung sumber daya grup penskalaan yang berisi beberapa tipe instans? Selama skala keluar, bagaimana autoscaler memilih antara beberapa kelompok node yang diaktifkan? Bagaimana cara mengonfigurasi resource kustom untuk kelompok node dengan penskalaan otomatis diaktifkan? Mengapa pengaktifan penskalaan otomatis untuk kelompok node gagal?
	Perilaku skala-masuk	Mengapa cluster-autoscaler gagal melakukan skala-masuk node? Bagaimana cara mengaktifkan atau menonaktifkan eviction untuk DaemonSet tertentu? Jenis pod apa saja yang dapat mencegah cluster-autoscaler menghapus node?
	Dukungan ekstensi	Apakah cluster-autoscaler mendukung CustomResourceDefinitions (CRDs)?
Perilaku penskalaan kustom	Kontrol perilaku penskalaan menggunakan pod	Bagaimana cara menunda respons skala keluar cluster-autoscaler terhadap pod yang tidak dapat dijadwalkan?
Perilaku penskalaan kustom	Kontrol perilaku penskalaan menggunakan node	Bagaimana cara mencegah node tertentu dari skala-masuk oleh cluster-autoscaler? Bagaimana cara memengaruhi skala-masuk node menggunakan anotasi pod?
komponen cluster-autoscaler		Bagaimana cara memutakhirkan cluster-autoscaler ke versi terbaru? Operasi apa saja yang memicu pembaruan otomatis cluster-autoscaler? Mengapa penskalaan node gagal di kluster ACK yang dikelola saya meskipun izin peran yang diperlukan telah diberikan?

Klik untuk melihat indeks FAQ node instant scaling

Kategori	Subkategori	Tautan
Perilaku Node instant scaling	Batasan yang diketahui
	Perilaku skala keluar	Jenis sumber daya apa yang digunakan node instant scaling untuk simulasi penskalaan? Apakah node instant scaling memilih tipe instans yang sesuai dari kelompok node berdasarkan permintaan sumber daya pod? Bagaimana node instant scaling memilih tipe instans dari kelompok node dengan beberapa tipe? Bagaimana cara memantau inventaris tipe instans di kelompok node saat menggunakan node instant scaling? Bagaimana cara mengoptimalkan konfigurasi kelompok node untuk menghindari kegagalan skala keluar akibat inventaris tidak mencukupi? Mengapa node instant scaling gagal melakukan skala keluar node? Bagaimana cara mengonfigurasi resource kustom untuk kelompok node dengan node instant scaling diaktifkan?
	Perilaku skala-masuk	Mengapa node instant scaling gagal melakukan skala-masuk node? Jenis pod apa saja yang dapat mencegah node instant scaling menghapus node?
Perilaku penskalaan kustom	Mengontrol penskalaan dengan pod	Bagaimana cara mengontrol skala-masuk node menggunakan pod?
Perilaku penskalaan kustom	Mengontrol penskalaan dengan node	Bagaimana cara menentukan node mana yang akan dihapus selama skala-masuk? Bagaimana cara mencegah node tertentu dari skala-masuk? Apakah node instant scaling dapat dikonfigurasi hanya untuk menskalakan-masuk node kosong?
Add-on Node instant scaling		Apakah add-on node instant scaling diperbarui secara otomatis? Mengapa penskalaan node gagal di kluster ACK yang dikelola saya setelah izin yang diperlukan diberikan?

Klik untuk melihat indeks FAQ penskalaan workload (termasuk HPA dan CronHPA)

Referensi

Untuk penskalaan pra-instalasi atau berkinerja-tinggi, lihat Image kustom untuk optimalisasi penskalaan.
Untuk mengumpulkan log penyesuaian skala otomatis, lihat Kumpulkan file log komponen sistem.
Ikuti Konfigurasi workload yang direkomendasikan saat mengonfigurasi workload Anda.
Untuk kontainer arsitektur tanpa server, Knative menskalakan pod berdasarkan jumlah permintaan dan konkurensi, termasuk skala-ke-nol. Lihat Aktifkan penyesuaian skala otomatis untuk mengatasi fluktuasi lalu lintas.