Penskalaan workload dan penskalaan sumber daya komputasi secara dinamis menyesuaikan replika pod dan kapasitas kluster untuk mengatasi lonjakan lalu lintas serta mengurangi biaya.
Catatan penggunaan
-
Sebelum mengonfigurasi penskalaan workload dan penskalaan node, pahami terlebih dahulu solusi komunitas seperti Horizontal Pod Autoscaler (HPA), Vertical Pod Autoscaler (VPA), dan Cluster Autoscaling.
-
Jika kluster Anda memiliki lebih dari 500 node atau 10.000 pod, lihat Rencanakan laju penskalaan untuk memastikan stabilitas kluster dan lapisan kontrol.
Penskalaan workload dan penskalaan sumber daya komputasi
Penyesuaian skala otomatis ACK beroperasi pada dua lapisan:
-
Penskalaan workload: Menyesuaikan jumlah pod atau alokasi sumber daya per pod pada lapisan penjadwalan. Sebagai contoh, HPA menskalakan pod aplikasi berdasarkan perubahan lalu lintas.
-
Penskalaan sumber daya komputasi: Menyesuaikan sumber daya kluster melalui penskalaan node dan penskalaan node virtual berdasarkan penjadwalan pod dan penggunaan sumber daya.
Kombinasikan kedua lapisan tersebut untuk meningkatkan pemanfaatan sumber daya sekaligus memenuhi kebutuhan penjadwalan pod.
Penskalaan workload solutions
Untuk penskalaan sementara, jalankan kubectl scale untuk menyesuaikan jumlah pod secara manual. Untuk penskalaan otomatis, pilih salah satu solusi penskalaan workload berikut.
|
Solusi |
Deskripsi |
Metrik penskalaan |
Skenario |
Referensi |
|
HPA |
HPA memperluas kapasitas pod saat beban puncak dan mengurangi kapasitas saat beban rendah untuk mengoptimalkan biaya. Cocok untuk sebagian besar skenario. |
|
Ideal untuk layanan online dengan fluktuasi lalu lintas yang sering, seperti e-commerce, pendidikan daring, dan layanan keuangan. |
|
|
CronHPA |
CronHPA menskalakan pod sesuai jadwal pratinjau mirip Crontab dengan dukungan zona waktu dan tanggal. Tanggal tertentu seperti hari libur dapat dikecualikan. Kompatibel dengan HPA. |
Penskalaan terjadwal |
Ideal untuk aplikasi dengan pola lalu lintas yang dapat diprediksi atau tugas terjadwal. |
|
|
VPA |
VPA memantau konsumsi sumber daya pod, merekomendasikan alokasi CPU dan memori, serta menyesuaikan alokasi tanpa mengubah jumlah replika. |
VPA merekomendasikan dan secara opsional menyesuaikan permintaan dan batas CPU serta memori untuk pod. |
Ideal untuk alokasi sumber daya yang stabil, seperti aplikasi berstatus dan penerapan monolitik berskala besar. VPA biasanya berlaku saat pod pulih dari anomali. |
|
|
Kubernetes-based Event Driven Autoscaling (KEDA) |
KEDA memungkinkan penskalaan otomatis berbasis event untuk workload dari berbagai sumber event. |
Jumlah event, seperti panjang antrian. |
Ideal untuk pekerjaan offline berbasis event yang memerlukan penskalaan instan, seperti transkoding video dan audio, pekerjaan berbasis event, dan pemrosesan aliran. |
|
|
Advanced Horizontal Pod Autoscaler (AHPA) |
AHPA mempelajari pola fluktuasi workload dari metrik historis untuk memprediksi permintaan sumber daya dan mengaktifkan penskalaan prediktif. |
|
Ideal untuk pola lalu lintas periodik, seperti siaran langsung, pendidikan daring, dan gaming. |
Kontroler UnitedDeployment mengelola workload jenis yang sama di beberapa subset dengan penyesuaian replika per subset. Gabungkan dengan solusi penskalaan di atas untuk penskalaan fleksibel di berbagai jenis sumber daya komputasi. Lihat Terapkan penskalaan workload berdasarkan kontroler UnitedDeployment.
Penskalaan sumber daya komputasi
Komponen penskalaan sumber daya komputasi mendeteksi pod yang tertunda dan menyediakan node ECS atau instance kontainer elastis untuk memenuhi kebutuhan penjadwalan.
Untuk perbandingan penskalaan node, lihat Penskalaan node.
Statistik pengiriman sumber daya dalam tabel berikut bersifat teoretis. Nilai aktual dapat bervariasi tergantung lingkungan.
|
Solusi |
Deskripsi |
Skenario |
Efisiensi pengiriman sumber daya |
Referensi |
|
Node auto scaling |
ACK secara otomatis menskalakan node ketika sumber daya kluster tidak dapat memenuhi penjadwalan pod. |
Cocok untuk semua skenario, terutama layanan online, tugas pembelajaran mendalam, dan penskalaan skala kecil. Direkomendasikan untuk kluster dengan kurang dari 20 kelompok node penskalaan otomatis atau kelompok node dengan kurang dari 100 node. |
Waktu yang dibutuhkan untuk menambahkan 100 node ke kluster:
|
|
|
Node instant scaling |
Node instant scaling menawarkan penskalaan lebih cepat, tingkat keberhasilan pengiriman lebih tinggi, dan pemantauan kesehatan inventaris instance ECS dibandingkan node auto scaling. Lihat Perbandingan solusi. |
Cocok untuk semua skenario, terutama kluster berskala besar yang memerlukan penskalaan lebih cepat, penskalaan multi-tipe-instans dan multi-zona, atau penjadwalan lanjutan seperti batasan penyebaran topologi. Kluster dianggap besar jika ada kelompok node penskalaan otomatis dengan lebih dari 100 node atau kluster memiliki lebih dari 20 kelompok node penskalaan otomatis. |
Waktu yang dibutuhkan untuk menambahkan 100 node ke kluster:
|
|
|
Virtual nodes |
Virtual nodes menghilangkan manajemen node dan perencanaan kapasitas. Kluster mendukung hingga 50.000 pod pada virtual nodes, dengan hingga 10.000 pod dapat dibuat dalam 1 menit selama skala keluar. |
Cocok untuk semua skenario, terutama tugas, tugas terjadwal, komputasi data, aplikasi AI, dan lonjakan workload. |
Waktu yang dibutuhkan untuk membuat 1.000 pod dalam kluster:
|
Penagihan
Penyesuaian skala otomatis itu sendiri gratis. Komponen penskalaan berjalan sebagai pod, sehingga kluster Anda harus memiliki setidaknya satu node. Anda dikenai biaya untuk node yang ditambahkan melalui penyesuaian skala otomatis. Lihat Ikhtisar penagihan.
FAQ
Lihat FAQ Penyesuaian Skala Otomatis.
Referensi
-
Untuk penskalaan pra-instalasi atau berkinerja-tinggi, lihat Image kustom untuk optimalisasi penskalaan.
-
Untuk mengumpulkan log penyesuaian skala otomatis, lihat Kumpulkan file log komponen sistem.
-
Ikuti Konfigurasi workload yang direkomendasikan saat mengonfigurasi workload Anda.
-
Untuk kontainer arsitektur tanpa server, Knative menskalakan pod berdasarkan jumlah permintaan dan konkurensi, termasuk skala-ke-nol. Lihat Aktifkan penyesuaian skala otomatis untuk mengatasi fluktuasi lalu lintas.