All Products
Search
Document Center

Container Service for Kubernetes:Ikhtisar Penyesuaian Skala Otomatis

Last Updated:Jun 18, 2026

Penskalaan workload dan penskalaan sumber daya komputasi secara dinamis menyesuaikan replika pod dan kapasitas kluster untuk mengatasi lonjakan lalu lintas serta mengurangi biaya.

Catatan penggunaan

Penskalaan workload dan penskalaan sumber daya komputasi

Penyesuaian skala otomatis ACK beroperasi pada dua lapisan:

  • Penskalaan workload: Menyesuaikan jumlah pod atau alokasi sumber daya per pod pada lapisan penjadwalan. Sebagai contoh, HPA menskalakan pod aplikasi berdasarkan perubahan lalu lintas.

  • Penskalaan sumber daya komputasi: Menyesuaikan sumber daya kluster melalui penskalaan node dan penskalaan node virtual berdasarkan penjadwalan pod dan penggunaan sumber daya.

Kombinasikan kedua lapisan tersebut untuk meningkatkan pemanfaatan sumber daya sekaligus memenuhi kebutuhan penjadwalan pod.

Penskalaan workload solutions

Untuk penskalaan sementara, jalankan kubectl scale untuk menyesuaikan jumlah pod secara manual. Untuk penskalaan otomatis, pilih salah satu solusi penskalaan workload berikut.

Solusi

Deskripsi

Metrik penskalaan

Skenario

Referensi

HPA

HPA memperluas kapasitas pod saat beban puncak dan mengurangi kapasitas saat beban rendah untuk mengoptimalkan biaya. Cocok untuk sebagian besar skenario.

  • Metrik sumber daya seperti pemanfaatan CPU dan memori

  • Metrik kustom

Ideal untuk layanan online dengan fluktuasi lalu lintas yang sering, seperti e-commerce, pendidikan daring, dan layanan keuangan.

Gunakan Horizontal Pod Autoscaler (HPA)

CronHPA

CronHPA menskalakan pod sesuai jadwal pratinjau mirip Crontab dengan dukungan zona waktu dan tanggal. Tanggal tertentu seperti hari libur dapat dikecualikan. Kompatibel dengan HPA.

Penskalaan terjadwal

Ideal untuk aplikasi dengan pola lalu lintas yang dapat diprediksi atau tugas terjadwal.

VPA

VPA memantau konsumsi sumber daya pod, merekomendasikan alokasi CPU dan memori, serta menyesuaikan alokasi tanpa mengubah jumlah replika.

VPA merekomendasikan dan secara opsional menyesuaikan permintaan dan batas CPU serta memori untuk pod.

Ideal untuk alokasi sumber daya yang stabil, seperti aplikasi berstatus dan penerapan monolitik berskala besar. VPA biasanya berlaku saat pod pulih dari anomali.

Vertical Pod Autoscaler (VPA)

Kubernetes-based Event Driven Autoscaling (KEDA)

KEDA memungkinkan penskalaan otomatis berbasis event untuk workload dari berbagai sumber event.

Jumlah event, seperti panjang antrian.

Ideal untuk pekerjaan offline berbasis event yang memerlukan penskalaan instan, seperti transkoding video dan audio, pekerjaan berbasis event, dan pemrosesan aliran.

Penskalaan otomatis berbasis event

Advanced Horizontal Pod Autoscaler (AHPA)

AHPA mempelajari pola fluktuasi workload dari metrik historis untuk memprediksi permintaan sumber daya dan mengaktifkan penskalaan prediktif.

  • Metrik sumber daya seperti pemanfaatan CPU, memori, dan GPU

  • Metrik lalu lintas seperti permintaan per detik (QPS) dan waktu respons (RT)

  • Metrik kustom lainnya

Ideal untuk pola lalu lintas periodik, seperti siaran langsung, pendidikan daring, dan gaming.

Prediksi Penyesuaian Skala Otomatis (AHPA)

Kontroler UnitedDeployment mengelola workload jenis yang sama di beberapa subset dengan penyesuaian replika per subset. Gabungkan dengan solusi penskalaan di atas untuk penskalaan fleksibel di berbagai jenis sumber daya komputasi. Lihat Terapkan penskalaan workload berdasarkan kontroler UnitedDeployment.

Penskalaan sumber daya komputasi

Komponen penskalaan sumber daya komputasi mendeteksi pod yang tertunda dan menyediakan node ECS atau instance kontainer elastis untuk memenuhi kebutuhan penjadwalan.

Untuk perbandingan penskalaan node, lihat Penskalaan node.

Penting

Statistik pengiriman sumber daya dalam tabel berikut bersifat teoretis. Nilai aktual dapat bervariasi tergantung lingkungan.

Solusi

Deskripsi

Skenario

Efisiensi pengiriman sumber daya

Referensi

Node auto scaling

ACK secara otomatis menskalakan node ketika sumber daya kluster tidak dapat memenuhi penjadwalan pod.

Cocok untuk semua skenario, terutama layanan online, tugas pembelajaran mendalam, dan penskalaan skala kecil. Direkomendasikan untuk kluster dengan kurang dari 20 kelompok node penskalaan otomatis atau kelompok node dengan kurang dari 100 node.

Waktu yang dibutuhkan untuk menambahkan 100 node ke kluster:

Aktifkan node autoscaling

Node instant scaling

Node instant scaling menawarkan penskalaan lebih cepat, tingkat keberhasilan pengiriman lebih tinggi, dan pemantauan kesehatan inventaris instance ECS dibandingkan node auto scaling. Lihat Perbandingan solusi.

Cocok untuk semua skenario, terutama kluster berskala besar yang memerlukan penskalaan lebih cepat, penskalaan multi-tipe-instans dan multi-zona, atau penjadwalan lanjutan seperti batasan penyebaran topologi. Kluster dianggap besar jika ada kelompok node penskalaan otomatis dengan lebih dari 100 node atau kluster memiliki lebih dari 20 kelompok node penskalaan otomatis.

Waktu yang dibutuhkan untuk menambahkan 100 node ke kluster:

Virtual nodes

Virtual nodes menghilangkan manajemen node dan perencanaan kapasitas. Kluster mendukung hingga 50.000 pod pada virtual nodes, dengan hingga 10.000 pod dapat dibuat dalam 1 menit selama skala keluar.

Cocok untuk semua skenario, terutama tugas, tugas terjadwal, komputasi data, aplikasi AI, dan lonjakan workload.

Waktu yang dibutuhkan untuk membuat 1.000 pod dalam kluster:

  • Saat caching image dinonaktifkan: 30 detik.

  • Saat caching image diaktifkan: 15 detik.

Jadwalkan pod untuk berjalan di ECI

Penagihan

Penyesuaian skala otomatis itu sendiri gratis. Komponen penskalaan berjalan sebagai pod, sehingga kluster Anda harus memiliki setidaknya satu node. Anda dikenai biaya untuk node yang ditambahkan melalui penyesuaian skala otomatis. Lihat Ikhtisar penagihan.

FAQ

Lihat FAQ Penyesuaian Skala Otomatis.

Klik untuk melihat indeks FAQ node auto scaling

Kategori

Subkategori

Tautan

Perilaku penskalaan node auto scaling

Batasan yang diketahui

Perilaku skala keluar

Perilaku skala-masuk

Dukungan ekstensi

Apakah cluster-autoscaler mendukung CustomResourceDefinitions (CRDs)?

Perilaku penskalaan kustom

Kontrol perilaku penskalaan menggunakan pod

Kontrol perilaku penskalaan menggunakan node

komponen cluster-autoscaler

Klik untuk melihat indeks FAQ node instant scaling

Kategori

Subkategori

Tautan

Perilaku Node instant scaling

Batasan yang diketahui

Perilaku skala keluar

Perilaku skala-masuk

Perilaku penskalaan kustom

Mengontrol penskalaan dengan pod

Bagaimana cara mengontrol skala-masuk node menggunakan pod?

Mengontrol penskalaan dengan node

Add-on Node instant scaling

Referensi