Penskalaan otomatis adalah layanan manajemen yang secara dinamis menyesuaikan sumber daya komputasi untuk memenuhi kebutuhan bisnis Anda. Layanan ini cocok untuk beban kerja online, tugas komputasi dan pelatihan berskala besar, tugas pembelajaran mendalam berakselerasi GPU, serta tugas inferensi model dan pelatihan model yang menggunakan GPU bersama. Topik ini menjelaskan solusi penskalaan otomatis yang didukung oleh ACK Serverless clusters.
Solusi | Ikhtisar | Metrik Penskalaan | Skenario | Jenis Sumber Daya yang Didukung | Referensi |
HPA | Untuk Kubernetes, Horizontal Pod Autoscaler (HPA) merupakan solusi yang paling umum digunakan untuk penskalaan pod secara otomatis. HPA dapat dengan cepat menambahkan replika pod guna menangani beban tinggi saat permintaan meningkat dan mengurangi replika secara tepat untuk menghemat sumber daya ketika permintaan menurun. |
| Bisnis dengan fluktuasi permintaan layanan yang besar, beragam layanan, dan kebutuhan penskalaan yang sering, seperti e-commerce, pendidikan online, dan layanan keuangan. | Objek seperti Deployments dan StatefulSets yang kompatibel dengan antarmuka | |
CronHPA | Cron Horizontal Pod Autoscaler (CronHPA) menskalakan pod dalam kluster berdasarkan jadwal yang mirip dengan crontab. Fitur ini mendukung konfigurasi zona waktu, tanggal eksekusi, serta tanggal pengecualian (seperti hari libur) dan dapat bekerja sama dengan HPA. | Penjadwalan Penskalaan. | Trafik bisnis mengalami periode puncak yang signifikan, atau aplikasi perlu menjalankan tugas pada waktu tertentu. | Sumber daya seperti Deployments dan StatefulSets. | |
VPA | Vertical Pod Autoscaler (VPA) memantau penggunaan sumber daya pod, memberikan rekomendasi alokasi CPU dan memori yang optimal, serta menyesuaikan pengaturan tersebut secara otomatis sesuai kebutuhan tanpa mengubah jumlah replika pod. | VPA merekomendasikan serta menyesuaikan secara otomatis permintaan dan batas untuk sumber daya CPU dan memori pada kontainer pod. | Aplikasi berstatus atau aplikasi monolitik yang membutuhkan pasokan sumber daya stabil. Biasanya, VPA digunakan saat pod pulih dari anomali. | Sumber daya seperti Deployments, DaemonSets, dan StatefulSets tersedia. | |
AHPA | Advanced Horizontal Pod Autoscaler (AHPA) secara otomatis mengidentifikasi fluktuasi beban kerja serta memprediksi permintaan sumber daya berdasarkan data metrik historis, membantu Anda menerapkan penskalaan prediktif. |
| Aplikasi dengan beban kerja periodik, seperti streaming langsung, pendidikan online, dan aplikasi game. | Sumber daya seperti Deployments dan Knative Services. |