Penjelasan Auto Scaling: arsitektur beban kerja dinamis & stabil - Auto Scaling - Alibaba Cloud - Auto Scaling

Auto Scaling secara otomatis menyesuaikan jumlah instans Elastic Compute Service (ECS) dan instans kontainer elastis sebagai respons terhadap perubahan beban kerja, sehingga mengurangi kebutuhan intervensi manual. Halaman ini menjelaskan empat skenario umum untuk membantu Anda memilih pendekatan penskalaan yang tepat sesuai situasi Anda.

Menangani lonjakan traffic yang tidak dapat diprediksi

Permasalahan: Situs berita mengalami lonjakan tampilan halaman saat berita penting muncul, lalu menurun seiring minat terhadap berita tersebut memudar. Lonjakan traffic ini tidak dapat diantisipasi, sehingga penyesuaian jumlah instans secara manual menjadi tidak praktis dan rentan kesalahan.

Solusi: Buat tugas berbasis peristiwa untuk memantau metrik seperti utilisasi CPU. Auto Scaling merespons secara otomatis berdasarkan hasil pemantauan tersebut.

Dua konfigurasi umum:

Aturan penskalaan simple (dua tugas): Jika utilisasi CPU mencapai 70% atau lebih, tambahkan tiga instans ke grup penskalaan. Jika turun di bawah 30%, hapus tiga instans.
Aturan penskalaan target tracking (satu tugas): Tetapkan target utilisasi CPU sebesar 50%. Auto Scaling menyesuaikan jumlah instans agar tetap mempertahankan target tersebut.

Menangani pola traffic yang dapat diprediksi

Permasalahan: Perusahaan game secara konsisten mengalami lonjakan permintaan setiap hari antara pukul 18.00 hingga 22.00. Penskalaan manual sebelum jam sibuk dan penskalaan turun setelahnya bersifat repetitif dan mudah terlupa.

Solusi: Buat Tugas terjadwal untuk menambah dan melepas instans pada waktu tetap setiap hari.

Contoh konfigurasi:

Pada pukul 17.55, Tugas terjadwal memicu aturan penskalaan simple yang menambah tiga instans—memberi waktu bagi instans tersebut untuk siap sebelum jam sibuk dimulai pukul 18.00.
Pada pukul 22.05, Tugas terjadwal kedua memicu aturan penskalaan simple yang menghapus ketiga instans tersebut begitu jam sepi dimulai.

Konfigurasi ini memastikan kapasitas tersedia saat traffic datang dan dilepas saat tidak lagi diperlukan, tanpa adanya instans menganggur semalaman.

Mempertahankan ketersediaan tinggi dengan beban kerja stabil

Permasalahan: Perusahaan telekomunikasi menjalankan beban kerja yang stabil tanpa variasi traffic signifikan—namun jika suatu instans gagal secara tak terduga, tim mungkin tidak segera menyadarinya, sehingga menyebabkan gangguan layanan.

Solusi: Aktifkan Pemeriksaan kesehatan di grup penskalaan Anda. Auto Scaling terus-menerus memantau kesehatan instans. Saat mendeteksi instans yang tidak sehat, sistem secara otomatis membuat penggantinya agar layanan tetap berjalan.

Tetapkan jumlah minimum instans dalam grup penskalaan Anda. Auto Scaling memastikan jumlah instans dalam grup tidak pernah turun di bawah angka tersebut, sehingga memberikan jaminan garis dasar ketersediaan.

Menangani pola traffic campuran dan kompleks

Permasalahan: Perusahaan menjalankan traffic harian yang stabil tetapi kadang mengalami lonjakan permintaan. Perusahaan tersebut sudah memiliki instans subscription dan hanya perlu menambah kapasitas saat beban meningkat—bukan mengganti armada yang sudah ada.

Solusi: Tambahkan secara manual instans subscription Anda ke dalam grup penskalaan, lalu konfigurasikan tugas berbasis peristiwa untuk memantau utilisasi CPU dan melakukan penskalaan sesuai kebutuhan. Auto Scaling menjaga instans subscription tetap berjalan dan hanya menambah atau menghapus instans tambahan saat diperlukan.

Untuk kebutuhan yang lebih kompleks, gabungkan beberapa fitur secara bersamaan:

Tugas terjadwal untuk periode puncak yang dapat diprediksi
Tugas berbasis peristiwa untuk lonjakan tak terduga
Pemeriksaan kesehatan untuk ketersediaan berkelanjutan

Penggunaan fitur-fitur ini secara bersamaan memungkinkan Anda mengatasi berbagai kondisi traffic sekaligus meminimalkan biaya dan upaya manual.