All Products
Search
Document Center

Server Load Balancer:Gunakan Auto Scaling untuk menambah atau menghapus server backend secara otomatis untuk ALB

Last Updated:Apr 04, 2026

Anda dapat mengaitkan Auto Scaling dengan kelompok server dari instans Application Load Balancer (ALB). Dengan mengonfigurasi tugas berbasis peristiwa, jumlah instans ECS dalam kelompok server dapat disesuaikan secara otomatis. Hal ini meningkatkan ketersediaan tinggi layanan ALB dan mengurangi biaya resource.

Contoh skenario

Situs berita mengalami lonjakan trafik mendadak setelah menerbitkan berita utama. Server yang tersedia tidak mampu menangani volume permintaan yang tinggi, sehingga halaman berita menjadi tidak responsif. Setelah minat terhadap berita tersebut memudar, trafik kembali normal dan halaman dimuat dengan lancar. Karena waktu terjadinya lonjakan dan penurunan trafik tidak dapat diprediksi, sulit untuk menyesuaikan jumlah instans secara manual tepat waktu. Jumlah instans yang dibutuhkan juga tidak pasti, sehingga menyulitkan upaya menjaga ketersediaan layanan situs web.

Untuk mengatasi skenario ini, Anda dapat menggunakan tugas berbasis peristiwa dalam Auto Scaling. CloudMonitor secara otomatis menyesuaikan resource elastis berdasarkan metrik seperti utilisasi CPU dan mengaitkannya dengan kelompok server ALB. Setelah grup penskalaan dikaitkan dengan kelompok server instans ALB, setiap instans ECS yang ditambahkan atau dihapus dari grup penskalaan—baik secara otomatis maupun manual—akan secara otomatis ditambahkan atau dihapus dari kelompok server ALB. Instans ALB kemudian menggunakan resource ECS tersebut berdasarkan kebijakan distribusi trafik dan pemeriksaan kesehatan, sehingga meningkatkan ketersediaan dan elastisitas resource.

Topik ini memberikan contoh di mana instans ALB mendistribusikan permintaan klien ke server backend, ECS01, berdasarkan aturan pengalihan. Anda membuat grup penskalaan dan mengonfigurasi tugas berbasis peristiwa. Ketika utilisasi CPU ECS01 melebihi ambang batas tertentu, instans ECS baru secara otomatis dibuat dan ditambahkan ke kelompok server. Ketika utilisasi CPU turun di bawah ambang batas lain yang telah ditentukan, instans tambahan tersebut secara otomatis dihapus dari kelompok server dan dilepas.

Prasyarat

  • Anda memiliki satu atau beberapa instans ALB yang berada dalam status Active. Untuk informasi selengkapnya, lihat Buat dan kelola instans ALB.

  • Kelompok server bernama RS1 telah dibuat untuk instans ALB dan instans ECS01 telah ditambahkan ke kelompok server tersebut. Kelompok server berada dalam status Available.

  • Anda telah membuat custom image dari instans ECS01. Untuk informasi selengkapnya, lihat Buat custom image dari instans.

  • Pemeriksaan kesehatan telah diaktifkan untuk instans ALB. Untuk informasi selengkapnya, lihat Pemeriksaan kesehatan untuk ALB.

  • Setidaknya satu listener telah dikonfigurasi untuk instans ALB. Untuk informasi selengkapnya, lihat Tambahkan listener HTTP.

  • Instans ALB dan grup penskalaan berada dalam VPC yang sama.

Langkah 1: Buat grup penskalaan

  1. Login ke Auto Scaling console.

  2. Di panel navigasi kiri, klik Scaling groups.

  3. Di bilah navigasi atas, pilih wilayah.

  4. Pada halaman Scaling groups, klik Create scaling group untuk membuka halaman Create scaling group.

    Konfigurasikan parameter seperti yang dijelaskan dalam tabel berikut. Untuk informasi lebih lanjut tentang parameter lainnya, lihat Buat grup penskalaan ECS.

    Parameter

    Deskripsi

    Instance Configuration Source

    Pilih Create from Scratch.

    Minimum Number of Instances

    Jika jumlah instans saat ini dalam grup penskalaan kurang dari nilai ini, Auto Scaling akan secara otomatis menambahkan instans hingga mencapai nilai tersebut. Untuk memastikan setidaknya instans ECS01 yang sudah ada tetap berjalan, atur nilai ini ke 1.

    Maximum Number of Instances

    Jika jumlah instans saat ini dalam grup penskalaan melebihi nilai ini, Auto Scaling akan secara otomatis menghapus instans hingga mencapai nilai tersebut. Untuk memungkinkan maksimal satu instans tambahan selain ECS01, atur nilai ini ke 2.

    Default cooldown (seconds)

    Periode setelah aktivitas penskalaan selesai, di mana grup penskalaan tidak akan memulai aktivitas penskalaan lainnya. Ini hanya berlaku untuk aktivitas penskalaan yang dipicu oleh tugas berbasis peristiwa dari CloudMonitor. Dalam contoh ini, atur nilainya ke 0. Sesuaikan nilai ini berdasarkan kebutuhan bisnis Anda.

    VPC dan vSwitch

    Pilih VPC dan vSwitch tempat instans ECS01 berada.

    Associated ALB, NLB, and GWLB Server Groups

    Pilih kelompok server yang sesuai, lalu konfigurasikan port dan bobot.

  5. Konfigurasikan opsi yang tersisa sesuai kebutuhan, lalu klik Create. Setelah grup penskalaan dibuat, Anda dapat melihatnya di halaman Scaling Groups.

Langkah 2: Buat konfigurasi penskalaan

  1. Di halaman Scaling Groups, temukan grup penskalaan yang telah Anda buat, lalu klik Details pada kolom Actions. Klik tab Instance Configuration Sources, lalu pilih Scaling Configurations.

  2. Di tab Scaling Configurations, klik Create Scaling Configuration. Konfigurasikan parameter seperti yang dijelaskan dalam tabel berikut. Untuk detail parameter lainnya yang harus Anda konfigurasi sesuai kebutuhan bisnis, lihat parameter konfigurasi penskalaan lainnya.

    Parameter

    Deskripsi

    Billing method

    Metode penagihan untuk instans ECS. Dalam contoh ini, pilih Pay-as-you-go.

    Select image

    Pilih custom image yang telah Anda buat dari instans ECS01.

    Instance Configuration Mode

    Dalam contoh ini, pilih Specify Instance Type.

    Select Instance Type

    Pilih tipe instans yang sama dengan instans ECS01.

    Security Group

    Pilih security group tempat instans ECS01 berada.

  3. Setelah menyelesaikan konfigurasi, klik Create, lalu klik Confirm.

  4. Pada kotak dialog Scaling configuration created, klik Enable Configuration. Pada kotak dialog berikutnya, aktifkan konfigurasi penskalaan dan grup penskalaan.

Langkah 3: Buat aturan penskalaan

  1. Di halaman Scaling Groups, temukan grup penskalaan, lalu klik Details pada kolom Actions. Klik tab Scaling Rules and Event-triggered Tasks, lalu klik tab Scaling Rules.

  2. Buat aturan scale-out: Di tab Scaling Rules, klik Create Scaling Rule. Konfigurasikan parameter seperti yang dijelaskan dalam tabel berikut. Untuk detail parameter lainnya yang harus Anda konfigurasi sesuai kebutuhan bisnis, lihat parameter aturan penskalaan lainnya. Lalu, klik OK.

    Parameter

    Deskripsi

    Rule Name

    Masukkan nama kustom. Misalnya, scale-out-by-1.

    Rule Type

    Dalam contoh ini, pilih Simple Scaling Rule.

    Scaling Activity

    Dalam contoh ini, pilih Add 1 Instance.

  3. Buat aturan scale-in: Di tab Scaling Rules, klik Create Scaling Rule. Konfigurasikan parameter seperti yang dijelaskan dalam tabel berikut. Konfigurasikan parameter lainnya sesuai kebutuhan. Lalu, klik OK.

    Parameter

    Deskripsi

    Rule Name

    Masukkan nama kustom. Misalnya, scale-in-by-1.

    Rule Type

    Dalam contoh ini, pilih Simple Scaling Rule.

    Scaling Activity

    Dalam contoh ini, pilih Remove 1 Instance.

Langkah 4: Buat tugas berbasis peristiwa dan kaitkan aturan penskalaan

  1. Di panel navigasi kiri, klik Event-triggered tasks.

  2. Di halaman Alert Task, klik tab System Monitoring, lalu klik Create Event-triggered Task.

  3. Buat tugas scale-out: Di kotak dialog Create Event-triggered Task, konfigurasikan parameter seperti yang dijelaskan dalam tabel berikut. Untuk detail parameter lainnya yang harus Anda konfigurasi sesuai kebutuhan bisnis, lihat parameter tugas berbasis peristiwa lainnya. Lalu, klik OK.

    Parameter

    Deskripsi

    Name

    Masukkan nama tugas kustom. Misalnya, cpu-scale-out-task.

    Resource Monitored

    Pilih grup penskalaan yang telah Anda buat di Langkah 1.

    Alert Condition

    Dalam contoh ini, atur kondisi menjadi (Agent) CPU utilization, Maximum >= 60%.

    Reference Period

    Dalam contoh ini, pilih 1 Minute.

    Trigger After

    Jumlah kali berturut-turut kondisi alert harus terpenuhi untuk memicu tugas. Dalam contoh ini, pilih 1.

    Scaling Rule Triggered Upon Alerting

    Pilih aturan scale-out yang telah Anda buat di Langkah 3.

  4. Buat tugas scale-in: Klik lagi Create Event-triggered Task. Di kotak dialog, konfigurasikan parameter seperti yang dijelaskan dalam tabel berikut. Konfigurasikan parameter lainnya sesuai kebutuhan. Lalu, klik OK.

    Parameter

    Deskripsi

    Name

    Masukkan nama tugas kustom. Misalnya, cpu-scale-in-task.

    Resource Monitored

    Pilih grup penskalaan yang telah Anda buat di Langkah 1.

    Alert Condition

    Dalam contoh ini, atur kondisi menjadi (Agent) CPU utilization, Maximum <= 30%.

    Reference Period

    Dalam contoh ini, pilih 1 Minute.

    Trigger After

    Jumlah kali berturut-turut kondisi alert harus terpenuhi untuk memicu tugas. Dalam contoh ini, pilih 1.

    Scaling Rule Triggered Upon Alerting

    Pilih aturan scale-in yang telah Anda buat di Langkah 3.

Langkah 5: Tambahkan instans yang sudah ada

Agar Auto Scaling dapat memantau instans yang sudah ada dan memicu aktivitas penskalaan, Anda harus menambahkan instans tersebut ke grup penskalaan.

  1. Di halaman Scaling Groups, temukan grup penskalaan, lalu klik Details pada kolom Actions. Klik tab Instances, lalu klik Manually Added.

  2. Pilih Add Existing Instance, pilih instans ECS01, lalu klik Add.

  3. Di tab Manually Added, Anda dapat melihat instans ECS01 yang telah ditambahkan.

Langkah 6: Verifikasi penskalaan otomatis

Gunakan uji stres untuk meningkatkan utilisasi CPU instans ECS01 lebih dari 60%. Hal ini akan memicu tugas berbasis peristiwa scale-out, yang secara otomatis menambahkan instans ECS. Selama periode ini, Anda dapat melihat instans baru di konsol. Setelah uji stres berakhir, utilisasi CPU ECS01 turun di bawah 30%, yang memicu tugas scale-in untuk secara otomatis menghapus instans yang ditambahkan.

  1. Untuk menginstal tool stress, login ke instans ECS01 dan jalankan perintah berikut:

    sudo yum install -y epel-release 
    sudo yum install -y stress 
  2. Untuk melakukan uji stres pada instans ECS01 selama 60 detik, jalankan perintah berikut:

    sudo stress --cpu 1 --io 4 --vm 2 --vm-bytes 128M --timeout 60s &
  3. Kembali ke halaman Alert Task di Auto Scaling console. Tunggu beberapa menit hingga Status tugas berubah menjadi Alert.

  4. Buka halaman Scaling Groups. Di kolom Instances/Capacity, periksa bahwa jumlah Total Instances bertambah satu. Hal ini menunjukkan bahwa instans ECS baru telah ditambahkan ke grup penskalaan.

  5. Login ke ALB console.

  6. Di panel navigasi kiri, pilih ALB > Server Groups.

  7. Klik ID kelompok server target, lalu klik tab Backend Servers. Anda akan melihat dua server backend. Instans dengan nama seperti ESS-XX adalah instans ECS yang secara otomatis ditambahkan oleh Auto Scaling.

  8. Setelah uji stres 60 detik berakhir, login kembali ke konsol Auto Scaling dan ALB. Anda akan menemukan bahwa instans yang ditambahkan telah secara otomatis dihapus.