全部产品
Search
文档中心

Auto Scaling:Cara Kerja Auto Scaling

更新时间:Jul 06, 2025

Tema ini menjelaskan alur kerja Auto Scaling dan cara mengonfigurasi mode penskalaan, serta mencakup diagram alur kerja untuk Auto Scaling.

Auto Scaling mengelola grup penskalaan yang berisi instance Elastic Compute Service (ECS) dan instance kontainer elastis dengan cara serupa. Tema ini menggunakan instance ECS untuk menggambarkan alur kerja Auto Scaling. Untuk informasi lebih lanjut tentang instance ECS dan instance kontainer elastis, lihat Apa itu ECS? dan Apa itu Elastic Container Instance?.

Bagaimana Auto Scaling bekerja

Gambar berikut menunjukkan bagaimana Auto Scaling menambahkan instance ECS.

Dalam contoh ini, aplikasi web dengan arsitektur tiga lapis digunakan. Instance ECS memproses permintaan, seperti yang ditunjukkan oleh kotak garis putus-putus di sisi kanan gambar sebelumnya. Dalam arsitektur tersebut, instance Server Load Balancer (SLB) di lapisan atas meneruskan permintaan klien ke instance ECS dalam grup penskalaan di lapisan tengah. Instance ECS memproses permintaan tersebut, sedangkan instance ApsaraDB RDS di lapisan bawah menyimpan data layanan.

Anda dapat menggunakan Auto Scaling untuk menyesuaikan jumlah instance ECS di lapisan tengah berdasarkan kebutuhan bisnis Anda. Prosedur berikut menjelaskan bagaimana Auto Scaling menyesuaikan jumlah instance ECS:

  1. Auto Scaling mengeksekusi aktivitas penskalaan ketika kondisi yang ditentukan dalam mode penskalaan terpenuhi. Tabel berikut menjelaskan mode penskalaan yang didukung. Untuk informasi tentang cara mengonfigurasi mode penskalaan, lihat Konfigurasikan Mode Penskalaan.

    Anda dapat menggabungkan mode penskalaan yang dijelaskan dalam tabel berikut berdasarkan kebutuhan bisnis Anda. Sebagai contoh, jika beban kerja meningkat secara signifikan pada pukul 12:00 siang setiap hari, Anda dapat mengonfigurasi tugas terjadwal untuk secara otomatis membuat 20 instance ECS pada waktu tersebut. Untuk memastikan jumlah instance ECS memenuhi kebutuhan bisnis Anda, Anda dapat menggabungkan mode terjadwal dengan mode penskalaan lainnya, seperti mode dinamis dan mode kustom. Pendekatan ini membantu mengatasi potensi perbedaan antara instance yang dibuat dan kebutuhan Anda.

    Mode penskalaan

    Deskripsi

    Panduan pengguna

    Referensi API

    Mode jumlah tetap

    • Setelah Anda mengonfigurasi parameter Minimum Number of Instances selama pembuatan grup penskalaan, Auto Scaling akan secara otomatis menambahkan instance ECS untuk memenuhi jumlah minimum yang ditentukan jika total jumlah instance ECS berada di bawah minimum tersebut.

    • Setelah Anda mengonfigurasi parameter Maximum Number of Instances selama pembuatan grup penskalaan, Auto Scaling akan secara otomatis menghapus instance ECS jika total jumlah melebihi maksimum yang ditentukan, mengurangi jumlah instance menjadi nilai yang telah ditetapkan.

    • Jika Anda mengonfigurasi parameter Expected Number of Instances selama pembuatan grup penskalaan, Auto Scaling akan secara otomatis menyesuaikan jumlah instance ECS dalam grup penskalaan agar sesuai dengan nilai yang ditentukan.

    Konfigurasikan grup penskalaan

    CreateScalingGroup

    Mode kesehatan

    Jika Anda mengaktifkan fitur pemeriksaan kesehatan selama pembuatan grup penskalaan, Auto Scaling akan memantau instance ECS pada interval tertentu. Jika sebuah instance ECS ditemukan tidak sehat, Auto Scaling akan menghapusnya dari grup penskalaan.

    Catatan

    Fitur pemeriksaan kesehatan adalah komponen integral dari grup penskalaan. Jika sebuah instance SLB dengan fitur pemeriksaan kesehatan diaktifkan dilampirkan ke grup penskalaan Anda, fitur pemeriksaan kesehatan dari grup penskalaan dan instance SLB akan aktif secara bersamaan. Instance SLB bisa berupa instance Classic Load Balancer (CLB) atau Application Load Balancer (ALB).

    Konfigurasikan grup penskalaan

    CreateScalingGroup

    Mode terjadwal

    Anda dapat membuat tugas terjadwal untuk secara otomatis mengeksekusi aturan penskalaan pada titik waktu yang ditentukan.

    Konfigurasikan tugas terjadwal

    CreateScheduledTask

    Mode kustom

    Anda dapat secara manual melakukan tindakan penskalaan dengan mengeksekusi aturan penskalaan atau menambahkan, menghapus, atau menghapus instance ECS.

    Mode dinamis

    Anda dapat membuat tugas berbasis acara berdasarkan metrik kinerja yang dipantau oleh CloudMonitor, seperti utilisasi CPU. Ketika nilai metrik dari grup penskalaan memenuhi kondisi peringatan, peringatan dipicu, dan aturan penskalaan yang sesuai dieksekusi. Sebagai contoh, jika rata-rata utilisasi CPU dari semua instance ECS dalam grup penskalaan melebihi 60%, peringatan dipicu, dan tindakan penskalaan dilakukan.

    Kelola tugas berbasis acara

    CreateAlarm

  2. Auto Scaling memanggil operasi API ExecuteScalingRule untuk mengeksekusi aktivitas penskalaan. Operasi API ini harus mencakup pengenal unik dari aturan penskalaan yang ingin Anda eksekusi. Contoh: ari:acs:ess:cn-hangzhou:140692647406****:scalingrule/asr-bp1dvirgwkoowxk7****.

    • Jika Anda membuat aturan penskalaan di konsol Auto Scaling, Anda dapat menemukan aturan penskalaan dalam daftar aturan penskalaan dan mengklik ID aturan penskalaan di kolom Scaling Rule ID/Name. Di halaman yang muncul, Anda dapat melihat pengenal unik dari aturan penskalaan. Contoh: asr-bp14u7kzh8442w9z****. Untuk informasi lebih lanjut tentang cara membuat aturan penskalaan, lihat Konfigurasikan Aturan Penskalaan.

    • Jika Anda membuat aturan penskalaan dengan memanggil operasi API, Anda dapat memanggil operasi API DescribeScalingRules untuk menanyakan pengenal unik dari aturan penskalaan.

  3. Auto Scaling menggunakan pengenal unik untuk mengambil informasi tentang aturan penskalaan, termasuk grup penskalaan terkait dan konfigurasi penskalaan. Kemudian memulai aktivitas penskalaan berdasarkan informasi tersebut.

    1. Auto Scaling menggunakan pengenal unik untuk mengambil informasi tentang aturan penskalaan dan grup penskalaan terkaitnya. Kemudian menentukan jumlah instance ECS yang diperlukan berdasarkan kebutuhan bisnis Anda. Selain itu, Auto Scaling dapat menanyakan informasi tentang instance SLB dan instance ApsaraDB RDS untuk lampiran instance ECS.

    2. Auto Scaling mengambil detail konfigurasi penskalaan dari grup penskalaan, termasuk vCPU, ukuran memori, dan bandwidth yang diperlukan untuk membuat instance ECS.

    3. Auto Scaling memulai aktivitas penskalaan berdasarkan jumlah instance ECS yang diperlukan, sumber konfigurasi instance, serta instance SLB dan instance ApsaraDB RDS untuk lampiran instance ECS.

  4. Selama penskalaan, Auto Scaling secara otomatis membuat instance ECS dan mengonfigurasi instance SLB dan instance ApsaraDB RDS untuk lampiran instance ECS.

    1. Auto Scaling menyediakan jumlah instance ECS yang diperlukan berdasarkan sumber konfigurasi instance.

    2. Alamat IP privat dari instance ECS ditambahkan ke daftar putih instance ApsaraDB RDS, dan instance ECS didaftarkan sebagai server backend untuk instance SLB.

  5. Setelah aktivitas penskalaan selesai, Auto Scaling mengaktifkan periode cooldown untuk grup penskalaan.

    Grup penskalaan hanya dapat memproses permintaan penskalaan baru setelah periode cooldown berakhir.

Konfigurasikan mode penskalaan

Auto Scaling secara otomatis menyesuaikan jumlah instance ECS dalam grup penskalaan Anda berdasarkan konfigurasi Anda, menambahkan atau menghapus instance sesuai kebutuhan. Anda dapat mengonfigurasi mode penskalaan yang dijelaskan dalam tabel berikut di Auto Scaling untuk mengeksekusi aktivitas penskalaan.

Mode penskalaan

Metode konfigurasi

Deskripsi

Mode jumlah tetap

Grup penskalaan + Sumber konfigurasi instance

Efek penskalaan dalam mode jumlah tetap bergantung pada pengaturan parameter berikut:

  • Jumlah minimum instance

  • Jumlah maksimum instance

  • (Opsional) Jumlah Instance yang Diharapkan

Mode kesehatan

Grup penskalaan + Sumber konfigurasi instance

Anda harus mengaktifkan Instance Health Check untuk grup penskalaan.

Mode terjadwal

Grup penskalaan + Sumber konfigurasi instance + Aturan penskalaan + Tugas terjadwal

Efek penskalaan dalam mode terjadwal bergantung pada konfigurasi tugas terjadwal.

Mode dinamis

Grup penskalaan + Sumber konfigurasi instance + Aturan penskalaan + Tugas berbasis acara

Efek penskalaan dalam mode dinamis bergantung pada konfigurasi tugas berbasis acara.

Mode kustom

Metode konfigurasi kustom

Dalam mode ini, Anda dapat secara manual menambahkan, menghapus, atau menghapus instance ECS. Anda juga dapat secara manual mengeksekusi aturan penskalaan.

Multi-mode

Kombinasi metode konfigurasi sebelumnya

Efek penskalaan dalam multi-mode bergantung pada mode penskalaan yang disertakan. Mode penskalaan beroperasi secara independen, tanpa prioritas. Auto Scaling menerapkan konfigurasi mode penskalaan pertama yang dipicu.

Sebagai contoh, ketika menggunakan mode terjadwal dan dinamis bersama-sama, Anda harus membuat tugas terjadwal dan tugas berbasis acara. Jika tugas terjadwal dipicu sebelum tugas berbasis acara, Auto Scaling akan mengeksekusi tugas terjadwal terlebih dahulu.

Tabel berikut menjelaskan setiap metode konfigurasi.

No.

Metode Konfigurasi

Deskripsi

Grup Penskalaan + Sumber Konfigurasi Instance

Buat grup penskalaan, konfigurasikan sumber konfigurasi instance untuknya, dan kemudian aktifkan baik sumber konfigurasi instance maupun grup penskalaan.

Auto Scaling hanya dapat menskalakan instance setelah operasi sebelumnya selesai. Grup penskalaan dan sumber konfigurasi instance adalah komponen penting dari unit konfigurasi dasar.

Grup Penskalaan + Sumber Konfigurasi Instance + Aturan Penskalaan + Tugas Terjadwal

Bersama dengan unit konfigurasi dasar dalam Metode 1, buat aturan penskalaan dan tugas terjadwal.

Auto Scaling memulai tugas terjadwal untuk mengeksekusi aturan penskalaan.

Grup Penskalaan + Sumber Konfigurasi Instance + Aturan Penskalaan + Tugas Berbasis Acara

Bersama dengan unit konfigurasi dasar dalam Metode 1, buat aturan penskalaan dan tugas berbasis acara.

Auto Scaling memulai tugas berbasis acara untuk mengeksekusi aturan penskalaan.

Alur Kerja

Auto Scaling memungkinkan Anda mengaitkan grup penskalaan Anda dengan satu atau lebih instance SLB dan instance ApsaraDB RDS. Ketika klien mengirimkan permintaan dari perangkat seluler atau PC, instance SLB terkait meneruskan permintaan ke instance ECS dalam grup penskalaan. Instance ECS memproses permintaan tersebut, dan instance ApsaraDB RDS menyimpan data aplikasi.

Auto Scaling menyesuaikan jumlah instance ECS dalam grup penskalaan berdasarkan kebutuhan bisnis Anda dan mode penskalaan yang dikonfigurasi. Gambar berikut menunjukkan alur kerja penskalaan keluar dan masuk, serta pemulihan elastis (pemeriksaan kesehatan).

Gambar 1 Alur Kerja Penskalaan Keluar弹性扩张示意图

Gambar 2 Alur Kerja Penskalaan Masuk弹性收缩示意图

Gambar 3 Alur Kerja Pemulihan Elastis弹性自愈示意图