Tema ini menjelaskan alur kerja Auto Scaling dan cara mengonfigurasi mode penskalaan, serta mencakup diagram alur kerja untuk Auto Scaling.
Auto Scaling mengelola grup penskalaan yang berisi instance Elastic Compute Service (ECS) dan instance kontainer elastis dengan cara serupa. Tema ini menggunakan instance ECS untuk menggambarkan alur kerja Auto Scaling. Untuk informasi lebih lanjut tentang instance ECS dan instance kontainer elastis, lihat Apa itu ECS? dan Apa itu Elastic Container Instance?.
Bagaimana Auto Scaling bekerja
Gambar berikut menunjukkan bagaimana Auto Scaling menambahkan instance ECS.
Dalam contoh ini, aplikasi web dengan arsitektur tiga lapis digunakan. Instance ECS memproses permintaan, seperti yang ditunjukkan oleh kotak garis putus-putus di sisi kanan gambar sebelumnya. Dalam arsitektur tersebut, instance Server Load Balancer (SLB) di lapisan atas meneruskan permintaan klien ke instance ECS dalam grup penskalaan di lapisan tengah. Instance ECS memproses permintaan tersebut, sedangkan instance ApsaraDB RDS di lapisan bawah menyimpan data layanan.
Anda dapat menggunakan Auto Scaling untuk menyesuaikan jumlah instance ECS di lapisan tengah berdasarkan kebutuhan bisnis Anda. Prosedur berikut menjelaskan bagaimana Auto Scaling menyesuaikan jumlah instance ECS:
Auto Scaling mengeksekusi aktivitas penskalaan ketika kondisi yang ditentukan dalam mode penskalaan terpenuhi. Tabel berikut menjelaskan mode penskalaan yang didukung. Untuk informasi tentang cara mengonfigurasi mode penskalaan, lihat Konfigurasikan Mode Penskalaan.
Anda dapat menggabungkan mode penskalaan yang dijelaskan dalam tabel berikut berdasarkan kebutuhan bisnis Anda. Sebagai contoh, jika beban kerja meningkat secara signifikan pada pukul 12:00 siang setiap hari, Anda dapat mengonfigurasi tugas terjadwal untuk secara otomatis membuat 20 instance ECS pada waktu tersebut. Untuk memastikan jumlah instance ECS memenuhi kebutuhan bisnis Anda, Anda dapat menggabungkan mode terjadwal dengan mode penskalaan lainnya, seperti mode dinamis dan mode kustom. Pendekatan ini membantu mengatasi potensi perbedaan antara instance yang dibuat dan kebutuhan Anda.
Mode penskalaan
Deskripsi
Panduan pengguna
Referensi API
Mode jumlah tetap
Setelah Anda mengonfigurasi parameter Minimum Number of Instances selama pembuatan grup penskalaan, Auto Scaling akan secara otomatis menambahkan instance ECS untuk memenuhi jumlah minimum yang ditentukan jika total jumlah instance ECS berada di bawah minimum tersebut.
Setelah Anda mengonfigurasi parameter Maximum Number of Instances selama pembuatan grup penskalaan, Auto Scaling akan secara otomatis menghapus instance ECS jika total jumlah melebihi maksimum yang ditentukan, mengurangi jumlah instance menjadi nilai yang telah ditetapkan.
Jika Anda mengonfigurasi parameter Expected Number of Instances selama pembuatan grup penskalaan, Auto Scaling akan secara otomatis menyesuaikan jumlah instance ECS dalam grup penskalaan agar sesuai dengan nilai yang ditentukan.
Mode kesehatan
Jika Anda mengaktifkan fitur pemeriksaan kesehatan selama pembuatan grup penskalaan, Auto Scaling akan memantau instance ECS pada interval tertentu. Jika sebuah instance ECS ditemukan tidak sehat, Auto Scaling akan menghapusnya dari grup penskalaan.
CatatanFitur pemeriksaan kesehatan adalah komponen integral dari grup penskalaan. Jika sebuah instance SLB dengan fitur pemeriksaan kesehatan diaktifkan dilampirkan ke grup penskalaan Anda, fitur pemeriksaan kesehatan dari grup penskalaan dan instance SLB akan aktif secara bersamaan. Instance SLB bisa berupa instance Classic Load Balancer (CLB) atau Application Load Balancer (ALB).
Mode terjadwal
Anda dapat membuat tugas terjadwal untuk secara otomatis mengeksekusi aturan penskalaan pada titik waktu yang ditentukan.
Mode kustom
Anda dapat secara manual melakukan tindakan penskalaan dengan mengeksekusi aturan penskalaan atau menambahkan, menghapus, atau menghapus instance ECS.
Mode dinamis
Anda dapat membuat tugas berbasis acara berdasarkan metrik kinerja yang dipantau oleh CloudMonitor, seperti utilisasi CPU. Ketika nilai metrik dari grup penskalaan memenuhi kondisi peringatan, peringatan dipicu, dan aturan penskalaan yang sesuai dieksekusi. Sebagai contoh, jika rata-rata utilisasi CPU dari semua instance ECS dalam grup penskalaan melebihi 60%, peringatan dipicu, dan tindakan penskalaan dilakukan.
Auto Scaling memanggil operasi API ExecuteScalingRule untuk mengeksekusi aktivitas penskalaan. Operasi API ini harus mencakup pengenal unik dari aturan penskalaan yang ingin Anda eksekusi. Contoh: ari:acs:ess:cn-hangzhou:140692647406****:scalingrule/asr-bp1dvirgwkoowxk7****.
Jika Anda membuat aturan penskalaan di konsol Auto Scaling, Anda dapat menemukan aturan penskalaan dalam daftar aturan penskalaan dan mengklik ID aturan penskalaan di kolom Scaling Rule ID/Name. Di halaman yang muncul, Anda dapat melihat pengenal unik dari aturan penskalaan. Contoh: asr-bp14u7kzh8442w9z****. Untuk informasi lebih lanjut tentang cara membuat aturan penskalaan, lihat Konfigurasikan Aturan Penskalaan.
Jika Anda membuat aturan penskalaan dengan memanggil operasi API, Anda dapat memanggil operasi API DescribeScalingRules untuk menanyakan pengenal unik dari aturan penskalaan.
Auto Scaling menggunakan pengenal unik untuk mengambil informasi tentang aturan penskalaan, termasuk grup penskalaan terkait dan konfigurasi penskalaan. Kemudian memulai aktivitas penskalaan berdasarkan informasi tersebut.
Auto Scaling menggunakan pengenal unik untuk mengambil informasi tentang aturan penskalaan dan grup penskalaan terkaitnya. Kemudian menentukan jumlah instance ECS yang diperlukan berdasarkan kebutuhan bisnis Anda. Selain itu, Auto Scaling dapat menanyakan informasi tentang instance SLB dan instance ApsaraDB RDS untuk lampiran instance ECS.
Auto Scaling mengambil detail konfigurasi penskalaan dari grup penskalaan, termasuk vCPU, ukuran memori, dan bandwidth yang diperlukan untuk membuat instance ECS.
Auto Scaling memulai aktivitas penskalaan berdasarkan jumlah instance ECS yang diperlukan, sumber konfigurasi instance, serta instance SLB dan instance ApsaraDB RDS untuk lampiran instance ECS.
Selama penskalaan, Auto Scaling secara otomatis membuat instance ECS dan mengonfigurasi instance SLB dan instance ApsaraDB RDS untuk lampiran instance ECS.
Auto Scaling menyediakan jumlah instance ECS yang diperlukan berdasarkan sumber konfigurasi instance.
Alamat IP privat dari instance ECS ditambahkan ke daftar putih instance ApsaraDB RDS, dan instance ECS didaftarkan sebagai server backend untuk instance SLB.
Setelah aktivitas penskalaan selesai, Auto Scaling mengaktifkan periode cooldown untuk grup penskalaan.
Grup penskalaan hanya dapat memproses permintaan penskalaan baru setelah periode cooldown berakhir.
Konfigurasikan mode penskalaan
Auto Scaling secara otomatis menyesuaikan jumlah instance ECS dalam grup penskalaan Anda berdasarkan konfigurasi Anda, menambahkan atau menghapus instance sesuai kebutuhan. Anda dapat mengonfigurasi mode penskalaan yang dijelaskan dalam tabel berikut di Auto Scaling untuk mengeksekusi aktivitas penskalaan.
Mode penskalaan | Metode konfigurasi | Deskripsi |
Mode jumlah tetap | Grup penskalaan + Sumber konfigurasi instance① | Efek penskalaan dalam mode jumlah tetap bergantung pada pengaturan parameter berikut:
|
Mode kesehatan | Grup penskalaan + Sumber konfigurasi instance① | Anda harus mengaktifkan Instance Health Check untuk grup penskalaan. |
Mode terjadwal | Grup penskalaan + Sumber konfigurasi instance + Aturan penskalaan + Tugas terjadwal② | Efek penskalaan dalam mode terjadwal bergantung pada konfigurasi tugas terjadwal. |
Mode dinamis | Grup penskalaan + Sumber konfigurasi instance + Aturan penskalaan + Tugas berbasis acara③ | Efek penskalaan dalam mode dinamis bergantung pada konfigurasi tugas berbasis acara. |
Mode kustom | Metode konfigurasi kustom | Dalam mode ini, Anda dapat secara manual menambahkan, menghapus, atau menghapus instance ECS. Anda juga dapat secara manual mengeksekusi aturan penskalaan. |
Multi-mode | Kombinasi metode konfigurasi sebelumnya | Efek penskalaan dalam multi-mode bergantung pada mode penskalaan yang disertakan. Mode penskalaan beroperasi secara independen, tanpa prioritas. Auto Scaling menerapkan konfigurasi mode penskalaan pertama yang dipicu. Sebagai contoh, ketika menggunakan mode terjadwal dan dinamis bersama-sama, Anda harus membuat tugas terjadwal dan tugas berbasis acara. Jika tugas terjadwal dipicu sebelum tugas berbasis acara, Auto Scaling akan mengeksekusi tugas terjadwal terlebih dahulu. |
Tabel berikut menjelaskan setiap metode konfigurasi.
No. | Metode Konfigurasi | Deskripsi |
① | Grup Penskalaan + Sumber Konfigurasi Instance | Buat grup penskalaan, konfigurasikan sumber konfigurasi instance untuknya, dan kemudian aktifkan baik sumber konfigurasi instance maupun grup penskalaan. Auto Scaling hanya dapat menskalakan instance setelah operasi sebelumnya selesai. Grup penskalaan dan sumber konfigurasi instance adalah komponen penting dari unit konfigurasi dasar. |
② | Grup Penskalaan + Sumber Konfigurasi Instance + Aturan Penskalaan + Tugas Terjadwal | Bersama dengan unit konfigurasi dasar dalam Metode 1, buat aturan penskalaan dan tugas terjadwal. Auto Scaling memulai tugas terjadwal untuk mengeksekusi aturan penskalaan. |
③ | Grup Penskalaan + Sumber Konfigurasi Instance + Aturan Penskalaan + Tugas Berbasis Acara | Bersama dengan unit konfigurasi dasar dalam Metode 1, buat aturan penskalaan dan tugas berbasis acara. Auto Scaling memulai tugas berbasis acara untuk mengeksekusi aturan penskalaan. |
Alur Kerja
Auto Scaling memungkinkan Anda mengaitkan grup penskalaan Anda dengan satu atau lebih instance SLB dan instance ApsaraDB RDS. Ketika klien mengirimkan permintaan dari perangkat seluler atau PC, instance SLB terkait meneruskan permintaan ke instance ECS dalam grup penskalaan. Instance ECS memproses permintaan tersebut, dan instance ApsaraDB RDS menyimpan data aplikasi.
Auto Scaling menyesuaikan jumlah instance ECS dalam grup penskalaan berdasarkan kebutuhan bisnis Anda dan mode penskalaan yang dikonfigurasi. Gambar berikut menunjukkan alur kerja penskalaan keluar dan masuk, serta pemulihan elastis (pemeriksaan kesehatan).
Gambar 1 Alur Kerja Penskalaan Keluar
Gambar 2 Alur Kerja Penskalaan Masuk
Gambar 3 Alur Kerja Pemulihan Elastis