Menambahkan instans saat terjadi lonjakan lalu lintas, lalu menghapusnya ketika permintaan turun.
Mengganti instans yang tidak sehat secara otomatis untuk menjaga ketersediaan.
Mengurangi total biaya kepemilikan dengan menghindari over-provisioning.
Auto Scaling mendukung instans Elastic Compute Service (ECS) dan instans Elastic Container Instance (ECI).
Auto Scaling hanya menskala jumlah instans. Untuk mengubah spesifikasi instans seperti CPU, memori, atau bandwidth, gunakan CloudOps Orchestration Service (OOS).
Auto Scaling, juga dikenal sebagai Elastic Scaling Service (ESS), membantu Anda mengelola fluktuasi lalu lintas layanan dengan secara otomatis menyesuaikan jumlah instans komputasi berdasarkan kebijakan yang Anda tentukan. Hal ini meningkatkan pemanfaatan sumber daya dan mengurangi biaya.
Mengapa menggunakan Auto Scaling?
Ketika permintaan bisnis meningkat, Auto Scaling menambahkan instans dengan tipe tertentu untuk menjaga kapasitas. Ketika permintaan menurun, Auto Scaling menghapus instans untuk mengurangi biaya.
| Manfaat | Deskripsi |
|---|---|
| Otomatisasi | Skala keluar: membuat instans dan mendaftarkannya ke load balancer, serta mengaitkannya dengan instans ApsaraDB RDS. Skala-masuk: menghapus instans dan melepasnya dari load balancer, serta memutus kaitannya dari instans RDS. |
| Penghematan biaya | Menghilangkan kebutuhan untuk menyesuaikan sumber daya secara manual, menyediakan kapasitas di muka, atau melacak instans yang menganggur. Secara default, Auto Scaling memeriksa metrik setiap satu menit. Jika suatu metrik tidak sesuai dengan ambang batas yang Anda tentukan, aktivitas penskalaan akan segera dimulai. Waktu respons Auto Scaling bergantung pada faktor-faktor berikut: waktu startup instans yang diskala (waktu dari saat instans dibuat hingga sistem operasinya siap), dan jumlah instans yang akan diskala. Untuk grup hingga 1.000 instans, aktivitas penskalaan biasanya selesai dalam waktu satu menit. |
| Ketersediaan tinggi | Memantau kesehatan instans ECS dan ECI. Secara otomatis mengganti instans yang tidak dalam status Berjalan untuk menjaga kapasitas yang Anda inginkan. |
| Fleksibilitas | Mendukung lima mode penskalaan untuk menangani beban kerja yang beragam: jumlah tetap, kesehatan, terjadwal, dinamis, dan kustom. Mode dinamis mendukung integrasi dengan sistem pemantauan eksternal melalui API. Mendukung templat instans yang fleksibel untuk meningkatkan tingkat keberhasilan pembuatan instans. |
| Audit | Mencatat setiap aktivitas penskalaan dan menyediakan pemantauan untuk grup penskalaan guna membantu Anda mendiagnosis masalah dengan cepat. |
Untuk informasi lebih lanjut, lihat Manfaat.
Fitur
Auto Scaling menskala jumlah instans ECS atau ECI berdasarkan konfigurasi Anda. Fitur ini tidak mengubah konfigurasi instans individual (CPU, memori, bandwidth). Untuk menyesuaikan spesifikasi instans, gunakan CloudOps Orchestration Service (OOS).
Konfigurasikan komponen-komponen berikut untuk menggunakan Auto Scaling. Grup penskalaan dan sumber konfigurasi instans wajib disediakan; semua komponen lain bersifat opsional.
| Komponen | Deskripsi |
|---|---|
| Grup penskalaan | Wadah untuk instans identik yang digunakan dalam skenario bisnis serupa. Menentukan tipe instans, jumlah minimum dan maksimum instans, serta grup server Classic Load Balancer (CLB) atau Application Load Balancer (ALB) yang terkait. Buat beberapa grup penskalaan untuk berbagai skenario aplikasi. |
| Sumber konfigurasi instans | Templat yang digunakan Auto Scaling untuk membuat instans selama peristiwa skala keluar. Templat tipe ECS membuat instans ECS; templat tipe ECI membuat instans ECI. |
| Aturan penskalaan | Menentukan aksi penskalaan, seperti menambahkan satu instans ECS atau ECI. Jalankan aturan penskalaan secara manual, atau picu melalui tugas berbasis peristiwa atau tugas terjadwal. Aturan penskalaan juga dapat secara dinamis menyesuaikan jumlah minimum dan maksimum instans untuk grup penskalaan. |
| Tugas berbasis peristiwa | Memantau metrik grup penskalaan secara real-time menggunakan CloudMonitor. Ketika suatu metrik memenuhi ambang batas yang dikonfigurasi, Auto Scaling menjalankan aturan penskalaan yang sesuai. |
| Tugas terjadwal | Menjalankan aturan penskalaan pada waktu tertentu. |
Gambar berikut menunjukkan alur kerja Auto Scaling.
Auto Scaling juga menyediakan fitur-fitur berikut.
Notifikasi
Auto Scaling dapat mengirim notifikasi ketika aktivitas penskalaan berhasil, gagal, atau ditolak.
| Aturan | Deskripsi |
|---|---|
| Aturan notifikasi reguler | Mengirim notifikasi melalui SMS, pesan internal, atau email. |
| Aturan notifikasi lanjutan | Mengirim pesan ke peristiwa sistem CloudMonitor atau Simple Message Queue (SMQ, sebelumnya MNS). SMQ adalah layanan berbayar dengan model layanan topik dan antrian. Untuk informasi harga, lihat Billing overview. |
Manajemen Instance
| Fitur | Deskripsi |
|---|---|
| Kait siklus hidup | Alat untuk mengelola siklus hidup instans ECS atau ECI dalam grup penskalaan. Saat Auto Scaling melakukan aktivitas skala keluar atau skala-masuk, kait siklus hidup dapat dipicu untuk menempatkan instans yang terpengaruh dalam status pending. Hal ini memberi Anda periode kustom untuk melakukan operasi pada instans sebelum waktu tunggu kait habis dan aktivitas dilanjutkan. |
| Manajemen instans manual | Menambahkan atau menghapus instans ECS, instans ECI, atau instans terkelola secara manual. |
| Pembaruan bergulir | Memperbarui instans ECS secara batch dalam grup penskalaan tipe ECS. Berlaku untuk instans dalam status In Service. Pembaruan yang didukung mencakup penggantian image, eksekusi skrip, dan instalasi paket OOS. |
Kasus penggunaan
Auto Scaling menangani perubahan lalu lintas baik yang dapat diprediksi maupun yang tidak dapat diprediksi.
Pola lalu lintas yang dapat diprediksi. Platform streaming video mengalami lonjakan lalu lintas mingguan setiap Jumat pukul 20.00 saat acara populer ditayangkan. Buat tugas terjadwal untuk menambahkan satu instans ECS atau ECI pada waktu tersebut setiap minggu.
Pola lalu lintas yang tidak dapat diprediksi. Platform streaming langsung memiliki lalu lintas yang sulit diprediksi. Buat tugas berbasis peristiwa untuk menambahkan satu instans ECS atau ECI setiap kali pemanfaatan CPU melebihi 60%.
Untuk informasi lebih lanjut, lihat Kasus penggunaan.
Cara kerja
Auto Scaling menjalankan aktivitas penskalaan berdasarkan mode penskalaan yang dikonfigurasi untuk menambah atau menghapus instans dalam grup penskalaan. Untuk informasi lebih lanjut, lihat Prinsip kerja.
Penagihan
Auto Scaling sendiri gratis. Anda hanya membayar sumber daya yang dibuat dan dikelola oleh Auto Scaling, seperti instans ECS, instans ECI, instans ApsaraDB RDS, layanan Server Load Balancer (SLB) (instans CLB, grup server ALB, atau grup server Network Load Balancer (NLB)), dan SMQ. Untuk informasi lebih lanjut, lihat Billing overview.
Akses Auto Scaling
Konsol: Auto Scaling console — antarmuka web untuk manajemen interaktif.
API: API gaya RPC yang mendukung permintaan GET dan POST. Lihat Daftar operasi berdasarkan fungsi.
Alibaba Cloud CLI: Alat command line untuk scripting dan otomatisasi lintas layanan Alibaba Cloud.
OpenAPI Explorer: Alat online untuk mencari operasi, melakukan panggilan uji coba, dan menghasilkan kode contoh SDK.
Layanan terkait
| Layanan | Deskripsi |
|---|---|
| Elastic Compute Service (ECS) | Layanan cloud computing Infrastruktur sebagai Layanan (IaaS) yang menyediakan sumber daya komputasi on-demand untuk digunakan dengan Auto Scaling. |
| Elastic Container Instance | Layanan kontainer arsitektur tanpa server. Menggunakan ECI sebagai runtime kontainer mengurangi beban O&M dan meningkatkan elastisitas aplikasi. |
| ApsaraDB RDS | Layanan database relasional terkelola. Auto Scaling mengaitkan dan memutus kaitan instans RDS selama skala keluar dan skala-masuk. |
| Server Load Balancer (SLB) | Mendistribusikan lalu lintas masuk ke berbagai instans untuk menghilangkan single point of failure. Termasuk ALB, NLB, dan CLB. Auto Scaling mendaftarkan instans baru ke load balancer selama skala keluar. |
| CloudMonitor | Memantau sumber daya Alibaba Cloud dan aplikasi internet. Tugas berbasis peristiwa menggunakan metrik CloudMonitor untuk menentukan kapan harus menskala. |
| Simple Message Queue (SMQ, sebelumnya MNS) | Layanan antrian pesan ringan. Digunakan dalam aturan notifikasi lanjutan untuk menerima event aktivitas penskalaan. |