全部产品
Search
文档中心

Auto Scaling:Apa itu Auto Scaling?

更新时间:Dec 31, 2025

Auto Scaling, juga dikenal sebagai Elastic Scaling Service (ESS), secara otomatis menyesuaikan resource komputasi Anda (instans) berdasarkan kebijakan yang Anda tentukan. Hal ini membantu Anda mengatasi fluktuasi trafik aplikasi, meningkatkan pemanfaatan resource, dan menurunkan biaya.

Mengapa menggunakan Auto Scaling?

Saat permintaan bisnis meningkat, Auto Scaling secara otomatis menambahkan lebih banyak instans dari tipe tertentu—seperti instans Elastic Compute Service (ECS) atau instans Elastic Container Instance (ECI)—untuk memastikan daya komputasi yang mencukupi. Saat permintaan menurun, instans tersebut secara otomatis dihapus untuk menghemat biaya.

Auto Scaling memberikan manfaat berikut:

Manfaat

Deskripsi

Otomatisasi

  • Scale-out: Secara otomatis membuat instans tipe tertentu dan menambahkannya ke load balancer. Instans tersebut juga secara otomatis diasosiasikan dengan instans ApsaraDB RDS.

  • Scale-in: Secara otomatis menghapus instans tipe tertentu dan melepaskannya dari load balancer. Instans tersebut juga secara otomatis didisosiasikan dari instans RDS.

Penghematan biaya

Anda tidak perlu lagi menyesuaikan resource secara manual, menyediakan kapasitas sebelumnya, atau khawatir tentang melepaskan resource yang tidak digunakan tepat waktu. Auto Scaling melakukan tugas penskalaan pada waktu yang tepat untuk mengurangi total biaya kepemilikan Anda.

Secara default, Auto Scaling memantau metrik penskalaan terkait (atau jumlah instans yang diharapkan) sekali per menit. Jika suatu metrik tidak sesuai dengan ambang batas yang Anda tentukan, aktivitas penskalaan akan segera dipicu. Waktu respons Auto Scaling bergantung pada faktor-faktor berikut:

  • Waktu startup instans yang diskalakan, yaitu waktu dari saat instans dibuat hingga sistem operasinya siap.

  • Jumlah instans yang akan diskalakan. Untuk hingga 1.000 instans, aktivitas penskalaan biasanya selesai dalam satu menit.

Ketersediaan tinggi

Anda tidak perlu lagi khawatir tentang kesehatan instans ECS atau ECI Anda. Auto Scaling menyediakan fitur pemeriksaan kesehatan yang secara otomatis mengganti instans yang tidak sehat—yaitu yang tidak dalam status Berjalan—dengan instans baru untuk menjaga ketersediaan.

Fleksibilitas dan kecerdasan

  • Mendukung penentuan tipe instans: ECS atau ECI.

  • Mendukung berbagai mode penskalaan untuk menangani skenario yang beragam. Mode yang didukung meliputi mode jumlah tetap, kesehatan, terjadwal, dinamis, dan kustom. Mode dinamis mendukung integrasi dengan sistem pemantauan eksternal melalui API.

  • Mendukung templat instans yang fleksibel untuk meningkatkan tingkat keberhasilan pembuatan instans.

  • Mendukung berbagai kebijakan penskalaan untuk skenario bisnis yang berbeda.

Audit yang mudah

Auto Scaling mencatat setiap aktivitas penskalaan dan menyediakan pemantauan untuk grup penskalaan guna membantu Anda mendiagnosis masalah dengan cepat.

Untuk informasi selengkapnya, lihat Manfaat.

Fitur

Auto Scaling hanya mendukung penambahan atau pengurangan jumlah instans ECS atau ECI. Fitur ini tidak mendukung perubahan konfigurasi instans individual, seperti CPU, memori, atau bandwidth. Untuk menyesuaikan konfigurasi tersebut, Anda dapat menggunakan CloudOps Orchestration Service (OOS). Untuk informasi selengkapnya, lihat Apa itu OOS?

Auto Scaling dapat secara otomatis membuat atau menghapus instans ECS atau ECI berdasarkan kebutuhan bisnis Anda. Anda perlu mengonfigurasi komponen utama berikut.

fitur

Deskripsi

Grup penskalaan

Grup penskalaan berisi instans yang identik, dirancang untuk digunakan dalam skenario bisnis yang serupa. Anda dapat mengonfigurasi grup penskalaan untuk menentukan tipe instans guna daya komputasi. Selain itu, Anda dapat menentukan sumber konfigurasi instans, jumlah instans minimum dan maksimum, serta grup server Classic Load Balancer (CLB) atau Application Load Balancer (ALB) yang terkait. Jika Anda memiliki beberapa skenario aplikasi, Anda dapat membuat beberapa grup penskalaan. Auto Scaling menyesuaikan kapasitas komputasi untuk setiap grup penskalaan secara independen berdasarkan konfigurasi Anda.

Sumber konfigurasi instans

Mengelola templat yang digunakan untuk membuat instans ECS atau ECI. Selama peristiwa scale-out, Auto Scaling menggunakan templat tipe ECS untuk membuat Instance ECS dan templat tipe ECI untuk membuat instans ECI.

Aturan penskalaan

Mememicu aktivitas penskalaan, seperti menambahkan satu instans ECS atau ECI. Anda dapat menjalankan aturan penskalaan secara manual atau memicunya menggunakan tugas berbasis peristiwa atau tugas terjadwal. Anda juga dapat menggunakan aturan penskalaan untuk mengatur nilai batas (jumlah instans maksimum dan minimum) untuk grup penskalaan secara cerdas.

Tugas berbasis peristiwa

Menggunakan CloudMonitor untuk memantau berbagai metrik grup penskalaan secara real time. Ketika suatu metrik memenuhi ambang batas yang dikonfigurasi, Auto Scaling menjalankan aturan penskalaan yang sesuai.

Tugas terjadwal

Menjalankan aturan penskalaan pada waktu yang ditentukan.

Di antara komponen yang tercantum di atas, Anda harus mengonfigurasi dan mengaktifkan grup penskalaan beserta sumber konfigurasi instansnya agar Auto Scaling dapat berfungsi. Komponen lainnya dapat dikonfigurasi sesuai kebutuhan. Alur kerja Auto Scaling ditunjukkan pada gambar berikut.

image

Auto Scaling juga menyediakan fitur lain untuk memenuhi kebutuhan Anda dalam berbagai skenario:

  • Saat aktivitas penskalaan berhasil, gagal, atau ditolak, Auto Scaling mendukung pengiriman notifikasi melalui metode berikut.

    Aturan

    Deskripsi

    Aturan notifikasi reguler

    Mendukung pengiriman notifikasi melalui SMS, pesan internal, dan email.

    Aturan notifikasi lanjutan

    Mendukung pengiriman pesan ke event sistem CloudMonitor atau Simple Message Queue (SMQ), yang sebelumnya dikenal sebagai MNS. SMQ mencakup dua model layanan: topik dan antrian. SMQ merupakan layanan berbayar. Untuk detail harga lebih lanjut, lihat Billing.

  • Saat Anda mengelola Instans dalam grup penskalaan, Auto Scaling juga mendukung fitur berikut.

    Fitur

    Deskripsi

    Kait siklus hidup

    Alat untuk mengelola siklus hidup instans ECS atau ECI dalam grup penskalaan. Saat Auto Scaling secara otomatis melakukan aktivitas scale-out atau scale-in, kait siklus hidup dapat dipicu untuk menempatkan instans yang terpengaruh dalam status tertunda. Hal ini memberi Anda periode kustom untuk melakukan operasi pada instans sebelum waktu tunggu kait habis dan aktivitas dilanjutkan.

    Manajemen instans manual

    Memungkinkan Anda menambahkan atau menghapus Instans dari grup penskalaan secara manual. Instans tersebut dapat berupa instans ECS, instans ECI, atau instans terkelola.

    Pembaruan bergulir

    Pembaruan bergulir tersedia untuk grup penskalaan tipe ECS. Anda dapat menggunakan fitur ini untuk memperbarui konfigurasi instans ECS secara batch. Anda dapat memperbarui citra, menjalankan skrip, atau menginstal paket OOS pada semua instans ECS dalam status In Service di dalam grup penskalaan.

Kasus Penggunaan

Auto Scaling ideal untuk skenario dengan volume bisnis yang berfluktuasi:

  • Untuk perubahan volume bisnis yang dapat diprediksi.

    Misalnya, perusahaan streaming video mengalami lonjakan trafik setiap hari Jumat pukul 20.00 ketika acara populer ditayangkan. Anda dapat membuat tugas terjadwal untuk secara otomatis menambahkan satu instans ECS atau ECI pada waktu tersebut setiap minggu.

  • Untuk perubahan volume bisnis yang tidak dapat diprediksi.

    Misalnya, perusahaan live streaming memiliki trafik yang sulit diprediksi. Anda dapat membuat tugas berbasis peristiwa untuk secara otomatis menambahkan satu Instans ECS atau ECI setiap kali penggunaan CPU melebihi 60%.

Untuk informasi selengkapnya, lihat Kasus Penggunaan.

Cara Kerja

Auto Scaling menjalankan aktivitas penskalaan berdasarkan mode penskalaan yang dikonfigurasi untuk menambah atau menghapus instans dari grup penskalaan. Untuk informasi selengkapnya, lihat Prinsip Kerja.

Billing

Auto Scaling sendiri tidak dikenai biaya. Namun, Anda dikenai biaya untuk resource yang Anda gunakan, seperti Instance ECS, instans ECI, instans RDS, layanan Server Load Balancer (SLB) (seperti instans CLB, grup server ALB, atau grup server Network Load Balancer (NLB)), dan SMQ. Untuk informasi selengkapnya, lihat Ikhtisar Billing.

Cara Menggunakan Auto Scaling

  • Auto Scaling console: Antarmuka berbasis web untuk operasi interaktif.

  • API: Mendukung API gaya RPC dengan permintaan GET dan POST. Untuk informasi selengkapnya tentang API, lihat Daftar operasi berdasarkan fungsi. Berikut adalah tool developer umum untuk memanggil API Auto Scaling:

    • Alibaba Cloud CLI: Tool manajemen yang fleksibel dan dapat diperluas yang dibangun di atas API Alibaba Cloud. Anda dapat menggunakan CLI untuk mengenkapsulasi API Alibaba Cloud asli dan memperluas fungsionalitasnya.

    • OpenAPI Explorer: Menyediakan layanan untuk pencarian cepat antarmuka, pemanggilan API online, dan pembuatan kode contoh SDK secara dinamis.

Layanan Terkait

Layanan

Deskripsi

Elastic Compute Service (ECS)

Layanan komputasi awan Infrastructure as a Service (IaaS) yang memungkinkan Anda menyediakan dan menggunakan resource komputasi sesuai permintaan serta mengaktifkan Auto Scaling.

Elastic Container Instance

Layanan kontainer arsitektur tanpa server yang gesit dan aman. Menggunakan ECI sebagai lingkungan runtime kontainer memberikan elastisitas dan keamanan yang lebih besar bagi aplikasi Anda sekaligus mengurangi biaya penggunaan dan O&M.

ApsaraDB RDS

Layanan database online yang aman, stabil, andal, hemat biaya, dan dapat diskalakan yang menyederhanakan operasi database.

Server Load Balancer (SLB)

Layanan yang mendistribusikan trafik masuk sesuai permintaan untuk menghilangkan single point of failure dan meningkatkan ketersediaan aplikasi. Layanan ini mencakup tiga tipe produk: ALB, NLB, dan CLB.

CloudMonitor

Layanan untuk memantau resource Alibaba Cloud dan aplikasi internet. Layanan ini membantu Anda memahami penggunaan resource dan status bisnis Anda di Alibaba Cloud, sehingga Anda dapat mengatasi kegagalan secara tepat waktu dan memastikan kelangsungan bisnis.

Simple Message Queue (SMQ, sebelumnya MNS)

Layanan antrian pesan ringan yang efisien, andal, aman, dan dapat diskalakan. Layanan ini membantu developer membangun sistem yang longgar terhubung dengan memungkinkan pertukaran data dan pesan antara komponen aplikasi terdistribusi.