全部产品
Search
文档中心

Auto Scaling:Apa itu Auto Scaling?

更新时间:Dec 04, 2025

Auto Scaling adalah layanan cloud yang secara otomatis menyesuaikan jumlah instance berdasarkan permintaan beban kerja dan kebijakan penskalaan. Layanan ini memastikan ketersediaan sumber daya komputasi yang memadai, meminimalkan kapasitas menganggur, dan mengurangi biaya.

Video berikut menunjukkan cara menggunakan Auto Scaling dengan instance Elastic Compute Service (ECS).

Mengapa memilih Auto Scaling?

Auto Scaling secara otomatis menambah atau menghapus instance ECS atau instance kontainer elastis dari grup penskalaan berdasarkan perubahan permintaan bisnis. Ini memastikan daya komputasi yang cukup saat permintaan meningkat dan meminimalkan biaya sumber daya saat permintaan menurun. Dengan demikian, Auto Scaling memastikan bahwa grup penskalaan selalu sesuai dengan kebutuhan bisnis Anda.

Tabel berikut menjelaskan manfaat yang diberikan oleh Auto Scaling.

Manfaat

Deskripsi

Otomatisasi

  • Selama acara penambahan skala, Auto Scaling secara otomatis meluncurkan instance tipe tertentu dalam grup penskalaan Anda dan menempelkannya ke instance Server Load Balancer (SLB) terkait. Ini juga menambahkan alamat IP privat instance tersebut ke daftar putih alamat IP instance ApsaraDB RDS terkait.

  • Selama acara pengurangan skala, Auto Scaling secara otomatis menghapus instance tipe tertentu dari grup penskalaan dan melepaskannya dari instance SLB terkait. Ini juga menghapus alamat IP privat instance yang dihapus dari daftar putih alamat IP instance ApsaraDB RDS terkait.

Efisiensi biaya

Dengan Auto Scaling, Anda tidak perlu secara manual menyesuaikan jumlah instance atau menyiapkannya untuk lonjakan lalu lintas. Ini secara otomatis memastikan bahwa Anda memiliki jumlah instance yang tepat tanpa ada sumber daya menganggur. Auto Scaling secara otomatis menyesuaikan jumlah instance untuk mengoptimalkan biaya sumber daya.

Ini memantau perubahan metrik atau fluktuasi dalam jumlah instance yang diharapkan dalam grup penskalaan Anda selama periode statistik yang ditentukan, yang defaultnya satu menit. Jika Auto Scaling mendeteksi bahwa nilai metrik berada di luar rentang yang diizinkan, ia segera memicu tindakan penskalaan. Faktor-faktor berikut dapat memengaruhi kecepatan penskalaan:

  • Waktu startup instance: waktu yang diperlukan bagi sebuah instance untuk menjadi operasional, dari pembuatan hingga dapat memberikan layanan seperti yang diharapkan.

  • Jumlah instance yang menunggu penambahan: Jika 1.000 atau lebih sedikit instance menunggu untuk ditambahkan ke grup penskalaan Anda, Auto Scaling dapat menyelesaikan proses dalam waktu 1 menit.

Ketersediaan tinggi

Anda dapat menggunakan Auto Scaling untuk memantau kesehatan instance ECS atau instance kontainer elastis, memastikan aplikasi Anda tetap tersedia tinggi. Auto Scaling secara otomatis memeriksa kesehatan instance, dan jika sebuah instance terdeteksi tidak sehat, ia akan menggantinya dengan instance baru dari tipe yang sama.

Fleksibilitas dan kecerdasan

  • Anda dapat mengonfigurasi Auto Scaling untuk menskalakan instance tipe pilihan Anda (instance ECS atau instance kontainer elastis).

  • Auto Scaling menawarkan mode penskalaan berikut untuk mengatasi persyaratan bisnis yang kompleks: mode jumlah tetap, kesehatan, terjadwal, dinamis, dan kustom. Mode dinamis mendukung integrasi dengan sistem pemantauan eksternal melalui operasi API.

  • Auto Scaling memungkinkan Anda memilih template pembuatan instance untuk menyediakan instance berdasarkan kebutuhan bisnis Anda, meningkatkan tingkat keberhasilan acara penambahan skala.

  • Ini juga mendukung beberapa kebijakan penskalaan untuk digunakan dalam berbagai skenario bisnis.

Pemeriksaan mudah

Auto Scaling mencatat detail setiap acara penskalaan dan memantau grup penskalaan, memungkinkan Anda mengidentifikasi dan menyelesaikan masalah dengan efisien.

Untuk informasi lebih lanjut, lihat Manfaat.

Fitur

Auto Scaling mendukung penyesuaian jumlah instance ECS dan instance kontainer elastis (pengurangan dan penambahan skala). Namun, fitur ini tidak mendukung penyesuaian konfigurasi instance ECS individu atau instance kontainer elastis. Untuk memodifikasi konfigurasi instance ECS atau instance kontainer elastis (seperti vCPU, ukuran memori, bandwidth), aktifkan Layanan Orkestrasi CloudOps (OOS). Untuk informasi lebih lanjut, lihat Apa itu OOS?

Auto Scaling secara dinamis menyesuaikan jumlah instance ECS atau instance kontainer elastis untuk memenuhi kebutuhan bisnis Anda. Tabel berikut menjelaskan komponen utama Auto Scaling.

Komponen

Deskripsi

Grup penskalaan

Grup penskalaan berisi instance identik, dirancang untuk digunakan dalam skenario bisnis serupa. Anda dapat mengonfigurasi grup penskalaan untuk menentukan tipe instance untuk daya komputasi. Selain itu, Anda dapat menentukan sumber konfigurasi instance, jumlah minimum dan maksimum instance, serta grup server Classic Load Balancer (CLB) atau Application Load Balancer (ALB) terkait. Untuk beberapa skenario bisnis, Anda dapat membuat grup penskalaan terpisah. Auto Scaling akan secara otomatis mengalokasikan sumber daya komputasi ke setiap grup berdasarkan konfigurasi Anda.

Sumber konfigurasi instance

Sumber konfigurasi instance mendefinisikan template yang digunakan untuk mengelola instance ECS atau instance kontainer elastis Anda. Auto Scaling menggunakan template ECS untuk membuat instance ECS dan template Instance Kontainer Elastis untuk membuat instance kontainer elastis selama acara penambahan skala.

Aturan penskalaan

Aturan penskalaan memicu acara penskalaan, seperti menambahkan instance ECS atau instance kontainer elastis. Aturan penskalaan dapat dieksekusi secara manual, atau dikonfigurasi untuk berjalan secara otomatis melalui tugas yang dipicu oleh acara atau terjadwal. Aturan penskalaan memungkinkan penyesuaian dinamis batas minimum dan maksimum instance untuk grup penskalaan Anda berdasarkan pemicu tertentu.

Tugas yang dipicu oleh acara

Auto Scaling terintegrasi dengan CloudMonitor untuk melacak metrik grup penskalaan Anda secara real-time. Ketika metrik yang dipantau mencapai ambang batas yang ditentukan, aturan penskalaan yang sesuai dieksekusi.

Tugas terjadwal

Anda dapat membuat tugas terjadwal untuk secara otomatis mengeksekusi aturan penskalaan pada titik waktu yang ditentukan.

Auto Scaling dapat diaktifkan setelah Anda mengonfigurasi dan mengaktifkan grup penskalaan, serta menentukan sumber konfigurasi instance untuk grup tersebut. Konfigurasi tambahan dapat disesuaikan berdasarkan kebutuhan bisnis Anda. Gambar berikut mengilustrasikan cara menggunakan Auto Scaling.

Auto Scaling juga menyediakan fitur-fitur berikut untuk mengatasi berbagai kebutuhan bisnis:

  • Auto Scaling mengirimkan notifikasi ketika acara penskalaan berhasil, gagal, atau ditolak, berdasarkan aturan yang telah ditentukan. Tabel berikut merinci aturan-aturan ini.

    Aturan

    Deskripsi

    Aturan notifikasi reguler

    Auto Scaling mengirimkan notifikasi melalui pesan teks, pesan internal, dan email.

    Aturan notifikasi lanjutan

    Auto Scaling mengirimkan notifikasi ke CloudMonitor atau SMQ. Jika Anda menggunakan SMQ, notifikasi dikirim ke topik SMQ atau antrian SMQ yang ditentukan. Anda akan dikenakan biaya saat menggunakan SMQ. Untuk informasi lebih lanjut tentang harga SMQ, lihat Penagihan.

  • Auto Scaling juga menyediakan fitur-fitur berikut untuk membantu Anda mengelola instance dalam grup penskalaan. Tabel berikut menjelaskan fitur-fitur ini.

    Fitur

    Deskripsi

    Hook siklus hidup

    Hook siklus hidup mengelola siklus hidup instance ECS atau instance kontainer elastis dalam grup penskalaan. Ini dipicu selama acara penskalaan untuk mengubah status instance menjadi "Pending Add" atau "Pending Remove." Operasi dapat dilakukan pada instance sampai hook siklus hidup habis waktu.

    Manajemen instance manual

    Auto Scaling memungkinkan penambahan atau penghapusan manual instance ECS, instance kontainer elastis, atau instance pihak ketiga yang dikelola Alibaba Cloud dalam grup penskalaan.

    Pembaruan bergulir

    Jika grup penskalaan Anda bertipe ECS, Anda dapat menggunakan fitur pembaruan bergulir untuk mengelola instance ECS. Ini memungkinkan Anda memperbarui konfigurasi di beberapa instance secara bersamaan, seperti memperbarui gambar, menjalankan skrip, atau menginstal paket OOS pada instance dalam status "In Service".

Skenario

Auto Scaling menyediakan berbagai fitur penskalaan yang cocok untuk skenario bisnis berikut:

  • Fluktuasi beban kerja dapat diprediksi.

    Sebagai contoh, perusahaan produksi video dapat menggunakan Auto Scaling untuk membuat tugas terjadwal berdasarkan pola lalu lintas yang dapat diprediksi. Auto Scaling secara otomatis menyediakan instance ECS atau instance kontainer elastis untuk menangani lonjakan lalu lintas, seperti yang terjadi setiap hari Jumat pukul 20:00:00.

  • Fluktuasi beban kerja tidak dapat diprediksi.

    Sebagai contoh, perusahaan produksi video dengan pola lalu lintas yang tidak dapat diprediksi dapat menggunakan Auto Scaling untuk membuat tugas yang dipicu oleh acara guna memantau utilisasi CPU. Ketika utilisasi CPU melebihi 60%, Auto Scaling secara otomatis menambahkan instance ECS atau instance kontainer elastis untuk mengelola lonjakan lalu lintas.

Untuk informasi lebih lanjut, lihat Skenario.

Cara kerjanya

Auto Scaling secara otomatis menyesuaikan jumlah instance ECS atau instance kontainer elastis dalam grup penskalaan berdasarkan mode penskalaan yang ditentukan. Instance-instance ini menangani permintaan klien. Auto Scaling memungkinkan penskalaan dinamis, menambahkan atau menghapus instance untuk memenuhi permintaan bisnis yang berfluktuasi. Untuk informasi lebih lanjut, lihat Prinsip Kerja.

Aturan penagihan

Auto Scaling gratis. Namun, Anda akan dikenakan biaya untuk sumber daya berikut yang digunakan di konsol Auto Scaling: instance ECS, instance kontainer elastis, instance ApsaraDB RDS, instance SLB (termasuk instance CLB, grup server ALB, dan grup server NLB), dan SMQ. Untuk informasi lebih lanjut, lihat Ikhtisar Penagihan.

Bagaimana cara menggunakan Auto Scaling?

  • Konsol Auto Scaling: halaman web yang mendukung operasi interaktif.

  • API: API panggilan prosedur jarak jauh (RPC) yang mendukung permintaan GET dan POST. Untuk informasi lebih lanjut tentang operasi API, lihat Daftar Operasi Berdasarkan Fungsi. Jika Anda ingin memanggil API Auto Scaling, gunakan salah satu alat pengembang umum berikut:

    • CLI Alibaba Cloud: alat manajemen fleksibel dan skalabel berbasis API Alibaba Cloud. Anda dapat menggunakan CLI untuk mengenkapsulasi API asli Alibaba Cloud dan mengembangkan fitur kustom.

    • OpenAPI Explorer: alat yang mengindeks operasi API secara efisien, memungkinkan pemanggilan API online, dan pembuatan kode contoh SDK secara dinamis.

Layanan terkait

Layanan

Deskripsi

Elastic Compute Service (ECS)

Layanan komputasi IaaS siap pakai dan skalabel yang ditawarkan oleh Alibaba Cloud.

Instance Kontainer Elastis

Layanan runtime kontainer serverless yang gesit dan aman yang disediakan oleh Alibaba Cloud. Instance kontainer elastis bersifat skalabel, aman, dan hemat biaya, membantu mengurangi biaya sumber daya dan operasional untuk sistem bisnis Anda.

ApsaraDB RDS

Layanan database online yang aman, andal, hemat biaya, dan skalabel yang dirancang untuk mengatasi tantangan operasional database.

Server Load Balancer (SLB)

Layanan load balancing yang mendistribusikan lalu lintas jaringan secara dinamis untuk meningkatkan ketersediaan aplikasi dan menghilangkan titik kegagalan tunggal. SLB menyediakan jenis load balancer berikut: ALB, NLB, dan CLB.

CloudMonitor

Layanan yang memantau sumber daya Alibaba Cloud dan aplikasi Internet. CloudMonitor memberikan wawasan komprehensif tentang penggunaan sumber daya dan status bisnis, memungkinkan Anda dengan cepat mengidentifikasi dan menangani masalah apa pun untuk memastikan operasi bisnis yang lancar.

Simple Message Queue (SMQ, sebelumnya MNS)

Layanan pesan ringan dan skalabel yang memungkinkan transfer data yang efisien, andal, dan aman antara komponen aplikasi terdistribusi, mendukung pengembangan sistem dengan keterkaitan longgar.