Auto Scaling adalah layanan cloud yang secara otomatis menyesuaikan jumlah instance berdasarkan permintaan beban kerja dan kebijakan penskalaan. Layanan ini memastikan ketersediaan sumber daya komputasi yang memadai, meminimalkan kapasitas menganggur, dan mengurangi biaya.
Video berikut menunjukkan cara menggunakan Auto Scaling dengan instance Elastic Compute Service (ECS).
Mengapa memilih Auto Scaling?
Auto Scaling secara otomatis menambah atau menghapus instance ECS atau instance kontainer elastis dari grup penskalaan berdasarkan perubahan permintaan bisnis. Ini memastikan daya komputasi yang cukup saat permintaan meningkat dan meminimalkan biaya sumber daya saat permintaan menurun. Dengan demikian, Auto Scaling memastikan bahwa grup penskalaan selalu sesuai dengan kebutuhan bisnis Anda.
Tabel berikut menjelaskan manfaat yang diberikan oleh Auto Scaling.
Manfaat | Deskripsi |
Otomatisasi |
|
Efisiensi biaya | Dengan Auto Scaling, Anda tidak perlu secara manual menyesuaikan jumlah instance atau menyiapkannya untuk lonjakan lalu lintas. Ini secara otomatis memastikan bahwa Anda memiliki jumlah instance yang tepat tanpa ada sumber daya menganggur. Auto Scaling secara otomatis menyesuaikan jumlah instance untuk mengoptimalkan biaya sumber daya. Ini memantau perubahan metrik atau fluktuasi dalam jumlah instance yang diharapkan dalam grup penskalaan Anda selama periode statistik yang ditentukan, yang defaultnya satu menit. Jika Auto Scaling mendeteksi bahwa nilai metrik berada di luar rentang yang diizinkan, ia segera memicu tindakan penskalaan. Faktor-faktor berikut dapat memengaruhi kecepatan penskalaan:
|
Ketersediaan tinggi | Anda dapat menggunakan Auto Scaling untuk memantau kesehatan instance ECS atau instance kontainer elastis, memastikan aplikasi Anda tetap tersedia tinggi. Auto Scaling secara otomatis memeriksa kesehatan instance, dan jika sebuah instance terdeteksi tidak sehat, ia akan menggantinya dengan instance baru dari tipe yang sama. |
Fleksibilitas dan kecerdasan |
|
Pemeriksaan mudah | Auto Scaling mencatat detail setiap acara penskalaan dan memantau grup penskalaan, memungkinkan Anda mengidentifikasi dan menyelesaikan masalah dengan efisien. |
Untuk informasi lebih lanjut, lihat Manfaat.
Fitur
Auto Scaling mendukung penyesuaian jumlah instance ECS dan instance kontainer elastis (pengurangan dan penambahan skala). Namun, fitur ini tidak mendukung penyesuaian konfigurasi instance ECS individu atau instance kontainer elastis. Untuk memodifikasi konfigurasi instance ECS atau instance kontainer elastis (seperti vCPU, ukuran memori, bandwidth), aktifkan Layanan Orkestrasi CloudOps (OOS). Untuk informasi lebih lanjut, lihat Apa itu OOS?
Auto Scaling secara dinamis menyesuaikan jumlah instance ECS atau instance kontainer elastis untuk memenuhi kebutuhan bisnis Anda. Tabel berikut menjelaskan komponen utama Auto Scaling.
Komponen | Deskripsi |
Grup penskalaan berisi instance identik, dirancang untuk digunakan dalam skenario bisnis serupa. Anda dapat mengonfigurasi grup penskalaan untuk menentukan tipe instance untuk daya komputasi. Selain itu, Anda dapat menentukan sumber konfigurasi instance, jumlah minimum dan maksimum instance, serta grup server Classic Load Balancer (CLB) atau Application Load Balancer (ALB) terkait. Untuk beberapa skenario bisnis, Anda dapat membuat grup penskalaan terpisah. Auto Scaling akan secara otomatis mengalokasikan sumber daya komputasi ke setiap grup berdasarkan konfigurasi Anda. | |
Sumber konfigurasi instance mendefinisikan template yang digunakan untuk mengelola instance ECS atau instance kontainer elastis Anda. Auto Scaling menggunakan template ECS untuk membuat instance ECS dan template Instance Kontainer Elastis untuk membuat instance kontainer elastis selama acara penambahan skala. | |
Aturan penskalaan memicu acara penskalaan, seperti menambahkan instance ECS atau instance kontainer elastis. Aturan penskalaan dapat dieksekusi secara manual, atau dikonfigurasi untuk berjalan secara otomatis melalui tugas yang dipicu oleh acara atau terjadwal. Aturan penskalaan memungkinkan penyesuaian dinamis batas minimum dan maksimum instance untuk grup penskalaan Anda berdasarkan pemicu tertentu. | |
Auto Scaling terintegrasi dengan CloudMonitor untuk melacak metrik grup penskalaan Anda secara real-time. Ketika metrik yang dipantau mencapai ambang batas yang ditentukan, aturan penskalaan yang sesuai dieksekusi. | |
Anda dapat membuat tugas terjadwal untuk secara otomatis mengeksekusi aturan penskalaan pada titik waktu yang ditentukan. |
Auto Scaling dapat diaktifkan setelah Anda mengonfigurasi dan mengaktifkan grup penskalaan, serta menentukan sumber konfigurasi instance untuk grup tersebut. Konfigurasi tambahan dapat disesuaikan berdasarkan kebutuhan bisnis Anda. Gambar berikut mengilustrasikan cara menggunakan Auto Scaling.
Auto Scaling juga menyediakan fitur-fitur berikut untuk mengatasi berbagai kebutuhan bisnis:
Auto Scaling mengirimkan notifikasi ketika acara penskalaan berhasil, gagal, atau ditolak, berdasarkan aturan yang telah ditentukan. Tabel berikut merinci aturan-aturan ini.
Aturan
Deskripsi
Auto Scaling mengirimkan notifikasi melalui pesan teks, pesan internal, dan email.
Auto Scaling mengirimkan notifikasi ke CloudMonitor atau SMQ. Jika Anda menggunakan SMQ, notifikasi dikirim ke topik SMQ atau antrian SMQ yang ditentukan. Anda akan dikenakan biaya saat menggunakan SMQ. Untuk informasi lebih lanjut tentang harga SMQ, lihat Penagihan.
Auto Scaling juga menyediakan fitur-fitur berikut untuk membantu Anda mengelola instance dalam grup penskalaan. Tabel berikut menjelaskan fitur-fitur ini.
Fitur
Deskripsi
Hook siklus hidup mengelola siklus hidup instance ECS atau instance kontainer elastis dalam grup penskalaan. Ini dipicu selama acara penskalaan untuk mengubah status instance menjadi "Pending Add" atau "Pending Remove." Operasi dapat dilakukan pada instance sampai hook siklus hidup habis waktu.
Auto Scaling memungkinkan penambahan atau penghapusan manual instance ECS, instance kontainer elastis, atau instance pihak ketiga yang dikelola Alibaba Cloud dalam grup penskalaan.
Jika grup penskalaan Anda bertipe ECS, Anda dapat menggunakan fitur pembaruan bergulir untuk mengelola instance ECS. Ini memungkinkan Anda memperbarui konfigurasi di beberapa instance secara bersamaan, seperti memperbarui gambar, menjalankan skrip, atau menginstal paket OOS pada instance dalam status "In Service".
Skenario
Auto Scaling menyediakan berbagai fitur penskalaan yang cocok untuk skenario bisnis berikut:
Fluktuasi beban kerja dapat diprediksi.
Sebagai contoh, perusahaan produksi video dapat menggunakan Auto Scaling untuk membuat tugas terjadwal berdasarkan pola lalu lintas yang dapat diprediksi. Auto Scaling secara otomatis menyediakan instance ECS atau instance kontainer elastis untuk menangani lonjakan lalu lintas, seperti yang terjadi setiap hari Jumat pukul 20:00:00.
Fluktuasi beban kerja tidak dapat diprediksi.
Sebagai contoh, perusahaan produksi video dengan pola lalu lintas yang tidak dapat diprediksi dapat menggunakan Auto Scaling untuk membuat tugas yang dipicu oleh acara guna memantau utilisasi CPU. Ketika utilisasi CPU melebihi 60%, Auto Scaling secara otomatis menambahkan instance ECS atau instance kontainer elastis untuk mengelola lonjakan lalu lintas.
Untuk informasi lebih lanjut, lihat Skenario.
Cara kerjanya
Auto Scaling secara otomatis menyesuaikan jumlah instance ECS atau instance kontainer elastis dalam grup penskalaan berdasarkan mode penskalaan yang ditentukan. Instance-instance ini menangani permintaan klien. Auto Scaling memungkinkan penskalaan dinamis, menambahkan atau menghapus instance untuk memenuhi permintaan bisnis yang berfluktuasi. Untuk informasi lebih lanjut, lihat Prinsip Kerja.
Aturan penagihan
Auto Scaling gratis. Namun, Anda akan dikenakan biaya untuk sumber daya berikut yang digunakan di konsol Auto Scaling: instance ECS, instance kontainer elastis, instance ApsaraDB RDS, instance SLB (termasuk instance CLB, grup server ALB, dan grup server NLB), dan SMQ. Untuk informasi lebih lanjut, lihat Ikhtisar Penagihan.
Bagaimana cara menggunakan Auto Scaling?
Konsol Auto Scaling: halaman web yang mendukung operasi interaktif.
API: API panggilan prosedur jarak jauh (RPC) yang mendukung permintaan GET dan POST. Untuk informasi lebih lanjut tentang operasi API, lihat Daftar Operasi Berdasarkan Fungsi. Jika Anda ingin memanggil API Auto Scaling, gunakan salah satu alat pengembang umum berikut:
CLI Alibaba Cloud: alat manajemen fleksibel dan skalabel berbasis API Alibaba Cloud. Anda dapat menggunakan CLI untuk mengenkapsulasi API asli Alibaba Cloud dan mengembangkan fitur kustom.
OpenAPI Explorer: alat yang mengindeks operasi API secara efisien, memungkinkan pemanggilan API online, dan pembuatan kode contoh SDK secara dinamis.
Layanan terkait
Layanan | Deskripsi |
Layanan komputasi IaaS siap pakai dan skalabel yang ditawarkan oleh Alibaba Cloud. | |
Layanan runtime kontainer serverless yang gesit dan aman yang disediakan oleh Alibaba Cloud. Instance kontainer elastis bersifat skalabel, aman, dan hemat biaya, membantu mengurangi biaya sumber daya dan operasional untuk sistem bisnis Anda. | |
Layanan database online yang aman, andal, hemat biaya, dan skalabel yang dirancang untuk mengatasi tantangan operasional database. | |
Layanan load balancing yang mendistribusikan lalu lintas jaringan secara dinamis untuk meningkatkan ketersediaan aplikasi dan menghilangkan titik kegagalan tunggal. SLB menyediakan jenis load balancer berikut: ALB, NLB, dan CLB. | |
Layanan yang memantau sumber daya Alibaba Cloud dan aplikasi Internet. CloudMonitor memberikan wawasan komprehensif tentang penggunaan sumber daya dan status bisnis, memungkinkan Anda dengan cepat mengidentifikasi dan menangani masalah apa pun untuk memastikan operasi bisnis yang lancar. | |
Layanan pesan ringan dan skalabel yang memungkinkan transfer data yang efisien, andal, dan aman antara komponen aplikasi terdistribusi, mendukung pengembangan sistem dengan keterkaitan longgar. |