Topik ini menjelaskan sumber daya Auto Scaling dan penggunaannya untuk membantu Anda memahami konsep serta fitur inti Auto Scaling.
Proses penggunaan
Jika Anda mengatur parameter Instance Configuration Source ke Launch Templates atau Select Existing Instance saat membuat grup penskalaan, konfigurasi penskalaan akan dibuat secara otomatis dan langsung aktif. Anda tidak perlu membuat ulang konfigurasi penskalaan secara manual. Setelah proses pembuatan grup penskalaan selesai, Anda dapat langsung mengaktifkan grup penskalaan tersebut.
Create a scaling group
Grup penskalaan terdiri dari instans yang identik dan dirancang untuk skenario bisnis serupa. Saat membuat grup penskalaan, Anda dapat menentukan atribut seperti batas minimum dan maksimum jumlah instans, templat untuk event scale-out, serta kebijakan scale-in. Untuk informasi selengkapnya, lihat Ikhtisar.
Create a scaling configuration
Konfigurasi penskalaan adalah templat yang digunakan oleh Auto Scaling untuk meluncurkan instans Elastic Compute Service (ECS) atau instans kontainer elastis secara otomatis. Untuk informasi selengkapnya, lihat Ikhtisar.
Enable the scaling configuration
Jika grup penskalaan tidak memiliki konfigurasi penskalaan aktif, sistem akan menampilkan prompt yang meminta Anda mengaktifkan konfigurasi penskalaan setelah grup penskalaan dibuat. Satu grup penskalaan dapat memiliki beberapa konfigurasi penskalaan, tetapi hanya satu yang dapat aktif pada satu waktu. Untuk informasi selengkapnya, lihat Manage scaling configurations.
Enable the scaling group
Event penskalaan hanya terjadi pada grup penskalaan yang berada dalam status Enabled. Jika grup penskalaan telah memiliki konfigurasi penskalaan aktif, Anda akan diminta untuk mengaktifkan grup tersebut. Anda juga dapat membuka halaman Scaling Groups untuk mengaktifkan grup penskalaan secara manual. Untuk informasi selengkapnya, lihat Enable a scaling group.
Creates a scaling rule
Aturan penskalaan menentukan aksi untuk menyesuaikan jumlah instans dalam grup penskalaan, sehingga membantu mengelola penambahan atau penghapusan instans. Untuk informasi selengkapnya, lihat Ikhtisar.
Execute the scaling rule
Untuk mengeksekusi aturan penskalaan, Anda dapat menggunakan salah satu metode berikut. Untuk informasi selengkapnya, lihat Execute a scaling rule.
Manual execution: Eksekusi aturan penskalaan secara manual. Metode ini ideal untuk menangani kebutuhan bisnis sementara.
Automatic execution based on scheduled tasks: Konfigurasikan Tugas terjadwal untuk mengeksekusi aturan penskalaan pada waktu tertentu. Metode ini ideal untuk mengelola fluktuasi beban kerja dengan pola yang dapat diprediksi.
Automatic execution based on event-triggered tasks: Konfigurasikan tugas berbasis peristiwa untuk memantau metrik tertentu, mengirimkan alert, dan mengeksekusi aturan penskalaan. Pendekatan ini ideal untuk menangani fluktuasi beban kerja tanpa pola yang dapat diprediksi.
Skema Penggunaan
Deskripsi skenario dan contoh | Referensi |
Untuk kebutuhan bisnis sementara, jumlah server yang perlu ditambahkan dan waktu penambahannya tidak pasti, terutama ketika tidak tersedia metrik untuk pemantauan. Dalam kasus seperti ini, penyesuaian jumlah server harus dilakukan secara manual. Sebagai contoh, jika sebuah perusahaan memerlukan server tambahan untuk keperluan pengujian sementara, pengawasan manual diperlukan untuk menentukan jumlah dan waktu penyesuaian server. | |
Jika beban kerja Anda menunjukkan fluktuasi yang dapat diprediksi dengan jam puncak dan jam sepi yang jelas, Anda dapat mengonfigurasi Tugas terjadwal di Konsol Auto Scaling untuk menyesuaikan jumlah instans ECS pada titik waktu tertentu. Sebagai contoh, perusahaan game mengamati peningkatan konsisten beban kerja bisnis setiap malam dari pukul 18.00 hingga 23.00, sehingga memerlukan server tambahan selama periode tersebut. Di luar periode ini, hanya diperlukan jumlah server tetap untuk mendukung operasional reguler. | |
Saat mengelola fluktuasi beban kerja dinamis, menentukan jumlah server optimal dan waktu penskalaan bisa menjadi tantangan. Jika Anda ingin menyesuaikan kapasitas server berdasarkan perubahan beban kerja secara real-time, Anda dapat membuat tugas berbasis peristiwa di Konsol Auto Scaling. Sebagai contoh, traffic pada situs web berita sangat bervariasi. Jumlah kunjungan halaman melonjak saat ada berita hangat dan menurun seiring berita tersebut menjadi kurang aktual. |