Ketika beban kerja bisnis Anda menurun, Auto Scaling memicu event skala-masuk di grup penskalaan Anda. Hal ini mengotomatiskan penyesuaian resource dan meminimalkan biaya. Topik ini menjelaskan cara melakukan operasi skala-masuk graceful.
Pengenalan proses skala-masuk
Saat proses skala-masuk dipicu di grup penskalaan Anda, Auto Scaling memilih instans yang akan dihapus berdasarkan kebijakan skala-masuk yang dikonfigurasi. Setelah dihapus, instans tersebut direklamasi sesuai dengan mode reklamasi instans yang telah ditentukan sebelumnya. Konfigurasi bervariasi tergantung pada fase berbeda dalam proses skala-masuk, seperti yang ditunjukkan pada gambar berikut.
Picu event skala-masuk
Kendalikan batas skala-masuk untuk memenuhi kebutuhan bisnis harian
Metode implementasi: Konfigurasikan parameter Minimum Number of Instances untuk grup penskalaan.
Parameter Minimum Number of Instances menentukan batas bawah jumlah instans dalam grup penskalaan. Saat permintaan skala-masuk diajukan, Auto Scaling akan menolak permintaan tersebut jika jumlah instans turun di bawah batas ini setelah proses skala-masuk selesai. Hal ini mencegah resource menjadi tidak mencukupi untuk memenuhi kebutuhan bisnis harian.
Operasi: Untuk informasi selengkapnya, lihat Manage scaling groups.
Skala-masuk instans berdasarkan tier beban kerja (aturan penskalaan langkah)
Metode implementasi: Buat aturan penskalaan langkah untuk grup penskalaan.
Anda dapat membuat aturan penskalaan langkah untuk mengaktifkan skala-masuk berdasarkan tier beban kerja. Metode ini secara efektif mencegah overload sistem atau gangguan akibat penghapusan instans secara cepat dalam jumlah besar dan memastikan event skala-masuk berjalan dengan graceful. Misalnya, Anda ingin merancang solusi skala-masuk kustom berdasarkan tier utilisasi CPU berikut di grup penskalaan Anda:
Skala-masuk lima instans jika rata-rata utilisasi CPU turun di bawah 20%.
Skala-masuk tiga instans ECS jika rata-rata utilisasi CPU berada di antara 20% dan 30%.
Skala-masuk satu instans ECS jika rata-rata utilisasi CPU berada di antara 30% dan 50%.
Dalam kasus ini, Anda dapat membuat aturan penskalaan langkah, seperti yang ditunjukkan pada gambar berikut. 
Operasi: Untuk informasi selengkapnya, lihat Configure scaling rules.
Konfigurasikan periode cooldown dan tugas berbasis peristiwa untuk mengontrol laju serta frekuensi skala-masuk
Anda dapat mengonfigurasi periode cooldown dan tugas berbasis peristiwa untuk mencegah ketidakstabilan bisnis akibat operasi skala-masuk yang terlalu sering dan memastikan event skala-masuk berjalan dengan graceful.
Tentukan waktu pemicu event skala-masuk
Anda dapat menentukan waktu pemicu event skala-masuk sesuai kebutuhan bisnis Anda. Hal ini menerapkan event skala-masuk yang graceful. Anda dapat menggunakan salah satu metode berikut:
Pilih instans yang ingin di-scale in
Secara default, Auto Scaling melakukan skala-masuk instans berdasarkan urutan vSwitch yang ditentukan di grup penskalaan Anda (kebijakan prioritas). Anda dapat mengubah kebijakan skala-masuk untuk memilih instans yang ingin Anda skala-masuk sesuai kebutuhan bisnis Anda.
Jika Anda tidak ingin instans yang bersifat mission-critical di-skala-masuk, Anda dapat menempatkan instans tersebut ke dalam status Protected untuk mencegah gangguan bisnis akibat skala-masuk instans yang tidak diinginkan. Untuk informasi selengkapnya, lihat Manually put instances into the Protected state or move instances out of the Protected state.
Grup penskalaan tipe Elastic Container Instance tidak mendukung parameter Scale-In Policy dan Scaling Policy. Secara default, Auto Scaling akan lebih dulu menghapus instans kontainer elastis yang dibuat dari konfigurasi penskalaan paling awal dari grup penskalaan, lalu menghapus instans kontainer elastis paling awal dari grup penskalaan.
Solusi 1: Seimbangkan distribusi instans di berbagai zona setelah proses skala-masuk selesai
Solusi ini memastikan disaster recovery. Jika Anda menggunakan solusi ini, instans akan didistribusikan secara merata di beberapa zona setelah proses skala-masuk selesai untuk menerapkan disaster recovery.
Metode implementasi: Atur parameter Scaling Policy ke Balanced Distribution Policy.
Setelah Anda mengaktifkan kebijakan distribusi seimbang, Auto Scaling akan lebih dulu melakukan skala-masuk instans dari zona yang memiliki jumlah instans terbanyak. Jika Anda ingin proses skala-masuk berlanjut setelah kebijakan distribusi seimbang diterapkan, atur parameter Scale-In Policy ke Created From Earliest Scaling Configuration, Earliest Instances, atau Most Recent Instances.
Operasi: Untuk informasi selengkapnya, lihat Scenario 2: Scaling policy (Balanced Distribution Policy) + Scale-in policy.
Solusi 2: Utamakan skala-masuk instans dengan harga satuan tertinggi (kebijakan optimasi biaya)
Solusi ini memastikan efisiensi biaya. Anda dapat mengaktifkan kebijakan optimasi biaya untuk melakukan skala-masuk pada instans yang memiliki tingkat efisiensi biaya terendah. Hal ini meningkatkan pemanfaatan resource.
Metode implementasi: Atur kebijakan Scaling Policy ke Cost Optimization Policy.
Setelah Anda mengaktifkan kebijakan optimasi biaya, Auto Scaling akan lebih dulu melakukan skala-masuk pada instans dengan harga satuan tertinggi dari grup penskalaan Anda. Jika Anda ingin proses skala-masuk berlanjut setelah kebijakan optimasi biaya diterapkan, atur parameter Scale-In Policy ke Instances Created From Earliest Scaling Configuration, Earliest Instances, atau Most Recent Instances.
Operasi: Untuk informasi selengkapnya, lihat Scenario 3: Scaling policy (Cost Optimization Policy) + Scale-in policy.
Solusi ini membantu Anda menyeimbangkan biaya resource. Anda dapat mengonfigurasi rasio instans preemptible terhadap instans pay-as-you-go di grup penskalaan Anda.
Solusi 3: Buat kebijakan kombinasi kustom
Anda dapat menggabungkan Solusi 1 dan Solusi 2.
Metode implementasi: Atur parameter Scaling Policy untuk grup penskalaan Anda ke Custom Combination Policy.
Saat Anda mengaktifkan kebijakan kombinasi kustom, Anda dapat menyesuaikan rasio instans pay-as-you-go terhadap instans preemptible, menyeimbangkan kapasitas resource di berbagai zona, serta membuat kebijakan perencanaan kapasitas untuk instans pay-as-you-go dan preemptible.
Operasi: Untuk informasi selengkapnya, lihat Mengatur kebijakan penghentian Instans untuk grup penskalaan.
Solusi 4: Buat kebijakan skala-masuk kustom
Jika kebijakan skala-masuk yang didukung oleh Auto Scaling tidak memenuhi kebutuhan bisnis Anda, Anda dapat menggunakan Function Compute untuk membuat kebijakan skala-masuk kustom, seperti yang dijelaskan dalam solusi ini.
Metode implementasi: Atur parameter Scale-In Policy ke Custom Policy.
Anda dapat membuat kebijakan skala-masuk kustom menggunakan bahasa pemrograman di Function Compute. Setiap kali event skala-masuk dipicu, fungsi yang Anda buat di Function Compute akan dipanggil. Saat membuat fungsi tersebut, Anda dapat menentukan instans mana yang boleh di-skala-masuk dan instans mana yang tidak boleh, sesuai kebutuhan bisnis Anda.
Operasi: Untuk informasi selengkapnya, lihat Use Function Compute to customize ECS scale-in policies.
Lakukan skala-masuk instans secara graceful
Proses skala-masuk hanya berlangsung jika instans yang memenuhi standar skala-masuk telah menyelesaikan tugas yang sedang berjalan. Proses ini, yang dikenal sebagai graceful scale-in, mencegah gangguan bisnis akibat operasi skala-masuk.
Metode implementasi: Buat lifecycle hook.
Saat proses skala-masuk dipicu, Anda dapat mengaktifkan lifecycle hook untuk menempatkan instans yang memiliki tugas sedang berjalan ke status Pending Remove. Selama masa berlaku lifecycle hook, Anda dapat melakukan operasi pada instans tersebut. Jika diperlukan waktu lebih lama untuk menyelesaikan tugas yang sedang berjalan, Anda dapat memanggil operasi API untuk memperpanjang masa berlaku lifecycle hook.
Operasi: Untuk informasi selengkapnya, lihat Overview dan RecordLifecycleActionHeartbeat.
Jika Anda langsung menghapus, menghilangkan, atau menghentikan instans untuk mencapai efek skala-masuk serupa, lifecycle hook tidak akan berlaku. Anda tidak dapat menggunakan solusi ini.
Reklamasi instans yang telah di-skala-masuk
Untuk meningkatkan efisiensi skala-masuk, mode reklamasi instans default adalah Force Release. Dalam mode ini, Auto Scaling langsung melepas instans yang dihapus dari grup penskalaan. Tidak ada resource yang dipertahankan setelah instans dilepas. Anda juga dapat menggunakan mode reklamasi instans lainnya. Untuk informasi selengkapnya, lihat Manage scaling groups.