Konfigurasikan skala-masuk graceful untuk grup penskalaan - Auto Scaling

Saat permintaan sumber daya untuk beban kerja bisnis Anda menurun, grup penskalaan memicu event skala-masuk berdasarkan kebijakan yang telah Anda tetapkan. Hal ini secara otomatis mengurangi jumlah instans dalam grup penskalaan guna mencegah pemborosan sumber daya. Topik ini menjelaskan cara melakukan skala-masuk yang graceful.

Proses skala-masuk

Saat event skala-masuk terjadi, grup penskalaan memilih instans untuk dihapus berdasarkan kebijakan yang telah Anda konfigurasikan, lalu mereklaim instans tersebut sesuai dengan mode reklaim instans yang telah Anda atur. Anda dapat mengonfigurasikan aksi yang sesuai pada berbagai tahap proses skala-masuk, seperti yang ditunjukkan pada gambar berikut.

Picu skala-masuk

Kendalikan batas skala-masuk

Metode: Tetapkan Minimum Number of Instances untuk grup penskalaan.

Jumlah minimum instans berfungsi sebagai batas bawah aktivitas skala-masuk. Jika suatu aktivitas skala-masuk menyebabkan jumlah instans turun di bawah nilai minimum ini, aktivitas tersebut akan ditolak. Hal ini memastikan grup penskalaan Anda tetap memiliki cukup instans untuk mendukung beban kerja garis dasar Anda.
Prosedur: Untuk informasi lebih lanjut, lihat Manage scaling groups.

Penskalaan Masuk Berdasarkan Tingkatan Beban Kerja

Metode: Buat aturan penskalaan langkah untuk grup penskalaan.

Anda dapat membuat aturan penskalaan langkah untuk melakukan skala-masuk berdasarkan tier beban kerja. Pendekatan ini membantu mencegah tekanan sistem atau gangguan layanan akibat penghapusan terlalu banyak instans sekaligus, sehingga memungkinkan skala-masuk yang graceful. Sebagai contoh, Anda dapat merancang rencana skala-masuk berdasarkan rata-rata utilisasi CPU kluster grup penskalaan Anda, seperti:
- Hapus 5 instans ketika rata-rata utilisasi CPU berada di bawah 20%.
- Hapus 3 instans ketika rata-rata utilisasi CPU berada di bawah 30%.
- Hapus 1 instans ketika rata-rata utilisasi CPU berada di bawah 50%.
- Untuk menerapkan hal ini, Anda dapat mengonfigurasikan aturan penskalaan langkah berikut. Pada kotak dialog Create Scaling Rule, atur Monitoring Type ke System Monitoring. Untuk Execution Time, pilih tugas alarm Low CPU Utilization (rata-rata utilisasi CPU (Agent) kurang dari atau sama dengan 50% selama 3 kali berturut-turut). Konfigurasikan aturan untuk menghapus instans secara bertahap: hapus 1 instans saat utilisasi CPU berada di antara 30% dan 50%, hapus 3 instans saat berada di antara 20% dan 30%, dan hapus 5 instans saat berada di bawah 20%. Atur instance warmup menjadi 300 detik.
Prosedur: Untuk informasi lebih lanjut, lihat Configure scaling rules.

Kendalikan kecepatan dan frekuensi skala-masuk

Anda dapat mengatur periode cooldown dan frekuensi pemicu untuk tugas alarm guna mencegah fluktuasi bisnis akibat aktivitas skala-masuk yang terlalu cepat, sehingga memastikan skala-masuk yang graceful.

Metode 1: Tetapkan periode cooldown

Metode: Tetapkan periode cooldown default untuk grup penskalaan dan periode cooldown untuk aturan penskalaan.

Periode cooldown adalah interval minimum antara dua aktivitas penskalaan yang dipicu oleh tugas alarm. Konfigurasi ini memungkinkan Anda mengendalikan frekuensi aktivitas skala-masuk.
Prosedur: Untuk informasi lebih lanjut, lihat Cooldown period.

Metode 2: Tetapkan frekuensi pemicu untuk tugas alarm

Metode: Untuk tugas alarm, konfigurasikan parameter seperti Statistical Period, Statistical Method, dan Triggered After.

Pengaturan ini memungkinkan Anda mengendalikan frekuensi aktivitas skala-masuk yang dipicu oleh tugas alarm tersebut.
Prosedur: Untuk informasi lebih lanjut, lihat Configure alarm tasks.

Metode 3: Tetapkan frekuensi pemicu untuk aturan penskalaan pelacakan target

Metode: Tetapkan Threshold for Scale-in Alerts untuk aturan penskalaan pelacakan target.

Setelah Anda membuat aturan penskalaan pelacakan target, tugas alarm akan dibuat secara otomatis. Parameter ini menentukan berapa kali berturut-turut ambang batas harus terpenuhi untuk memicu tugas alarm skala-masuk.
Prosedur: Untuk informasi lebih lanjut, lihat Target tracking scaling rules.

Kustomisasi pemicu skala-masuk

Anda dapat menyesuaikan kapan skala-masuk dipicu berdasarkan kebutuhan Anda untuk mencapai skala-masuk yang graceful. Anda dapat menggunakan salah satu metode berikut.

Metode 1: Jalankan secara manual aturan simple

Anda dapat memicu skala-masuk dengan menjalankan secara manual Simple Scaling Rule. Untuk informasi lebih lanjut, lihat Configure scaling rules.

Catatan

Metode ini mendukung panggilan API. Untuk informasi lebih lanjut tentang API tersebut, lihat ExecuteScalingRule dan ScaleWithAdjustment.

Metode 2: Ubah pengaturan jumlah instans grup penskalaan untuk memicu skala-masuk

Anda dapat memicu aktivitas skala-masuk dengan mengubah Maximum Instances atau Expected Number of Instances. Grup penskalaan akan secara otomatis melakukan skala-masuk berdasarkan pengaturan tersebut. Untuk informasi lebih lanjut, lihat Manage scaling groups.

Catatan

Metode ini mendukung panggilan API. Untuk informasi lebih lanjut tentang API tersebut, lihat ModifyScalingGroup.

Pilih instans untuk skala-masuk

Secara default, grup penskalaan menghapus instans berdasarkan prioritas vSwitch yang Anda konfigurasikan. Anda dapat mengubah kebijakan skala-masuk untuk memilih instans yang akan dihapus sesuai dengan kebutuhan bisnis Anda.

Penting

Jika Anda tidak ingin instans penting di-skala-masuk, Anda dapat mengaktifkan status Protected untuk instans tersebut guna mencegahnya secara tidak sengaja di-skala-masuk dan mengganggu operasi bisnis normal Anda. Untuk instruksi detail, lihat Manually add an instance to or remove an instance from the Protected state.
Grup penskalaan Elastic Container Instance (ECI) tidak mendukung konfigurasi Scaling Policy atau Instance Removing Policy. Secara default, grup penskalaan ECI pertama-tama memilih kumpulan instans yang dibuat oleh konfigurasi penskalaan tertua, lalu menghapus instans tertua dari kumpulan tersebut.

Solusi 1: Kebijakan distribusi seimbang

Solusi ini berfokus pada pemulihan bencana. Solusi ini memastikan bahwa instans tetap terdistribusi secara merata di berbagai zona setelah skala-masuk, yang membantu mencapai ketersediaan tinggi di beberapa zona.

Metode: Tetapkan Scaling Policy ke Balanced Distribution Policy.

Dengan kebijakan ini, grup penskalaan memprioritaskan penghapusan instans dari zona yang memiliki jumlah instans terbanyak. Jika terdapat beberapa instans yang memenuhi syarat untuk dihapus, grup tersebut kemudian menggunakan Instance Removing Policy yang telah dikonfigurasikan untuk menentukan pilihan akhir, seperti menghapus instans tertua atau terbaru, atau instans dari konfigurasi penskalaan paling awal.
Prosedur: Untuk informasi lebih lanjut, lihat Scenario 2: Scaling Policy (Balanced Distribution Policy) + Scale-In Policy.

Solusi 2: Kebijakan optimalisasi biaya

Solusi ini berfokus pada pengendalian biaya. Kebijakan Optimalisasi Biaya memprioritaskan penghapusan instans dengan harga satuan tertinggi untuk mengurangi biaya.

Metode: Tetapkan Scaling Policy ke Cost Optimization Policy.

Dengan kebijakan ini, grup penskalaan memprioritaskan penghapusan instans dengan harga satuan vCPU tertinggi. Jika terdapat beberapa instans dengan harga tertinggi yang sama, grup tersebut kemudian menggunakan Instance Removing Policy yang telah dikonfigurasikan untuk menentukan pilihan akhir, seperti menghapus instans tertua atau terbaru, atau instans dari konfigurasi penskalaan paling awal.
Prosedur: Untuk informasi lebih lanjut, lihat Scenario 3: Scaling Policy (Cost Optimization Policy) + Scale-In Policy.

Catatan

Solusi ini juga memungkinkan Anda mengonfigurasi rasio instans preemptible terhadap instans pay-as-you-go dalam grup penskalaan untuk menyeimbangkan biaya.

Solusi 3: Kebijakan kombinasi kustom

Anda dapat menggabungkan strategi dari Solusi 1 dan Solusi 2 sesuai dengan kebutuhan bisnis Anda.

Metode: Tetapkan Scaling Policy ke Custom Combination Policy.

Kebijakan ini memungkinkan Anda menyesuaikan rasio instans pay-as-you-go terhadap instans preemptible, menyeimbangkan kapasitas di berbagai zona, serta menentukan strategi distribusi kapasitas terpisah untuk setiap tipe instans.
Prosedur: Untuk informasi lebih lanjut, lihat Configure an instance termination policy for a scaling group.

Solusi 4: Kebijakan penskalaan masuk kustom

Jika kebijakan skala-masuk bawaan tidak memenuhi kebutuhan Anda, Anda dapat menggunakan solusi ini untuk membuat kebijakan kustom dengan menggunakan Function Compute.

Metode: Tetapkan Instance Removing Policy ke Custom Policy.

Anda dapat menentukan logika skala-masuk kustom secara terprogram di Function Compute. Setiap kali event skala-masuk dipicu, fungsi yang telah Anda konfigurasikan akan dipanggil. Di dalam fungsi tersebut, Anda dapat menentukan instans mana yang dapat dihapus dan instans mana yang tidak boleh dihapus.
Prosedur: Untuk informasi selengkapnya, lihat Menyesuaikan kebijakan penghapusan Instance ECS menggunakan fungsi.

Skala-masuk graceful

Skala-masuk yang mulus memastikan bahwa jika Instans yang dipilih untuk dihapus sedang memproses Tugas, penghapusannya ditunda hingga Tugas tersebut selesai, sehingga mencegah gangguan layanan.

Metode: Siapkan Lifecycle Hook.

Saat skala-masuk menghapus instans, Anda dapat menggunakan lifecycle hook untuk menjeda penghapusan instans dan menjalankan aksi kustom. Anda juga dapat memanggil API untuk memperpanjang waktu tunggu hook, sehingga instans dapat menyelesaikan tugasnya sebelum dihentikan.
Prosedur: Untuk informasi lebih lanjut, lihat Overview of lifecycle hooks dan Extend the wait time of a lifecycle hook.

Penting

Menghapus, menghilangkan, atau menghentikan instans secara langsung tidak memicu lifecycle hook. Metode ini tidak berlaku dalam kasus-kasus tersebut.

Mereklaim instans yang dihapus

Untuk meningkatkan efisiensi skala-masuk, grup penskalaan secara default menggunakan mode Force Release untuk mereklaim instans. Dalam mode ini, instans yang dihapus segera dilepas. Untuk mengubah Instance Reclaim Mode, lihat Manage scaling groups.