全部产品
Search
文档中心

Auto Scaling:Panduan skala-masuk

更新时间:Jan 09, 2026

Ketika beban kerja bisnis Anda menurun, Auto Scaling memicu event skala-masuk di grup penskalaan Anda. Hal ini mengotomatiskan penyesuaian resource dan meminimalkan biaya. Topik ini menjelaskan cara melakukan operasi skala-masuk graceful.

Pengenalan proses skala-masuk

Saat proses skala-masuk dipicu di grup penskalaan Anda, Auto Scaling memilih instans yang akan dihapus berdasarkan kebijakan skala-masuk yang dikonfigurasi. Setelah dihapus, instans tersebut direklamasi sesuai dengan mode reklamasi instans yang telah ditentukan sebelumnya. Konfigurasi bervariasi tergantung pada fase berbeda dalam proses skala-masuk, seperti yang ditunjukkan pada gambar berikut.

image

Picu event skala-masuk

Kendalikan batas skala-masuk untuk memenuhi kebutuhan bisnis harian

  • Metode implementasi: Konfigurasikan parameter Minimum Number of Instances untuk grup penskalaan.

    Parameter Minimum Number of Instances menentukan batas bawah jumlah instans dalam grup penskalaan. Saat permintaan skala-masuk diajukan, Auto Scaling akan menolak permintaan tersebut jika jumlah instans turun di bawah batas ini setelah proses skala-masuk selesai. Hal ini mencegah resource menjadi tidak mencukupi untuk memenuhi kebutuhan bisnis harian.

  • Operasi: Untuk informasi selengkapnya, lihat Manage scaling groups.

Skala-masuk instans berdasarkan tier beban kerja (aturan penskalaan langkah)

  • Metode implementasi: Buat aturan penskalaan langkah untuk grup penskalaan.

    Anda dapat membuat aturan penskalaan langkah untuk mengaktifkan skala-masuk berdasarkan tier beban kerja. Metode ini secara efektif mencegah overload sistem atau gangguan akibat penghapusan instans secara cepat dalam jumlah besar dan memastikan event skala-masuk berjalan dengan graceful. Misalnya, Anda ingin merancang solusi skala-masuk kustom berdasarkan tier utilisasi CPU berikut di grup penskalaan Anda:

    • Skala-masuk lima instans jika rata-rata utilisasi CPU turun di bawah 20%.

    • Skala-masuk tiga instans ECS jika rata-rata utilisasi CPU berada di antara 20% dan 30%.

    • Skala-masuk satu instans ECS jika rata-rata utilisasi CPU berada di antara 30% dan 50%.

Dalam kasus ini, Anda dapat membuat aturan penskalaan langkah, seperti yang ditunjukkan pada gambar berikut. image

Konfigurasikan periode cooldown dan tugas berbasis peristiwa untuk mengontrol laju serta frekuensi skala-masuk

Anda dapat mengonfigurasi periode cooldown dan tugas berbasis peristiwa untuk mencegah ketidakstabilan bisnis akibat operasi skala-masuk yang terlalu sering dan memastikan event skala-masuk berjalan dengan graceful.

Metode 1: Konfigurasikan periode cooldown

  • Metode implementasi: Konfigurasikan periode cooldown untuk grup penskalaan dan aturan penskalaan Anda.

    Periode cooldown menentukan interval minimum antara dua operasi penskalaan berturut-turut yang dipicu oleh tugas berbasis peristiwa. Pengaturan ini memungkinkan Anda mengontrol frekuensi skala-masuk.

  • Operasi: Untuk informasi selengkapnya, lihat Cooldown period.

Metode 2: Konfigurasikan frekuensi pemicu tugas berbasis peristiwa Anda

  • Metode implementasi: Konfigurasikan parameter berikut untuk tugas berbasis peristiwa Anda: Statistical Period, Condition, dan Triggered After.

    Anda dapat menggunakan parameter-parameter ini untuk mengontrol frekuensi operasi skala-masuk yang dipicu oleh tugas berbasis peristiwa Anda.

  • Operasi: Untuk informasi selengkapnya, lihat Manage event-triggered tasks.

Metode 3: Konfigurasikan frekuensi pemicu aturan penskalaan pelacakan target Anda

  • Metode implementasi: Konfigurasikan parameter Threshold for Scale-in Alerts untuk aturan penskalaan pelacakan target Anda.

    Setelah Anda membuat aturan penskalaan pelacakan target, tugas berbasis peristiwa akan dibuat secara otomatis. Parameter ini menentukan jumlah kali berturut-turut kondisi alert harus terpenuhi sebelum tugas berbasis peristiwa yang dibuat secara otomatis memicu alert skala-masuk.

  • Operasi: Untuk informasi selengkapnya, lihat Target tracking scaling rule.

Tentukan waktu pemicu event skala-masuk

Anda dapat menentukan waktu pemicu event skala-masuk sesuai kebutuhan bisnis Anda. Hal ini menerapkan event skala-masuk yang graceful. Anda dapat menggunakan salah satu metode berikut:

Metode 1: Jalankan secara manual aturan penskalaan sederhana

Anda dapat menjalankan secara manual aturan penskalaan sederhana untuk memicu event skala-masuk. Untuk informasi selengkapnya, lihat Configure scaling rules.

Catatan

Metode ini mendukung operasi API. Untuk informasi selengkapnya, lihat ExecuteScalingRule dan ScaleWithAdjustment.

Metode 2: Ubah jumlah instans di grup penskalaan Anda untuk memicu event skala-masuk

Anda dapat mengubah parameter Maximum Number of Instances atau Expected Number of Instances untuk memicu event skala-masuk. Auto Scaling akan menyesuaikan jumlah instans di grup penskalaan Anda berdasarkan pengaturan kedua parameter tersebut guna memastikan efek skala-masuk yang Anda harapkan. Untuk informasi selengkapnya, lihat Manage scaling groups.

Catatan

Metode ini mendukung operasi API. Untuk informasi selengkapnya, lihat ModifyScalingGroup.

Pilih instans yang ingin di-scale in

Secara default, Auto Scaling melakukan skala-masuk instans berdasarkan urutan vSwitch yang ditentukan di grup penskalaan Anda (kebijakan prioritas). Anda dapat mengubah kebijakan skala-masuk untuk memilih instans yang ingin Anda skala-masuk sesuai kebutuhan bisnis Anda.

Penting
  • Jika Anda tidak ingin instans yang bersifat mission-critical di-skala-masuk, Anda dapat menempatkan instans tersebut ke dalam status Protected untuk mencegah gangguan bisnis akibat skala-masuk instans yang tidak diinginkan. Untuk informasi selengkapnya, lihat Manually put instances into the Protected state or move instances out of the Protected state.

  • Grup penskalaan tipe Elastic Container Instance tidak mendukung parameter Scale-In Policy dan Scaling Policy. Secara default, Auto Scaling akan lebih dulu menghapus instans kontainer elastis yang dibuat dari konfigurasi penskalaan paling awal dari grup penskalaan, lalu menghapus instans kontainer elastis paling awal dari grup penskalaan.

Solusi 1: Seimbangkan distribusi instans di berbagai zona setelah proses skala-masuk selesai

Solusi ini memastikan disaster recovery. Jika Anda menggunakan solusi ini, instans akan didistribusikan secara merata di beberapa zona setelah proses skala-masuk selesai untuk menerapkan disaster recovery.

  • Metode implementasi: Atur parameter Scaling Policy ke Balanced Distribution Policy.

    Setelah Anda mengaktifkan kebijakan distribusi seimbang, Auto Scaling akan lebih dulu melakukan skala-masuk instans dari zona yang memiliki jumlah instans terbanyak. Jika Anda ingin proses skala-masuk berlanjut setelah kebijakan distribusi seimbang diterapkan, atur parameter Scale-In Policy ke Created From Earliest Scaling Configuration, Earliest Instances, atau Most Recent Instances.

  • Operasi: Untuk informasi selengkapnya, lihat Scenario 2: Scaling policy (Balanced Distribution Policy) + Scale-in policy.

Solusi 2: Utamakan skala-masuk instans dengan harga satuan tertinggi (kebijakan optimasi biaya)

Solusi ini memastikan efisiensi biaya. Anda dapat mengaktifkan kebijakan optimasi biaya untuk melakukan skala-masuk pada instans yang memiliki tingkat efisiensi biaya terendah. Hal ini meningkatkan pemanfaatan resource.

  • Metode implementasi: Atur kebijakan Scaling Policy ke Cost Optimization Policy.

    Setelah Anda mengaktifkan kebijakan optimasi biaya, Auto Scaling akan lebih dulu melakukan skala-masuk pada instans dengan harga satuan tertinggi dari grup penskalaan Anda. Jika Anda ingin proses skala-masuk berlanjut setelah kebijakan optimasi biaya diterapkan, atur parameter Scale-In Policy ke Instances Created From Earliest Scaling Configuration, Earliest Instances, atau Most Recent Instances.

  • Operasi: Untuk informasi selengkapnya, lihat Scenario 3: Scaling policy (Cost Optimization Policy) + Scale-in policy.

Catatan

Solusi ini membantu Anda menyeimbangkan biaya resource. Anda dapat mengonfigurasi rasio instans preemptible terhadap instans pay-as-you-go di grup penskalaan Anda.

Solusi 3: Buat kebijakan kombinasi kustom

Anda dapat menggabungkan Solusi 1 dan Solusi 2.

  • Metode implementasi: Atur parameter Scaling Policy untuk grup penskalaan Anda ke Custom Combination Policy.

    Saat Anda mengaktifkan kebijakan kombinasi kustom, Anda dapat menyesuaikan rasio instans pay-as-you-go terhadap instans preemptible, menyeimbangkan kapasitas resource di berbagai zona, serta membuat kebijakan perencanaan kapasitas untuk instans pay-as-you-go dan preemptible.

  • Operasi: Untuk informasi selengkapnya, lihat Mengatur kebijakan penghentian Instans untuk grup penskalaan.

Solusi 4: Buat kebijakan skala-masuk kustom

Jika kebijakan skala-masuk yang didukung oleh Auto Scaling tidak memenuhi kebutuhan bisnis Anda, Anda dapat menggunakan Function Compute untuk membuat kebijakan skala-masuk kustom, seperti yang dijelaskan dalam solusi ini.

  • Metode implementasi: Atur parameter Scale-In Policy ke Custom Policy.

    Anda dapat membuat kebijakan skala-masuk kustom menggunakan bahasa pemrograman di Function Compute. Setiap kali event skala-masuk dipicu, fungsi yang Anda buat di Function Compute akan dipanggil. Saat membuat fungsi tersebut, Anda dapat menentukan instans mana yang boleh di-skala-masuk dan instans mana yang tidak boleh, sesuai kebutuhan bisnis Anda.

  • Operasi: Untuk informasi selengkapnya, lihat Use Function Compute to customize ECS scale-in policies.

Lakukan skala-masuk instans secara graceful

Proses skala-masuk hanya berlangsung jika instans yang memenuhi standar skala-masuk telah menyelesaikan tugas yang sedang berjalan. Proses ini, yang dikenal sebagai graceful scale-in, mencegah gangguan bisnis akibat operasi skala-masuk.

  • Metode implementasi: Buat lifecycle hook.

    Saat proses skala-masuk dipicu, Anda dapat mengaktifkan lifecycle hook untuk menempatkan instans yang memiliki tugas sedang berjalan ke status Pending Remove. Selama masa berlaku lifecycle hook, Anda dapat melakukan operasi pada instans tersebut. Jika diperlukan waktu lebih lama untuk menyelesaikan tugas yang sedang berjalan, Anda dapat memanggil operasi API untuk memperpanjang masa berlaku lifecycle hook.

  • Operasi: Untuk informasi selengkapnya, lihat Overview dan RecordLifecycleActionHeartbeat.

Penting

Jika Anda langsung menghapus, menghilangkan, atau menghentikan instans untuk mencapai efek skala-masuk serupa, lifecycle hook tidak akan berlaku. Anda tidak dapat menggunakan solusi ini.

Reklamasi instans yang telah di-skala-masuk

Untuk meningkatkan efisiensi skala-masuk, mode reklamasi instans default adalah Force Release. Dalam mode ini, Auto Scaling langsung melepas instans yang dihapus dari grup penskalaan. Tidak ada resource yang dipertahankan setelah instans dilepas. Anda juga dapat menggunakan mode reklamasi instans lainnya. Untuk informasi selengkapnya, lihat Manage scaling groups.