全部产品
Search
文档中心

Auto Scaling:Panduan Scale-in

更新时间:Jul 06, 2025

Ketika beban kerja bisnis menurun, Auto Scaling memicu peristiwa scale-in dalam grup scaling. Hal ini mengotomatiskan penyesuaian sumber daya dan meminimalkan biaya. Panduan ini menjelaskan cara melakukan operasi scale-in yang mulus.

Pengenalan proses scale-in

Ketika proses scale-in dipicu dalam grup scaling, Auto Scaling memilih instance untuk dihapus berdasarkan kebijakan scale-in yang telah dikonfigurasi. Setelah penghapusan, instance dikelola kembali sesuai mode pengelolaan ulang yang telah ditentukan sebelumnya. Konfigurasi bervariasi berdasarkan fase-fase dalam proses scale-in, seperti yang ditunjukkan pada gambar berikut.

Memicu peristiwa scale-in

Kontrol batas scale-in untuk memenuhi persyaratan bisnis harian

  • Metode Implementasi: Konfigurasikan parameter Minimum Number of Instances untuk grup scaling.

    Parameter Jumlah Minimum Instance menentukan batas bawah jumlah instance dalam grup scaling. Ketika permintaan scale-in dimulai, Auto Scaling menolak permintaan tersebut jika jumlah instance turun di bawah batas bawah setelah proses selesai. Ini mencegah kekurangan sumber daya untuk memenuhi kebutuhan bisnis harian.

  • Operasi: Untuk informasi lebih lanjut, lihat Kelola Grup Scaling.

Scale in instance berdasarkan tingkat beban kerja (aturan penskalaan bertahap)

  • Metode Implementasi: Buat aturan penskalaan bertahap untuk grup scaling.

    Anda dapat membuat aturan penskalaan bertahap untuk mengaktifkan scale-in berdasarkan tingkat beban kerja. Metode ini mencegah overload sistem atau gangguan akibat penghapusan cepat beberapa instance dan memastikan peristiwa scale-in yang mulus. Contohnya, Anda dapat merancang solusi scale-in kustom berdasarkan tingkat utilisasi CPU berikut dalam grup scaling:

    • Menyusut lima instance jika rata-rata utilisasi CPU turun di bawah 20%.

    • Menyusut tiga instance ECS jika rata-rata utilisasi CPU berkisar antara 20% hingga 30%.

    • Menyusut satu instance ECS jika rata-rata utilisasi CPU berkisar antara 30% hingga 50%.

Dalam kasus ini, Anda dapat membuat aturan penskalaan bertahap, seperti yang ditunjukkan pada gambar berikut. image

Konfigurasikan periode cooldown dan tugas yang dipicu oleh peristiwa untuk mengontrol laju dan frekuensi scale-in

Anda dapat mengonfigurasi periode cooldown dan tugas yang dipicu oleh peristiwa untuk mencegah ketidakstabilan bisnis akibat operasi scale-in yang sering dan memastikan peristiwa scale-in yang mulus.

Metode 1: Konfigurasikan Periode Cooldown

  • Metode Implementasi: Konfigurasikan periode cooldown untuk grup scaling dan aturan penskalaan.

    Periode cooldown menentukan interval minimum dua operasi penskalaan berturut-turut yang dipicu oleh tugas yang dipicu oleh peristiwa. Pengaturan ini memungkinkan Anda mengontrol frekuensi scale-in.

  • Operasi: Untuk informasi lebih lanjut, lihat Periode Cooldown.

Metode 2: Konfigurasikan Frekuensi Pemicuan Tugas yang Dipicu oleh Peristiwa Anda

  • Metode Implementasi: Konfigurasikan parameter berikut untuk tugas yang dipicu oleh peristiwa Anda: Statistical Period, Condition, dan Triggered After.

    Anda dapat menggunakan parameter ini untuk mengontrol frekuensi operasi scale-in yang dipicu oleh tugas yang dipicu oleh peristiwa Anda.

  • Operasi: Untuk informasi lebih lanjut, lihat Kelola Tugas yang Dipicu oleh Peristiwa.

Metode 3: Konfigurasikan Frekuensi Pemicuan Aturan Penskalaan Pelacakan Target Anda

  • Metode Implementasi: Konfigurasikan parameter Threshold for Scale-in Alerts untuk aturan penskalaan pelacakan target Anda.

    Setelah Anda membuat aturan penskalaan pelacakan target, tugas yang dipicu oleh peristiwa dibuat secara otomatis. Parameter ini menentukan jumlah kali berturut-turut kondisi peringatan harus terpenuhi sebelum tugas yang dipicu oleh peristiwa memicu peringatan scale-in.

  • Operasi: Untuk informasi lebih lanjut, lihat Aturan Penskalaan Pelacakan Target.

Tentukan waktu ketika peristiwa scale-in dipicu

Anda dapat menentukan waktu ketika peristiwa scale-in dipicu berdasarkan kebutuhan bisnis. Ini mengimplementasikan peristiwa scale-in yang mulus. Anda dapat menggunakan salah satu metode berikut:

Metode 1: Secara Manual Jalankan Aturan Penskalaan Sederhana

Anda dapat secara manual menjalankan aturan penskalaan sederhana untuk memicu peristiwa scale-in. Untuk informasi lebih lanjut, lihat Konfigurasikan Aturan Penskalaan.

Catatan

Metode ini mendukung operasi API. Untuk informasi lebih lanjut, lihat ExecuteScalingRule dan ScaleWithAdjustment.

Metode 2: Ubah Jumlah Instance dalam Grup Scaling Anda untuk Memicu Peristiwa Scale-in

Anda dapat memodifikasi parameter Maximum Number of Instances atau Expected Number of Instances untuk memicu peristiwa scale-in. Auto Scaling menyesuaikan jumlah instance dalam grup scaling Anda berdasarkan pengaturan kedua parameter tersebut untuk memastikan efek scale-in yang diharapkan. Untuk informasi lebih lanjut, lihat Kelola Grup Scaling.

Catatan

Metode ini mendukung operasi API. Untuk informasi lebih lanjut, lihat ModifyScalingGroup.

Pilih instance yang ingin Anda scale in

Secara default, Auto Scaling menyusut instance berdasarkan urutan vSwitch yang ditentukan dari grup scaling Anda (kebijakan prioritas). Anda dapat memodifikasi kebijakan scale-in untuk memilih instance yang ingin Anda scale in berdasarkan kebutuhan bisnis Anda.

Penting
  • Jika Anda tidak ingin instance penting untuk misi disusutkan, Anda dapat menempatkan instance ini ke dalam status Terlindungi untuk mencegah gangguan bisnis akibat penyusutan instance yang tidak terduga. Untuk informasi lebih lanjut, lihat Secara Manual Tempatkan Instance ke dalam Status Terlindungi atau Keluarkan Instance dari Status Terlindungi.

  • Grup scaling tipe Elastic Container Instance tidak mendukung parameter Scale-In Policy dan Scaling Policy. Secara default, Auto Scaling memprioritaskan penghapusan instance kontainer elastis yang dibuat dari konfigurasi penskalaan paling awal dari grup scaling, lalu menghapus instance kontainer elastis paling awal dari grup scaling.

Solusi 1: Seimbangkan distribusi instance di seluruh zona setelah proses scale-in selesai

Solusi ini memastikan pemulihan bencana. Jika Anda menggunakan solusi ini, instance didistribusikan secara merata di beberapa zona setelah proses scale-in selesai untuk mengimplementasikan pemulihan bencana.

  • Metode Implementasi: Atur parameter Scaling Policy ke Balanced Distribution Policy.

    Setelah Anda mengaktifkan kebijakan distribusi seimbang, Auto Scaling memprioritaskan penyusutan instance dari zona yang memiliki jumlah instance terbesar. Jika Anda ingin proses scale-in berlanjut setelah kebijakan distribusi seimbang berlaku, atur parameter Scale-In Policy ke Dibuat Dari Konfigurasi Penskalaan Paling Awal, Instance Paling Awal, atau Instance Paling Baru.

  • Operasi: Untuk informasi lebih lanjut, lihat Skenario 2: Kebijakan Distribusi Seimbang + Kebijakan Scale-in.

Solusi 2: Prioritaskan penyusutan instance yang memiliki harga satuan tertinggi (kebijakan optimasi biaya)

Solusi ini memastikan efisiensi biaya. Anda dapat mengaktifkan kebijakan optimasi biaya untuk menyusutkan instance yang memiliki tingkat efisiensi biaya terendah. Ini meningkatkan pemanfaatan sumber daya.

  • Metode Implementasi: Atur parameter Scaling Policy ke Cost Optimization Policy.

    Setelah Anda mengaktifkan kebijakan optimasi biaya, Auto Scaling memprioritaskan penyusutan instance yang memiliki harga satuan tertinggi dari grup scaling Anda. Jika Anda ingin proses scale-in berlanjut setelah kebijakan optimasi biaya berlaku, atur parameter Scale-In Policy ke Instance Dibuat Dari Konfigurasi Penskalaan Paling Awal, Instance Paling Awal, atau Instance Paling Baru.

  • Operasi: Untuk informasi lebih lanjut, lihat Skenario 3: Kebijakan Optimasi Biaya + Kebijakan Scale-in.

Catatan

Solusi ini membantu Anda menyeimbangkan biaya sumber daya. Anda dapat mengonfigurasi rasio instance preemptible terhadap instance bayar sesuai pemakaian dalam grup scaling Anda.

Solusi 3: Buat kebijakan kombinasi kustom

Anda dapat menggabungkan Solusi 1 dan Solusi 2.

  • Metode Implementasi: Atur parameter Scaling Policy untuk grup scaling Anda ke Custom Combination Policy.

    Ketika Anda mengaktifkan kebijakan kombinasi kustom, Anda dapat menyesuaikan rasio instance bayar sesuai pemakaian terhadap instance preemptible, menyeimbangkan kapasitas sumber daya di beberapa zona, dan membuat kebijakan perencanaan kapasitas untuk instance bayar sesuai pemakaian dan preemptible.

  • Operasi: Untuk informasi lebih lanjut, lihat Gabungkan Kebijakan Penskalaan dan Kebijakan Scale-in.

Solusi 4: Buat kebijakan scale-in kustom

Jika kebijakan scale-in yang didukung oleh Auto Scaling tidak dapat memenuhi kebutuhan bisnis Anda, Anda dapat menggunakan Function Compute untuk membuat kebijakan scale-in kustom, seperti yang dijelaskan dalam solusi ini.

  • Metode Implementasi: Atur parameter Scale-In Policy ke Custom Policy.

    Anda dapat membuat kebijakan scale-in kustom dengan menggunakan bahasa pemrograman di Function Compute. Setiap kali peristiwa scale-in dipicu, fungsi yang Anda buat di Function Compute dipanggil. Anda dapat menentukan instance mana yang dapat disusutkan dan instance mana yang tidak dapat disusutkan saat Anda membuat fungsi berdasarkan kebutuhan bisnis Anda.

  • Operasi: Untuk informasi lebih lanjut, lihat Gunakan Function Compute untuk Menyesuaikan Kebijakan Scale-in ECS.

Scale in instance dengan mulus

Proses scale-in hanya berlanjut jika instance yang memenuhi standar scale-in telah menyelesaikan tugas yang sedang berlangsung. Proses ini, yang dikenal sebagai scale-in yang mulus, mencegah gangguan bisnis akibat operasi scale-in.

  • Metode Implementasi: Buat hook siklus hidup.

    Ketika proses scale-in dipicu, Anda dapat mengaktifkan hook siklus hidup untuk menempatkan instance yang memiliki tugas yang sedang berlangsung ke dalam status Pending Remove. Selama periode efektif hook siklus hidup, Anda dapat melakukan operasi pada instance tersebut. Jika periode waktu yang lebih lama diperlukan untuk menyelesaikan tugas yang sedang berlangsung, Anda dapat memanggil operasi API untuk memperpanjang periode efektif hook siklus hidup.

  • Operasi: Untuk informasi lebih lanjut, lihat Ikhtisar dan RecordLifecycleActionHeartbeat.

Penting
  • Grup scaling tipe Elastic Container Instance tidak mendukung fitur hook siklus hidup. Jika Anda menggunakan grup scaling tipe Elastic Container Instance, Anda tidak dapat menggunakan solusi ini.

  • Jika Anda langsung menghapus, menghapus, atau menghentikan instance untuk efek scale-in yang serupa, tidak ada hook siklus hidup yang berlaku. Anda tidak dapat menggunakan solusi ini.

Kelola kembali instance yang disusutkan

Untuk meningkatkan efisiensi scale-in, mode pengelolaan ulang instance default adalah Forcibly Release. Dalam mode ini, Auto Scaling langsung melepaskan instance yang dihapus dari grup scaling. Tidak ada sumber daya yang tersisa setelah instance dilepaskan. Anda juga dapat menggunakan mode pengelolaan ulang instance lainnya. Untuk informasi lebih lanjut, lihat Kelola Grup Scaling.