Tetapkan jumlah minimum instans suatu fungsi ke nilai lebih besar dari 0 untuk mengalokasikan sumber daya elastis sebelumnya. Hal ini membantu mencegah latensi permintaan akibat cold start selama jam sibuk. Anda juga dapat mengonfigurasi kebijakan untuk secara otomatis menskalakan jumlah minimum instans berdasarkan jadwal atau ambang batas metrik guna memastikan kinerja tinggi dan meningkatkan pemanfaatan instans.
Menetapkan jumlah minimum instans ke nilai lebih besar dari 0 membantu mengurangi cold start dan memberikan tanggapan layanan yang lebih baik bagi bisnis online yang sensitif terhadap latensi. Anda dikenai biaya untuk instans-instans ini terlepas dari penggunaannya. Saat instans-instans ini memproses permintaan, mereka ditagih dengan tarif instans elastis aktif. Saat menganggur, mereka ditagih dengan tarif instans elastis menganggur. Untuk informasi lebih lanjut tentang cara penagihan instans elastis aktif dan menganggur, lihat Ikhtisar Penagihan.
Anda hanya dapat mengonfigurasi kebijakan elastis untuk jumlah minimum instans pada alias fungsi atau versi LATEST.
Tetapkan jumlah minimum instans
Masuk ke Konsol Function Compute. Di panel navigasi sebelah kiri, pilih .
Di bilah navigasi atas, pilih Wilayah. Pada halaman Functions, klik Create Function.
Pada halaman Create Function, di bagian Elastic Configuration, tetapkan parameter Minimum Number Of Instances. Konfigurasikan parameter yang diperlukan lainnya, lalu klik Create.
Konfigurasikan kebijakan elastis
Pada halaman detail fungsi target, klik tab Elastic Configuration. Di bagian Elastic Policies, klik Edit pada baris kebijakan target.
Pada panel Edit Elastic Policy, konfigurasikan kebijakan elastis dinamis untuk jumlah minimum instans.
CatatanJika Anda mengonfigurasi beberapa kebijakan autoscaling, sistem akan menghitung Minimum Number Of Instances untuk setiap kebijakan saat dipicu, dan menetapkan jumlah minimum instans saat ini ke nilai Minimum Number Of Instances tertinggi di antara kebijakan yang sedang berlaku. Untuk informasi lebih lanjut, lihat Bagaimana jumlah minimum instans saat ini dihitung?.
Saat kebijakan elastis aktif, pengaturan awal Minimum Number Of Instances diabaikan. Jika tidak ada kebijakan elastis yang aktif, jumlah minimum instans saat ini kembali ke nilai awal yang Anda konfigurasikan untuk Minimum Number Of Instances.
Konfigurasikan kebijakan Scheduled Scaling atau Threshold-based Scaling
Scheduled scaling
Kebijakan scheduled scaling cocok untuk fungsi dengan pola periodik yang jelas atau puncak lalu lintas yang dapat diprediksi. Ketika jumlah pemanggilan fungsi konkuren melebihi jumlah minimum instans, permintaan tambahan tersebut secara otomatis ditangani oleh instans elastis on-demand. Untuk informasi lebih lanjut, lihat Scheduled scaling.

Seperti yang ditunjukkan pada gambar, contoh ini menetapkan Time Zone ke Asia/Shanghai (UTC+8). Kebijakan ini bersifat jangka panjang dan menskalakan jumlah minimum instans menjadi 50 pada pukul 10.00 dari Senin hingga Jumat, serta menskalakan kembali menjadi 5 pada pukul 22.00.
Threshold-based scaling
Sistem secara berkala mengumpulkan metrik seperti Instance Concurrency Utilization, Memory Utilization, atau pemanfaatan sumber daya untuk instans yang dipercepat GPU. Ketika kondisi terpenuhi, Minimum Number Of Instances akan diskalakan sesuai. Untuk informasi lebih lanjut, lihat Threshold-based scaling.

Seperti yang ditunjukkan pada gambar, contoh ini menetapkan Time Zone ke Asia/Shanghai (UTC+8). Kebijakan ini aktif mulai 00.00 pada 15 Juli 2025 hingga 00.00 pada 31 Juli 2025, dan melacak metrik Instance Concurrency Utilization. Ketika pemanfaatan melebihi nilai pelacakan 60%, sistem menskalakan hingga maksimum 100 instans. Ketika pemanfaatan turun di bawah 60%, sistem menskalakan kembali hingga minimum 10 instans.
Untuk fungsi CPU, threshold-based scaling untuk jumlah minimum instans memantau metrik Instance Concurrency Utilization dan Memory Utilization. Untuk fungsi GPU, kebijakan ini mendukung pemantauan metrik Instance Concurrency Utilization dan metrik pemanfaatan sumber daya terkait GPU, seperti yang ditunjukkan pada gambar berikut.
CPU functions
GPU functions


Konfigurasikan penskalaan elastis periodik menggunakan CRON Expression
Jika bisnis Anda memiliki pola periodik yang jelas, Anda juga dapat menggunakan ekspresi CRON untuk menskalakan jumlah minimum instans secara periodik. Seperti yang ditunjukkan pada gambar berikut, Time Zone ditetapkan ke Asia/Shanghai (UTC+8). Jumlah minimum instans diskalakan menjadi 10 pada pukul 10.00 setiap hari Senin dan diskalakan kembali menjadi 1 pada pukul 22.00 setiap hari Jumat.

Ubah atau hapus kebijakan elastis untuk jumlah minimum instans
Masuk ke Konsol Function Compute. Di panel navigasi sebelah kiri, pilih . Pada halaman Elastic Policies, temukan kebijakan target. Di kolom Actions, klik Edit atau Delete untuk mengubah atau menghapus kebijakan tersebut.
Menghapus kebijakan elastis untuk jumlah minimum instans suatu alias akan melepaskan semua instans yang telah dialokasikan sebelumnya untuk alias tersebut. Fungsi kemudian secara otomatis beralih ke penskalaan on-demand, yang mungkin melibatkan cold start. Untuk layanan berbasis CPU, waktu rata-rata cold start biasanya ratusan milidetik, tergantung pada kecepatan startup aplikasi. Untuk layanan berbasis GPU, waktu rata-rata cold start bisa mencapai beberapa menit, tergantung pada ukuran model dan kecepatan pemuatan.
Referensi
Untuk membatasi jumlah instans untuk fungsi tertentu, Anda dapat mengonfigurasi kuota fungsi. Jika jumlah total instans yang Berjalan untuk fungsi tersebut melebihi batas yang dikonfigurasi, Function Compute akan mengembalikan error throttling.