全部产品
Search
文档中心

Function Compute:Konfigurasikan instans yang disediakan dan aturan penskalaan otomatis

更新时间:Jul 06, 2025

Terdapat dua mode penggunaan instans di Function Compute: mode on-demand dan mode yang disediakan. Pada kedua mode tersebut, Anda dapat mengonfigurasi aturan penskalaan otomatis berdasarkan batasan terkait jumlah dan kecepatan penskalaan instans. Untuk instans yang disediakan, Anda juga dapat mengonfigurasi penjadwalan penskalaan dan aturan penskalaan berbasis metrik.

Batasan penskalaan instans

Scaling limits for on-demand instances

Function Compute memprioritaskan penggunaan instans yang ada untuk memproses permintaan. Ketika instans yang ada mencapai kapasitas penuh, Function Compute membuat instans baru untuk menangani permintaan tersebut. Seiring meningkatnya jumlah permintaan, Function Compute terus membuat instans baru hingga cukup instans tersedia untuk menangani permintaan masuk atau jumlah instans mencapai batas atas. Penskalaan instans on-demand dibatasi oleh faktor-faktor berikut:

  • Jumlah maksimum instans yang diizinkan: Secara default, setiap akun Alibaba Cloud dapat menjalankan hingga 100 instans di suatu wilayah, termasuk instans on-demand dan instans yang disediakan. Kuota aktual ditampilkan di halaman Kuota Umum pada Konsol Quota Center.

  • Kecepatan penskalaan instans yang berjalan dibatasi baik oleh jumlah maksimum instans burstable yang diizinkan maupun laju maksimum peningkatan instans. Untuk informasi lebih lanjut tentang batasan di wilayah berbeda, lihat Batasan pada Kecepatan Penskalaan Instans di Wilayah Berbeda.

    • Instans burstable: instans yang dibuat segera. Batas atas default untuk instans burstable adalah 100 atau 300, tergantung pada wilayah.

    • Laju pertumbuhan instans: kecepatan peningkatan jumlah instans setelah batas atas untuk instans burstable tercapai. Batas atas default untuk laju pertumbuhan instans adalah 100 per menit atau 300 per menit, tergantung pada wilayah.

Jika jumlah instans atau kecepatan penskalaan melebihi batas, Function Compute mengembalikan HTTP 429 kode status, yang menunjukkan bahwa kesalahan throttling telah terjadi. Gambar berikut menunjukkan bagaimana Function Compute menerapkan throttling ketika pemanggilan melonjak.dg_fc_throttling_behaviors

  • ①: Function Compute segera membuat instans untuk menangani lonjakan permintaan. Cold start terjadi selama proses ini. Tidak ada kesalahan throttling yang dilaporkan karena jumlah instans burstable belum mencapai batas atas.

  • ②: Peningkatan jumlah instans sekarang dibatasi oleh laju pertumbuhan instans, karena batas atas untuk instans burstable telah tercapai. Kesalahan throttling dilaporkan untuk beberapa permintaan.

  • ③: Jumlah maksimum instans telah tercapai, sehingga menyebabkan kesalahan throttling untuk beberapa permintaan.

Secara default, semua fungsi dalam akun Alibaba Cloud di wilayah yang sama berbagi batas penskalaan yang sama. Untuk mengonfigurasi jumlah maksimum instans untuk fungsi tertentu, lihat Ikhtisar Konfigurasi Jumlah Maksimum Instans On-Demand. Ketika jumlah instans yang berjalan melebihi jumlah maksimum yang dikonfigurasi, Function Compute mengembalikan kesalahan throttling.

Scaling limits for provisioned instances

Ketika jumlah pemanggilan mendadak terlalu besar, kesalahan throttling menjadi tak terhindarkan. Selain itu, pembuatan instans baru memperkenalkan cold start. Keduanya meningkatkan latensi penanganan permintaan. Untuk mengurangi latensi, Anda dapat memesan instans terlebih dahulu di Function Compute. Instans yang dipesan ini disebut instans yang disediakan. Penskalaan instans yang disediakan tidak terpengaruh oleh batasan yang diberlakukan pada instans on-demand. Sebaliknya, itu dibatasi oleh faktor-faktor berikut.

  • Jumlah maksimum instans yang diizinkan: Secara default, setiap akun Alibaba Cloud dapat menjalankan hingga 100 instans di suatu wilayah, termasuk instans on-demand dan instans yang disediakan. Kuota aktual ditampilkan di halaman Kuota Umum pada Konsol Quota Center.

  • Kecepatan penskalaan maksimum: Batas atas default untuk kecepatan penskalaan instans yang disediakan adalah 100 per menit atau 300 per menit, tergantung pada wilayah. Untuk informasi lebih lanjut tentang batasan di wilayah berbeda, lihat Batasan pada Kecepatan Penskalaan Instans di Wilayah Berbeda. Gambar berikut menunjukkan bagaimana Function Compute menerapkan throttling ketika instans yang disediakan dikonfigurasi dalam skenario beban yang sama seperti gambar sebelumnya.dg_fc_ throttling_behaviors_with_provisioned_instances

    • ①: Semua permintaan masuk diproses segera, hingga instans yang disediakan mencapai kapasitas penuh mereka. Selama proses ini, tidak ada cold start yang terjadi, dan tidak ada kesalahan throttling yang dilaporkan.

    • ②: Instans yang disediakan sekarang sepenuhnya dimanfaatkan. Function Compute mulai membuat instans on-demand untuk menangani permintaan berikutnya hingga jumlah instans burstable mencapai batas atas. Selama proses ini, cold start terjadi, tetapi tidak ada kesalahan throttling yang dilaporkan.

Batasan pada kecepatan penskalaan instans di wilayah berbeda

Wilayah

Jumlah maksimum instans burstable

Laju pertumbuhan instans maksimum

Cina (Hangzhou), Cina (Shanghai), Cina (Beijing), Cina (Zhangjiakou), dan Cina (Shenzhen)

300

300 per menit

Wilayah lainnya

100

100 per menit

Catatan
  • Dalam wilayah yang sama, batasan kecepatan penskalaan tidak membedakan antara instans yang disediakan dan instans on-demand.

  • Secara default, setiap akun Alibaba Cloud dapat menjalankan hingga 100 instans di suatu wilayah. Kuota aktual ditampilkan di halaman Kuota Umum pada Konsol Quota Center. Anda juga dapat mengajukan penyesuaian kuota di Konsol Quota Center.

  • Instans yang dipercepat GPU memiliki kecepatan penskalaan yang lebih lambat dibandingkan instans CPU. Oleh karena itu, kami merekomendasikan agar Anda memesan instans yang dipercepat GPU terlebih dahulu menggunakan mode yang disediakan.

Konfigurasikan aturan penskalaan otomatis

Buat aturan penskalaan otomatis

  1. Masuk ke Konsol Function Compute. Di panel navigasi kiri, klik Services & Functions.

  2. Di bilah navigasi atas, pilih wilayah. Di halaman Services, klik layanan yang diinginkan.

  3. Di halaman Functions, klik fungsi yang ingin Anda modifikasi.
  4. Di halaman Function Details, klik tab Auto Scaling dan klik Create Rule.

  5. Di halaman yang muncul, konfigurasikan parameter berikut dan klik Create.

    • Untuk instans on-demand

      Atur parameter Minimum Number of Instances ke 0 dan parameter Maximum Number of Instances ke nilai yang sesuai dengan kebutuhan bisnis Anda. Jika Anda tidak mengatur parameter Maximum Number of Instances, jumlah maksimum yang diizinkan akan didasarkan pada batasan yang berlaku untuk akun Alibaba Cloud Anda dan wilayah saat ini.

      Catatan

      Parameter Idle Mode, Scheduled Setting Modification, dan Metric-based Setting Modification hanya berlaku untuk instans yang disediakan.

    • Untuk instans yang disediakan

      Parameter

      Deskripsi

      Basic Settings

      Version or Alias

      Pilih versi atau alias untuk mana Anda ingin membuat instans yang disediakan.

      Catatan

      Anda hanya dapat membuat instans yang disediakan untuk versi LATEST.

      Minimum Number of Instances

      Masukkan jumlah instans yang disediakan yang ingin Anda buat. Jumlah minimum instans sama dengan jumlah instans yang disediakan yang akan dibuat.

      Catatan

      Dengan menetapkan jumlah minimum instans fungsi, Anda dapat mengurangi cold start dan waktu respons untuk permintaan pemanggilan fungsi. Ini membantu meningkatkan kinerja layanan online Anda, terutama yang sensitif terhadap latensi respons.

      Idle Mode

      Aktifkan atau nonaktifkan fitur mode idle berdasarkan kebutuhan bisnis Anda. Secara default, fitur ini dinonaktifkan. Perhatikan hal-hal berikut:

      • Jika Anda mengaktifkan fitur ini, instans yang disediakan dialokasikan sumber daya vCPU hanya saat mereka memproses permintaan. Ketika mereka berhenti memproses permintaan, sumber daya vCPU dibekukan.

        Function Compute terus mengirimkan permintaan masuk ke instans yang sama berdasarkan pengaturan konkurensi instans hingga instans tersebut mencapai kapasitas. Misalnya, jika Anda mengatur konkurensi instans menjadi 50 dan memiliki 10 instans yang disediakan dalam mode idle, ketika 40 permintaan tiba, mereka dikirim ke instans yang sama, dan hanya instans itu yang beralih ke status aktif.

      • Jika Anda menonaktifkan fitur ini, instans yang disediakan tetap aktif setiap saat, artinya mereka dialokasikan sumber daya vCPU terlepas dari apakah mereka memproses permintaan atau tidak.

      Maximum Number of Instances

      Tetapkan jumlah maksimum instans yang paling sesuai dengan kebutuhan bisnis Anda. Baik instans yang disediakan maupun instans on-demand harus dihitung. Jumlah maksimum instans sama dengan jumlah instans yang disediakan yang akan dibuat ditambah jumlah maksimum instans on-demand yang diizinkan.

      Catatan
      • Dengan menetapkan jumlah maksimum instans, Anda dapat mencegah satu fungsi mendominasi terlalu banyak instans karena pemanggilan berlebihan. Ini membantu melindungi sumber daya backend dan menghindari biaya tak terduga.

      • Jika Anda tidak mengatur parameter ini, jumlah maksimum instans yang diizinkan akan didasarkan pada batasan yang berlaku untuk akun Alibaba Cloud Anda dan wilayah saat ini.

      (Opsional) Scheduled Setting Modification: Anda dapat membuat aturan penskalaan terjadwal untuk mengonfigurasi instans yang disediakan secara lebih fleksibel. Kebijakan penskalaan terjadwal secara otomatis menyesuaikan jumlah instans yang disediakan ke nilai tertentu pada waktu yang ditentukan, memenuhi persyaratan konkurensi spesifik layanan Anda. Untuk informasi lebih lanjut tentang prinsip konfigurasi dan contoh, lihat Modifikasi Pengaturan Terjadwal.

      Policy Name

      Masukkan nama kebijakan.

      Minimum Number of Instances

      Masukkan jumlah instans yang disediakan yang Anda inginkan untuk rentang waktu tertentu.

      Schedule Expression (UTC)

      Masukkan ekspresi jadwal. Contoh: cron(0 0 20 * * *). Untuk informasi lebih lanjut, lihat Deskripsi Parameter.

      Effective Time (UTC)

      Tentukan waktu mulai dan akhir untuk aturan penskalaan terjadwal berlaku.

      (Opsional) Metric-based Setting Modification: Kebijakan penskalaan berbasis metrik secara otomatis menyesuaikan jumlah instans yang disediakan setiap menit berdasarkan pemanfaatan konkurensi instans dan berbagai sumber daya fungsi. Untuk informasi lebih lanjut tentang prinsip konfigurasi dan contoh, lihat Modifikasi Pengaturan Berbasis Metrik.

      Policy Name

      Masukkan nama kebijakan.

      Minimum Range of Instances

      Tentukan rentang untuk jumlah minimum instans yang disediakan.

      Utilization Type

      Parameter ini hanya tersedia untuk instans yang dipercepat GPU. Pilih tipe metrik yang akan menentukan cara kerja kebijakan penskalaan. Untuk informasi lebih lanjut tentang kebijakan penskalaan otomatis instans yang dipercepat GPU, lihat Buat kebijakan penskalaan otomatis untuk instans yang dipercepat GPU yang disediakan.

      Concurrency Usage Threshold

      Konfigurasikan ambang batas yang memicu penskalaan. Ketika pemanfaatan konkurensi instans atau sumber daya fungsi yang ditentukan jatuh di bawah ambang batas yang Anda tetapkan, Function Compute mengurangi jumlah instans yang disediakan. Sebaliknya, ketika pemanfaatan melebihi ambang batas, Function Compute menambah instans.

      Effective Time (UTC)

      Tentukan waktu mulai dan akhir untuk aturan penskalaan berbasis metrik berlaku.

Pergi ke tab Penskalaan Otomatis fungsi untuk melihat aturan penskalaan otomatis yang Anda buat.

Ubah atau hapus aturan penskalaan otomatis

Di tab Auto Scaling, temukan aturan yang ingin Anda kelola, dan klik Modify atau Delete di kolom Actions untuk mengubah atau menghapus aturan.

Catatan

Tetapkan parameter Minimum Number of Instances ke 0 jika Anda tidak lagi memerlukan instans yang disediakan.

Penskalaan otomatis instans yang disediakan

Selain menetapkan jumlah tetap instans yang disediakan, Anda dapat melakukan penyesuaian fleksibel dengan mengonfigurasi parameter Modifikasi Pengaturan Terjadwal dan Modifikasi Pengaturan Berbasis Metrik. Pendekatan ini membantu meningkatkan pemanfaatan instans.

Modifikasi Pengaturan Terjadwal

  • Definisi: Kebijakan penskalaan terjadwal secara otomatis menyesuaikan jumlah instans yang disediakan ke nilai tertentu pada waktu yang ditentukan, memenuhi persyaratan konkurensi spesifik layanan Anda.

  • Skenario yang berlaku: Pilih penskalaan terjadwal ketika layanan Anda memiliki pola periodik yang jelas atau puncak lalu lintas yang dapat diprediksi. Ketika jumlah pemanggilan konkuren melebihi kapasitas yang didefinisikan oleh kebijakan penskalaan terjadwal, semua permintaan berlebih akan diarahkan ke instans on-demand untuk diproses. Untuk informasi lebih lanjut, lihat Tipe Instans dan Mode Penggunaan.

  • Contoh: Gambar berikut menunjukkan dua tindakan terjadwal untuk penskalaan instans. Tindakan terjadwal pertama menambah instans yang disediakan sebelum puncak lalu lintas, dan tindakan terjadwal kedua mengurangi instans yang disediakan setelah puncak lalu lintas.instance

Kode sampel berikut menunjukkan detail konfigurasi. Dalam contoh ini, fungsi bernama function_1 dalam layanan bernama service_1 dikonfigurasi untuk penskalaan otomatis masuk dan keluar. Konfigurasi ini berlaku dari 10:00:00 pada 1 November 2022 hingga 10:00:00 pada 30 November 2022. Jumlah instans yang disediakan disesuaikan menjadi 50 pada pukul 20:00 dan 10 pada pukul 22:00 setiap hari. Untuk informasi lebih lanjut tentang cara menggunakan operasi PutProvisionConfig untuk mengonfigurasi penskalaan terjadwal, lihat kode sampel berikut.

{
  "ServiceName": "service_1",
  "FunctionName": "function_1",
  "Qualifier": "alias_1",
  "ScheduledActions": [
    {
      "Name": "action_1",
      "StartTime": "2022-11-01T10:00:00Z",
      "EndTime": "2022-11-30T10:00:00Z",
      "TargetValue": 50,
      "ScheduleExpression": "cron(0 0 20 * * *)"
    },
    {
      "Name": "action_2",
      "StartTime": "2022-11-01T10:00:00Z",
      "EndTime": "2022-11-30T10:00:00Z",
      "TargetValue": 10,
      "ScheduleExpression": "cron(0 0 22 * * *)"
    }
  ]
}

Tabel berikut menjelaskan parameter dalam kode sampel.

Parameter

Deskripsi

Name

Nama tugas penskalaan otomatis terjadwal.

StartTime

Waktu ketika kebijakan penskalaan mulai berlaku, dalam UTC.

EndTime

Waktu ketika kebijakan penskalaan kedaluwarsa, dalam UTC.

TargetValue

Jumlah target instans.

ScheduleExpression

Ekspresi yang menentukan kapan menjalankan tugas penskalaan terjadwal. Format berikut didukung:

  • At expressions - "at(yyyy-mm-ddThh:mm:ss)": menentukan bahwa tugas terjadwal harus dijalankan hanya sekali. Waktu harus dalam UTC. Misalnya, jika Anda ingin memulai tugas terjadwal pada pukul 20:00 tanggal 1 April 2021 (UTC+8), gunakan at(2021-04-01T12:00:00), yang menunjukkan bahwa tugas terjadwal dimulai pada pukul 12:00 tanggal 1 April 2021 (UTC).

  • Cron expressions - "cron(0 0 4 * * *)": menentukan bahwa tugas terjadwal harus dijalankan beberapa kali. Atur nilai dalam format crontab standar dalam UTC. Misalnya, jika Anda ingin memulai tugas terjadwal pada pukul 20:00 (UTC+8) setiap hari, gunakan cron(0 0 12 * * *), yang menunjukkan bahwa tugas terjadwal dimulai pada pukul 12:00 (UTC) setiap hari.

Tabel berikut menjelaskan bidang ekspresi cron dalam format Detik Menit Jam Hari-bulan Bulan Hari-minggu.

Tabel 1. Deskripsi Bidang

Bidang

Nilai Valid

Karakter Khusus yang Diizinkan

Detik

0 hingga 59

Tidak ada

Menit

0 hingga 59

, - * /

Jam

0 hingga 23

, - * /

Hari-bulan

1 hingga 31

, - * ? /

Bulan

1 hingga 12 atau JAN hingga DEC

, - * /

Hari-minggu

1 hingga 7 atau MON hingga SUN

, - * ?

Tabel 2. Deskripsi Karakter Khusus

Karakter

Deskripsi

Contoh

*

Menunjukkan apa saja atau masing-masing.

Dalam bidang Menit, 0 menunjukkan bahwa tugas dijalankan pada awal setiap menit.

,

Menentukan daftar nilai.

Dalam bidang Hari-minggu, MON, WED, FRI menunjukkan setiap Senin, Rabu, dan Jumat.

-

Menentukan rentang.

Dalam bidang Jam, 10-12 menunjukkan rentang waktu dari pukul 10:00 hingga 12:00 dalam UTC.

?

Menunjukkan nilai yang tidak pasti.

Karakter ini digunakan bersama dengan nilai tertentu. Misalnya, ketika Anda menentukan tanggal tanpa mengikatnya ke hari tertentu dalam seminggu, Anda dapat menggunakan karakter ini di bidang Hari-minggu.

/

Menentukan penambahan. n/m menunjukkan penambahan m mulai dari posisi n.

Dalam bidang Menit, nilai 3/5 menunjukkan bahwa tugas dijalankan setiap 5 menit, dimulai dari menit ketiga.

Modifikasi Pengaturan Berbasis Metrik

  • Definisi: Kebijakan penskalaan otomatis berbasis metrik secara dinamis menyesuaikan jumlah instans yang disediakan berdasarkan metrik yang dilacak.

  • Fungsionalitas: Setelah mengonfigurasi kebijakan penskalaan berbasis metrik, Function Compute secara berkala mengumpulkan metrik pemanfaatan konkurensi atau metrik pemanfaatan sumber daya untuk instans yang disediakan. Metrik ini digunakan bersama dengan nilai pemicu penskalaan yang telah ditentukan untuk mengontrol penskalaan instans, memastikan jumlah instans sesuai dengan penggunaan sumber daya aktual.

  • Prinsip: Jumlah instans yang disediakan disesuaikan setiap menit berdasarkan nilai metrik.

    • Ketika nilai metrik melebihi ambang batas yang ditentukan untuk penskalaan keluar, Function Compute meningkatkan jumlah instans yang disediakan ke target penskalaan keluar yang telah ditentukan.

    • Sebaliknya, ketika nilai metrik turun di bawah ambang batas yang ditentukan untuk penskalaan masuk, Function Compute menyesuaikan jumlah instans yang disediakan menuju target penskalaan masuk yang telah ditentukan.

    Jika jumlah maksimum dan minimum instans yang disediakan dikonfigurasi, Function Compute menskalakan instans dalam rentang tersebut. Penskalaan berhenti ketika jumlah instans mencapai batas maksimum atau minimum.

  • Contoh: Gambar berikut menunjukkan contoh penskalaan otomatis berdasarkan pemanfaatan konkurensi instans.

    • Ketika volume lalu lintas meningkat, ambang batas penskalaan keluar dipicu dan Function Compute mulai meningkatkan jumlah instans yang disediakan. Penskalaan keluar berhenti ketika jumlah mencapai batas atas. Permintaan berlebih dikirim ke instans on-demand untuk diproses.

    • Ketika volume lalu lintas menurun, ambang batas penskalaan masuk dipicu dan Function Compute mulai mengurangi jumlah instans yang disediakan.

    instance

Metrik pemanfaatan konkurensi hanya mencakup instans yang disediakan dan tidak termasuk instans on-demand.

Metrik dihitung menggunakan rumus berikut: Jumlah permintaan konkuren yang ditangani oleh instans yang disediakan dibagi dengan jumlah maksimum permintaan konkuren yang dapat ditangani oleh semua instans yang disediakan. Nilai metrik berkisar antara 0 hingga 1.

Jumlah maksimum permintaan konkuren yang dapat ditangani oleh semua instans yang disediakan, atau konkurensi maksimum, ditentukan oleh pengaturan konkurensi instans. Untuk informasi lebih lanjut, lihat Konfigurasikan konkurensi instans.

  • Setiap instans memproses satu permintaan pada satu waktu: Konkurensi Maksimum = Jumlah Instans.

  • Setiap instans secara bersamaan memproses beberapa permintaan: Konkurensi Maksimum = Jumlah Instans × Jumlah permintaan yang diproses secara bersamaan oleh satu instans.

Nilai Target untuk Penskalaan:

  • Nilai-nilai tersebut ditentukan oleh nilai metrik saat ini, target metrik, jumlah instans yang disediakan saat ini, dan koefisien penskalaan masuk.

  • Prinsip Perhitungan: Function Compute melakukan penskalaan masuk instans yang disediakan berdasarkan koefisien penskalaan masuk, yang berkisar antara 0 (tidak termasuk) hingga 1. Koefisien penskalaan masuk adalah parameter sistem yang digunakan untuk memperlambat kecepatan penskalaan masuk dan tidak memerlukan konfigurasi manual. Nilai target untuk tugas penskalaan adalah bilangan bulat terkecil yang lebih besar dari atau sama dengan hasil perhitungan berikut:

    • Target penskalaan keluar = Instans yang disediakan saat ini × (Nilai metrik saat ini / Target metrik)

    • Target penskalaan masuk = Instans yang disediakan saat ini × Koefisien penskalaan masuk × (1 - Nilai metrik saat ini / Target metrik)

  • Contoh: Jika nilai metrik saat ini adalah 80%, target metrik adalah 40%, dan jumlah instans yang disediakan saat ini adalah 100, nilai target dihitung menggunakan rumus berikut: 100 × (80% / 40%) = 200. Jumlah instans yang disediakan ditingkatkan menjadi 200 untuk memastikan bahwa target metrik tetap mendekati 40%.

Kode sampel berikut menunjukkan detail konfigurasi. Dalam contoh ini, fungsi bernama function_1 dalam layanan bernama service_1 dikonfigurasi untuk penskalaan otomatis masuk dan keluar berdasarkan metrik ProvisionedConcurrencyUtilization. Konfigurasi ini berlaku mulai 10:00:00 pada 1 November 2022 hingga 10:00:00 pada 30 November 2022. Ketika pemanfaatan konkurensi melebihi 60%, jumlah instans yang disediakan akan ditingkatkan dengan batas maksimum 100. Sebaliknya, ketika pemanfaatan turun di bawah 60%, jumlah instans yang disediakan akan dikurangi dengan batas minimum 10. Untuk informasi lebih lanjut tentang cara menggunakan operasi PutProvisionConfig guna mengonfigurasi penskalaan terjadwal, lihat kode sampel berikut.

{
  "ServiceName": "service_1",
  "FunctionName": "function_1",
  "Qualifier": "alias_1",
  "TargetTrackingPolicies": [
    {
      "Name": "action_1",
      "StartTime": "2022-11-01T10:00:00Z",
      "EndTime": "2022-11-30T10:00:00Z",
      "MetricType": "ProvisionedConcurrencyUtilization",
      "MetricTarget": 0.6,
      "MinCapacity": 10,
      "MaxCapacity": 100,
    }
  ]
}

Tabel berikut menjelaskan parameter dalam kode sampel.

Parameter

Deskripsi

Name

Nama tugas penskalaan otomatis berbasis metrik yang dikonfigurasi.

StartTime

Waktu ketika kebijakan penskalaan mulai berlaku, dalam UTC.

EndTime

Waktu ketika kebijakan penskalaan kedaluwarsa, dalam UTC.

MetricType

Metrik yang dilacak. Dalam contoh ini, nilainya diatur ke ProvisionedConcurrencyUtilization.

MetricTarget

Ambang batas untuk penskalaan otomatis berbasis metrik.

MinCapacity

Jumlah maksimum instans yang disediakan untuk penskalaan keluar.

MaxCapacity

Jumlah minimum instans yang disediakan untuk penskalaan masuk.

Referensi

  • Untuk informasi lebih lanjut mengenai konsep dasar serta metode penagihan untuk instans on-demand dan instans yang disediakan, lihat: Tipe Instans dan Mode Penggunaan.

  • Setelah mengonfigurasi kebijakan penskalaan otomatis untuk instans yang disediakan, Anda dapat memeriksa metrik FunctionProvisionedCurrentInstance untuk melihat jumlah instans yang digunakan dalam eksekusi fungsi. Untuk detail lebih lanjut, lihat Metrik Spesifik Fungsi.