通過設定函數的最小執行個體數>0提前鎖定彈性資源,可以有效避免函數調用高峰期間因執行個體冷啟動導致的請求延遲問題。另外,還可以配置指定時間段或指定指標利用率達到設定閾值後對最小執行個體數進行擴縮容,保障效能的同時提高執行個體利用率。
設定函數的最小執行個體數>0用於解決冷啟動問題,為時延敏感的線上業務提供更好的服務響應。此時,無論是否使用,都需要為這部分執行個體付費,處理要求階段按照彈性執行個體(活躍)單價計費,未處理要求階段按照彈性執行個體(閑置)單價計費。關於彈性執行個體(活躍)和彈性執行個體(閑置)的費用計算,請參見計費概述。
僅支援為函數別名或LATEST版本設定最小執行個體數彈性策略。
設定最小執行個體數
登入Function Compute控制台,在左側導覽列,選擇。
在頂部功能表列,選擇地區,然後在函數列表頁面,單擊建立函數。
在建立函數頁面的彈性配置地區,設定最小執行個體數的值,填寫其他必選項,然後單擊建立。
配置彈性策略
在目標函數的詳情頁面,選擇彈性配置頁簽,在下方彈性策略地區,單擊目標策略行的編輯。
在編輯彈性策略面板,設定最小執行個體數的動態彈性策略。
說明如果您配置了多條彈性策略,系統會計算每條策略觸發時的最小執行個體數,並取目前時間有效彈性策略中最小執行個體數的最大值作為當前最小執行個體數,詳情請參見如何計算當前最小執行個體數?。
配置的彈性策略生效期間,初始配置的最小執行個體數不生效。某段時間內,如果不存在有效彈性策略,則當前最小執行個體數等於您初始配置的最小執行個體數。
設定定時伸縮/水位伸縮彈性策略
定時伸縮
定時伸縮策略適用於函數有明顯的周期性規律或可預知的流量高峰。當函數調用並發大於最小執行個體數時,超出的部分會自動分配至按量彈性執行個體。更多資訊,請參見定時伸縮。

如圖所示,本文樣本為指定時區Asia/Shanghai,即北京時間,策略長期有效,每周一至周五10:00將最小執行個體數擴容至50,22:00再將最小執行個體數收縮至5。
水位伸縮
根系統周期性採集執行個體並發利用率、記憶體利用率或GPU執行個體的資源使用率指標,滿足條件時,對最小執行個體數進行擴縮容,詳見水位伸縮。

如圖所示,本文樣本為指定時區Asia/Shanghai,即北京時間,策略有效區間為2025-07-15 0時至2025-07-31 0時,追蹤執行個體並發利用率指標,並發利用率追蹤值為60%,超過60%時開始擴容,擴容上限為100;並發利用率低於60%時開始縮容,縮容下限為10。
CPU函數最小執行個體數水位伸縮監控的指標包括執行個體並發利用率和記憶體利用率,GPU函數水位伸縮策略支援監控的指標執行個體並發利用率和GPU資源相關利用率指標,詳見下圖。
CPU函數
GPU函數


設定CRON運算式周期Auto Scaling
如果業務有明顯的周期性規律,您也可以通過CRON運算式設定周期性擴縮容最小執行個體數。如下圖所示,指定時區Asia/Shanghai,即北京時間,每周一10:00將最小執行個體數擴容至10,每周五22:00再將最小執行個體數收縮至1。

修改或刪除最小執行個體數彈性策略
登入Function Compute控制台,在左側導覽列選擇,在彈性策略頁面的彈性策略列表,單擊目標策略操作列的編輯或者刪除,修改或者刪除相應的最小執行個體數彈性策略。
刪除某別名的最小執行個體數彈性策略將關閉該別名上預留的所有執行個體,自動轉為按請求彈性,此時會有冷啟動過程。CPU業務平均冷啟動效率為百毫秒層級,取決於應用本身啟動速度。GPU業務平均冷啟動效率為分鐘層級,取決於模型大小與載入速度。
相關文檔
如果需要限制某個函數的執行個體數,您可以配置函數配額。配置後,當此函數處於執行狀態的函數執行個體總數超過限制後,Function Compute將返迴流控錯誤。