全部產品
Search
文件中心

Function Compute:執行個體類型和規格

更新時間:Sep 05, 2025

在通用計算情境中,例如 Web 服務和資料處理,Function Compute通常只需使用基礎的 CPU 執行個體即可滿足需求。然而,在需要進行大規模並行計算或深度學習任務的情境下,如音視頻處理、人工智慧(AI)推理及影像處理等,GPU 執行個體則能夠顯著提升計算效率。

針對 GPU 執行個體,Function Compute提供了兩種執行個體類型:彈性執行個體和常駐執行個體。您可以根據具體的業務需求選擇合適的執行個體類型與規格,在確保業務穩定啟動並執行同時,最大限度地提升資源使用率和效能表現。

執行個體類型選型

針對CPU函數,僅支援彈性執行個體。針對GPU函數,您可以根據業務資源使用率、對延時敏感程度和對費用的穩定性要求,選擇彈性執行個體或常駐執行個體,詳細選型指引請參見以下流程圖。

說明

僅支援為Ada、Ada.2、Ada.3、Hopper和Xpu.1系列卡型的GPU函數綁定常駐執行個體。

彈性執行個體

如果設定函數的最小執行個體數為0,將按請求量自動Auto Scaling,無請求後執行個體自動回收,即按使用量計費,不使用不收費,能夠做到最大程度降本。業務請求越頻繁,資源使用率越高,相對虛擬機器彈性的降本幅度越高。

是否存在冷啟動

是。針對時延敏感業務,為瞭解決冷啟動問題,可以設定最小執行個體數≥1,提前鎖定彈性資源,當請求到達時,迅速喚醒執行個體執行請求。

計費說明(後付費

函數的使用費用由彈性執行個體(活躍)和彈性執行個體(閑置)費用構成,如果設定最小執行個體數≥1,建議開啟閑置模式開關。彈性執行個體(閑置)狀態下vCPU資源使用不收費,GPU資源使用僅收1/5費用,使用費用遠遠小於彈性執行個體(活躍)狀態的費用。

關於彈性執行個體(活躍)和彈性執行個體(閑置)的情境劃分,請參見彈性執行個體

常駐執行個體

僅適用於GPU函數。使用者需提前購買常駐資源集區,然後基於常駐資源集區為指定函數分配指定數量和卡型的常駐執行個體,從而實現使用成本的可控與固定。適用於業務資源使用率高、時延要求高或對費用穩定性有較高要求的情境。

是否存在冷啟動

否。使用常駐執行個體時,函數最多可以同時處理的請求數=被分配的常駐執行個體數×執行個體並發數,超出的請求將被流控,而未超出的請求,可以實現即時響應,徹底消除冷啟動。

計費說明(預付費

函數費用包括已購買的所有常駐資源集區的預付費費用。

執行個體規格

  • CPU執行個體

    vCPU(核)

    記憶體規格(MB)

    程式碼封裝大小上限(GB)

    函數執行時間長度上限(s)

    磁碟大小上限(GB)

    頻寬能力上限(Gbps)

    0.05~16

    取值說明:必須為0.05的倍數。

    128~32768

    取值說明:必須為64的倍數。

    10

    86400

    10

    取值說明:

    • 512 MB,預設值。

    • 10 GB。

    5

    說明

    vCPU大小(單位為核)與記憶體大小(單位為GB)的比例必須設定在1∶1到1∶4之間。

  • GPU執行個體

    說明

    fc.gpu.tesla.1執行個體規格的效能與NVIDIA T4效能基本一致。

    執行個體規格

    支援的

    執行個體類型

    整卡顯存(GB)

    整卡算力(TFLOPS)

    可選切分規格

    FP16算力

    FP32算力

    vGPU顯存(MB)

    vGPU算力(卡)

    vCPU(核)

    記憶體規格(MB)

    fc.gpu.tesla.1

    彈性執行個體

    16

    65

    8

    16384(對應16 GB)

    取值說明:僅支援整卡顯存,若購買多卡,所有資源乘以多卡的倍數。

    預設分配整卡算力。

    說明:由Function Compute系統自動分配,無需手動設定。

    取值為0.05~(vGPU顯存(GB)/2)。

    取值說明:必須為0.05的倍數。

    取值為128~(vGPU顯存(GB)*2048)。

    取值說明:必須為64的倍數。

    fc.gpu.ada.1

    • 彈性執行個體

    • 常駐執行個體

    48

    119

    60

    49152(對應48 GB)

    取值說明:僅支援整卡顯存,若購買多卡,所有資源乘以多卡的倍數。

    取值為4、8或16。

    取值為32768、65536或98304。

    fc.gpu.ada.2

    • 彈性執行個體

    • 常駐執行個體

    24

    166

    83

    24576(對應24 GB)

    取值說明:僅支援整卡顯存,若購買多卡,所有資源乘以多卡的倍數。

    取值為8或16。

    取值為32768或65536。

    fc.gpu.ada.3

    • 彈性執行個體

    • 常駐執行個體

    48

    148

    73.54

    49152(對應48 GB)

    取值說明:僅支援整卡顯存,若購買多卡,所有資源乘以多卡的倍數。

    取值為8或16。

    取值為65536或98304。

    fc.gpu.hopper.1

    • 彈性執行個體

    • 常駐執行個體

    96

    148

    44

    98304(對應96 GB)

    取值說明:僅支援整卡顯存,若購買多卡,所有資源乘以多卡的倍數。

    16

    取值為98304。

    fc.gpu.xpu.1

    • 彈性執行個體

    • 常駐執行個體

    96

    123

    61.5

    98304(對應96 GB)

    取值說明:僅支援整卡顯存,若購買多卡,所有資源乘以多卡的倍數。

    16

    取值為98304。

    Function ComputeGPU執行個體同時支援以下資源規格。

    鏡像大小(GB)

    函數執行時間長度上限(s)

    磁碟大小上限(GB)

    頻寬能力上限(Gbps)

    ACR企業版(標準版):15

    ACR企業版(進階版):15

    ACR企業版(基礎版):15

    ACR個人版(免費):15

    86400

    10

    5

    說明
    • 執行個體規格設定為g1等同於設定為fc.gpu.tesla.1。

    • 目前支援Tesla系列GPU執行個體的地區包括華東1(杭州)、華東2(上海)、華北2(北京)、華北3(張家口)、華南1(深圳)、日本(東京)、美國(維吉尼亞)和新加坡。

    • 目前支援Ada系列GPU執行個體的地區包括華北2(北京)、華東1(杭州)、華東2(上海)、華南1(深圳)、新加坡和美國(維吉尼亞)。

GPU執行個體規格與執行個體並發度的關係

Ada.1整卡顯存為48GB,Tesla系列整卡顯存為16GB,僅支援整卡顯存,則單卡同時承載1個GPU容器,由於各地區的GPU卡數配額預設最大為30,地區層級最多可同時承載30個GPU容器。

  • 當GPU函數執行個體並發度為1時,該函數在地區層級的推理並發度為30。

  • 當GPU函數執行個體並發度為5時,該函數在地區層級的推理並發度為150。

單一實例多並發

如果您希望提高執行個體資源使用率,建議根據業務對資源的訴求,配置您的執行個體為單一實例多並發。在這種方案下,當多個任務同時在一個執行個體上執行時,CPU或者記憶體將被搶佔式共用,有效提高資源使用率。更多資訊,請參見配置單一實例並發度

單一實例單並發執行時間長度

一個執行個體執行一個請求時,執行時間長度的計量是從請求到達執行個體開始,到請求執行完畢為止。

單一實例多並發執行時間長度

一個執行個體並發執行多個請求時,執行時間長度的計量是從第一個請求到達執行個體開始,到最後一個請求執行完畢為止。並發執行請求時,可以複用資源節省費用。

相關文檔

  • 關於Function Compute的計費方式以及計費項目等更多資訊,請參見計費概述

  • 使用API建立函數時可以通過instanceType參數指定執行個體類型,請參見CreateFunction - 建立函數

  • 關於如何通過控制台指定期望的執行個體類型和執行個體規格的具體操作,請參見建立函數