如果需要使用流行AI專案,如Stable Diffusion WebUI、ComfyUI、RAG、TensorRT等底層需要使用GPU執行個體來加速計算的應用,推薦以鏡像方式部署函數應用。將容器鏡像作為函數的交付物,提升開發和交付效率。
建立函數
登入Function Compute控制台,在左側導覽列,選擇。
在頂部功能表列,選擇地區,然後在函數列表頁面,單擊建立函數。
在彈出的對話方塊,根據提示和實際情境,選擇GPU函數類型,然後單擊建立GPU函數。
在建立GPU函數頁面,設定以下配置項,然後單擊建立。
基礎配置:輸入函數名稱,唯一用於標識函數的符號,在同一帳號及地區下,函數名稱必須唯一且符合命名規範。
彈性配置:選擇執行個體類型,常駐執行個體和彈性執行個體無法同時使用,且函數建立完成後,執行個體類型不支援切換。
彈性執行個體
配置項
說明
樣本
執行個體類型
選擇彈性執行個體,按請求量自動Auto Scaling,無請求後執行個體自動回收,即按使用量計費,不使用不收費。
彈性執行個體
GPU 卡型
選擇GPU卡型。關於各種卡型支援的規格,請參見執行個體類型和規格。
Ada 系列
規格方案
根據您的業務情況,設定函數的顯存、vCPU、記憶體及磁碟規格。設定規格後,實際調用函數產生的各資源使用量均按照規格乘以佔用時間長度計量,詳情請參見計費概述。
說明磁碟中所有目錄可寫,共用磁碟的空間。
磁碟大小與底層執行函數的執行個體生命週期一致,執行個體被系統回收後,磁碟上的資料也會消失。如您需要對檔案進行持久化儲存,可以選擇掛載NAS或OSS。具體操作,請參見配置NAS檔案系統和配置OSSObject Storage Service。
顯存:48 GB
vCPU:8 vCPU
記憶體:64 GB
磁碟:512 MB(不計費,Function Compute提供10GB的磁碟免費使用額度)
最小執行個體數
如果您的業務對延遲敏感,選擇彈性執行個體後,建議設定最小執行個體數≥1,提前鎖定資源,降低冷啟動延遲。
說明設定最小執行個體數≥1後,如果未配置最小執行個體數彈性策略或某段時間內,無有效彈性策略,則當前最小執行個體數為此處設定的最小執行個體數。
如果配置了多條彈性策略,系統會計算每條策略觸發時的最小執行個體數,並取目前時間有效彈性策略中最小執行個體數的最大值作為當前最小執行個體數。
更多資訊,請參見如何計算當前最小執行個體數?。
1
單一實例並發度
您可以為GPU函數配置單一實例多並發,即單個函數執行個體可以同時處理多個請求。具體操作,請參見配置單一實例並發度。
常駐執行個體
配置項
說明
樣本
執行個體類型
選擇常駐執行個體,即從已購買的常駐資源集區分配執行個體給函數。
希望成本可預測、業務時延敏感、資源使用率高的情境,推薦您使用常駐執行個體,保障業務穩定性。
常駐執行個體
常駐資源集區
常駐資源集區是可以為目標函數分配的常駐執行個體池,如果您的常駐資源集區剩餘額度不足,請單擊操作列的擴容,然後按照介面提示進行擴容。更多資訊,請參見常駐資源集區(訂用帳戶)。
常駐資源集區:fc-pool-****
GPU卡型:Ada
規格方案
根據您的業務情況,設定函數的顯存、vCPU、記憶體及磁碟規格。設定規格後,實際調用函數產生的各資源使用量均按照規格乘以佔用時間長度計量,詳情請參見計費概述。
說明磁碟中所有目錄可寫,共用磁碟的空間。
磁碟大小與底層執行函數的執行個體生命週期一致,執行個體被系統回收後,磁碟上的資料也會消失。如您需要對檔案進行持久化儲存,可以選擇掛載NAS或OSS。具體操作,請參見配置NAS檔案系統和配置OSSObject Storage Service。
顯存:48 GB
vCPU:8 vCPU
記憶體:64 GB
磁碟:512 MB(不計費,Function Compute提供10GB的磁碟免費使用額度)
常駐執行個體數
根據常駐資源集區的資源情況為目標函數分配常駐執行個體數。
1
單一實例並發度
您可以為GPU函數配置單一實例多並發,即單個函數執行個體可以同時處理多個請求。具體操作,請參見配置單一實例並發度。
20
函數代碼:配置函數的運行環境和代碼相關資訊。
配置項
說明
樣本
運行環境
使用樣本鏡像:選擇Function Compute提供的樣本鏡像,快速體驗部署鏡像函數。您需要從配置項容器鏡像下方鏡像列表中選擇目標鏡像。
使用ACR中的鏡像:單擊配置項容器鏡像下方的選擇 ACR 中的鏡像,在彈出的選擇容器鏡像面板,選擇已建立的容器鏡像執行個體和ACR 鏡像倉庫,然後在下方選擇鏡像地區找到目標鏡像並在其右側操作列單擊選擇。更多資訊,請參見建立自訂鏡像函數。
容器鏡像
選擇目標鏡像。
SpringBoot Web 應用程式樣本鏡像
啟動命令
程式的啟動命令。如果不配置啟動命令,則預設使用鏡像中的Entrypoint/CMD。
無
監聽連接埠
您的代碼中的HTTP Server所監聽的連接埠。
9000
執行逾時時間
設定逾時時間。執行逾時時間預設為60秒,最長為86400秒。
60
執行個體預熱:AI推理情境,配置執行個體預熱實現模型預熱,解決模型初次請求耗時較長的問題。
配置項
說明
樣本
執行個體預熱
執行個體預熱
通過配置Initializer回調程式,在函數執行個體啟動成功之後,處理請求之前,通過運行指定指令碼或調用介面進行模型載入,提前預熱,最佳化冷啟動。
更多關於Initializer回調程式的介紹,請參見配置執行個體生命週期。
開啟
逾時時間
設定Initializer回調程式逾時時間。
60
預熱程式類型
支援配置執行指令和調用代碼兩種類型的Initializer回調程式實現模型預熱。
執行指令
指令內容
配置執行指令內容。支援使用者自訂Shell實現方式,例如
/bin/bash、/bin/sh、/bin/csh和/bin/zsh等,需要確保函數運行時環境支援對應的Shell實現方式。參見回調方法實現
許可權、網路、儲存:配置函數訪問角色、網路和儲存掛載等。
配置項
說明
樣本
函數角色
Function Compute平台會使用這個RAM角色來產生訪問的阿里雲資源的臨時密鑰,並傳遞給代碼。更多資訊,請參見使用函數角色授予Function Compute訪問其他雲端服務的許可權。
mytestrole
允許訪問 VPC
用於開啟允許函數訪問VPC內資源。更多資訊,請參見配置網路。
開啟
專用網路
允許訪問 VPC選擇是時必填。建立新的VPC或在下拉式清單中選擇要訪問的VPC ID。
fc.auto.create.vpc.1632317****
交換器
允許訪問 VPC選擇是時必填。建立新的交換器或在下拉式清單中選擇交換器ID。
fc.auto.create.vswitch.vpc-bp1p8248****
安全性群組
允許訪問 VPC選擇是時必填。建立新的安全性群組或在下拉式清單中選擇安全性群組。
fc.auto.create.SecurityGroup.vsw-bp15ftbbbbd****
允許預設網卡訪問公網
是否允許函數通過預設網卡訪問公網。
重要使用固定公網IP地址功能時,必須關閉允許函數預設網卡訪問公網,否則配置的固定公網IP地址不生效。更多資訊,請參見配置固定公網IP地址。
開啟
掛載 NAS 檔案系統
為函數配置NAS檔案系統,用於持久化儲存函數間共用資料,例如多個推理函數共用的模型。
如果選擇自動設定,系統預設使用已有名稱為Alibaba-Fc-V3-Component-Generated的通用型NAS檔案系統,如果當前帳號下沒有合格NAS,系統會自動建立。
開啟
掛載 OSS Object Storage Service
為函數掛載OSSObject Storage Service,用於持久化儲存日誌、業務檔案等。具體操作,請參見配置OSSObject Storage Service。
開啟
日誌、鏈路追蹤
配置項
說明
樣本
日誌功能
用於設定將函數的執行日誌持久化儲存到Log Service,方便您進行代碼調試、故障分析和資料分析等。更多資訊,請參見配置日誌功能。
自動設定:自動選擇以
serverless-<region_id>開頭的記錄項目。該記錄項目每個地區僅建立一個,不會重複建立,如系統查詢到當前地區下已有此記錄項目,將直接使用。
自訂配置:需手動指定目標記錄項目和日誌庫。
開啟
更多配置
配置項
說明
樣本
時區
選擇函數的時區。此處設定函數的時區後,將自動為函數添加一條環境變數TZ,其值為設定的目標時區。
UTC
標籤
為函數設定標籤便於分組管理函數,需同時設定標籤鍵和標籤值。
key : value
資源群組
選擇函數所在配置資源群組,使用資源群組對函數進行分組管理。
預設資源群組
環境變數
通過環境變數,在不修改代碼的前提下靈活調整函數的行為,詳見配置環境變數。
{ "BUCKET_NAME": "MY_BUCKET", "TABLE_NAME": "MY_TABLE" }
編輯函數
函數建立完成後,如果需要變更鏡像,您可以在函數詳情頁的配置頁簽,編輯運行時,詳見下圖。

更多修改,例如修改環境變數、日誌儲存等設定,請參見配置函數。
刪除函數
登入Function Compute控制台,在函數列表找到目標函數,單擊其右側操作列的刪除,然後在彈出的對話方塊,確認要刪除的函數已無任何觸發器、最小執行個體數彈性策略等綁定資源後,再次確認刪除。
擷取函數ARN
資源ARN(Aliyun Resource Name)用於在代碼中定位阿里雲資源。可以擷取函數的ARN,便於引用函數。
登入Function Compute控制台,在左側導覽列,選擇。
在頂部功能表列,選擇地區,然後在函數列表頁面,單擊目標函數。
在函數詳情頁面,單擊右側的複製 ARN擷取目標函數的ARN。

相關文檔
針對不同使用情境,Function Compute提供事件函數、Web函數、任務函數和GPU函數四種函數類型,關於如何針對使用情境選擇函數類型,請參見技術選型指南。
除控制台外,Function Compute還提供調用API和使用Serverless Devs工具方式來管理函數,具體請參見CreateFunction - 建立函數和Serverless Devs快速入門。
函數執行逾時,可以嘗試的操作見函數執行逾時,報錯Function time out after怎麼辦?。
使用頻率較低的函數調用時間會比較長,具體原因見為什麼使用頻率較低的函數調用時間比較長?。如果想消除冷啟動延時的影響,可以設定最小執行個體數≥1。