函数计算提供的实例类型包含弹性实例和GPU实例。本文介绍实例类型、实例规格、使用说明以及实例的两种使用模式。
实例类型
- 弹性实例:函数计算的基本实例。适用于突发流量和计算密集等各种场景。
- GPU实例:提供Ampere以及Turing架构的GPU实例。主要适用于音视频、AI人工智能和图像处理等场景。在不同的场景中,将不同的业务负载下沉至GPU硬件加速,从而提升业务处理效率。重要
- GPU实例仅支持通过容器镜像方式部署。
- 使用GPU实例过程中,为了确保您的业务正常进行,请加入钉钉用户群(钉钉群号:11721331),并提供以下信息。
- 组织名称,例如您所在的公司名称。
- 您的阿里云账号ID。
- 您使用GPU实例的地域,例如华南1(深圳)。
- 联系方式,例如您的手机号、邮箱或钉钉账号等。
实例规格
- 弹性实例
弹性实例包含以下实例规格,您可以根据业务需求选择不同配置的实例。
vCPU(核) 内存规格(MB) 代码包大小上限(GB) 函数执行时长上限(s) 磁盘大小上限(GB) 带宽能力上限(Gbps) 0.05~16 取值说明:必须为0.05的倍数。
128~32768 取值说明:必须为64的倍数。
10 86400 10 取值说明:- 512 MB,默认值。
- 10 GB。
5 说明 vCPU大小(单位为核)与内存大小(单位为GB)的比例必须设置在1∶1到1∶4之间。 - GPU实例
GPU实例包含以下实例规格,您可以根据业务需求选择不同配置的实例。
实例规格 卡型 vGPU显存(MB) vGPU算力(卡) vCPU(核) 内存规格(MB) fc.gpu.tesla.1 Tesla系列T4卡型 1024~16384(对应1 GB~16 GB) 取值说明:必须为1024 MB的倍数。
取值为vGPU显存(GB)/16。例如,配置vGPU显存为5 GB,则vGPU最高可得5/16张卡算力。 说明:由函数计算系统自动分配,无需手动配置。
取值为0.05~(vGPU显存(GB)/2)。 取值说明:必须为0.05的倍数。具体信息,请参见GPU规格配置表。
取值为128~(显存(GB)*2048)。 取值说明:必须为64的倍数。具体信息,请参见GPU规格配置表。
fc.gpu.ampere.1 Ampere系列A10卡型 1024~24576(对应1 GB~24 GB) 取值说明:必须为1024 MB的倍数。
取值为vGPU显存(GB)/24。例如,配置vGPU显存为5 GB,则vGPU最高可得5/24张卡算力。 说明:由函数计算系统自动分配,无需手动配置。
取值为0.05~(vGPU显存(GB)/3)。 取值说明:必须为0.05的倍数。具体信息,请参见GPU规格配置表。
取值为128~((显存(GB)*4096)/3)。 取值说明:必须为64的倍数。具体信息,请参见GPU规格配置表。
函数计算GPU实例同时支持以下资源规格。
镜像大小(GB) 函数执行时长上限(s) 磁盘大小上限(GB) 带宽能力上限(Gbps) ACR企业版(标准版):10
ACR企业版(高级版):10
ACR企业版(基础版):10
ACR个人版(免费):10
86400 10 5 说明- 实例规格设置为g1等同于设置为fc.gpu.tesla.1。
- 目前支持GPU实例T4卡型的地域包括华东1(杭州)、华东2(上海)、华北2(北京)、华北3(张家口)、华南1(深圳)、日本(东京)和美国(弗吉尼亚)。
- 目前支持GPU实例A10卡型的地域包括华东1(杭州)、华东2(上海)、华南1(深圳)、日本(东京)和美国(弗吉尼亚)。
GPU规格配置表
展开查看
fc.gpu.tesla.1
实例规格配置表。vGPU显存(MB) | vCPU(核) | 内存规格上限(GB) | 内存规格(MB) |
---|---|---|---|
1024 | 0.05~0.5 | 2 | 128~2048 |
2048 | 0.05~1 | 4 | 128~4096 |
3072 | 0.05~1.5 | 6 | 128~6144 |
4096 | 0.05~2 | 8 | 128~8192 |
5120 | 0.05~2.5 | 10 | 128~10240 |
6144 | 0.05~3 | 12 | 128~12288 |
7168 | 0.05~3.5 | 14 | 128~14336 |
8192 | 0.05~4 | 16 | 128~16384 |
9216 | 0.05~4.5 | 18 | 128~18432 |
10240 | 0.05~5 | 20 | 128~20480 |
11264 | 0.05~5.5 | 22 | 128~22528 |
12288 | 0.05~6 | 24 | 128~24576 |
13312 | 0.05~6.5 | 26 | 128~26624 |
14336 | 0.05~7 | 28 | 128~28672 |
15360 | 0.05~7.5 | 30 | 128~30720 |
16384 | 0.05~8 | 32 | 128~32768 |
展开查看
fc.gpu.ampere.1
实例规格配置表。vGPU显存(MB) | vCPU(核) | 内存规格上限(GB) | 内存规格(MB) |
---|---|---|---|
1024 | 0.05~0.3 | 1.3125 | 128~1344 |
2048 | 0.05~0.65 | 2.625 | 128~2688 |
3072 | 0.05~1 | 4 | 128~4096 |
4096 | 0.05~1.3 | 5.3125 | 128~5440 |
5120 | 0.05~1.65 | 6.625 | 128~6784 |
6144 | 0.05~2 | 8 | 128~8192 |
7168 | 0.05~2.3 | 9.3125 | 128~9536 |
8192 | 0.05~2.65 | 10.625 | 128~10880 |
9216 | 0.05~3 | 12 | 128~12288 |
10240 | 0.05~3.3 | 13.3125 | 128~13632 |
11264 | 0.05~3.65 | 14.625 | 128~14976 |
12288 | 0.05~4 | 16 | 128~16384 |
13312 | 0.05~4.3 | 17.3125 | 128~17728 |
14336 | 0.05~4.65 | 18.625 | 128~19072 |
15360 | 0.05~5 | 20 | 128~20480 |
16384 | 0.05~5.3 | 21.3125 | 128~21824 |
17408 | 0.05~5.65 | 22.625 | 128~23168 |
18432 | 0.05~6 | 24 | 128~24576 |
19456 | 0.05~6.3 | 25.3125 | 128~25920 |
20480 | 0.05~6.65 | 26.625 | 128~27264 |
21504 | 0.05~7 | 28 | 128~28672 |
22528 | 0.05~7.3 | 29.3125 | 128~30016 |
23552 | 0.05~7.65 | 30.625 | 128~31360 |
24576 | 0.05~8 | 32 | 128~32768 |
使用说明
如果您期望能降低冷启动时间或者提高资源利用率,可以参考以下方案。
- 预留模式:解决冷启动问题的最佳方案,建议根据业务资源预算选择固定数量预留、根据波峰波谷特性选择指定时间段预留,或者按照水位阈值选择自动伸缩的方案。预留后,实例的平均冷启动时延将明显降低。
- 单实例多并发:提高实例资源利用率问题的最佳方案,建议根据业务对资源的诉求,配置您的实例为单实例多并发。在这种方案下,当多个任务同时在一个实例上执行时,CPU或者内存将被抢占式共享,有效提高资源利用率。
实例模式
弹性实例和GPU实例均支持两种实例模式:按量模式和预留模式。两种实例模式说明如下。
按量模式
在按量模式下,函数计算系统自动为函数分配和释放实例。该模式下,函数执行时长的计量从请求执行函数开始,到请求执行完毕结束。按量模式下,同一个实例同一时间可以执行一个请求,也可以并发执行多个请求。更多信息,请参见设置实例并发度。
- 单实例单并发执行时长 按量模式下,一个实例执行一个请求时,执行时长的计量是从请求到达实例开始,到请求执行完毕为止。
- 单实例多并发执行时长
按量模式下,一个实例并发执行多个请求时,执行时长的计量是从第一个请求到达实例开始,到最后一个请求执行完毕为止。并发执行请求时,可以复用资源节省费用。
预留模式
预留模式下,函数实例由您自行分配、释放和管理。更多信息,请参见弹性管理(含预留模式)。该模式下,函数执行时长的计量是从函数计算系统启动预留函数实例开始,到您主动释放为止。因此,即使预留模式下实例未执行任何请求,只要没有释放实例,您都需要为实例付费。
