函数计算提供的实例类型包含弹性实例和GPU实例。本文介绍实例类型、实例规格、使用说明以及实例的两种使用模式。

实例类型

  • 弹性实例:函数计算的基本实例。适用于突发流量和计算密集等各种场景。
  • GPU实例:提供Ampere以及Turing架构的GPU实例。主要适用于音视频、AI人工智能和图像处理等场景。在不同的场景中,将不同的业务负载下沉至GPU硬件加速,从而提升业务处理效率。
    不同场景下使用GPU实例的最佳实践,请参见以下文档。
    重要
    • GPU实例仅支持通过容器镜像方式部署。
    • 使用GPU实例过程中,为了确保您的业务正常进行,请加入钉钉用户群(钉钉群号:11721331),并提供以下信息。
      • 组织名称,例如您所在的公司名称。
      • 您的阿里云账号ID。
      • 您使用GPU实例的地域,例如华南1(深圳)。
      • 联系方式,例如您的手机号、邮箱或钉钉账号等。

实例规格

  • 弹性实例

    弹性实例包含以下实例规格,您可以根据业务需求选择不同配置的实例。

    vCPU(核)内存规格(MB)代码包大小上限(GB)函数执行时长上限(s)磁盘大小上限(GB)带宽能力上限(Gbps)
    0.05~16

    取值说明:必须为0.05的倍数。

    128~32768

    取值说明:必须为64的倍数。

    108640010
    取值说明:
    • 512 MB,默认值。
    • 10 GB。
    5
    说明 vCPU大小(单位为核)与内存大小(单位为GB)的比例必须设置在1∶1到1∶4之间。
  • GPU实例

    GPU实例包含以下实例规格,您可以根据业务需求选择不同配置的实例。

    实例规格卡型vGPU显存(MB)vGPU算力(卡)vCPU(核)内存规格(MB)
    fc.gpu.tesla.1Tesla系列T4卡型1024~16384(对应1 GB~16 GB)

    取值说明:必须为1024 MB的倍数。

    取值为vGPU显存(GB)/16。例如,配置vGPU显存为5 GB,则vGPU最高可得5/16张卡算力。

    说明:由函数计算系统自动分配,无需手动配置。

    取值为0.05~(vGPU显存(GB)/2)。

    取值说明:必须为0.05的倍数。具体信息,请参见GPU规格配置表

    取值为128~(显存(GB)*2048)。

    取值说明:必须为64的倍数。具体信息,请参见GPU规格配置表

    fc.gpu.ampere.1Ampere系列A10卡型1024~24576(对应1 GB~24 GB)

    取值说明:必须为1024 MB的倍数。

    取值为vGPU显存(GB)/24。例如,配置vGPU显存为5 GB,则vGPU最高可得5/24张卡算力。

    说明:由函数计算系统自动分配,无需手动配置。

    取值为0.05~(vGPU显存(GB)/3)。

    取值说明:必须为0.05的倍数。具体信息,请参见GPU规格配置表

    取值为128~((显存(GB)*4096)/3)。

    取值说明:必须为64的倍数。具体信息,请参见GPU规格配置表

    函数计算GPU实例同时支持以下资源规格。

    镜像大小(GB)函数执行时长上限(s)磁盘大小上限(GB)带宽能力上限(Gbps)

    ACR企业版(标准版):10

    ACR企业版(高级版):10

    ACR企业版(基础版):10

    ACR个人版(免费):10

    86400105
    说明
    • 实例规格设置为g1等同于设置为fc.gpu.tesla.1。
    • 目前支持GPU实例T4卡型的地域包括华东1(杭州)、华东2(上海)、华北2(北京)、华北3(张家口)、华南1(深圳)、日本(东京)和美国(弗吉尼亚)。
    • 目前支持GPU实例A10卡型的地域包括华东1(杭州)、华东2(上海)、华南1(深圳)、日本(东京)和美国(弗吉尼亚)。

GPU规格配置表

展开查看fc.gpu.tesla.1实例规格配置表。
vGPU显存(MB)vCPU(核)内存规格上限(GB)内存规格(MB)
10240.05~0.52128~2048
20480.05~14128~4096
30720.05~1.56128~6144
40960.05~28128~8192
51200.05~2.510128~10240
61440.05~312128~12288
71680.05~3.514128~14336
81920.05~416128~16384
92160.05~4.518128~18432
102400.05~520128~20480
112640.05~5.522128~22528
122880.05~624128~24576
133120.05~6.526128~26624
143360.05~728128~28672
153600.05~7.530128~30720
163840.05~832128~32768
展开查看fc.gpu.ampere.1实例规格配置表。
vGPU显存(MB)vCPU(核)内存规格上限(GB)内存规格(MB)
10240.05~0.31.3125128~1344
20480.05~0.652.625128~2688
30720.05~14128~4096
40960.05~1.35.3125128~5440
51200.05~1.656.625128~6784
61440.05~28128~8192
71680.05~2.39.3125128~9536
81920.05~2.6510.625128~10880
92160.05~312128~12288
102400.05~3.313.3125128~13632
112640.05~3.6514.625128~14976
122880.05~416128~16384
133120.05~4.317.3125128~17728
143360.05~4.6518.625128~19072
153600.05~520128~20480
163840.05~5.321.3125128~21824
174080.05~5.6522.625128~23168
184320.05~624128~24576
194560.05~6.325.3125128~25920
204800.05~6.6526.625128~27264
215040.05~728128~28672
225280.05~7.329.3125128~30016
235520.05~7.6530.625128~31360
245760.05~832128~32768

使用说明

如果您期望能降低冷启动时间或者提高资源利用率,可以参考以下方案。

  • 预留模式:解决冷启动问题的最佳方案,建议根据业务资源预算选择固定数量预留、根据波峰波谷特性选择指定时间段预留,或者按照水位阈值选择自动伸缩的方案。预留后,实例的平均冷启动时延将明显降低。
  • 单实例多并发:提高实例资源利用率问题的最佳方案,建议根据业务对资源的诉求,配置您的实例为单实例多并发。在这种方案下,当多个任务同时在一个实例上执行时,CPU或者内存将被抢占式共享,有效提高资源利用率。

实例模式

弹性实例和GPU实例均支持两种实例模式:按量模式和预留模式。两种实例模式说明如下。

按量模式

在按量模式下,函数计算系统自动为函数分配和释放实例。该模式下,函数执行时长的计量从请求执行函数开始,到请求执行完毕结束。按量模式下,同一个实例同一时间可以执行一个请求,也可以并发执行多个请求。更多信息,请参见设置实例并发度

  • 单实例单并发执行时长
    按量模式下,一个实例执行一个请求时,执行时长的计量是从请求到达实例开始,到请求执行完毕为止。instanceconcurrency=1
  • 单实例多并发执行时长

    按量模式下,一个实例并发执行多个请求时,执行时长的计量是从第一个请求到达实例开始,到最后一个请求执行完毕为止。并发执行请求时,可以复用资源节省费用。

    instanceconcurrency>1

预留模式

预留模式下,函数实例由您自行分配、释放和管理。更多信息,请参见弹性管理(含预留模式)。该模式下,函数执行时长的计量是从函数计算系统启动预留函数实例开始,到您主动释放为止。因此,即使预留模式下实例未执行任何请求,只要没有释放实例,您都需要为实例付费。On-Demand Resources

更多信息