EAS提供公共资源、EAS资源组和资源配额三种资源类型,满足从测试到生产的不同场景需求。本文介绍如何选择资源类型并配置计算资源与调度策略。
选择资源类型
资源类型 | 适用场景 | 计费 | 功能对比 | |
适用于测试或流量有波动大的业务(专属资源搭配弹性资源池)。 |
|
| ||
专属资源组 | 适合高安全性要求或需独占资源的场景(紧缺资源,可通过购买专属资源来锁定)。 |
|
| |
虚拟资源组 | 将多种不同类型的资源(公共资源、资源配额、EAS专属资源)组合而成的逻辑资源组。 | 根据实际调度使用的资源进行计费。 |
| |
资源配额 | 通用计算2.0 | 适合需要独享资源、资源隔离的生产场景。 |
| |
适合大模型或需要高性能硬件(RDMA高速互联、智算CPFS存储)的场景。 |
| |||
选择建议:
测试和开发:使用公共资源,按需付费,无需前期投入。高峰期可能资源不足,详见公共资源库存不足怎么办。
生产环境(稳定业务):使用EAS 专属资源组或资源配额(通用计算2.0),资源独享、性能稳定,支持预付费降低成本。
生产环境(流量波动):使用虚拟资源组,专属资源或资源配额保底,公共资源应对峰值。
大模型或特殊硬件:使用资源配额(灵骏智算),访问高性能硬件。
选择实例规格
根据模型大小和推理负载,选择 CPU 或 GPU 机型规格。
竞价实例:使用公共资源时,可开启竞价模式并设置出价上限,以低于常规实例的价格使用空闲资源。竞价实例可能被回收,适用于对中断不敏感的推理任务。
GPU驱动版本:选择 GPU 实例时,可指定 GPU 驱动版本(服务功能>资源配置),以满足特定模型或框架的运行要求。
配置系统盘
系统盘用于存储运行时产生的临时数据。不同资源类型的默认配置如下:
公共资源:免费提供 30 GiB 系统盘,超出部分按用量付费。
EAS 资源组或资源配额:默认 60 GiB 系统盘,修改容量后从宿主机划分。
设置副本数
副本数即服务运行的实例数量。建议配置多个副本,避免单点故障导致服务不可用。
配置调度策略
使用 EAS 资源组或资源配额时,可通过以下策略优化资源调度:
弹性资源池:当自有资源不足时,自动使用公共资源(按量付费)扩容以应对突发流量;缩容时优先释放公共资源实例,节约成本。详情请参见弹性资源池。
指定节点调度:将服务限定在指定节点上运行。未指定时,非排除节点均可被使用。
高优资源重调度:开启后,系统周期性将实例从低优先级资源(如公共资源)迁移到高优先级资源(如专属资源组),优化成本。适用于滚动更新导致实例临时调度到公共资源、或需要迁移常规实例到竞价实例以节约成本的场景。
资源亲和性调度:使用公共资源组中的灵骏智算资源进行多机分布式推理时,建议在服务功能区域开启资源亲和性调度,将按您填写的 HPN Zone 将实例调度至指定超节点网络域,确保 RDMA 高速互联。
GPU 切分与分布式推理
常见问题
资源使用与限制
Q:为什么不能选择1核2 GB的机器规格?
为避免您在使用时出现问题,目前1核2 GB的机型已下架。因为EAS会在每个机器节点上部署一些系统组件,这些组件会占用部分机器资源。如果机型规格太小,系统组件占用的资源比例会过高,导致您的可用资源比例降低。
Q:如何评估PAI-EAS实例规格可部署的模型数量?
可以创建多个 EAS 实例,分别部署不同的模型。但单个实例能够部署的模型数量取决于该模型所需的资源量(CPU 核数、GPU 显存、内存等),无法提前预估固定数量。建议根据模型实际资源需求选择合适的实例规格,或将不同模型拆分到多个实例上部署。
Q:EAS部署服务数量上限是多少?
EAS服务部署实例数要根据资源的剩余使用量来确定,具体的剩余量可以在控制台的资源组列表的机器列表中查看,详情请参见使用EAS资源组。
如果根据CPU核数来分配任务,那么部署的实例数上限就是 (CPU核数 - 1) / 每个实例使用的核心数。
Q: EAS中与4090显卡近似算力的规格?
ecs.gn8ia-2x.8xlarge性能接近4090。
Q:在特定资源规格下,模型部署后支持的最大并发数是多少?
模型服务的最大并发数与模型、使用场景、资源配置等多因素相关,建议通过服务压测了解服务性能。
专属资源组管理
Q:专属资源组长时间处于扩容中
通常是因为当前地域资源不足。对于预付费机器,如果资源不足创建失败,系统会自动创建退款订单,已支付的费用会原路返回。
Q: 如何删除专属资源组的预付费机器实例?
前往阿里云资源退订页面,退订不再使用的EAS预付费专属机器。其中:
类型:选择非全额退订。
产品名称:选择EAS专属机器预付费。
单击搜索找到待退订资源,然后单击操作列下的退订资源,并按照控制台操作指引完成退订流程。
Q:EAS资源组机器退订后服务实例数据是否会保留?
不保留服务实例数据。
系统盘管理
Q:如何扩容系统盘?
可以通过以下两种方式为服务配置或扩容系统盘:
控制台配置:在创建或更新服务时,在,直接设置系统盘大小。
JSON 配置:在服务的 JSON 配置文件中,修改
metadata字段下的disk值。"metadata": {"disk": "40Gi"}
如果使用的是专属资源组,配置的系统盘大小不能超过节点机器本身的系统盘大小。如需更大系统盘,需要释放当前节点,重新购买并选择更大的系统盘规格。