配置部署资源 - 人工智能平台 PAI

EAS提供公共资源、EAS资源组和资源配额三种资源类型，满足从测试到生产的不同场景需求。本文介绍如何选择资源类型并配置计算资源与调度策略。

选择资源类型

资源类型		适用场景	计费	功能对比
公共资源		适用于测试或流量有波动大的业务（专属资源搭配弹性资源池）。	先使用，后付费，按需开通。后付费（按量付费），详情请参见EAS计费说明。	使用公共计算资源，无需单独购买，高峰期无法保证稳定的资源分配。支持CPU、GPU（A10、P4、P100、T4及V100卡）
EAS资源组	专属资源组	适合高安全性要求或需独占资源的场景（紧缺资源，可通过购买专属资源来锁定）。	先购买，后使用。支持预付费（包年包月）和后付费（按量付费），详情请参见EAS计费说明。	独享专属计算资源，资源隔离更安全支持CPU、支持GPU（A10、P4、P100、T4及V100卡）支持GPU切分功能
EAS资源组	虚拟资源组	将多种不同类型的资源（公共资源、资源配额、EAS专属资源）组合而成的逻辑资源组。	根据实际调度使用的资源进行计费。	将同一个服务部署在多种不同的资源。支持设置调度优先级。
资源配额	通用计算2.0	适合需要独享资源、资源隔离的生产场景。	先购买，后使用。预付费（包年包月），详情参见AI计算资源计费说明。	训推一体资源管理，提升资源利用率。支持GPU切分功能。
资源配额	灵骏智算	适合大模型或需要高性能硬件（RDMA高速互联、智算CPFS存储）的场景。	先购买，后使用。预付费（包年包月），详情参见AI计算资源计费说明。	训推一体资源管理，提升资源利用率。支持GPU切分功能。

选择建议：

测试和开发：使用公共资源，按需付费，无需前期投入。高峰期可能资源不足，详见公共资源库存不足怎么办。
生产环境（稳定业务）：使用EAS 专属资源组或资源配额（通用计算2.0），资源独享、性能稳定，支持预付费降低成本。
生产环境（流量波动）：使用虚拟资源组，专属资源或资源配额保底，公共资源应对峰值。
大模型或特殊硬件：使用资源配额（灵骏智算），访问高性能硬件。

选择实例规格

根据模型大小和推理负载，选择 CPU 或 GPU 机型规格。

竞价实例：使用公共资源时，可开启竞价模式并设置出价上限，以低于常规实例的价格使用空闲资源。竞价实例可能被回收，适用于对中断不敏感的推理任务。
GPU驱动版本：选择 GPU 实例时，可指定 GPU 驱动版本（服务功能>资源配置），以满足特定模型或框架的运行要求。

配置系统盘

系统盘用于存储运行时产生的临时数据。不同资源类型的默认配置如下：

公共资源：免费提供 30 GiB 系统盘，超出部分按用量付费。
EAS 资源组或资源配额：默认 60 GiB 系统盘，修改容量后从宿主机划分。

配置共享内存

共享内存允许容器内的多个进程直接读写同一块内存区域，避免数据复制开销，适用于需要高效进程间通信的场景。

使用多进程推理框架（如 vLLM tensor parallel、多 worker 并发推理）时，建议根据模型大小配置足够的共享内存。

设置副本数

副本数即服务运行的实例数量。建议配置多个副本，避免单点故障导致服务不可用。

配置调度策略

使用 EAS 资源组或资源配额时，可通过以下策略优化资源调度：

弹性资源池：当自有资源不足时，自动使用公共资源（按量付费）扩容以应对突发流量；缩容时优先释放公共资源实例，节约成本。详情请参见弹性资源池。
指定节点调度：将服务限定在指定节点上运行。未指定时，非排除节点均可被使用。
高优资源重调度：开启后，系统周期性将实例从低优先级资源（如公共资源）迁移到高优先级资源（如专属资源组），优化成本。适用于滚动更新导致实例临时调度到公共资源、或需要迁移常规实例到竞价实例以节约成本的场景。
资源亲和性调度：使用公共资源组中的灵骏智算资源进行多机分布式推理时，建议在服务功能区域开启资源亲和性调度，将按您填写的 HPN Zone 将实例调度至指定超节点网络域，确保 RDMA 高速互联。

GPU 切分与分布式推理

GPU 切分：将一张 GPU 卡的算力和显存切分给多个服务实例共享使用，提升 GPU 利用率，降低部署成本。适用于模型较小或推理负载不高的场景。仅使用EAS资源组和资源配额时支持开启。
多机分布式推理：将单个服务实例部署在多台机器上，突破单机硬件限制，支持超大规模模型的部署与运行。

常见问题

资源使用与限制

Q：为什么不能选择1核2 GB的机器规格？

为避免您在使用时出现问题，目前1核2 GB的机型已下架。因为EAS会在每个机器节点上部署一些系统组件，这些组件会占用部分机器资源。如果机型规格太小，系统组件占用的资源比例会过高，导致您的可用资源比例降低。

Q：如何评估PAI-EAS实例规格可部署的模型数量？

可以创建多个 EAS 实例，分别部署不同的模型。但单个实例能够部署的模型数量取决于该模型所需的资源量（CPU 核数、GPU 显存、内存等），无法提前预估固定数量。建议根据模型实际资源需求选择合适的实例规格，或将不同模型拆分到多个实例上部署。

Q：EAS部署服务数量上限是多少？

EAS服务部署实例数要根据资源的剩余使用量来确定，具体的剩余量可以在控制台的资源组列表的机器列表中查看，详情请参见使用EAS资源组。

如果根据CPU核数来分配任务，那么部署的实例数上限就是 (CPU核数 - 1) / 每个实例使用的核心数。

Q： EAS中与4090显卡近似算力的规格？

ecs.gn8ia-2x.8xlarge性能接近4090。

Q：在特定资源规格下，模型部署后支持的最大并发数是多少？

模型服务的最大并发数与模型、使用场景、资源配置等多因素相关，建议通过服务压测了解服务性能。

专属资源组管理

Q：专属资源组长时间处于扩容中

通常是因为当前地域资源不足。对于预付费机器，如果资源不足创建失败，系统会自动创建退款订单，已支付的费用会原路返回。

Q：如何删除专属资源组的预付费机器实例？

前往阿里云资源退订页面，退订不再使用的EAS预付费专属机器。其中：

类型：选择非全额退订。
产品名称：选择EAS专属机器预付费。

单击搜索找到待退订资源，然后单击操作列下的退订资源，并按照控制台操作指引完成退订流程。

Q：EAS资源组机器退订后服务实例数据是否会保留？

不保留服务实例数据。

系统盘管理

Q：如何扩容系统盘？

可以通过以下两种方式为服务配置或扩容系统盘：

控制台配置：在创建或更新服务时，在资源信息 > 配置系统盘，直接设置系统盘大小。
JSON 配置：在服务的 JSON 配置文件中，修改 metadata 字段下的 disk 值。
```
"metadata": {"disk": "40Gi"}
```

说明

如果使用的是专属资源组，配置的系统盘大小不能超过节点机器本身的系统盘大小。如需更大系统盘，需要释放当前节点，重新购买并选择更大的系统盘规格。