全部产品
Search
文档中心

人工智能平台 PAI:配置部署资源

更新时间:Jun 17, 2026

EAS提供公共资源、EAS资源组和资源配额三种资源类型,满足从测试到生产的不同场景需求。本文介绍如何选择资源类型并配置计算资源与调度策略。

选择资源类型

资源类型

适用场景

计费

功能对比

公共资源

适用于测试或流量有波动大的业务(专属资源搭配弹性资源池)。

  • 先使用,后付费,按需开通。

  • 后付费(按量付费),详情请参见EAS计费说明

  • 使用公共计算资源,无需单独购买,高峰期无法保证稳定的资源分配。

  • 支持CPU、GPU(A10、P4、P100、T4及V100卡)

EAS资源组

专属资源组

适合高安全性要求或需独占资源的场景(紧缺资源,可通过购买专属资源来锁定)。

  • 先购买,后使用。

  • 支持预付费(包年包月)和后付费(按量付费),详情请参见EAS计费说明

  • 独享专属计算资源,资源隔离更安全

  • 支持CPU、支持GPU(A10、P4、P100、T4及V100卡)

  • 支持GPU切分功能

虚拟资源组

将多种不同类型的资源(公共资源、资源配额、EAS专属资源)组合而成的逻辑资源组。

根据实际调度使用的资源进行计费。

  • 将同一个服务部署在多种不同的资源。

  • 支持设置调度优先级。

资源配额

通用计算2.0

适合需要独享资源、资源隔离的生产场景。

灵骏智算

适合大模型或需要高性能硬件(RDMA高速互联、智算CPFS存储)的场景。

选择建议:

  • 测试和开发:使用公共资源,按需付费,无需前期投入。高峰期可能资源不足,详见公共资源库存不足怎么办

  • 生产环境(稳定业务):使用EAS 专属资源组或资源配额(通用计算2.0),资源独享、性能稳定,支持预付费降低成本。

  • 生产环境(流量波动):使用虚拟资源组,专属资源或资源配额保底,公共资源应对峰值。

  • 大模型或特殊硬件:使用资源配额(灵骏智算),访问高性能硬件。

选择实例规格

根据模型大小和推理负载,选择 CPU 或 GPU 机型规格。

  • 竞价实例:使用公共资源时,可开启竞价模式并设置出价上限,以低于常规实例的价格使用空闲资源。竞价实例可能被回收,适用于对中断不敏感的推理任务。

  • GPU驱动版本:选择 GPU 实例时,可指定 GPU 驱动版本(服务功能>资源配置),以满足特定模型或框架的运行要求。

配置系统盘

系统盘用于存储运行时产生的临时数据。不同资源类型的默认配置如下:

  • 公共资源:免费提供 30 GiB 系统盘,超出部分按用量付费。

  • EAS 资源组或资源配额:默认 60 GiB 系统盘,修改容量后从宿主机划分。

配置共享内存

共享内存允许容器内的多个进程直接读写同一块内存区域,避免数据复制开销,适用于需要高效进程间通信的场景。

使用多进程推理框架(如 vLLM tensor parallel、多 worker 并发推理)时,建议根据模型大小配置足够的共享内存。

设置副本数

副本数即服务运行的实例数量。建议配置多个副本,避免单点故障导致服务不可用。

配置调度策略

使用 EAS 资源组或资源配额时,可通过以下策略优化资源调度:

  • 弹性资源池:当自有资源不足时,自动使用公共资源(按量付费)扩容以应对突发流量;缩容时优先释放公共资源实例,节约成本。详情请参见弹性资源池

  • 指定节点调度:将服务限定在指定节点上运行。未指定时,非排除节点均可被使用。

  • 高优资源重调度:开启后,系统周期性将实例从低优先级资源(如公共资源)迁移到高优先级资源(如专属资源组),优化成本。适用于滚动更新导致实例临时调度到公共资源、或需要迁移常规实例到竞价实例以节约成本的场景。

  • 资源亲和性调度:使用公共资源组中的灵骏智算资源进行多机分布式推理时,建议在服务功能区域开启资源亲和性调度,将按您填写的 HPN Zone 将实例调度至指定超节点网络域,确保 RDMA 高速互联。

GPU 切分与分布式推理

  • GPU 切分:将一张 GPU 卡的算力和显存切分给多个服务实例共享使用,提升 GPU 利用率,降低部署成本。适用于模型较小或推理负载不高的场景。仅使用EAS资源组和资源配额时支持开启。

  • 多机分布式推理:将单个服务实例部署在多台机器上,突破单机硬件限制,支持超大规模模型的部署与运行。

常见问题

资源使用与限制

Q:为什么不能选择1核2 GB的机器规格?

为避免您在使用时出现问题,目前1核2 GB的机型已下架。因为EAS会在每个机器节点上部署一些系统组件,这些组件会占用部分机器资源。如果机型规格太小,系统组件占用的资源比例会过高,导致您的可用资源比例降低。

Q:如何评估PAI-EAS实例规格可部署的模型数量?

可以创建多个 EAS 实例,分别部署不同的模型。但单个实例能够部署的模型数量取决于该模型所需的资源量(CPU 核数、GPU 显存、内存等),无法提前预估固定数量。建议根据模型实际资源需求选择合适的实例规格,或将不同模型拆分到多个实例上部署。

Q:EAS部署服务数量上限是多少?

EAS服务部署实例数要根据资源的剩余使用量来确定,具体的剩余量可以在控制台的资源组列表的机器列表中查看,详情请参见使用EAS资源组

如果根据CPU核数来分配任务,那么部署的实例数上限就是 (CPU核数 - 1) / 每个实例使用的核心数。

Q: EAS中与4090显卡近似算力的规格?

ecs.gn8ia-2x.8xlarge性能接近4090。

Q:在特定资源规格下,模型部署后支持的最大并发数是多少?

模型服务的最大并发数与模型、使用场景、资源配置等多因素相关,建议通过服务压测了解服务性能。

专属资源组管理

Q:专属资源组长时间处于扩容中

通常是因为当前地域资源不足。对于预付费机器,如果资源不足创建失败,系统会自动创建退款订单,已支付的费用会原路返回。

Q: 如何删除专属资源组的预付费机器实例?

前往阿里云资源退订页面,退订不再使用的EAS预付费专属机器。其中:

  • 类型:选择非全额退订

  • 产品名称:选择EAS专属机器预付费

单击搜索找到待退订资源,然后单击操作列下的退订资源,并按照控制台操作指引完成退订流程。

Q:EAS资源组机器退订后服务实例数据是否会保留?

不保留服务实例数据。

系统盘管理

Q:如何扩容系统盘?

可以通过以下两种方式为服务配置或扩容系统盘:

  1. 控制台配置:在创建或更新服务时,在资源信息 > 配置系统盘,直接设置系统盘大小。

  2. JSON 配置:在服务的 JSON 配置文件中,修改 metadata 字段下的 disk 值。

    "metadata": {"disk": "40Gi"}
说明

如果使用的是专属资源组,配置的系统盘大小不能超过节点机器本身的系统盘大小。如需更大系统盘,需要释放当前节点,重新购买并选择更大的系统盘规格。