全部产品
Search
文档中心

人工智能平台 PAI:功能发布记录

更新时间:Nov 14, 2025

2025年

10月

发布时间

功能

说明

相关文档

2025-10-17

灵骏智算GU7系列新增570驱动.

灵骏智算GU7系列新增570驱动;目前PAI训练服务,GU7系列支持 530、550、570等多种驱动,提供无需重装,任务提交时多驱动选择的能力,充分发挥Serverless 平台能力,为客户提供最优的使用体验。

2025-10-17

Dify on PAI-EAS场景化部署发布

Dify 是一个开源的大语言模型应用开发平台,旨在帮助开发者、企业及非技术人员快速构建、部署和管理基于生成式 AI 的应用。支持客户在EAS上一键部署开源版Dify平台并支持WebUI使用和相关接口调用,快速实现构建、部署和管理基于生成式 AI 的应用。

部署Dify大模型应用平台

2025-10-17

DSW实例全生命周期事件支持消息通知

1. 支持工作空间管理员在工作空间配置-事件通知配置中配置消息通知规则,选择实例状态、镜像保存状态以及钉钉、短信、电话、企微等事件通知目标

2. 当消息通知规则中的状态事件发生时,用户可实时收到消息通知并及时做出处理

2025-10-17

模型蒸馏功能发布

基于PAI自研的EasyDistll算法库,提供产品化的模型蒸馏能力,将教师大模型的能力通过蒸馏迁移至学生小模型,同时支持蒸馏数据在线合成(非推理模型的指令数据合成、推理模型的思维链数据合成),最终使小模型接近或达到大模型在特定任务上的效果,帮助用户提升模型性能、降低部署成本。

09月

发布时间

功能

说明

相关文档

2025-09-19

ArtLab发布设计智能体Design Agent

通过自然语言指令即可轻松完成高质量的图像生成、视频制作及精细化图片编辑,极大降低创意实现门槛。

释放自然语言的创造力,重新定义AIGC设计工作流。

2025-09-19

EAS算力检测与容错功能发布

EAS算力检测与容错功能对参与推理的资源进行全面检测,自动隔离故障节点,并触发后台自动化运维流程,有效减少服务推理初期遇到问题的可能性,提升推理部署成功率。

算力检测与容错

2025-09-17

数据开发支持 PAI Flow 节点直接运行

PAI Flow 提供端到端机器学习流程开发能力,可实现与人工智能平台 PAI 的可视化建模 Desiger相同的工作流功能,并能周期性调度工作流。

PAI Flow节点

08月

发布时间

功能

说明

相关文档

2025-08-25

EAS支持EP专家并行部署

EAS实现了DeepSeek-R1等MoE模型的EP部署,支持vLLM和SGLang等推理引擎,赋能客户突破硬件限制,提升资源利用率和系统吞吐量。

基于专家并行和PD分离部署MoE模型

2025-08-15

发布模型评测中心v1.0

开箱即用,无需代码开发即可完成端到端的模型评测链路,快速评估模型能力是否适合客户自身业务场景

2025-08-13

AI资源组(灵骏智算)支持按量购买(后付费+节省计划)

AI资源组(灵骏智算)支持按量购买,结合节省计划,提供购买时间长自动匹配折扣力度产品能力(1年/3年/5年购买时间越长,折扣越大),为用户提供更加灵活、性价比更高的使用方式。

新建资源组并购买灵骏智算资源

2025-08-13

DataJuicer on DLC 正式发布

DLC 支持提交DataJuicer框架任务,通过多算子(100+)、多规模(单节点、多节点)、高可用(自愈),高效完成大规模数据的清洗、过滤、转换和增强,实现大模型场景文本及多模态数据处理计算能力。

快速提交DataJuicer任务

2025-08-11

DLC 自研Custom任务正式发布(v1.0)

DLC 自研分布式框架 Custom,该框架任务支持PAI 调度策略,自愈能力,同时提供自定义角色、成功策略、扩展端口等高阶能力,满足大模型后训练,自动驾驶等多种业务场景的计算能力。

2025-08-08

模型权重服务功能发布

模型权重服务功能,大幅降低冷启动与扩容时长,解决模型加载耗时过长的业界难题,破解LLM超大规模部署效能瓶颈。

模型权重服务

2025-08-07

EAS发布Prefill-Decode分离功能

EAS发布PD分离功能,包含静态PD分离、动态PD分离等多种部署模式,支持vLLM/SGLang/BladeLLM等多种推理引擎,帮助客户降低推理延迟。

07月

发布时间

功能

说明

相关文档

2025-07-10

DSW支持分布式开发调试环境

帮助用户调试验证分布式任务,打造更高效的开发训练流程。

  1. 内置适配不同资源及网络架构的通讯库配置等环境变量

  2. 通过DNS域名产品化实例互访方式,用户可直接通过实例ID实现实例间互访

  3. 支持RDMA/eRDMA

实例互联进行分布式训练

06月

发布时间

功能

说明

相关文档

2025-06-10

ArtLab支持基于ComfyUI构建并分享AIGC应用

PAI-ArtLab升级企业级AIGC应用能力

1. 支持基于ComfyUI workflow自定义构建、发布AIGC应用

2. 将ArtLab平台AIGC应用分享成开箱即用的PC端、H5移动端的AIGC应用

Model Gallery

2025-06-05

数据开发支持人工智能平台PAI Flow

统一大数据开发与AI统一产品入口,提升PAI Flow与大数据引擎深度联动,实现大数据AI一体化开发。

  1. Data Studio PAI Flow支持更多算子组件;

  2. 支持 PAI Flow 整体运行、发布、运维等操作;

  3. PAI Flow产品使用体验优化,如增强PAI Flow算子组件必要属性的配置联动;

  4. 支持将PAI Flow作为一个节点参与到Workflow中,并支持包含PAI Flow的Workflow整体运行;

05月

发布时间

功能

说明

相关文档

2025-05-30

快速开始>Model Gallery在马来西亚(吉隆坡)地域开服。

Model Gallery在马来西亚(吉隆坡)地域开服。Model Gallery集成了众多AI开源社区中优质的预训练模型,帮助您快速上手并利用PAI进行模型的训练和部署。

Model Gallery

04月

发布时间

功能

说明

相关文档

2025-04-04

镜像管理支持构建自定义镜像

PAI正式推出自定义镜像构建功能,开发者与企业客户可基于已有镜像灵活安装依赖项,或者通过自定义Dockerfile构建自定义镜像,镜像会自动推送至ACR并在PAI平台注册,满足客户的个性化定制需求,告别本地构建与上传的繁琐流程。

2025-04-01

DSW在美国(弗吉尼亚)、美国(硅谷)正式开服

DSW新增美国(弗吉尼亚)、美国(硅谷)地域,用户可以在控制台上按需使用。

03月

发布时间

功能

说明

相关文档

2025-03-28

LangStudio 1.0正式发布

在LangStudio 0.1版本基础上新增支持:

1. 知识库的创建及管理:在控制台支持知识库的创建和同步,并可在应用流构建中使用知识库。

2. 使用PAI-DSW作为应用开发环境:提供基于DSW的Notebook、WebIDE环境进行应用流开发。

3. 对应用流进行效果评测:预置评测模版,支持对应用进行离线运行效果评测和在线服务效果评测。

4. 部署应用支持对话历史:使用云上数据库/本地存储对话历史,并支持对话历史的管理和导出。

2025-03-28

DSW支持NAS数据集/存储路径动态挂载

DSW支持存储动态挂载,用户无需重启实例即可挂载/卸载NAS数据集。

2025-03-28

分布式训练(DLC)支持通过ossfs挂载OSS数据源

分布式训练(DLC)支持通过ossfs方式挂载OSS数据源,为自动驾驶等计算密集型任务(通常按顺序和随机读取、顺序追加写入),提供较好的OSS读写性能。

在DLC训练任务中使用云存储

2025-03-27

AI算力节点状态升级

优化了算力节点状态,新增了禁止调度的状态码,从而提升您的使用体验。

节点

2025-03-19

分布式训练(DLC)提交Ray任务,支持自定义角色

分布式训练(DLC)提交Ray框架任务时,支持您自定义Worker角色,从而实现异构资源的混合运行。

创建训练任务

2025-03-19

资源配额(Quota)支持指定节点扩缩容

资源配额扩缩容支持节点维度的操作,使得Quota间算力管理、更配及转让操作更加灵活。

管理资源配额

2025-03-07

PAI训练服务在美国(硅谷)正式开服

分布式训练(DLC)和AI资源配额(Quota)现已在美国(硅谷)地域开通,您可以使用资源配额(Quota)和公共资源(按量付费)来提交训练任务。

地域和可用区

02月

发布时间

功能

说明

相关文档

2025-02-28

分布式训练(DLC)挂载存储实例(NAS、CPFS等)支持配置读写权限

分布式训练(DLC)在挂载阿里云存储实例(OSS、NAS、 CPFS等)时,支持配置读写权限,支持用户存储实例权限的精细化管理。

在DLC训练任务中使用云存储

2025-02-21

AI调度引擎v2.0,实现多级任务抢占

PAI基于资源配额(Quota)的调度引擎,通过任务类型分级(如训练/推理/开发和优先级)与动态优先级评估算法,触发抢占机制,确保高优先级任务可以快速执行;同时结合AIMaster抢占式回滚技术,被中断任务自动保存中间状态并进入排队队列,资源释放后优先恢复执行,最终实现资源紧张场景下的高效调度。

抢占策略

2025-02-10

PAI-DLC阿里云文件存储(NAS、 CPFS等)挂载时支持配置多链接(nconnect)

PAI分布式训练(DLC)挂载阿里云文件存储(NAS、 CPFS等)时,支持配置多链接(nconnect),支持您对挂载连接数的精细化控制, 优化多节点并发访问性能,确保大规模训练任务稳定性。

在DLC训练任务中使用云存储

2025-02-07

EAS支持多机分布式推理功能

随着Qwen-Max和DeepSeek等超大规模MoE模型的问世,单一设备已难以承载其庞大的参数量。为此,EAS推出多机分布式推理解决方案,突破硬件限制,高效支持超大规模模型的部署与运行。EAS分布式推理支持流水线并行(Pipeline Parallelism)、张量并行(Tensor Parallelism)和数据并行(Data Parallelism)等多种并行方式,兼容BladeLLM、vLLM、SGLang等高性能推理引擎框架。

多机分布式推理

01月

发布时间

功能

说明

相关文档

2025-01-21

DLC支持训练超时告警功能

DLC支持配置训练超时告警,客户可自定义配置训练任务在环境准备、排队、运行阶段的超时告警规则。当规则触发时,会发送告警通知,便于客户监控训练进程异常。

消息通知

2025-01-21

DLC支持训练状态通知

DLC 支持订阅训练状态通知,新增排队、竞价、环境准备、运行等状态事件,方便客户追踪训练进程,完善训练服务的消息通知能力。

消息通知

2025-01-20

DLC提交任务支持直接挂载存储服务

用户在使用DLC 提交训练任务时,支持用户在提交表单直接选择不同的存储实例,目前支持OSS、通用NAS、极速NAS、通用CPFS和智算CPFS 多种阿里云存储实例,降低使用门槛,方便用户使用。

创建训练任务

2025-01-20

Ray on DLC 支持使用闲时资源

DLC支持使用闲时资源提交Ray任务, 方便客户使用一份资源运行多种,实现任务间的资源共享,提升资源利用率。

使用闲时资源

2025-01-20

ArtLab上线行业工具能力

ArtLab上线行业工具能力,一期已上线电商产品写实(家电家具)、企业风格海报生成、创意鞋履等应用。后续会持续不断丰富预置应用。

2025-01-20

ArtLab上线AIGC应用专区

PAI-ArtLab上线AIGC应用专区模块,支持用户使用封装了ComfyUI工作流的在线应用,进行文生图、图生图等操作,降低用户对AIGC生产工具的使用门槛,并支持通过serverless服务的模式降低用户的使用成本。

1. 开箱即用:无需环境配置,一键启动应用

2. 平台内置企业级AIGC应用,例如生成企业风格海报、生成企业活动头像等

3. Serverless应用模式:仅GPU推理时计费,大幅降低用户成本

2025-01-20

Model Gallery支持模型推理加速

PAI-Model Gallery中的预训练模型可根据机型选择情况,匹配出可支持的推理加速能力(vllm、BladeLLM)。

2025-01-16

EAS全新升级BladeLLM高性能部署服务

PAI-EAS支持BladeLLM场景化部署,实现LLM推理更快的响应时间和更高的吞吐量。

BladeLLM是PAI自研的推理引擎,提供高效运行时、高性能算子实现和混合量化。PAI-EAS全面结合BladeLLM,推出LLM高性能推理服务,支持部署预置模型和自定义模型,支持一键开启模型并行、投机采样等高级选项,为您提供高效的LLM部署方案。

BladeLLM快速入门

2025-01-02

Model Gallery在中国香港等多地正式开服

PAI-Model Gallery集成了LLM、CV、NLP、语音等领域的预训练模型,提供一站式零代码的模型训练、模型压缩、模型评测、模型部署功能。 新增开通中国香港、日本(东京)、印度尼西亚(雅加达)、德国(法兰克福)、美国(弗吉尼亚)地域。

2024年

12月

发布时间

功能

说明

相关文档

2024-12-23

DLC按量任务账单支持区分任务类型

DLC 训练任务支持标记后付费和竞价任务的系统标签 (key:acs:pai:payType),客户账单系统中快速甄别和筛选按量任务类型,消耗和优惠一目了然。

查看账单明细

2024-12-16

Designer支持大模型数据预处理链路聚合执行

Designer支持将多个串行的大模型数据预处理(on DLC)节点合并执行,避免多次数据落盘和分布式任务启停的时间消耗,提升执行效率,并支持自动智能聚合。

大模型数据处理组件聚合成组

2024-12-16

DLC支持运行通用计算资源的竞价任务

PAI训练服务DLC 支持基于通用计算资源的竞价任务,为客户提供更具性价比的AI算力。

2024-12-10

PAI训练服务德国(法兰克福)正式开服

分布式训练服务DLC、AI资源配额(Quota)开通德国(法兰克福)地域,可以支持客户使用资源配额(Quota)提交训练任务

2024-12-09

DLC任务状态升级v2.0

基于资源配额(Quota),DLC任务状态的排队中“Queuing” 和预分配“PreAllocation”合并,统一为排队中“Queuing”,提供更加清晰和简单的任务状态信息,方便使用和理解。

2024-12-06

DLC算力健康检测支持自定义检测项

DLC算力健康检测(SanityCheck)支持计算性能检测、节点通信检测、计算通信交叉检测、模拟验证等15+检测项,进一步提升算力、网络等故障排查和定位能力。此外,检测项对用户开放,基于业务实现自主选择,实现检查可管可控。

SanityCheck:算力健康检测

11月

发布时间

功能

说明

相关文档

2024-11-20

DSW支持OSS数据集动态挂载

1. 提供OSS数据集动态挂载/动态卸载的产品能力,无需重启实例就可以快速使用数据。

2. 提供简单易用的SDK,允许用户通过简单的配置或一行代码实现数据集挂载/卸载。

3. 支持动态挂载AI资产-数据集(PAI公共数据集/自定义数据集)或直接挂载OSS存储路径。

挂载数据集/OSS/NAS/CPFS

2024-11-20

DSW实例支持自定义服务访问配置能力

随着AIGC的快速发展,各类WebUI框架和应用开发框架已成为开发者的主流选择。PAI-DSW作为一站式AI开发平台,提供了自定义服务访问配置功能,开发者可在应用开发过程中,随时通过安全的方式将服务分享给协作开发者进行测试和验证。

通过公网访问实例中的服务

10月

发布时间

功能

说明

相关文档

2024-10-17

AI资源组(通用计算)国际Region支持L20

PAI AI资源组(通用计算)国际Region支持L20(gn8is系列)

2024-10-12

DLC 任务状态升级v1.0

DLC任务基于资源配额(Quota)、竞价资源、公共的算力, 包年包月、竞价、按量的商业模式,任务级别、实例级别的层级,整体新增环境准备“EnvPreparing”,竞价任务新增竞价“Bidding”,简化已创建“Created”, 按量简化排队中“Queuing” 和预分配“PreAllocation” 等状态, 提供更加清晰和简单的任务状态信息,方便使用和理解。

2024-10-11

ArtLab ComfyUI Serverless工具

PAI-ArtLab工具箱中上线ComfyUI serverless工具,支持用户通过ComfyUI进行文生图、图生图等操作,并通过serverless模式降低用户使用成本,仅模型推理时计费。

AIGC设计(ArtLab)

2024-10-10

QuickStart支持LLM的DPO、CPT训练能力

PAI QuickStart-Model Gallery提供LLM训练能力,本次更新在原有SFT监督微调基础上,新增DPO直接偏好优化、CPT继续预训练的训练方式,提供更加完整的LLM模型训练能力

快速开始(QuickStart)

09月

发布时间

功能

说明

相关文档

2024-09-29

DSW内置通义灵码

DSW内置智能编码助手通义灵码(个人版),提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码优化、注释生成、代码解释、研发智能问答、异常报错排查等能力,用户可免安装免登录直接使用,助力开发者高效、流畅地编码。

使用通义灵码进行智能编码

2024-10-08

PAI 训练服务在中国(香港)、印尼(雅加达)正式开服

分布式训练服务DLC、AI资源配额(Quota)新增开通中国(香港)、印度尼西亚(雅加达)地域,可以支持客户使用资源配额(Quota)和公共资源(按量付费)的提交训练任务。

08月

发布时间

功能

说明

相关文档

2024-11-11

裁判员模型服务正式发布

PAI-裁判员模型服务,使用基于Qwen2微调的大模型作为裁判员,对被评估模型的生成结果进行打分,适用于开放性、复杂问答场景。其主要优势概述如下:

1. 准确:裁判员模型擅长进行主观问题的评测,能够对问题进行智能场景分类,如开放性问题(闲聊/咨询/推荐等)、创意写作、代码生成、角色扮演等场景,针对不同场景会制定不同的评测标准,极大提高了评测的准确率。

2. 高效:裁判员模型无需人工标记数据,只需输入问题和模型回答,即可自主完成对大语言模型的分析与评价,大幅提高了评测的效率。

3. 易用:提供了控制台创建评测任务、API调用、SDK调用等多种使用方式,既满足了用户快速上手体验,也便于开发灵活接入。

4. 低成本:仅需较便宜的价格,即可在中文评价场景中,提供与ChatGPT-4效果相媲美的评估性能。

裁判员模型概述

2024-09-03

DSW轻量版(NotebookLab)发布

1.Notebook编写环节轻量化,仅需浏览器即可开发,无需预先启动资源。

2.Notebook资产化,用户Notebook和实例资源解耦,更方便的作为技术文档/代码进行沉淀和分享。

Notebook Lab

2024-08-26

EAS推出LLM智能路由,提升LLM推理服务效率

客户在部署LLM类型的EAS服务时,支持关联LLM智能路由,能够对请求进行智能分发,从而保证后端实例处理的算力和显存尽可能均匀,提升集群资源使用水位。

LLM智能路由部署

2024-08-26

DLC通用计算资源,训练任务支持CPU亲和性

PAI DLC通用计算资源组, 针对工作负载的性能明显地和CPU缓存亲和性以及调度的影响任务,支持CPU绑核能力。提升任务性能。

2024-08-15

EAS专属网关功能发布

EAS专属网关功能发布,实现安全隔离与访问控制方面的推理需求,同时降低高并发和高吞吐业务场景带来的网络风险。公网和内网均可设置访问白名单,实现精细化管理。独享的网关资源,保证服务访问连接的稳定性。内网可通过PrivateLink绑定打通企业的VPC环境。客户可自主选择公网的开通与关闭,实现网络自主可控。

通过专属网关调用

2024-08-15

工作空间支持用户自定义角色

工作空间是PAI的顶层概念,为企业和团队提供统一的计算资源管理及人员权限管理能力,为AI开发者提供支持团队协作的全流程开发工具以及AI资产管理能力。随着使用场景的深入,PAI提供基础角色无法完全满足一些高级客户自定义管理需求的场景,例如期望某个角色仅可以使用DSW,不可以使用DLC等特殊管理场景。基于此类场景需求,PAI工作空间提供了自定义角色能力,支持有自定义需求的用户自行配置。

管理工作空间成员

2024-08-05

PAI-PyTorch低版本算法包(包含PyTorch100 / PyTorch131)下线公告

尊敬的PAI用户:

因整体系统升级,人工智能平台PAl将于2024年08月30日正式下线所有集群中的低版本PyTorch算法组件,若您有通过PAI命令pai -name pytorch100/pytorch131提交至MaxCompute的PyTorch作业,请注意及时迁移。建议您使用PAI-DLC提交PyTorch任务,详情请参见创建训练任务。自2024年08月31日起,老版本PyTorch算法组件的存量任务将不受SLA保障。

您有任何相关问题或需要协助,可以通过您的专属钉群或提交工单联系我们。

感谢您的配合!

07月

发布时间

功能

说明

相关文档

2024-07-03

EAS GPU共享功能上线

EAS模型部署的过程中,支持客户根据GPU算力占比与显存大小进行切分使用,降低客户资源成本,提升资源利用率。在部署页面支持实例按显存进行调度和按算力进行调度,实现单卡共享多实例功能。

EAS概述

2024-07-03

EAS服务实例健康检查功能发布

EAS服务实例健康检查帮助维护服务的高可用性,进行快速故障检测和自动恢复,实现企业级的推理服务部署。通过Kubernetes的健康检查机制,可以自动检测并恢复失败的容器,确保只有健康的实例接收流量并避免向不健康的实例分配资源。

EAS概述

06月

发布时间

功能

说明

相关文档

2024-07-01

QuickStart支持模型评测,评估LLM的综合性能

PAI-QuickStart提供LLM评测功能,可基于权威公开数据集(CMMLU/C-Eval/MMLU等),或自定义数据集,进行模型综合能力的评估,判断模型能力是否适合自身业务场景,并提供多模型性能对比能力。

模型评测

2024-06-19

PAI通用计算资源支持使用智算CPFS(邀测)

针对大模型客户数据场景,提供数据存储和计算成本最优方案, PAI联合存储团队, 最终实现PAI训练服务支持 on 通用计算(ECI)支持挂载(Mount) 智算CPFS

2024-06-12

Designer在华北6(乌兰察布)正式开服

PAI-Designer在华北6(乌兰察布)正式开服,可以在PAI控制台上按需求使用。

2024-06-11

Designer新增Notebook组件

Designer中提供了Notebook组件,可与DSW实例实现无缝连接,支持用户在工作流中直接使用Notebook编写、调试和运行代码,同时保留工作流的上下文和状态。

Notebook

05月

发布时间

功能

说明

相关文档

2024-07-01

快速开始中LLM支持QLoRA/LoRA/全参微调方式

对于PAI-QuickStart中的LLM模型,提供用户全参微调以及更低成本的LoRA和QLoRA微调方式,用户可根据需求自行选择,可有效降低用户的训练成本。

快速开始:Qwen2.5系列模型的微调、评测与部署

2024-06-07

DSW支持配置实例RAM角色

为实例授权PAI默认角色后,在DSW的以下开发场景中用户可以免配置AK,通过更安全的鉴权链快速开发和调试:

  • 通过PAI SDK创建训练任务提交至当前工作空间。

  • 通过DLC SDK创建训练任务提交至当前工作空间。

  • 通过ODPS SDK提交任务到实例所有者有执行权限的MaxCompute项目中。

  • 通过OSS SDK访问当前工作空间配置的默认存储路径Bucket中的数据。

  • 在WebIDE中使用通义灵码服务。

在用户自定义注入角色的情况下,DSW实例使用该角色的临时访问凭证来访问指定的阿里云服务,例如OSS、RDS等,实现DSW实例与其他阿里云服务之间的安全通信。

配置DSW实例RAM角色

04月

发布时间

功能

说明

相关文档

2024-04-29

EAS-Serverless AI绘画场景发布

EAS针对模型服务调用量分散且使用灵活的场景,提供的serverless的模型部署方式。EAS Serverless AI绘画场景化部署过程中,选择serverless部署后免费拉起服务,当真正产生GPU运算的过程才进行计费,AI绘画开始出图时,根据实际出图时长进行计费。

5分钟使用EAS一键部署Stable Diffusion实现文生图能力

03月

发布时间

功能

说明

相关文档

2024-03-25

DSW支持用户进行AI+大数据开发

DSW支持用户在DSW中通过python等代码方式提交数据分析及预处理任务到MaxCompute/EMR,处理完的数据继续在本机GPU或DLC中进行模型训练。

连接EMR处理大数据

2024-03-25

DSW发布文件中转站功能

DSW提供了文件中转站功能,当用户需要将本地电脑中保存的大模型等大文件上传到DSW实例时,文件中转站可对上传流程进行加速。在此基础上,用户的大文件仅需上传一次,可以在单个用户(RAM账号级别)的多个DSW实例中保存使用。

文件中转站

2024-03-15

PAI 灵骏智算服务国际站(新加坡区域)正式开服

PAI 灵骏智算服务是阿里云自主研发的新一代智能计算产品,提供深度优化的异构计算融合集群实例;经海量AI应用实践打磨,具备高性能、高效率、高资源利用率等核心优势。满足自动驾驶、基础科研、新药研发、金融、元宇宙等行业应用需求,以普惠的智能算力,加速科技创新和产业升级。 现已新增开通国际站新加坡地域,可以在控制台上按需求开通。

2024-06-06

Designer中GPU服务器及对应算法组件下线

因当前提供服务的V100、P100服务器集群即将过保,PAI将在2024年3月1日正式下线Designer中的TensorFlow(GPU)、MXNet、PyTorch算法组件。您后续可继续使用云原生版本的相关算法组件,训练任务将提交至PAI-DLC执行,推荐直接使用Designer上的Python组件来提交DLC任务,可完全覆盖以上列举功能,并提供了更多版本的训练框架。 预计2024年6月1日起,指定算法组件的存量任务将不受SLA保障,预计2024年6月30日全量集群下线。

Python脚本

02月

发布时间

功能

说明

相关文档

2024-02-28

Designer支持LLM数据预处理算子及常用模板

高质量的数据预处理是LLM成功应用的关键步骤,PAI-Designer提供去重、标准化、敏感信息打码等等常用的高性能数据预处理算子,并基于MaxCompute提供大规模分布式数据计算能力,可大幅提升客户在LLM场景下的数据预处理效率,进一步提升LLM模型的可靠性和效果。

组件参考:大模型数据处理

2024-02-04

EAS-Serverless模型服务灰度邀测

EAS针对模型服务调用量分散且使用灵活的场景,提供的serverless的模型部署方式。EAS Serverless在场景化使用场景中,选择serverless部署后免费拉起服务,当真正产生GPU运算的过程才进行计费,比如AI绘画开始出图时,根据实际出图时长进行计费。

EAS概述

01月

发布时间

功能

说明

相关文档

2024-02-04

QuickStart在国际站发布

快速开始(QuickStart)开通对新加坡地域的支持,您在该地域可以开始使用QuickStart产品。

2024-02-04

EAS极简部署功能发布

针对通用的部署场景提供真正简化版的部署方式,包括ModelScope模型部署、HuggingFace模型部署、Triton部署、TFserving部署、LLM、SDWebUI。在这些场景里,只需要提供模型的存储目录即可,即可一键拉起服务和应用。

2024-02-01

EAS一键部署AI视频生成应用

通过EAS一键部署基于ComfyUI和Stable Video Diffusion模型的AI视频生成Web应用,快速实现文本生成视频以及图像生成视频的AI生成解决方案,帮助短视频直播平台、游戏互娱、动画制作等类型的客户快速实践AIGC。

5分钟使用EAS一键部署AI视频生成应用

2023年

12月

发布时间

功能

说明

相关文档

2023-12-13

Designer在印度尼西亚(雅加达)正式开服

Designer新增开通印度尼西亚(雅加达)地域,可以在PAI控制台上按需使用。

2023-12-06

DSW实例支持SSH直连访问

支持用户在自己VPC内部机器/本地代码开发环境中更方便访问DSW实例进行开发及训练

远程连接:SSH直连方式

11月

发布时间

功能

说明

相关文档

2023-11-20

PAI发布自动机器学习(AutoML)平台

PAI提供自动机器学习(AutoML)平台,AutoML是PAI产品的机器学习增强型服务,集成了多种PAI平台支持的算法和分布式计算资源,支持多种方式访问。在模型超参调优领域,它可以帮助您自动寻找最优化超参值,大幅提高模型调优效率。

AutoML工作原理

10月

发布时间

功能

说明

相关文档

2023-10-27

AI训练(预付费)在国际站(北京等5个地域)正式开服

PAI-AI训练(预付费)国际站新增开通华北2(北京)、华东2(上海)、华东1(杭州)、华南1(深圳)、新加坡地域,可以在控制台上包年包月进行购买。

09月

发布时间

功能

说明

相关文档

2023-09-28

EAS一键部署通义千问大模型服务

通过PAI-EAS一键部署基于开源模型通义千问的WebUI应用,以及使用WebUI和API进行模型推理。 通义千问-7B(Qwen-7B)是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。同时,在Qwen-7B的基础上,我们使用对齐机制开发了基于大语言模型的AI助手Qwen-7B-Chat。

5分钟使用EAS一键部署LLM大语言模型应用

2023-09-18

分布式训练产品DLC支持监控指标订阅和告警

PAI-DLC支持查看和监控任务资源状况,并提供了全面详细的监控指标,帮助用户更好地掌握资源负载情况。通过监控告警功能,用户可以监控PAI-DLC分布式训练任务资源,并灵活地配置告警规则。

训练监控与报警

2023-09-18

EasyCKPT高性能CKPT发布

PAI-EasyCKPT是为PyTorch大模型训练场景而开发的高性能Checkpoint框架,通过异步化层次化保存、重叠模型拷贝和计算、网络感知异步存储的策略, 实现近0开销的模型保存机制和大模型训练全过程精度无损的模型保存与恢复的能力。 支持主流大模型训练框架Megatron和DeepSpeed,用户只需要少量代码改动即可使用。

EasyCkpt:AI大模型高性能状态保存恢复

08月

发布时间

功能

说明

相关文档

2023-09-04

支持Stable Diffusion微调部署

  • Stable Diffusion模型一键部署。

  • Stable Diffusion模型微调训练方案。

  • 快速启动/部署Stable Diffusion WebUI。

  • Kohya Stable Diffusion模型微调应用。

AIGC

07月

06月

05月

发布时间

功能

说明

相关文档

2023-05-20

新增支持PAI Python SDK功能

PAI Python SDK是PAI推出的Python SDK,旨在为机器学习工程师提供更易用的HighLevel API,使其能够轻松地在PAI上完成模型训练和部署,并且无缝地连接机器学习的整个流程。

PAI Python SDK

04月

发布时间

功能

说明

相关文档

2023-04-19

EAS新增支持弹性资源池功能

EAS提供了服务资源自动伸缩的功能,即在专属资源组中部署的服务,在扩容时如果遇到机器资源不足,新扩出来的实例会自动启动在按量付费的公共资源上,并以公共资源组的方式来计费;在缩容时会优先缩减公共资源组中的服务实例。

弹性资源池

2023-04-04

EAS全新快捷服务部署控制台上线

EAS服务部署支持三种部署方式,包括镜像部署服务、镜像部署AI-Web应用、模型Processor部署服务。您可以通过简单的一键部署操作,快速地将AI服务或应用部署到EAS,降低了部署的门槛和难度。

EAS概述

03月

发布时间

功能

说明

相关文档

2023-03-23

模型管理功能升级

Designer能够将训练获得的模型快速注册至模型管理;PAI模型管理增加模型版本准入机制,模型准入状态变更可以触发模型下游事件,包括自动发送钉钉群机器人消息、自动调用指定的HTTP或HTTPS服务。

模型版本准入状态及事件触发

02月

发布时间

功能

说明

相关文档

2023-02-13

EAS支持抢占式资源实例

当您使用公共资源组部署EAS服务时,支持选用抢占式资源实例,来降低运行成本。

EAS抢占型实例Spot Instance

2023-02-06

EAS支持多规格实例选择

EAS部署环节支持多规格实例选择,通过遍历配置文件中提供的规格列表来拉起资源,从而极大地降低单一规格库存不足带来的部署风险。

多规格实例选择

01月

发布时间

功能

说明

相关文档

2023-01-13

Designer支持将全链路Pipeline一键部署为在线服务

Designer支持将一个包含数据预处理、特征工程、模型预测的离线数据处理Pipeline打包成一个Pipeline模型,并一键部署为EAS在线服务。

Pipeline部署在线服务

2022年

12月

功能名称

功能描述

发布时间

发布地域

相关文档

EAS新增支持倚天710系列计算资源

EAS新增支持倚天710系列计算资源,这些资源具有更高的性价比,可以帮助您降低模型部署和推理的成本,提高效率。

2022-12-8

全部地域

EAS概述

Designer新增多种算法组件

Designer新增多种算法组件,包括Prophet时序算法、Mtable展开、MTable聚合、时间窗口SQL等组件。您可以在Designer平台的左侧组件树中查找并使用这些组件。

2022-12-5

全部地域

Designer组件概览

Designer新增自定义模板功能

Designer支持将一个运行成功状态的工作流创建为自定义模板。您可以在Designer中直接使用该模板,快速构建出类似的工作流,从而提高工作效率。

2022-12-1

全部地域

创建工作流:自定义模板

11月

功能名称

功能描述

发布时间

发布地域

相关文档

EAS新增机器节点自运维功能

PAI支持通过资源组对机器实例进行管理和运维,包括查看机器的基本信息、停止和重启机器的调度、清空节点的服务实例等操作。

2022-11-30

全部地域

EAS概述

DSW实例更新

DSW实例生命周期透出,支持查看DSW实例的状态变化。

支持查看DSW实例详情及变更配置。

2022-11-18

全部地域

创建DSW实例

09月

功能名称

功能描述

发布时间

发布地域

相关文档

EAS新增服务分组与异步推理功能

在创建EAS服务时,您可以指定所属的服务分组。服务分组拥有统一的流量入口,并能按照流量分配策略将入口流量分配给每个服务。您还可以指定每个服务在服务分组中的流量比例,以实现资源的有效利用。

PAI提供了队列服务和异步推理功能,可以通过请求分发、订阅推送或定期查询结果来实现推理。

2022-09-30

全部地域

08月

功能名称

功能描述

发布时间

发布地域

相关文档

Designer新增多种算法组件

Designer新增多种算法组件,包括XGBoost、DBSCAN、高斯聚类、岭回归以及Lasso回归的训练及预测组件。您可以在Designer平台的左侧组件树中查找并使用相应的组件。

2022-08-02

全部地域

07月

功能名称

功能描述

发布时间

发布地域

相关文档

新增自定义Python脚本组件

Designer新增自定义Python脚本组件,您可以使用该组件实现自定义算法开发,并与PAI预置算法串联使用,更灵活地扩展算法使用场景。

2022-07-15

Python脚本

Designer在美国(弗吉尼亚)正式开服

Designer在美国(弗吉尼亚)正式开服。您可以在PAI控制台上选择对应地域并创建工作空间,即可使用Designer相关功能。

2022-07-05

美国(弗吉尼亚)

新增EAS-benchmark服务自动压测功能

EAS新增EAS-benchmark服务自动压测功能,您可以使用EAS-benchmark分布式通用压测工具,创建压测任务,对EAS部署的预测服务进行一键压测。

2022-07-04

06月

功能名称

功能描述

发布时间

发布地域

相关文档

新增多种可视化分析能力

Designer的视觉类深度学习组件提供了基于Tensorboard的可视化分析能力,并且基于可视化大屏提供特征重要性评估、相关性分析以及散点图的可视化能力。

2022-06-22

使用TensorBoard查看分析报告

Designer在中国(香港)正式开服

Designer在中国(香港)正式开服,提供上百种PAI自研机器学习算法和几十个行业模板,您可以在PAI控制台上按需使用。

2022-06-20

中国(香港)

05月

功能名称

功能描述

发布时间

发布地域

相关文档

Designer在新加坡、美国(硅谷)正式开服

Designer在新加坡和美国(硅谷)正式开服,提供上百种PAI自研机器学习算法和几十个行业模板,您可以在PAI控制台上按需使用。

2022-05-10

  • 新加坡

  • 美国(硅谷)

04月

功能名称

功能描述

发布时间

发布地域

相关文档

新增Flink全托管资源

您可以购买Flink全托管资源,并关联到工作空间,在Designer中通过可视化拖拉拽的方式或PyAlink脚本的方式构建AI工作流,实现大规模分布式模型训练。

2022-04-30

德国(法兰克福)

Flink全托管资源管理

Designer新增异常检测类、推荐类、数据源类、自定义算法类组件

Designer新增PyAlink脚本、读CSV文件、IForest异常检测、局部异常因子异常检测、One-Class SVM异常检测、swing推荐等组件。其中PyAlink脚本组件支持调用上百种Alink框架下的算法。

2022-04-16

德国(法兰克福)

03月

功能名称

功能描述

发布时间

发布地域

相关文档

Designer在德国(法兰克福)正式开服

Designer在德国(法兰克福)正式开服,提供上百种PAI自研机器学习算法和几十个行业模板,您可以在PAI控制台上按需使用。

2022-03-30

德国(法兰克福)

PAI-Blade新增支持TensorFlow2.7版本

PAI-Blade新增支持TensorFlow2.7版本,您可以自主选择TensorFlow版本。

2022-03-27

全部地域

DSW在新加坡等5个地域正式开服

您可以在开服地域,创建DSW实例,并使用DSW相关功能来构建和训练模型。

2022-03-21

  • 新加坡

  • 马来西亚(吉隆坡)

  • 印度尼西亚(雅加达)

  • 德国(法兰克福)

EAS新增定时伸缩功能,支持GRPC或WebSocket协议的镜像部署发布

EAS新增了定时伸缩功能,您可以定时对部署的服务进行实例的扩缩容,同时EAS支持通过开源TFServing或Triton的方式来部署服务。

2022-03-21

定时自动扩缩容功能