PAI灵骏智算服务

全面的AI计算平台,满足大型语言模型(LLM)训练等高性能计算的算力需求

PAI 灵骏智算服务目前仅部署在中国的乌兰察布和新加坡。请联系销售为您提供购买咨询服务。

为什么选择灵骏

PAI灵骏智算服务是面向大规模深度学习及融合智算的PaaS产品,支持公共云Serverless版和独享版形态,基于软硬件一体优化技术,构建高性能异构算力底座,提供AI工程化全流程能力,具备高性能、高效率、高利用率等核心优势,满足高性能计算等领域需求,可在大模型训练、自动驾驶、科研、金融等领域广泛应用。

  • 无服务器Serverless

    公共云 Serverless 形态助您一键快速拉起AI计算任务,借助自动运维轻松管理复杂的异构系统,并与阿里云上的计算、存储、网络等各类产品无缝衔接。

  • 高性能RDMA网络

    阿里云在大型数据中心构建了高性能的RDMA网络,凭借800Gbps的高速低延迟传输以及GPU直连技术,提高传输的稳定性和安全,大幅提升AI训练速度。

  • 高效可靠的CPFS存储系统

    阿里云的CPFS存储系统采用全并行存储架构,支持 POSIX/MPI-IO 和 NFS 协议,单集群支持高达2TB/s的数据吞吐量和3000万的IOPS,为AI训练提供高效可靠的存储服务。

  • 全面的高性能加速

    自研分布式训练加速引擎通过数据集加速、计算加速、优化算法、调度算法和资源优化技术等多种手段,充分释放算力,全面提升AI训练和推理的速度和效率。

产品组合

PAl灵骏智算服务Serverless版(多租版)

灵骏智算服务Serverless版提供灵活高性价比的选择。您可按需购买相关网络和存储产品,并根据业务要求一键完成扩缩容。 购买计算节点后,无需规划CPU管控节点,实现零成本运维。

  • 核心产品:

  • PAI灵骏智算GPU

  • CPFS存储系统

PAl灵骏智算服务独享版(单租版)

灵骏智算独享版(单租版)为您建立云上专属集群,让您的业务独享专属的AI平台和运维服务,同时利用阿里云上标准且互通的计算、存储、网络等服务,为您提供便捷的运营管理。

  • 核心产品:

  • PAI灵骏智算GPU

  • 灵骏智算连接

  • CPFS存储系统

  • ACK容器服务灵骏版

  • ECS云服务器

  • 云数据库RDS

产品功能

新一代AI智算平台,满足大规模AI算力需求

企业级AI开发平台

提供AI开发、训练等AI工程化全流程产品能力,支持多种AI角色管理,算力资源管理运维的企业级AI平台。

一站式AI计算服务

算力集群、高性能存储、容器服务、AI 开发平台的一键式开通和全生命周期管理。支持 Serverless 形态,可快速拉起 AI 计算任务,运维全面自动化。

易用的分布式计算

大模型训练只需简单配置即可自动分布式并发执行,优化的计算、网络、通信和存储架构可提高资源利用率,加快模型训练速度,让训练时间和成本大幅缩减。

集群管理

通过控制台页面或 OpenAPI 即可快速的创建集群,利用丰富的监控指标展示、事件类型以及运行统计,以可视化的方式快速查看运行情况,定位主机和服务异常,并提供从主机、网络到作业任务的关联诊断分析工具。方便性能调优和问题溯源。

RDMA网络

提供高性能的 RDMA 计算网络、RDMA 存储网络和管控网络,采用高性能和高可用的方式来访问其它阿里云服务,具有强安全隔离、分钟级部署、无级变速、原生高可靠等特点。

高性能存储

并行IO访问架构,单集群最高可达2TB/s吞吐和3000万IOPS,支持与云上和线下存储数据互通。

应用场景

场景简介

支持Serverless的AI研发场景,支持如Stable Diffusion、Llama 2、OPT等大模型的训练,提供深度优化的智能计算服务,可为图形图像处理(如AIGC图像生成)、自然语言处理(如AIGC文本生成)、语音、视频等应用场景提供高效、高性能的训练服务。

全局优化,更高效率

  • 超高吞吐和IOPS

    针对AI训练场景,数据预先加载至持久化存储,保障训练时数据加载和写入的高带宽需求,提升训练效率

  • 高资源利用率

    对GPU资源进行细粒度切分调度,满足协同开发,技术经阿里巴巴双十一全球购物节大规模应用验证,资源利用率可提升3倍

场景简介

超大规模融合算力,支持深度学习和高性能计算作业统一部署调度,为基础科研、新药研发、工程仿真等场景构建统一标准计算服务,促进范式创新、效率提升,促进AI与HPC开发生态融合。

面向创新的融合式开发

  • 促进科研新范式

    支持云原生和容器化的AI和HPC应用生态,为基础科研、新药研发、新材料研发等场景提供统一计算服务,支持跨地区、跨团队协同,提升资源使用率,同时促进技术生态融合,催化协同效应

  • 打造科研大平台

    基于RDMA技术和阿里云高性能通信库,构建低时延高带宽网络环境,针对AI+HPC应用进行通信优化,点对点时延可低至2us,最大可支持数万节点并行计算,为大规模科学计算提供极具效率优势的智能计算服务

了解由灵骏加速的阿里云生成式AI解决方案

开通灵骏

1
购买计算节点
联系销售
  • 您可根据业务需要,购买所需机型的计算节点。
  • 1. 登录智能计算灵骏控制台。
  • 2. 在左侧导航栏,选择资源与节点>节点管理
  • 3. 单击购买新节点,进入计算节点购买页面。根据界面提示,选择节点配置,然后单击立即购买,根据界面提示完成付款。
2
购买灵骏智算连接
联系销售
  • 1个集群当前最多支持使用1个灵骏连接实例来对接公共云环境。
  • 1. 登录并进入灵骏连接购买页面。
  • 2. 根据界面提示,选择智算连接规格,然后单击立即购买,根据界面提示完成付款。
3
购买CPFS存储
联系销售
  • 阿里云技术支持人员会在购买完成后为您配置网络连通。
  • 1. 访问CPFS存储购买页面。
  • 2. 根据界面提示,选择CPFS规格信息,然后单击立即购买,根据界面提示完成付款。
  • 说明:CPFS存储需要和灵骏处于相同的地域。后续使用过程中,CPFS计费账单会单独出账。

暖心服务,为你而来

1对1售前咨询、7x24服务、更快速的响应以及更多的免费工单。

1对1售前咨询

由经验丰富的云专家为不同规模企业提供一对一的售前咨询。了解更多

24/7 技术支持

售后服务时间从每周5天,每天10小时延长到每周7天,每天24小时。了解更多

更好的技术支持

基本售后支持计划的免费工单数量从每季度3个提升为6个。了解更多

更快的服务响应时间

针对一般指导,阿里云售后响应时间从36小时缩短到18小时。了解更多
phone 联系我们
AI 助理 由 Qwen 驱动