全部产品
Search
文档中心

GPU云服务器:产品优势

更新时间:Jan 23, 2025

阿里云GPU云服务器具有广阔的覆盖范围、超强的计算能力、出色的网络性能和灵活的购买方式,神行工具包(DeepGPU)是专门为GPU云服务器搭配的具有GPU计算服务增强能力的免费工具集。本文主要介绍GPU云服务器和神行工具包(DeepGPU)的优势。

GPU产品优势

  • 覆盖范围广阔

    阿里云GPU云服务器在全球多个地域实现规模部署,覆盖范围广,结合弹性供应、弹性伸缩等交付方式,能够很好地满足您业务的突发需求。

  • 计算能力超强

    阿里云GPU云服务器配备业界超强算力的GPU计算卡,结合高性能CPU平台,单实例可提供高达1000 TFLOPS的混合精度计算性能。

  • 网络性能出色

    阿里云GPU云服务器实例的VPC网络最大支持450万的PPS及32 Gbit/s的内网带宽。在此基础上,超级计算集群产品中,节点间额外提供高达50 Gbit/s的RDMA网络,满足节点间数据传输的低延时高带宽要求。

  • 购买方式灵活

    支持灵活的资源付费模式,包括包年包月、按量付费、抢占式实例、预留实例券、存储容量单位包。您可以按需要购买,避免资源浪费。

神行工具包(DeepGPU)优势

神行工具包中的组件主要包括集群极速部署工具FastGPU以及GPU容器共享技术cGPU,其各自具有以下核心优势。

集群极速部署工具FastGPU

使用FastGPU构建人工智能计算任务时,您无需关心IaaS层的计算、存储、网络等资源部署操作,简单适配即可一键部署,帮助您节省时间成本以及经济成本。

  • 节省时间

    • 一键部署集群。无需分别进行IaaS层计算、存储、网络等资源的部署操作,将部署集群的时间缩短到5分钟。

    • 通过接口和命令行管理任务和资源,方便快捷。

  • 节省成本

    • 当数据集完成准备工作并触发训练或推理任务后,才会触发GPU实例资源的购买。当训练或推理任务结束后,将自动释放GPU实例资源。实现了资源生命周期与任务同步,帮助您节省成本。

    • 支持创建抢占式实例。

  • 易用性好

    • 所有资源均为IaaS层,可访问、可调试。

    • 满足可视化和log管理需求,保证任务可回溯。

GPU容器共享技术cGPU

GPU容器共享技术cGPU拥有节约成本和灵活分配资源的优势,从而实现您业务的安全隔离。

  • 节约成本

    随着显卡技术的不断发展和半导体制造工艺的进步,单张GPU卡的算力越来越强,同时价格也越来越高。但在很多的业务场景下,一个AI应用并不需要一整张的GPU卡。cGPU的出现让多个容器共享一张GPU卡,从而实现业务的安全隔离,提升GPU利用率,节约用户成本。

  • 可灵活分配资源

    cGPU实现了物理GPU的资源任意划分,您可以按照不同比例灵活配置。

    • 支持按照显存和算力两个维度划分,您可以根据需要灵活分配。灵活资源分配

    • cGPU拥有灵活可配置的算力分配策略,支持三种调度策略的实时切换,满足了AI负载的峰谷能力的要求。可配置的算力分配策略