弹性高性能计算E-HPC

弹性高性能计算(E-HPC)基于阿里云基础设施,为用户提供一站式公有云HPC服务,面向教育科研,企事业单位和个人,提供快捷,弹性,安全和与阿里云产品互通的技术计算云平台。

立即开通 联系销售

弹性高性能计算 E-HPC

阿里云弹性高性能计算E-HPC产品构建在飞天平台基础设施之上,为用户提供一站式的高性能计算服务的云平台,即HPCaaS公有云服务。E-HPC支持高性能CPU、异构计算GPU实例的IaaS服务,高性能计算支撑软件栈的PaaS服务和根据应用模版定制的SaaS服务。主要面向需求大规模计算能力的企事业单位,支持HPC、AI和大规模数据分析等并行应用。


特点

阿里云弹性高性能计算E-HPC与传统超算中心以及自建集群相比,提供了一种快捷,弹性,安全以及互通的公共云高性能计算服务。

快捷

快速创建基于阿里云ECS/EGS/VPC/NAS等资源的计算集群,根据用户选择快速构建运行时环境和丰富的支撑软件栈。

弹性

根据计算负荷,时间和性能要求增减和释放计算节点,存储等资源,节约大量的CAPEX费用,包括但不限于硬件系统费用,永久软件许可证费用,机房水电风费用,运维人工费用等。由于使用的是阿里云弹性计算资源,可以是实现即买即用的任意规模组合和节点自动缩容扩容的功能。

安全

E-HPC是构建在阿里云IaaS产品之上的PaaS平台,所以集成了阿里云产品的组合安全性,如VPC保证的网络安全,ECS保证的计算安全和NAS保证的高可用高可靠存储等。

互通

由于构建在阿里云IaaS资源之上,E-HPC和其它云产品可全面打通,例如通过云盘,共享存储和VPC网络安全交换数据,并可以和其它数据分析,可视化产品互通完成复杂的数值仿真和数据分析闭环。


产品优势

E-HPC 相比传统超算中心

  • E-HPC 按需要使用的规模购买,无需排期,即买即用。

  • E-HPC 机型种类多,可根据应用需求购置最适合的计算资源配比(如 SCC,EGS 实例)。

  • E-HPC 充分复用阿里云产品,大大提高了数据安全性和高可用性。

E-HPC 相比自建物理 HPC 集群

  • E-HPC 可节约巨量 CAPEX 投入,包括但不限于:硬件系统费用;软件许可证费用 (多核,多节点);服务器机房建设,电力和制冷费用;平日运作的维护支持费用。

  • 使用 E-HPC 无需顾虑硬件升级换代。

  • E-HPC打通阿里云全系列产品,可扩展性极强。

E-HPC 相比自建云服务器集群

  • E-HPC 提供方便的软件管理服务,覆盖 HPC 应用全部支撑软件栈功能,并随 HPC 共同体(OEM/OSV/ISV/用户/开发者/开源社区)版本升级。

  • E-HPC 提供优化的软件许可证调度机制,节约成本。

  • E-HPC 提供集群节点自主扩容/缩容服务以及autoscale功能。


推荐配置

E-HPC 推荐实例配置主要包括以下几种,如下表所示。
:表格中展示的是各系列机型最高规格配置的实例。实际以创建集群时可供选择的配置为准。

机型CPU内存GPU网络
超级计算集群 sccgn564核 E5-2682 v4 2.5GHz512 GBNvidia Tesla P100 x 825 Gbps RoCE + DPDK
GPU计算型 gn516核 E5-2682 v4 2.5GHz120GBNvidia Tesla P100 x 825 Gbps
高主频计算型 scch564核 Skylake Xeon Platinum 3.1 GHz192 GBN/A25 Gbps RoCE + DPDK
通用型 g564核 Skylake Xeon Platinum 8163 2.5GHz256 GBN/A20 Gbps
计算网络增强型 sn1ne32核 E5-2682 v4 2.5GHz64 GBN/A10 Gbps + DPDK

定价

E-HPC产品的费用包含 ECS 产品的费用、E-HPC产品的费用、共享存储NAS费用以及登录节点的外网流量费用。

注意:若您的集群规模较大,可以通过提交工单的方式与我们联系以获得优惠。

ECS 产品费用

在开通 E-HPC 集群时,E-HPC集群内每个节点都是一个ECS实例,价格随选择的ECS实例硬件配置变化。创建E-HPC集群时会自动完成购买阿里云ECS的动作,所以您无需提前准备 ECS。如果您有 ECS 的优惠折扣,在这里购买时同样享有。

ECS定价

E-HPC 产品费用

E-HPC会提供集群的多维度管理服务,包括弹性节点增减、Open API 支持、监控报警、运维工具、服务端后台的自动化运维等。这部分费用按照用户核时数进行按量计费,用户在一个地域的所有集群总核数小于200核(vCPU)不收费,高于200核(vCPU)按每核时0.02元计费。

NAS 产品费用

E-HPC集群中需要使用NAS作为各节点的共享存储空间。价格可参考文件存储NAS 详细价格信息

登录节点外网流量费用

创建完成的E-HPC集群会默认给登录节点绑定EIP并开启一定量的公网带宽。这个流量是按量(小时)计费的,仅单向收取流出流量费用,流入流量免费。

例如,您在 1 小时内公网流出流量为 10GB,收取费用为 10GB × 每 G 价格 元 / 小时。每个 Region 的流量费略有不同。

弹性公网IP计费说明

E-HPC集群总费用

E-HPC集群总费用以创建集群时计价器显示的总价为准。

典型高性能计算应用场景

HPCaaS 弹性高性能计算云平台

弹性构建敏捷伸缩

支持基于阿里云ECS、EGS弹性计算实例,VPC专有网络,NAS存储实例快速构建任意规模的并行计算集群,并根据用户需求动态增删节点个数和存储规模。

主要优势

不用排队:用户只需购买EHPC的集群实例,就可以立刻获得相应数目的ECS,EGS,NAS和搭配的RDS,OSS等服务。

规模弹性伸缩:用户可以根据初期使用集群规模生成集群,在运行时通过集群调度动态伸缩集群数目。突破线下物理集群的规模限制。

安全隔离:管控空间和用户空间分离,并采用阿里云原生ECS,EGS,VPC安全隔离保证多租户间数据安全隔离。

E-HPC应用场景架构图

使用入门

通过管理控制台使用阿里云 E-HPC

弹性高性能计算E-HPC管理控制台提供基于 Web 的用户界面,您可以利用它访问和配置 E-HPC 集群。
您可以使用该控制台对 E-HPC 的相关组件(如节点、共享存储、用户等)进行创建、查看和管理。

前往E-HPC控制台

有关如何通过管理控制台创建和使用弹性高性能计算E-HPC集群,请参阅:

快速创建E-HPC集群

访问阿里云 E-HPC 产品文档

要创建使用弹性高性能计算E-HPC集群,请参阅E-HPC文档以详细了解弹性高性能计算E-HPC集群的工作原理以及如何修改和管理E-HPC集群组件。

E-HPC用户指南

阿里云 E-HPC API 参考

您可以使用E-HPC OpenAPI,通过编程创建、管理弹性高性能计算E-HPC集群的资源,并实现更好的掌控力。

E-HPC API概览

资源

以下这些文档、API 及其他产品相关资源的链接有助您充分利用弹性高性能计算E-HPC的功能和强大的计算能力。

开发者资源

通过以下链接,您可以查看E-HPC高级功能、帮助文档等。
这些链接可以帮助开发者将E-HPC集群与其现有高性能计算应用进行整合或改进配置。

阿里云产品/服务API总览

相关服务

通过以下链接可以查看E-HPC组件相关产品服务的详细帮助文档和开发资源等

云服务器 ECS

常见问题

如何登录集群?

E-HPC集群创建完成后,会自动为每个登录节点分配一个公网IP。

在E-HPC控制台主界面点选左侧栏的“节点”标签,在刷新后的主界面的“集群”右侧下拉菜单中选择所创建集群的名字。再到节点类型右侧下拉菜单中选择登录节点。表格中IP地址/ID栏即显示登录节点对应的公网地址。

若在集群创建最后一步生成了密钥对,则可通过支持密钥登录的终端软件(如putty等)使用密钥登录(推荐,安全性更好也更方便)。或通过普通ssh终端使用预设root密码即可登录。默认登录shell为bash。

为何某些地域无法开通E-HPC集群?

一般来说,部分地域+可用区无法开通E-HPC集群是受到以下几方面因素的限制:

  • 该地区没有部署NAS,E-HPC集群无法建立共享存储。

  • 该地域+可用区没有符合E-HPC集群计算节点配置的ECS可供选择(如无GPU实例)。

  • 该地域+可用区没有足够数量的资源满足E-HPC集群所需的节点数量。

如无特殊需求请选择其它地区进行E-HPC集群创建。

为何不能使用ECS管理控制台对E-HPC集群节点进行操作?

尽管E-HPC集群是基于ECS云服务器组建,但E-HPC还提供了额外的部署流程,包括且不限于以下条目:

  • E-HPC帮助用户按照既定节点配比(如开通高可用的情况下,4管控:1登录:n计算)和指定实例配置,为各类节点批量开通ECS云服务器。

  • E-HPC在开通各个节点对应的ECS云服务器后,会进一步部署管控系统。

  • E-HPC通过管控系统为用户预装选定的软件及其依赖软件包。

  • E-HPC根据节点类型分别配置作业调度器server和client。

以上操作和相关服务都依赖于E-HPC集群部署流程。若用户自行使用ECS管理控制台对各个节点进行干预则很可能导致集群创建失败,节点掉线或调度系统失效。因此我们强烈建议如非排查故障,禁止使用ECS管理控制台对E-HPC集群节点进行操作。

如有特殊需要,请在E-HPC开发维护人员指引下使用ECS管理控制台对节点进行检查。

什么是高可用?

高可用指的是创建的集群支持HA(High Availability)功能,不会因单点故障而导致整个集群失能的问题,创建出来的集群头节点(调度节点)和域账户管理节点都支持高可用配置。比如针对PBS Pro集群的头节点和NIS域账户管理节点都分别有两个,master和slave,当master节点不能工作的时候,会自动切换到slave节点上。

如何进行实名登记以购买中国大陆地域云产品服务?

根据中国大陆相关法规要求,购买和使用中国大陆节点(不含香港节点)云产品服务的用户(包括存量、新购、续费用户)需要进行实名登记。
当用户进行购买相关操作时,如选择了中国大陆区域(不含香港),系统将检查用户的实名登记信息,若未完成,购买流程将报错并被要求先进行实名登记。
实名登记流程参见:https://www.alibabacloud.com/help/zh/faq-detail/52595.htm