开源大数据平台 E-MapReduce(简称“EMR”)是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、StarRocks、Flink、Presto、ClickHouse等开源大数据计算和存储引擎。EMR计算资源支持灵活的弹性控制。EMR支持on ECS、on ACK以及Serverless多种部署形态。
产品优势

-
100% 兼容开源
100% 采用社区开源组件,随开源版本升级迭代。

-
安全可靠
分钟级搭建大数据计算环境,智能诊断分析,Kerberos身份认证,数据加密等。

-
节约成本
计算资源按需使用,自动数据冷热分层存储, 支持阿里云抢占式实例等。

-
弹性资源
支持按负载/时间配置规则,分钟级弹性伸缩, 支持多种弹性资源类型。
精心打造的功能
便捷使用
环境构建
通过控制台页面或OpenAPI即可在几分钟内启动EMR集群。便捷部署开源大数据框架,无需关心底层的硬件与软件部署。
资源拓展
通过控制台页面或OpenAPI即可方便地增加或减少已有集群的节点数目。您可以使用 EMR 托管扩展策略轻松设置扩展和缩减,使 EMR 集群自动管理计算资源,以满足您的使用需求和性能需求。这样可提高集群利用率并节约成本。
服务配置
可以快速添加EMR提供的服务,可以监控服务的状态,并对服务组件进行配置和运维操作。您现在可以修改在 EMR 集群上运行的应用程序的配置,包括 Apache Hadoop、Apache Spark、Apache Hive 和 Hue,而无需重新启动集群。EMR 应用程序重新配置功能让您可以即时修改应用程序,而无需关闭或重新创建集群。Amazon EMR 将应用您的新配置,并正常重启重新配置的应用程序。
便捷集成
您可以通过控制台、软件开发工具包或 CLI 应用配置。
开发调度
EMR Workflow是一个Serverless化的交互式数据分析和探索平台,满足大数据和AI融合下的数据处理需求,为数据工程师、数据分析师和数据科学家提供了可视化的应用程序开发环境。通过EMR Notebook可以完成对SQL、Python、Markdown等多种语言程序的代码的编写、调试和执行。EMR Notebook是一个全托管的工作流和任务调度服务,100%兼容开源Apache DolphinScheduler。它提供了易于使用的调度服务,您可以通过可视化的操作界面轻松地管理工作流和任务,高效构建数据湖仓,并为生产任务的稳定运行提供保障。支持对接DataWorks。DataWorks可基于E-MapReduce创建Hive、Spark SQL、Presto和MR等节点,实现任务工作流的配置和定时调度、元数据管理及数据质量监控告警等功能,为您提供一站式数据湖开发和治理的环境。
可拓展性与弹性
Serverless
E-MapReduce Serverless能够提供极致的资源弹性与稳定性,支持根据业务负载自动伸缩、按秒计费的资源弹性能力。E-MapReduce Serverless实例不采用固定规格,实例的计算资源会在您指定的范围内根据业务负载自动弹性伸缩,避免资源闲置浪费,并降低大数据运维成本。
弹性伸缩
EMR on ECS支持多种弹性策略,可按时间或负载自动扩缩集群计算资源,分钟级变化资源规模。
成本优化
多种计费方式
E-MapReduce提供包年包月、按量付费、抢占式实例等多种计费方式 ,对于短期需求,您可以选择按量付费,随用随开;对于长期需求,您可以选择包年包月,价格实惠,购买时长越长,折扣越多。
倚天 ARM 架构
EMR on ECS支持倚天架构,基于自研芯片倚天710,软硬协同,性价比提升40%以上。
监控诊断
集群监控
提供丰富的服务监控指标和主机监控指标展示,通过可视化的方式快速定位服务和主机异常。
事件中心
EMR服务提供丰富的事件类型,包含服务事件、管控服务事件、主机事件,可以更加快速、具体地获取到集群问题,并可以对问题发生链路进行溯源。
诊断分析
提供HDFS冷热数据分析和小文件分析功能,对服务性能优化提供依据。