全部产品
Search
文档中心

开源大数据平台E-MapReduce:产品简介

更新时间:Feb 27, 2024

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云其他的云数据存储系统和数据库系统(例如,阿里云OSS和RDS等)进行数据传输。

产品介绍

阿里云EMR提供了on ECS、on ACK和Serverless形态,以满足不同用户的需求。

形态

描述

EMR on ECS

EMR负责将开源Hadoop生态的组件安装部署在ECS上,并启动相应的服务。您可以在EMR控制台完成对集群ECS及服务的运维操作。

关于EMR on ECS的更多介绍,请参见什么是EMR on ECS

EMR on ACK

您需要先完成ACK集群的安装部署。当ACK集群准备就绪后,EMR将基于ACK的资源安装部署大数据服务组件,并在容器内运行。关于EMR on ACK的更多介绍,请参见什么是EMR on ACK

产品架构

什么是E-Mapreduce..png

产品优势

EMR on ECS

EMR为您提供了相对方便可控的企业级开源大数据服务。您可以快速搭建开源大数据服务,例如Hadoop、Spark、Flink、Kafka和HBase服务。

  • 100%采用社区开源组件,适配并优化开源组件,性能远高于开源版本。

  • 基于时间的弹性伸缩能力,抢占式实例可进一步降低成本。

  • 解耦了计算与存储之间的绑定关系,实现了资源的弹性利用。

  • 分钟级别创建和扩容集群,无需手动部署和启动服务。

EMR on ACK

  • 节省成本:无需单独购买ACK集群。

  • 简化运维:一套运维体系,一套集群管理,全面覆盖大数据和在线等多种业务。

  • 优化体验:支持ECS和ACK两套IaaS资源模型,您可以无缝切换。

  • 深度集成:完全采用云原生数据湖架构,计算使用阿里云ACK,计算资源可以无限扩展。