MaxCompute是适用于数据分析场景的企业级SaaS(Software as a Service)模式云数据仓库,以Serverless架构提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您可以经济并高效地分析处理海量数据。
随着数据收集手段不断丰富,行业数据大量积累,数据规模已增长到了传统软件行业无法承载的海量数据(TB、PB、EB)级别。MaxCompute提供离线和流式数据的接入,支持大规模数据计算及查询加速能力,为您提供面向多种计算场景的数据仓库解决方案及分析建模服务。MaxCompute还为您提供完善的数据导入方案以及多种经典的分布式计算模型,您可以不必关心分布式计算和维护细节,便可轻松完成大数据分析。
MaxCompute适用于100 GB以上规模的存储及计算需求,最大可达EB级别,并且MaxCompute已经在阿里巴巴集团内部得到大规模应用。MaxCompute适用于大型互联网企业的数据仓库和BI分析、网站的日志分析、电子商务网站的交易分析、用户特征和兴趣挖掘等。
MaxCompute还深度融合了阿里云如下产品:
核心功能
功能分类 | 功能描述 |
全托管的Serverless在线服务 |
|
弹性能力与扩展性 |
|
统一丰富的计算和存储能力 |
|
与DataWorks深度集成 | 一站式数据开发与治理平台DataWorks,可实现全域数据汇聚、融合加工和治理。DataWorks支持对MaxCompute项目进行管理以及Web端查询编辑。 |
集成AI能力 |
|
深度集成Spark引擎 |
|
湖仓一体 |
详细信息,请参见MaxCompute湖仓一体概述。 |
支持流式采集和近实时分析 |
|
提供持续的SaaS化云上数据保护 | 为云上企业提供基础设施、数据中心、网络、供电、平台安全能力、用户权限管理、隐私保护等保三级超20项安全功能,兼具开源大数据与托管数据库的安全能力。 |
产品架构
MaxCompute的产品架构如下。

模块名称 | 功能说明 |
存储 |
|
计算引擎 | MaxCompute本身具备计算引擎能力。在处理Spark作业时,MaxCompute运行在阿里云自研的CUPID平台之上,可以原生支持开源社区Yarn所支持的计算框架。 |
计算模型数据通道 | MaxCompute支持多种数据通道满足多场景需求:
|
用户接口 | MaxCompute提供如下用户接口: |
统一元数据及安全体系 | MaxCompute的Information Schema提供项目元数据及使用历史数据等信息,您可以对作业的运行情况,例如资源消耗、运行时长、数据处理量等指标进行分析,用于优化作业或规划资源容量。 MaxCompute还提供了完善的安全管理体系,例如访问控制、数据加密、动态脱敏等为数据安全性提供保障。更多安全相关信息,请参见安全管理。 |
产品优势
MaxCompute的主要优势如下:
简单易用
面向数据仓库实现高性能存储、计算。
预集成多种服务,标准SQL开发简单。
内建完善的管理和安全能力。
免运维,按量付费,不使用不产生费用。
匹配业务发展的弹性扩展能力
存储和计算独立扩展,动态扩缩容,按需弹性扩展,无需提前规划容量,满足突发业务增长。
支持多种分析场景
支持开放数据生态,以统一平台满足数据仓库、BI、近实时分析、数据湖分析、机器学习等多种场景。
开放的平台
支持开放接口和生态,为数据、应用迁移、二次开发提供灵活性。
支持与Airflow、Tableau等开源和商业产品灵活组合,构建丰富的数据应用。
联系我们
如果您在使用MaxCompute的过程中有任何疑问或建议,欢迎填写钉钉群申请表单加入钉钉群进行反馈。