云原生数据仓库AnalyticDB MySQL版的产品系列分为湖仓版(3.0)和数仓版(3.0)。本文介绍AnalyticDB MySQL版产品系列的特点、功能对比及规格。
产品系列
湖仓版(3.0)
湖仓版(3.0)是基于计算存储分离架构打造的,同时具备低成本离线处理和高性能在线分析能力的湖仓一体版本。在数仓版的能力基础上,从数据的采集、存储、计算和应用等方面做了全面的升级。提供将源端数据实时同步到湖(Hudi on OSS)或仓(C-Store)的可视化配置能力。通过底层存储的一份全量数据,来支持离线和在线两种场景,避免因数据同步产生的数据一致性和时效性等问题。计算层支持标准接口的多语言可编程计算引擎Spark。同时湖仓版(3.0)提供离线业务与在线业务的计算资源物理隔离的能力,能实现计算资源和存储资源按需弹性扩容。
适用场景包含离线处理场景(数据清洗、数据规整等预处理操作)、多源聚合分析和拉宽场景、预测洞察(机器学习和AI)等业务场景。
数仓版(3.0)弹性模式
数仓版(3.0)是基于计算存储分离架构打造的,支持海量数据实时写入可见及高性能在线分析的版本。支持按需弹性扩容计算资源和存储资源,提供数据冷热分层存储能力,以降低存储成本。同时提供离线业务与在线业务的计算资源物理隔离的能力。
适用场景包含构建海量数据实时写入和复杂ETL计算的实时数据仓库、大数据量的复杂查询、历史数据分析、日志分析等业务场景。
数仓版(3.0)弹性模式包括两种形态:单机版和集群版。
单机版
单机版即单节点部署,不具备分布式能力。单机版支持冷热数据分层,但不提供高可用服务,不支持资源组隔离和分时弹性功能。单机版不提供SLA承诺,故障恢复耗时长(大约为4~8小时),不建议用于生产环境。单机版适用于数据量不大、QPS较低、无需高可用服务等业务场景,更适合个人开发者测试使用、初创公司或小型企业入门使用。
集群版
集群版即多节点部署,具备分布式能力。集群版提供更完整的产品能力,适用于各类型企业在开发测试和生产环境使用。
数仓版(3.0)预留模式
数仓版(3.0)是基于计算存储耦合架构打造的高性能版本。支持高吞吐实时写入和高并发在线查询。实时写入和查询响应快。适用于查询加速、用户画像、交互报表、实时数据服务等场景。
功能对比
下表对不同产品系列支持的主要功能进行了对比。
功能类别 | 子类别 | 湖仓版(推荐) | 数仓版 | |
弹性模式(新版) | 预留模式 | |||
计算 | 羲和分析计算引擎 | 支持 | 支持 | 支持 |
Spark可编程计算引擎 | 支持 | 不支持 | 不支持 | |
存储 | 玄武分析型存储 | 支持 | 支持 | 支持 |
Hudi低成本存储 | 支持 | 不支持 | 不支持 | |
资源管理 | 资源组管理 | 支持 | 支持(单机版不支持) | 不支持 |
分时弹性 | 支持 | 支持(单机版不支持) | 不支持 | |
按需弹性 | 支持 | 不支持 | 不支持 | |
冷热数据分层 | - | 支持 | 支持 | 不支持 |
数据接入 | 数据实时接入 | 支持 | 不支持 | 不支持 |
元数据自动发现 | 支持 | 不支持 | 不支持 | |
作业开发 | SQL作业开发 | 支持 | 不支持 | 不支持 |
Spark作业开发 | 支持 | 不支持 | 不支持 | |
作业调度 | - | 支持 | 不支持 说明 不具备原生的作业调度能力,仅支持通过DMS、DataWorks等方式进行作业调度。 | 不支持 |
产品规格
湖仓版(3.0)规格
计算资源 | 存储资源 |
最小规格:16 ACU 最大规格:2048 ACU | 最小规格:24 ACU(1组) 最大规格:4800 ACU(200组) |
数仓版(3.0)弹性模式规格
类型 | 计算资源 |
单机版 | 8核32 GB和16核64 GB |
集群版 | 16核64 GB及以上 说明 仅2022年09月01日及以后购买的中国内地地域集群,支持16核64 GB(集群版)和24核96 GB(集群版)规格的多节点部署。 |
数仓版(3.0)预留模式规格
型号 | 规格 | ||
CPU | 内存(GB) | 磁盘空间(GB) | |
C8 | 24核 | 192 | 最小空间:100 最大空间:2000 |
C32 | 96核 | 768 | 最小空间:100 最大空间:8000 |
常见问题
如何查看产品系列?
在云原生数据仓库AnalyticDB MySQL控制台集群信息页面的集群属性区域查看产品系列和模式。
数仓版(3.0)弹性模式和预留模式的区别是什么?
存储计费模式不同:
预留模式下,需要在创建集群时指定所需的存储空间(例如1 TB),在集群运行期间按照指定的存储空间计费。
弹性模式下,创建集群时无需指定存储空间,集群运行期间按照实际占用存储空间计费。
例如某用户以按量付费方式创建集群,某天的数据实际存储空间为100 GB,则当天所需支付的存储空间费用=100 GB×时长,其中最小计费粒度为20 GB,不满20 GB按照20 GB计费。
资源分离:弹性模式下,CPU和内存资源被分为计算资源和数据资源,计算资源用于数据处理和计算统计运算;数据资源用于数据写入和查询时的数据读取。支持单独购买计算资源和数据资源,方便您深入分析资源瓶颈,精确扩缩容,降低成本。
哪些场景会对可用性产生影响?
节点意外终止服务、执行变更配置(磁盘扩容或者升级降级配置)或者版本升级时会对可用性产生影响。