全部产品
Search
文档中心

开源大数据平台E-MapReduce:EMR-5.5.x版本说明

更新时间:Apr 27, 2023

本文介绍EMR-5.5.x版本的发布日期、更新内容和发行版本信息。

发布日期

版本

日期

EMR-5.5.1

2022年3月25日

EMR-5.5.0

2022年2月15日

更新内容

EMR-5.5.1

说明

新版控制台的OLAP集群支持该版本。

服务

变更点

Clickhouse

修改了部分参数的默认值。

StarRocks

升级至2.1.1版本。

EMR-5.5.0

服务

变更点

SmartData

组件下线。

BIGBOOT

RSS

  • 升级ESS服务为RSS。

  • 增强了服务的功能和稳定性。

JindoSDK

  • 升级架构为JindoData。

  • EMR首次集成JindoSDK 4.0,支持OSS和OSS-HDFS服务等。

Spark

  • COUNT DISTINCT函数支持IF语句以及优化Case when的用法。

    设置参数spark.sql.optimizer.rewriteConditionalDistinctAggregates为true。

  • Shuffle Hash Join支持fallback到Sort Merge Join。

    设置参数spark.sql.join.preferSortMergeJoin为false,设置参数spark.sql.join.enableShuffledHashJoinFallback为true。

  • 支持非动态分区自动合并小文件。

    设置spark.sql.adaptive.merge.output.small.files.enabled参数为true。

  • GroupingSet以及Distinct等场景会自动调整并发度。

    设置参数spark.sql.execution.optimizeExpand为true。

  • 优化了Hive on Spark。

  • 支持Time Travel语法。

  • 适配JindoSDK。

Tez

适配JindoSDK。

Hive

  • 优化了Hive Jindo批量删除的问题。

  • 优化了HiveServer2 OOM问题。

  • 优化了Hive on Spark。

  • 适配JindoSDK。

Presto

  • 升级Presto至社区358版本。

  • 默认增加MySQL、Iceberg、Hudi、Phoenix、Kudu和Delta连接器,并更新默认配置。

  • 支持数据湖分析。

  • 支持UDF动态加载功能。

  • 适配JindoSDK。

Delta Lake

  • 版本升级

    • 升级至1.1.0版本,兼容Spark 3.2.0。

    • 所有商业版功能迁移至1.1.0版本。

  • 元数据管理

    • 优化元数据修改同步到metastore的部分。

    • 自动上报表的统计信息(dataProfiling)到metastore。

  • SQL

    • 支持Time Travel语法。

    • 支持DropPartition SQL语法。

    • 支持SQL动态分区覆盖写。

    • 支持指定位置(FIRST和AFTER)的ADD COLUMN操作。

  • 表管理能力增强

    • 支持并默认开启可以根据表大小动态调整文件大小。

    • 支持并默认开启自动Vacuum,支持并发Vacuum。

    • 优化了自动Compaction的逻辑,默认关闭。

    • 新增Zorder语法,并加速了Zorder的处理过程。

Hudi

  • 升级至0.10.0版本。

  • 支持Spark 3.2.0版本。

  • 支持JindoFS Block模式。

HDFS

适配JindoSDK。

YARN

  • 适配RSS内存配置。

  • 适配JindoSDK。

Flume

适配JindoSDK。

Impala

适配JindoSDK。

Ranger

  • 支持Spark 3.2.0版本。

  • 支持Presto 358版本。

HBase

  • 修复了默认参数存在的问题。

  • 修复了GC日志日期格式问题。

Clickhouse

Iceberg

  • 升级至0.13.0版本。

  • 支持Presto 358版本。

DLF-Auth

  • 支持Spark 3.2.0版本。

  • 支持Presto 358版本。

发行版本信息

说明

OLAP集群需要在新版控制台查看。

Hadoop集群

服务

版本

HDFS

3.2.1

YARN

3.2.1

Hive

3.1.2

Spark

3.2.0

Knox

1.1.0

Tez

0.9.2

Ganglia

3.7.2

Sqoop

1.4.7

DLF-Auth

1.0.4

Iceberg

0.13.0

Hudi

0.10.0

DeltaLake

1.1.0

OpenLDAP

2.4.44

Hue

4.9.0

JindoSDK

4.0.0

HBase

2.3.4

Zookeeper

3.6.3

Presto

358

Impala

3.4.0

Zeppelin

0.10.2

Flume

1.9.0

Livy

0.7.1

Superset

0.36.0

Ranger

2.1.0

RSS

1.0.0

Alluxio

2.5.0

Kudu

1.14.0

Oozie

5.2.1

ClickHouse集群

服务

版本

Zookeeper

3.6.3

Ganglia

3.7.2

ClickHouse

21.3.13.9

Shuffle Service集群

服务

版本

RSS

1.0.0

OLAP集群

服务

版本

ClickHouse

21.3.13.9.2.9

StarRocks

2.1.1

Zookeeper

3.6.3