すべてのプロダクト
Search
ドキュメントセンター

E-MapReduce:EMR 5.x シリーズのリリースノート

最終更新日:Nov 09, 2025

このトピックでは、EMR 5.x シリーズのリリース日と更新について説明します。各バージョンでサポートされているコンポーネントの詳細については、「ディストリビューション」をご参照ください。

EMR-5.21.x

リリース日

バージョン

日付

EMR-5.21.0

2025 年 10 月 27 日

更新

サービス

変更

Hive

  • プロファイルメカニズムを追加します。このメカニズムは、ORC などのデータレイクストレージのファイル形式を自動的に検出し、JindoSDK の最適化されたバッファーと事前読み取りパラメーターを適用します。

  • ORC ストライププリフェッチメカニズムを導入します。このメカニズムにより、中規模から大規模の ORC ファイルを処理する際に、並列計算と I/O 操作が可能になります。現在のストライプを処理しながら後続のストライプを非同期にプリフェッチすることで、スループットを向上させます。

  • ORC ベクター読み取りをサポートします。ORC ファイルからインデックスデータを読み取るか、述語プッシュダウンを実行すると、多くの散在した非連続のファイル範囲が生成されます。ベクター読み取りはバッチリクエストを送信して、スループットを大幅に向上させます。

  • JindoSDK バッチメタデータ API を統合します。この API は、getFileStatus などのメタデータリクエストをバッチで処理して、メタデータリクエストのスループットを向上させます。

Spark

  • プロファイルメカニズムを追加します。このメカニズムは、ORC などのデータレイクストレージのファイル形式を自動的に検出し、JindoSDK の最適化されたバッファーと事前読み取りパラメーターを適用します。

  • ORC ストライププリフェッチメカニズムを導入します。このメカニズムにより、中規模から大規模の ORC ファイルを処理する際に、並列計算と I/O 操作が可能になります。現在のストライプを処理しながら後続のストライプを非同期にプリフェッチすることで、スループットを向上させます。

  • 小規模ファイルに対する並列事前オープンをサポートします。この機能は、小規模ファイルのクエリシナリオを自動的に検出し、ファイルのバッチを並行して事前オープンします。これにより、頻繁なオープン操作によって引き起こされる I/O 遅延が大幅に削減されます。

  • ORC ベクター読み取りをサポートします。ORC ファイルからインデックスデータを読み取るか、述語プッシュダウンを実行すると、多くの散在した非連続のファイル範囲が生成されます。ベクター読み取りはバッチリクエストを送信して、スループットを大幅に向上させます。

Tez

小規模ファイルに対する並列事前オープンをサポートします。この機能は、小規模ファイルのクエリシナリオを自動的に検出し、ファイルのバッチを並行して事前オープンします。これにより、頻繁なオープン操作によって引き起こされる I/O 遅延が大幅に削減されます。

Ranger

  • Jindoauth Server は、クライアントユーザーが OSS にアクセスするためのカスタム RAM ロールをサポートします。

  • Ranger-yarn-plugin の依存関係の欠落問題を修正しました。

Paimon

バージョン 1-ali-16.3 にアップグレードしました。

JindoCache

バージョン 6.10.1 にアップグレードしました。

Deltalake

コンポーネントを追加しました。バージョンは 3.2.1 です。

リリースバージョン情報

DataLake クラスター

サービス

バージョン

Hadoop-Common

3.2.1

HDFS

3.2.1

OSS-HDFS

1.0.0

Hive

3.1.3

Spark2

2.4.8

Spark3

3.5.3

Tez

0.10.2

Trino

422

Deltalake

3.2.1

Hudi

0.15.0

Iceberg

1.5.0

Flume

1.11.0

Kyuubi

1.9.2

YARN

3.2.1

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

DLF-Auth

2.0.2

Presto

0.283

Zookeeper

3.8.4

Sqoop

1.4.7

Knox

1.5.0

Celeborn

0.5.2

JindoCache

6.10.1

Paimon

1-ali-16.3

OLAP クラスター

サービス

バージョン

StarRocks2

2.5.22

StarRocks3

3.2.11

Doris

2.1.4

ClickHouse

23.3.13.6

Zookeeper

3.8.4

DataFlow クラスター

サービス

バージョン

Hadoop-Common

3.2.1

HDFS

3.2.1

OSS-HDFS

1.0.0

YARN

3.2.1

OpenLDAP

2.4.46

Zookeeper

3.8.4

Knox

1.5.0

Flink

1.17.2

Paimon

1-ali-6.2

DataServing クラスター

サービス

バージョン

Hadoop-Common

3.2.1

HDFS

3.2.1

OSS-HDFS

1.0.0

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

Zookeeper

3.8.4

Knox

1.5.0

HBase

2.6.3

JindoCache

6.8.2

Phoenix

5.2.1

カスタムクラスター

サービス

バージョン

Hadoop-Common

3.2.1

HDFS

3.2.1

OSS-HDFS

1.0.0

Hive

3.1.3

Spark2

2.4.8

Spark3

3.5.3

Tez

0.10.2

Trino

422

Deltalake

3.2.1

Hudi

0.15.0

Iceberg

1.5.0

Flume

1.11.0

Kyuubi

1.9.2

YARN

3.2.1

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

DLF-Auth

2.0.2

Presto

0.283

StarRocks2

2.5.22

StarRocks3

3.2.11

Zookeeper

3.8.4

Sqoop

1.4.7

Knox

1.5.0

Celeborn

0.5.2

Flink

1.17.2

HBase

2.6.3

JindoCache

6.10.1

Paimon

1-ali-16.3

Phoenix

5.2.1

EMR-5.20.x

リリース日

バージョン

日付

EMR-5.20.0

2025 年 7 月 10 日

更新

サービス

変更

Hive

パーティションテーブルへのフィールド追加のパフォーマンスを最適化します。

YARN

特定のアプリケーションの動作がクラスターのスケジューリングパフォーマンスを低下させるのを防ぐために、グローバルスケジューリングのパフォーマンスを最適化します。

リリースバージョン情報

DataLake クラスター

サービス

バージョン

Hadoop-Common

3.2.1

HDFS

3.2.1

OSS-HDFS

1.0.0

Hive

3.1.3

Spark2

2.4.8

Spark3

3.5.3

Tez

0.10.2

Trino

422

Hudi

0.15.0

Iceberg

1.5.0

Flume

1.11.0

Kyuubi

1.9.2

YARN

3.2.1

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

DLF-Auth

2.0.2

Presto

0.283

Zookeeper

3.8.4

Sqoop

1.4.7

Knox

1.5.0

Celeborn

0.5.2

JindoCache

6.8.2

Paimon

1-ali-6.2

OLAP クラスター

サービス

バージョン

StarRocks2

2.5.22

StarRocks3

3.2.11

Doris

2.1.4

ClickHouse

23.3.13.6

Zookeeper

3.8.4

DataFlow クラスター

サービス

バージョン

Hadoop-Common

3.2.1

HDFS

3.2.1

OSS-HDFS

1.0.0

YARN

3.2.1

OpenLDAP

2.4.46

Zookeeper

3.8.4

Knox

1.5.0

Flink

1.17.2

Paimon

1-ali-6.2

DataServing クラスター

サービス

バージョン

Hadoop-Common

3.2.1

HDFS

3.2.1

OSS-HDFS

1.0.0

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

Zookeeper

3.8.4

Knox

1.5.0

HBase

2.6.3

JindoCache

6.8.2

Phoenix

5.2.1

カスタムクラスター

サービス

バージョン

Hadoop-Common

3.2.1

HDFS

3.2.1

OSS-HDFS

1.0.0

Hive

3.1.3

Spark2

2.4.8

Spark3

3.5.3

Tez

0.10.2

Trino

422

Hudi

0.15.0

Iceberg

1.5.0

Flume

1.11.0

Kyuubi

1.9.2

YARN

3.2.1

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

DLF-Auth

2.0.2

Presto

0.283

StarRocks2

2.5.22

StarRocks3

3.2.11

Zookeeper

3.8.4

Sqoop

1.4.7

Knox

1.5.0

Celeborn

0.5.2

Flink

1.17.2

HBase

2.6.3

JindoCache

6.8.2

Paimon

1-ali-6.2

Phoenix

5.2.1

EMR-5.19.x

リリース日

バージョン

日付

EMR-5.19.0

2025 年 4 月 24 日

更新

サービス

変更

Trino

LDAP が利用できない問題を修正しました。

YARN

  • グローバルスケジューリングの最適化により、リソース割り当ての効率を向上させます。

  • HTTP サービスのメトリック監視を追加します。

  • オープンソースのバグ (YARN-10213) を修正しました。

HBase

  • バージョン 2.6.3 にアップグレードしました。

  • デフォルトのランタイム環境を Java 11 に変更します。

  • デフォルトのガベージコレクターを G1 に変更します。

Phoenix

バージョン 5.2.1 にアップグレードしました。

JindoCache

バージョン 6.8.2 にアップグレードしました。

StarRocks

ストレージとコンピューティングが分離されたクラスターの作成をサポートします。

EMRHOOK

  • Spark 3.5 のサポートを追加しました。

  • Paimon テーブルのデータリネージ追跡をサポートします。

  • 安定性を向上させました。

リリースバージョン情報

DataLake クラスター

サービス

バージョン

Hadoop-Common

3.2.1

HDFS

3.2.1

OSS-HDFS

1.0.0

Hive

3.1.3

Spark2

2.4.8

Spark3

3.5.3

Tez

0.10.2

Trino

422

Hudi

0.15.0

Iceberg

1.5.0

Flume

1.11.0

Kyuubi

1.9.2

YARN

3.2.1

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

DLF-Auth

2.0.2

Presto

0.283

Zookeeper

3.8.4

Sqoop

1.4.7

Knox

1.5.0

Celeborn

0.5.2

JindoCache

6.8.2

Paimon

1-ali-6.2

OLAP クラスター

サービス

バージョン

StarRocks2

2.5.22

StarRocks3

3.2.11

Doris

2.1.4

ClickHouse

23.3.13.6

Zookeeper

3.8.4

DataFlow クラスター

サービス

バージョン

Hadoop-Common

3.2.1

HDFS

3.2.1

OSS-HDFS

1.0.0

YARN

3.2.1

OpenLDAP

2.4.46

Zookeeper

3.8.4

Knox

1.5.0

Flink

1.17.2

Paimon

1-ali-6.2

DataServing クラスター

サービス

バージョン

Hadoop-Common

3.2.1

HDFS

3.2.1

OSS-HDFS

1.0.0

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

Zookeeper

3.8.4

Knox

1.5.0

HBase

2.6.3

JindoCache

6.8.2

Phoenix

5.2.1

カスタムクラスター

サービス

バージョン

Hadoop-Common

3.2.1

HDFS

3.2.1

OSS-HDFS

1.0.0

Hive

3.1.3

Spark2

2.4.8

Spark3

3.5.3

Tez

0.10.2

Trino

422

Hudi

0.15.0

Iceberg

1.5.0

Flume

1.11.0

Kyuubi

1.9.2

YARN

3.2.1

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

DLF-Auth

2.0.2

Presto

0.283

StarRocks2

2.5.22

StarRocks3

3.2.11

Zookeeper

3.8.4

Sqoop

1.4.7

Knox

1.5.0

Celeborn

0.5.2

Flink

1.17.2

HBase

2.6.3

JindoCache

6.8.2

Paimon

1-ali-6.2

Phoenix

5.2.1

EMR-5.18.x

リリース日

バージョン

日付

EMR-5.18.1

2024 年 12 月 18 日

EMR-5.18.0 (新規購入はサポートされていません)

2024 年 12 月 4 日

更新

サービス

変更

Spark3

  • バージョン 3.5.3 にアップグレードしました。

  • Spark のスケールアウト中に発生する構成の問題を修正しました。

Trino

LDAP を有効にした後に接続が失敗する問題を修正しました。

Presto

Zookeeper

カスタム構成の追加をサポートします。

Ranger

既存の Spark 3 Ranger プラグインを、オープンソースの Kyuubi プロジェクトによって提供されるバージョンに置き換えます。

Hudi

バージョン 0.15.0 にアップグレードしました。

Celeborn

バージョン 0.5.2 にアップグレードしました。

Paimon

バージョン 1.0-ali-1 にアップグレードしました。

JindoCache

バージョン 6.5.3 にアップグレードしました。

StarRocks3

バージョン 3.2.11 にアップグレードしました。

StarRocks2

バージョン 2.5.22 にアップグレードしました。

Impala

サービスはオフラインです。代替として推奨されるサービスを使用するか、対応するサービスを自分でインストールしてください。

Impala の代替として、Presto、Trino、ClickHouse、または StarRocks を使用してください。

Kudu

Kafka

Kafka-Manager

EMR-5.17.x

リリース日

バージョン

日付

EMR-5.17.4

2024 年 12 月 18 日

EMR-5.17.3 (新規購入はサポートされていません)

2024 年 11 月 29 日

EMR-5.17.2 (新規購入はサポートされていません)

2024 年 8 月 29 日

EMR-5.17.1 (新規購入はサポートされていません)

2024 年 6 月 21 日

EMR-5.17.0 (新規購入はサポートされていません)

2024 年 4 月 23 日

更新

EMR-5.17.4

サービス

変更

JindoCache

バージョン 6.5.3 にアップグレードしました。

StarRocks2

バージョン 2.5.22 にアップグレードしました。

StarRocks3

バージョン 3.2.11 にアップグレードしました。

EMR-5.17.3

サービス

変更

JindoSDK

デッドロックの問題を解決するために JindoSDK をアップグレードします。

EMR-5.17.2

サービス

変更

JindoCache

  • バージョン 6.5.1 にアップグレードしました。

  • 分散ハッシュテーブル (DHT) の読み取りおよび書き込みパフォーマンスを向上させます。

Spark

  • パーティションフォルダーを削除できない問題を修正しました。

  • クライアント操作が metaStoreClient への接続を中断しないように、Hive パッケージの依存関係の問題を修正しました。

Trino

  • スケールアウト中に変更された一部の構成が予期せず復元される可能性がある問題を修正しました。

  • 高セキュリティの OSS-HDFS 上のデータのクエリをサポートします。

  • DLF-AUTH を有効にした後に発生するサービスの異常問題を修正しました。

Presto

高セキュリティの OSS-HDFS 上のデータのクエリをサポートします。

HDFS

NameNode と DataNode のメモリを変更できない問題を修正しました。

HBaseHDFS

YARN

  • ResourceManager は、処理能力を向上させるためにタイムラインイベントをバッチで送信することをサポートします。

  • ResourceManager のコンテナーとリソース処理におけるロジックの問題を修正しました。

Zookeeper

  • ノードグループのメモリ構成を変更できない問題を修正しました。

  • ログ構成ファイルのリファクタリングをサポートします。

Impala

エラスティックスケーリング中に顧客の構成が変更される問題を修正しました。

Ranger

新しい JindoSDK カーネルをサポートし、CPU 使用率を効果的に削減します。

Knox

Master-Extend ノードが 1 つしかない場合にコンポーネントの URL アクセスが失敗する問題を修正しました。

Kafka

Kafka Connect クラスターの起動問題を修正しました。

StarRocks

スケールアウト後に新しい BE ノードが表示されない問題を修正しました。

Doris

バージョン 2.1.4 にアップグレードしました。

Paimon

バージョン 0.9-ali-7 にアップグレードしました。

EMRHOOK

MaxCompute テーブルのデータリネージの解析をサポートします。

EMR-5.17.1

サービス

変更

Spark

Master-Extend ノードグループのデプロイをサポートします。

Hive

Kyuubi

Paimon

Flink の依存関係を VVR バージョンからコミュニティバージョンに置き換え、DLF カタログをサポートします。

Knox

パッケージングに JDK 8 を使用します。

Flink

EMR-5.17.0 で削除された DLF の構成と依存関係を復元します。

EMR-5.17.0

サービス

変更

Spark

Spark3 はバージョン 3.4.2 にアップグレードされました。

Celeborn

バージョン 0.4.0 にアップグレードしました。

Doris

バージョン 2.1.0 にアップグレードしました。

StarRocks

  • StarRocks2 はバージョン 2.5.18 にアップグレードされました。

  • StarRocks3 はバージョン 3.2.4 にアップグレードされました。

DeltaLake

バージョン 3.0.0 にアップグレードしました。

Iceberg

バージョン 1.5.0 にアップグレードしました。

Zookeeper

バージョン 3.8.4 にアップグレードしました。

JindoCache

バージョン 6.2.5 にアップグレードしました。

Flink

バージョン 1.17.2 にアップグレードしました。

EMR-5.16.x

リリース日

バージョン

日付

EMR-5.16.0

2024 年 2 月 19 日

更新

サービス

変更

Hudi

バージョン 0.14.0 にアップグレードしました。

Flume

バージョン 1.11.0 にアップグレードしました。

Kyuubi

バージョン 1.7.3 にアップグレードしました。

Impala

バージョン 4.3.0 にアップグレードしました。

Celeborn

バージョン 0.3.2 にアップグレードしました。

JindoCache

バージョン 6.2.0 にアップグレードしました。

Paimon

バージョン 0.7-ali-1 にアップグレードしました。

Kafka

バージョン 3.6.1 にアップグレードしました。

StarRocks

  • StarRocks2 はバージョン 2.5.13 にアップグレードされました。

  • StarRocks3 はバージョン 3.1.5 にアップグレードされました。

Spark

Commons Text の脆弱性を修正しました。

Ranger

  • Commons Text ライブラリの脆弱性を修正しました。

  • Spring Security フレームワークのパス一致権限バイパスの脆弱性を修正しました。

  • Spring Security フレームワークの転送/インクルード認証バイパスの脆弱性を修正しました。

  • Spring Framework の特殊な一致モードにおける身分認証バイパスの脆弱性を修正しました。

  • Ranger が Lightweight Directory Access Protocol (LDAP) サーバーからユーザー情報を取得し、ユーザー情報を更新する間隔を変更できます。

EMR-5.15.x

リリース日

バージョン

日付

EMR-5.15.1

2023 年 11 月 16 日

EMR-5.15.0 (新規購入はサポートされていません)

2023 年 10 月 27 日

更新

サービス

変更

JindoCache

サービスを追加しました。バージョンは 6.1.1 です。

JindoData

JindoData は選択できません。キャッシュには新しい JindoCache サービスを、認証には DLF-Auth サービスを使用してください。

Spark

[hive-site.xml] から jdo 関連の構成を削除します。

HBase

必要に応じて HBase Thrift Server のバージョン (v1 または v2) を選択できる設定項目を追加します。

StarRocks

StarRocks2 をバージョン 2.5.10 にアップグレードします。

Doris

Doris をバージョン 1.2.7 にアップグレードします。

Celeborn

Celeborn をバージョン 0.3.1 にアップグレードします。

Paimon

Paimon をバージョン 0.6-ali-2 にアップグレードします。

ClickHouse

ClickHouse をバージョン 23.3.13.6 にアップグレードします。

EMR-5.14.x

リリース日

バージョン

日付

EMR-5.14.2

2023 年 8 月 17 日

更新

サービス

変更

Trino

  • Paimon コネクタが HDFS テーブルのクエリに失敗する問題を修正しました。

  • ワーカーの監視メトリックを読み取れない問題を修正しました。

Presto

  • バージョン 0.283 にアップグレードしました。

  • ワーカーの監視メトリックを読み取れない問題を修正しました。

ClickHouse

デフォルトで、デフォルトユーザーにすべての権限を付与します。

StarRocks

  • 以前の StarRocks バージョンを StarRocks2 に名前変更しました。

  • StarRocks3 を追加しました。バージョンは 3.1.2 です。デフォルトでは、クラスターはストレージとコンピューティングが結合されたモードで作成されます。ストレージとコンピューティングが分離されたモードはサポートされていません。

Celeborn

バージョン 0.3.0 にアップグレードしました。

EMR-5.13.x

リリース日

バージョン

日付

EMR-5.13.0

2023 年 8 月 3 日

更新

サービス

変更

Hudi

バージョン 0.13.1 にアップグレードしました。

Paimon

バージョン 0.5-ali-1 にアップグレードしました。

StarRocks

バージョン 2.5.8 にアップグレードしました。

JindoData

バージョン 4.6.11 にアップグレードしました。

Trino

  • バージョン 422 にアップグレードしました。

  • Hudi コネクタは、Merge On Read (MOR) テーブルのクエリをサポートします。

  • 動的 UDF 読み込みのエラーメッセージを改善しました。

EMR-5.12.x

リリース日

バージョン

日付

EMR-5.12.1

2023 年 7 月 13 日

EMR-5.12.0 (新規購入はサポートされていません)

2023 年 6 月 1 日

更新

EMR-5.12.1

サービス

変更

Spark

  • Spark History Server は、デフォルトでストレージに OSS-HDFS を使用することをサポートします。

  • Spark 3 ネイティブエンジンは、ストレージに OSS と OSS-HDFS を使用することをサポートします。

Hive

Hive ウェアハウスは、デフォルトでストレージに OSS-HDFS を使用することをサポートします。

OSS-HDFS

サービスを追加しました。

YARN

デフォルトでストレージに OSS-HDFS を使用することをサポートします。

HBase

  • HBase HFile データは、デフォルトでストレージに OSS-HDFS を使用することをサポートします。

  • HBase WAL ログは、ストレージに OSS-HDFS を使用することをサポートします。

EMR-5.12.0

サービス

変更

Kyuubi

バージョン 1.7.1 にアップグレードしました。

Celeborn

バージョン 0.2.2 にアップグレードしました。

Paimon

  • Flink-Table-Store は Paimon に名前変更されました。

  • バージョン 0.4-ali-1 にアップグレードしました。

StarRocks

バージョン 2.5.5 にアップグレードしました。

Doris

バージョン 1.2.4 にアップグレードしました。

ClickHouse

バージョン 23.3.2.37 にアップグレードしました。

Trino

監査ログを取得するために、デフォルトでシンプルなイベントリスナーを提供します。

Phoenix

Hive on Phoenix をサポートします。

EMR-5.11.x

リリース日

バージョン

日付

EMR-5.11.1

2023 年 4 月 3 日

EMR-5.11.0 (新規購入はサポートされていません)

2023 年 2 月 28 日

更新

EMR-5.11.1

サービス

変更

ClickHouse

バージョン 22.8.14.53 にアップグレードしました。

Trino

odps.properties コネクタを追加して、MaxCompute でのクエリをサポートします。

JindoData

バージョン 4.6.5 にアップグレードしました。

JindoSDK

バージョン 4.6.5 にアップグレードしました。

Flink-Table-Store

バージョン 0.3-ali-2 にアップグレードしました。

YARN

ノードラベル管理をサポートします。

EMR-5.11.0

サービス

変更

Iceberg

バージョン 1.1.0 にアップグレードしました。

Hudi

  • バージョン 0.12.2 にアップグレードしました。

  • CDC をサポートします。

DeltaLake

  • バージョン 2.2.0 にアップグレードしました。

  • トランザクションログでの Vacuum 操作の記録をサポートします。

Kudu

バージョン 1.16.0 にアップグレードしました。

Clickhouse

ClickHouse サービスをインストールする際には、ZooKeeper サービスを選択する必要があります。

Celeborn

  • RSS は Celeborn に名前変更されました。

  • Celeborn のバージョンは 0.2.0 です。

Presto

サービスを追加しました。カーネルはコミュニティ Facebook PrestoDB 0.278.3 です。デフォルトの HTTP ポートは 8889、デフォルトの HTTPS ポートは 7779 です。

StarRocks

バージョン 2.5.1 にアップグレードしました。

Doris

バージョン 1.2.1 にアップグレードしました。

Kafka-Manager

バージョン 3.0.0.6 にアップグレードしました。

Impala

バージョン 4.2.0 にアップグレードしました。

OpenLDAP

バージョン 2.4.46 にアップグレードしました。

HBase

  • JDK 11 をサポートします。

  • ThriftServer2 をサポートします。

  • hbase.block.data.cachecompressed パラメーターのデフォルト値が true に変更されました。

Flink-Table-Store

サービスを追加しました。バージョンはコミュニティバージョン 0.3 に基づいています。

JindoData

バージョン 4.6.4 にアップグレードしました。

EMR-5.10.x

リリース日

EMR-5.10.0 2022 年 12 月 1 日

更新

サービス

変更

Iceberg

バージョン 0.14.1 にアップグレードしました。

Flink

Flink 1.15-vvr-6.0.2 にアップグレードしました。これはコミュニティ Flink 1.15 メジャーバージョンに対応しています。

Kafka

  • LDAP ユーザーのログイン認証と権限付与をサポートします。

  • ユーザーグループの権限付与をサポートします。

Trino

  • EMR Presto は、公式のコミュニティ名である Trino に名前が変更されました。

  • Ranger と DLF AUTH をサポートします。

  • ワンクリック LDAP 有効化後にワーカーノードへの接続が失敗する問題を修正しました。

JindoSDK

バージョン 4.6.2 にアップグレードしました。

JindoData

バージョン 4.6.2 にアップグレードしました。

HBase

  • Ranger をサポートします。

  • サービス追加時にストレージモードとして OSS-HDFS を選択できない問題を修正しました。

YARN

高セキュリティモードでは、ACL がデフォルトで有効になります。

Starrocks

バージョン 2.4.1 にアップグレードしました。

Doris

バージョン 1.1.5 にアップグレードしました。

Hudi

コンソールは hudi-defaults.conf の設定をサポートします。

Ranger

  • バージョン 2.3.0 にアップグレードしました。

  • Trino、YARN、HBase、Kafka との統合をサポートします。

DLF-Auth

  • バージョン 2.0.2 にアップグレードしました。

  • Trino と Impala をサポートします。

OpenLDAP

Nslcd コンポーネントと統合します。

Kudu

Kudu Tserver は Task ノードグループにインストールできなくなりました。

Spark

バージョン 3.3.1 にアップグレードしました。

Tez

バージョン 0.10.2 にアップグレードしました。

Kyuubi

バージョン 1.6.0 にアップグレードしました。

EMR-5.9.x

リリース日

バージョン

日付

EMR-5.9.1

2022 年 11 月 8 日

EMR-5.9.0 (新規購入はサポートされていません)

2022 年 10 月 14 日

更新

EMR-5.9.1

サービス

変更

Kerberos

EMR 上の外部 KDC への接続をサポートします。

Kafka

ユーザーがサービスの起動パラメーターをカスタマイズできる起動コマンド用の設定項目を追加します。

JindoData

  • バージョン 4.6.0 にアップグレードしました。

  • OSS-HDFS アクセスパスの書き換えをサポートします。

Flink

バージョン 1.13_vvr_4.0.15 にアップグレードしました。

RSS

バージョン 0.1.4 にアップグレードしました。

EMR-5.9.0

サービス

変更

Spark

  • バージョン 3.3 にアップグレードしました。

  • Kerberos 認証の有効化をサポートします。

Hudi

  • バージョン 0.12.0 にアップグレードしました。

  • Spark 3.3 をサポートします。

  • クラウドベースの MetaStore を使用してメタデータをホストし、アクセラレーション機能を有効にすることをサポートします。詳細については、「Hudi MetaStore の使用方法」をご参照ください。

Flink

  • Kerberos 認証の有効化をサポートします。

  • Data Lake Formation (DLF) との自動接続をサポートします。

Iceberg

  • バージョン 0.14.0 にアップグレードしました。

  • Spark 3.3 をサポートします。

  • Kerberos 認証の有効化をサポートします。

JindoData

  • バージョン 4.5.1 にアップグレードしました。

  • Alibaba Cloud リソースへの AccessKey なしのアクセスをサポートします。

Hadoop-Common and HDFS

  • Kerberos 認証の有効化をサポートします。

  • セキュリティ脆弱性 CVE-2022-25168 を修正しました。

Knox

Ranger と統合します。[アクセスリンクとポート] タブから Ranger UI にアクセスできます。

HBase

  • バージョン 2.4.9 にアップグレードしました。

  • Kerberos 認証の有効化をサポートします。

  • グループ構成をサポートします。

RSS

  • バージョン 0.1.2 にアップグレードしました。

  • Kerberos 認証の有効化をサポートします。

Doris

  • バージョン 1.1.2 にアップグレードしました。

  • Kerberos 認証の有効化をサポートします。

StarRocks

  • バージョン 2.3.2 にアップグレードしました。

  • Kerberos 認証の有効化をサポートします。

Kafka

  • バージョン 2.13_3.2.1 にアップグレードしました。

  • Kerberos 認証の有効化をサポートします。

DeltaLake

  • バージョン 2.1.0 へのアップグレードをサポートします。

  • Spark 3.3 をサポートします。

  • Kerberos 認証の有効化をサポートします。

Impala

  • DLF でのビューの作成をサポートします。

  • Kerberos 認証の有効化をサポートします。

Kudu

コンポーネントを追加しました。バージョンは 1.14.0 です。

YARN, Ranger, Hive, Kyuubi, Tez, Zookeeper, DLF-Auth, Phoenix, Sqoop, and Presto

Kerberos 認証の有効化をサポートします。

EMR-5.8.x

リリース日

EMR-5.8.0 2022 年 8 月 5 日

更新

サービス

変更

Spark

LDAP とのワンクリック統合をサポートします。

Hive

LDAP とのワンクリック統合をサポートします。

Presto

  • コミュニティバージョン 389 にアップグレードしました。

    コミュニティが提供するスタンドアロンの Delta Lake および Hudi コネクタを使用します。

    • このバージョンの Delta Lake コネクタは、Time Travel と Z-Order をサポートしていません。

    • このバージョンの Hudi コネクタは、MOR テーブルのクエリをサポートしていません。

  • LDAP とのワンクリック統合をサポートします。

DeltaLake

  • 自動化されたレイクテーブル管理のために DLF と統合されています。

  • CTAS シナリオでパーティション情報を自動的に同期できない問題を修正しました。

  • optimize および vacuum コマンドは、メトリック情報の返却をサポートします。

Hudi

バージョン 0.11.1 にアップグレードしました。

HadoopCommon

コンポーネントを追加しました。これにより、HDFS、YARN、JindoSDK の構成が互いに上書きされる問題が解決されます。

YARN

エラスティックスケーリング機能を強化します。

Ranger

  • Spark 2 と Spark 3 の両方をサポートします。

  • Ranger Usersync は LDAP とのワンクリック統合をサポートします。

Kafka

コンポーネントを追加しました。バージョンは 2.12-2.4.1 です。

HBase

コンポーネントを追加しました。バージョンは 2.3.4 です。

Phoenix

コンポーネントを追加しました。バージョンは 5.1.2 です。

Doris

バージョン 1.1.1 にアップグレードしました。

StarRocks

  • バージョン 2.3.0 にアップグレードしました。

  • プライマリキーモデルは、完全な DELETE WHERE 構文と、メモリ使用量を削減するためのプライマリキーインデックスの永続化をサポートします。

ClickHouse

  • バージョン 22.3.8.39 にアップグレードしました。

  • OSS から大きなファイルを読み取る際のメモリ不足の問題を修正しました。

EMR-5.6.x

リリース日

EMR-5.6.0 2022 年 4 月 21 日

更新

サービス

変更

JindoData

コンポーネントを追加しました。バージョンは 4.3.0 です。

JindoSDK

バージョン 4.3.0 にアップグレードしました。

Spark

バージョン 3.2.1 にアップグレードしました。

Hive

Tez で Speculation を有効にした後、コミットが繰り返されるバグを修正しました。

Presto

初期化済みの Hadoop クラスターに Presto サービスを追加した後、サービスが起動に失敗するバグを修正しました。

DeltaLake

DML はサブクエリをサポートします。

Hudi

バージョン 0.10.1 にアップグレードしました。

Iceberg

バージョン 0.13.1 にアップグレードしました。

YARN

ApplicationMasters (AM) が CORE グループノードでのみ実行されるように制限する機能構成を追加します。

HBase

HBase 2.3.4 カーネルのバグを修正しました。

Zookeeper

JVM パラメーター構成を最適化しました。

Impala

JindoSDK 4.3.0 に対応しました。

Sqoop

PostgreSQL のバージョンをアップグレードしました。

Zeppelin

JDBC Interpreter が起動に失敗する問題を修正しました。

Ranger

Ranger 1.2.0 Spark プラグインは Delta と Hudi をサポートします。

Flume

JindoSDK 4.3.0 に対応しました。

Oozie

Log4j をバージョン 2.17.2 にアップグレードしました。

DLF-Auth

バージョン 2.0.0 にアップグレードしました。

EMR-5.5.x

リリース日

バージョン

日付

EMR-5.5.1

2022 年 3 月 25 日

EMR-5.5.0 (新規購入はサポートされていません)

2022 年 2 月 15 日

更新

EMR-5.5.1

説明

新しいコンソール の OLAP クラスターのみがこのバージョンをサポートします。

サービス

変更

Clickhouse

一部のパラメーターのデフォルト値を変更しました。

StarRocks

バージョン 2.1.1 にアップグレードしました。

EMR-5.5.0

サービス

変更

SmartData

コンポーネントはオフラインです。

BIGBOOT

RSS

  • ESS サービスを RSS にアップグレードします。

  • サービスの機能と安定性を強化します。

JindoSDK

  • アーキテクチャを JindoData にアップグレードします。

  • EMR は初めて JindoSDK 4.0 と統合され、OSS や OSS-HDFS などのサービスをサポートします。

Spark

  • COUNT DISTINCT 関数は IF 文をサポートし、CASE WHEN の使用を最適化します。

    spark.sql.optimizer.rewriteConditionalDistinctAggregates パラメーターを true に設定します。

  • Shuffle Hash Join は Sort Merge Join へのフォールバックをサポートします。

    spark.sql.join.preferSortMergeJoin パラメーターを false に設定し、spark.sql.join.enableShuffledHashJoinFallback パラメーターを true に設定します。

  • 非動的パーティションの小規模ファイルの自動マージをサポートします。

    spark.sql.adaptive.merge.output.small.files.enabled パラメーターを true に設定します。

  • GroupingSet や Distinct などのシナリオでは、同時実行性が自動的に調整されます。

    spark.sql.execution.optimizeExpand パラメーターを true に設定します。

  • Hive on Spark を最適化します。

  • Time Travel 構文をサポートします。

  • JindoSDK に対応しました。

Tez

JindoSDK に対応しました。

Hive

  • Hive Jindo のバッチ削除を最適化します。

  • HiveServer2 の OOM 問題を最適化します。

  • Hive on Spark を最適化します。

  • JindoSDK に対応しました。

Presto

  • Presto をコミュニティバージョン 358 にアップグレードしました。

  • デフォルトで MySQL、Iceberg、Hudi、Phoenix、Kudu、Delta コネクタを追加し、デフォルト構成を更新します。

  • データレイク分析をサポートします。

  • 動的 UDF 読み込みをサポートします。

  • JindoSDK に対応しました。

Delta Lake

  • バージョンアップ

    • バージョン 1.1.0 にアップグレードしました。これは Spark 3.2.0 と互換性があります。

    • すべての商用機能はバージョン 1.1.0 に移行されました。

  • メタデータ管理

    • メタストアへのメタデータ変更の同期を最適化します。

    • テーブル統計 (dataProfiling) をメタストアに自動的にレポートします。

  • SQL

    • Time Travel 構文をサポートします。

    • DropPartition SQL 構文をサポートします。

    • SQL を使用した動的パーティションの上書きをサポートします。

    • 指定された位置 (FIRST および AFTER) での ADD COLUMN 操作をサポートします。

  • テーブル管理の強化

    • デフォルトで、テーブルサイズに基づいてファイルサイズを動的に調整することをサポートし、有効にします。

    • デフォルトで自動 Vacuum をサポートし、有効にします。同時 Vacuum もサポートされています。

    • 自動コンパクションのロジックを最適化します。この機能はデフォルトで無効になっています。

    • Z-order 構文を追加し、Z-order プロセスを高速化します。

Hudi

  • バージョン 0.10.0 にアップグレードしました。

  • Spark 3.2.0 をサポートします。

  • JindoFS ブロックモードをサポートします。

HDFS

JindoSDK に対応しました。

YARN

  • RSS メモリ構成に対応しました。

  • JindoSDK に対応しました。

Flume

JindoSDK に対応しました。

Impala

JindoSDK に対応しました。

Ranger

  • Spark 3.2.0 をサポートします。

  • Presto 358 をサポートします。

HBase

  • デフォルトパラメーターに関する問題を修正しました。

  • GC ログの日付形式に関する問題を修正しました。

Clickhouse

Iceberg

  • バージョン 0.13.0 にアップグレードしました。

  • Presto 358 をサポートします。

DLF-Auth

  • Spark 3.2.0 をサポートします。

  • Presto 358 をサポートします。

EMR-5.4.x

リリース日

バージョン

日付

EMR-5.4.3

2021 年 12 月

EMR-5.4.2 (新規購入はサポートされていません)

2021 年 12 月

EMR-5.4.1 (新規購入はサポートされていません)

2021 年 11 月

EMR-5.4.0 (新規購入はサポートされていません)

2021 年 10 月

更新

EMR-5.4.3

このリリースでは、関連するすべてのコンポーネントの Log4j セキュリティ脆弱性を修正します。詳細については、「脆弱性に関するお知らせ | Apache Log4j2 の任意コード実行の脆弱性」をご参照ください。

サービス

変更

Presto

Elasticsearch コネクタの Log4j 脆弱性を修正しました。

DLF Metastore

  • Metastore ログのデフォルト設定を有効から無効に変更しました。

  • Metastore gettablestats の URI が長すぎるために発生するエラーを修正しました。

Delta Lake

Metastore へのスキーマ変更の同期に関する問題を修正しました。

Sqoop

Sqoop が HCatalog テーブルをインポートする際に Decimal 型の精度が失われる問題を修正しました。

EMR-5.4.2

サービス

変更

SmartData

  • SmartData は 3.8.0 に更新されました。詳細については、「SmartData 3.8.X の概要」をご参照ください。

  • Kerberos と Ranger に基づく認証と権限付与を使用して、OSS 内のデータの権限を管理できます。

EMR-5.4.1

サービス

変更

SmartData

SmartData をバージョン 3.7.3 にアップグレードしました。詳細については、「SmartData 3.7.x の概要」をご参照ください。

Oozie

HA 環境での JAR パッケージの競合により Oozie の Jetty サーバーが起動に失敗する問題を修正しました。

Impala

DLF メタデータテーブルをクエリする際に発生する no such method error を修正しました。

DLF-Auth

DLF-Auth をバージョン 1.0.1 にアップグレードしました。

EMR-5.4.0

サービス

変更

SmartData

SmartData をバージョン 3.7.2 にアップグレードしました。詳細については、「SmartData 3.7.x の概要」をご参照ください。

Spark

  • Spark をバージョン 3.1.2 にアップグレードします。

  • Spark 3.x では、Spark SQL の Distinct 計算パフォーマンスが最適化されます。この最適化機能は、集約オペレーターに複数の count(distinct case ... when ...) メソッドが含まれている場合にトリガーされます。

  • Adaptive Query Execution (AQE) に必要な統計情報の一部が欠落している場合に返される範囲外の配列インデックスエラーが修正されます。

  • 特定のシナリオにおける AQE とデータキャッシングに関連するエラーが修正されます。

Hive

JindoFS (Block) 上の Hive では、バッチメタデータ最適化機能がサポートされています。この機能はデフォルトで無効になっています。

Presto

Delta テーブルは StorageHandler クエリをサポートします。

DeltaLake

  • DeltaLake をバージョン 1.0.0 にアップグレードします。

  • Hive 2 と Hive 3 用の delta-connectors を統合します。

  • delta-connectors が多階層パーティションテーブルをクエリするときに発生するエラーを修正します。

  • DataSkipping、Optimize、Zorder などの複数の特徴の SQL 構文をサポートします。

  • MetaStore へのメタデータの同期をサポートします。

Hudi

  • Hudi が 0.9.0 に更新されました。

  • Delta Lake と Hudi 間の sql.extension の互換性に関する問題が修正されました。

説明

Spark 3.1.2 をサポートします。

HDFS

NameNode の予約容量のデフォルトパラメーターが自動的に増加され、ディスク領域が不足した際に NameNode が速やかにセーフモードに入るようになります。

Storm

コンポーネントはオフラインです。

Zeppelin

Zeppelin をコミュニティバージョン 0.10.0 にアップグレードします。

Hue

  • YARN Job Browser で、場合によってジョブの表示または停止に失敗する不具合を修正。

  • デフォルトの構成で YARN Job Browser を有効化。

  • デフォルトの構成で Presto プロトコルをサポート。

Druid

次の問題が修正されました。サーバーが予期せずシャットダウンされた後、PID ファイルが削除されないために、関連するノードの再起動に失敗します。

ClickHouse

  • デフォルト構成を更新します。

  • クラスターのスケールアウトをサポートします。

  • MetaChecker 機能をサポートします。

  • OSS テーブルエンジンと OSS テーブル関数によるデータの読み取りをサポートします。

Iceberg

  • Iceberg をバージョン 0.12.0-1.0.1 にアップグレードします。

  • Hive Runtime の依存関係に関するエラーを修正します。

Knox

Spark UI への最初のアクセスが失敗する問題が修正されました。

DLF-Auth

サービスが追加されます。

Hive または Spark を使用して DLF にアクセスするための権限を設定できます。サービスバージョンは 1.0.0 です。

EMR-5.3.x

リリース日

バージョン

日付

EMR-5.3.1

2021 年 9 月

EMR-5.3.0 (新規購入はサポートされていません)

2021 年 8 月

更新

EMR-5.3.1

サービス

変更

SmartData

SmartData をバージョン 3.7.1 にアップグレードしました。

Hue

高セキュリティクラスターで Impala を使用できない問題を修正しました。

Kudu

Kerberos のサポートを追加しました。

HBase

  • 高セキュリティクラスターで HBase を再起動すると時間がかかりすぎる問題を修正しました。

  • Spark 3.1.1 と HBase の統合が失敗する問題を修正しました。

  • グレースフルストッププロセスを最適化しました。

EMR-5.3.0

サービス

変更

SmartData

SmartData をバージョン 3.7.0 にアップグレードしました。

Spark

Delta Lake との互換性の問題を修正しました。

Hive

JindoFS (ブロックモード) 上の Hive が、バッチメタデータ最適化機能をサポートするようになりました。

この機能はデフォルトで無効になっています。

DeltaLake

  • DeltaLake パーティション機能のサポートを追加しました。

  • desc detail コマンドと Spark バージョン 3.1.1 との間の互換性の問題を修正しました。

YARN

  • ノードの Containers REST API に appId、CPU、およびメモリのリソース使用量情報を追加しました。

  • リリースされた Auto Scaling ノード上の ApplicationMaster (AM) ログを表示できない問題を修正しました。

  • State Store 内の既存データが原因でクラスターが利用できなくなる問題を修正しました。

  • Auto Scaling によってデコミッションされた後にリリースされたノードをクリーンアップするサポートを追加しました。

  • Auto Scaling のグレースフルデコミッションロジックを改善しました。NodeManager (NM) プロセスが終了した後にのみ、ノードがオフラインとしてマークされるようになりました。

Zookeeper

コミュニティバージョン 3.6.3 にアップグレードしました。

Flink

  • SmartData コンポーネントを追加しました。

  • Secure Shell (SSH) を使用して DataFlow-Flink クラスターにタスクを送信する際に、OSS へのパスワードなしのアクセスができない問題を修正しました。

Impala

OSS パーティションディレクトリを直接削除すると、ディレクトリリストのループが発生する問題を修正しました。

Hue

Hue を Oozie と統合したときに発生するユーザーインターフェース (UI) の表示問題を修正しました。

Kudu

コミュニティバージョン 1.14.0 にアップグレードしました。

Clickhouse

コンポーネントのバージョンは 21.3.13.9 です。

Iceberg

Iceberg コンポーネントを追加しました。コンポーネントのバージョンは 0.12.0 です。

EMR-5.2.x

リリース日

EMR-5.2.1 2021年7月16日

新機能

サービス

変更

SmartData

SmartData をバージョン 3.6.1 にアップグレードしました。 詳細については、「SmartData 3.6.x の概要」をご参照ください。

Hive

  • Data Lake Formation (DLF) メタデータが使用された場合に show create table コマンドが不正な結果を返す問題を修正しました。

  • ジョブのパフォーマンスを向上させるために、デフォルトの Hive パラメーターを最適化しました。

  • 使いやすさのために、E-MapReduce コンソールの Hive サービスの [設定] ページにある [hive-env] タブの設定項目の名前を大文字に変更しました。

  • ユーザー定義関数 (UDF) が原因で発生した HiveServer2 のメモリリークを修正しました。

  • ファイルシステムと MetaStore に不整合がある場合に Hive テーブルにデータを書き込むときに表示されるエラーメッセージを改善しました。

HDFS

Zstandard (ZSTD) 圧縮フォーマットのサポートを追加しました。

Delta Lake

  • Delta Lake をバージョン 0.8.0 にアップグレードしました。

  • Spark 3 のサポートを追加しました。

Flink

Flink をバージョン 1.12-vvr-3.0.2 にアップグレードしました。

Hudi

  • Hudi をバージョン 0.8.0 にアップグレードしました。

  • Spark SQL との統合のサポートを追加しました。

Spark

重要

EMR-5.2.1 の Spark 3.1.1 は Kudu 1.11.1 と互換性がありません。

  • Delta Lake および Hudi データレイクフォーマットのサポートを追加しました。

  • Remote Shuffle Service のサポートを追加しました。

  • Livy のサポートを追加しました。

  • E-MapReduce コンソールの Spark サービスの [設定] ページにある [spark-defaults] タブの設定項目の名前を最適化しました。

  • コストベース最適化 (CBO)、動的パーティションプルーニング (DPP)、Z-Order などの特徴を最適化しました。 オープンソースの Spark 3 バージョンと比較して、パフォーマンスが 50% 向上しました。

  • Alibaba Cloud Log Service、DataHub、Message Queue for Apache RocketMQ (ONS) などのデータソースのサポートを追加しました。

Tez

ジョブのパフォーマンスを向上させるために、デフォルトの Tez パラメーターを最適化しました。

Ranger

  • Ranger が有効化されたときに発生した Spark ログの警告エラーを修正しました。

  • LDAP への接続後に自動ユーザー同期が失敗する問題を修正しました。

Knox

  • Kudu コンポーネントのサポートを追加しました。

  • Hbase コンポーネントのサポートを追加しました。

Kafka

  • Kafka クラスターにバランシング機能を提供するために、Cruise Control コンポーネントのサポートを追加しました。

  • Kafka ディスクのホットスワップ機能を導入しました。 ブローカーを停止または開始することなく、故障したディスクを交換できます。

  • 一部のパラメーターのデフォルト値を変更しました。

Phoenix

Hive および Spark SQL を使用して Phoenix テーブルにアクセスしたときに「JDBC Driver not found」エラーが報告される問題を修正しました。

ESS (EMR Remote Shuffle Service)

Spark 3 のサポートを追加しました。