すべてのプロダクト
Search
ドキュメントセンター

E-MapReduce:EMR 3.x シリーズのリリースノート

最終更新日:Nov 09, 2025

このトピックでは、EMR 3.x シリーズのリリース日と更新内容について説明します。各バージョンでサポートされているコンポーネントの詳細については、「リリースバージョン」をご参照ください。

EMR 3.55.x

リリース日

バージョン

日付

EMR-3.55.0

2025年10月27日

更新内容

サービス

変更

Ranger

  • Jindoauth Server は、クライアントユーザーが OSS にアクセスするためのカスタム RAM ロールをサポートします。

  • Ranger-yarn-plugin の依存関係の欠落を修正しました。

Paimon

バージョン 1-ali-16.3 にアップグレードしました。

JindoCache

バージョン 6.10.1 にアップグレードしました。

リリースバージョン情報

DataLake クラスター

サービス

バージョン

Hadoop-Common

2.8.5

HDFS

2.8.5

OSS-HDFS

1.0.0

Hive

2.3.9

Spark2

2.4.8

Spark3

3.4.2

YARN

2.8.5

Trino

422

DeltaLake

3.0.0

Hudi

0.15.0

Iceberg

1.5.0

Flume

1.11.0

Kyuubi

1.9.2

Tez

0.10.2

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

Sqoop

1.4.7

DLF-Auth

2.0.2

Presto

0.283

Zookeeper

3.8.4

Knox

1.5.0

Celeborn

0.5.2

JindoCache

6.10.1

Paimon

1-ali-16.3

OLAP クラスター

サービス

バージョン

StarRocks2

2.5.22

StarRocks3

3.2.11

Doris

2.1.4

ClickHouse

23.8.2.7

Zookeeper

3.8.4

DataFlow クラスター

サービス

バージョン

Hadoop-Common

2.8.5

HDFS

2.8.5

OSS-HDFS

1.0.0

YARN

2.8.5

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

Zookeeper

3.8.4

Knox

1.5.0

Flink

1.17.2

Paimon

1-ali-6.2

DataServing クラスター

サービス

バージョン

Hadoop-Common

2.8.5

HDFS

2.8.5

OSS-HDFS

1.0.0

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

Zookeeper

3.8.4

Knox

1.5.0

HBase

1.7.1

JindoCache

6.8.2

Phoenix

4.16.1

カスタムクラスター

サービス

バージョン

Hadoop-Common

2.8.5

HDFS

2.8.5

OSS-HDFS

1.0.0

Hive

2.3.9

Spark2

2.4.8

Spark3

3.4.2

YARN

2.8.5

Trino

422

DeltaLake

3.0.0

Hudi

0.15.0

Iceberg

1.5.0

Flume

1.11.0

Kyuubi

1.9.2

Tez

0.10.2

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

Sqoop

1.4.7

DLF-Auth

2.0.2

Presto

0.283

StarRocks2

2.5.22

StarRocks3

3.2.11

Zookeeper

3.8.4

Knox

1.5.0

Celeborn

0.5.2

Flink

1.17.2

HBase

1.7.1

JindoCache

6.10.1

Paimon

1-ali-16.3

Phoenix

4.16.1

EMR 3.54.x

リリース日

バージョン

日付

EMR-3.54.0

2025 年 7 月 10 日

更新内容

サービス

変更

Hive

いくつかの既知のバグを修正しました。

Tez

パフォーマンスと安定性を向上させるためにコミュニティのバグを修正しました。

リリースバージョン情報

DataLake クラスター

サービス

バージョン

Hadoop-Common

2.8.5

HDFS

2.8.5

OSS-HDFS

1.0.0

Hive

2.3.9

Spark2

2.4.8

Spark3

3.4.2

YARN

2.8.5

Trino

422

DeltaLake

3.0.0

Hudi

0.15.0

Iceberg

1.5.0

Flume

1.11.0

Kyuubi

1.9.2

Tez

0.10.2

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

Sqoop

1.4.7

DLF-Auth

2.0.2

Presto

0.283

Zookeeper

3.8.4

Knox

1.5.0

Celeborn

0.5.2

JindoCache

6.8.2

Paimon

1-ali-6.2

OLAP クラスター

サービス

バージョン

StarRocks2

2.5.22

StarRocks3

3.2.11

Doris

2.1.4

ClickHouse

23.8.2.7

Zookeeper

3.8.4

DataFlow クラスター

サービス

バージョン

Hadoop-Common

2.8.5

HDFS

2.8.5

OSS-HDFS

1.0.0

YARN

2.8.5

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

Zookeeper

3.8.4

Knox

1.5.0

Flink

1.17.2

Paimon

1-ali-6.2

DataServing クラスター

サービス

バージョン

Hadoop-Common

2.8.5

HDFS

2.8.5

OSS-HDFS

1.0.0

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

Zookeeper

3.8.4

Knox

1.5.0

HBase

1.7.1

JindoCache

6.8.2

Phoenix

4.16.1

カスタムクラスター

サービス

バージョン

Hadoop-Common

2.8.5

HDFS

2.8.5

OSS-HDFS

1.0.0

Hive

2.3.9

Spark2

2.4.8

Spark3

3.4.2

YARN

2.8.5

Trino

422

DeltaLake

3.0.0

Hudi

0.15.0

Iceberg

1.5.0

Flume

1.11.0

Kyuubi

1.9.2

Tez

0.10.2

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

Sqoop

1.4.7

DLF-Auth

2.0.2

Presto

0.283

StarRocks2

2.5.22

StarRocks3

3.2.11

Zookeeper

3.8.4

Knox

1.5.0

Celeborn

0.5.2

Flink

1.17.2

HBase

1.7.1

JindoCache

6.8.2

Paimon

1-ali-6.2

Phoenix

4.16.1

EMR 3.53.x

リリース日

バージョン

日付

EMR-3.53.0

2025 年 4 月 24 日

更新内容

サービス

変更

Trino

LDAP が利用できない問題を修正しました。

YARN

オープンソースのバグ (YARN-10213、YARN-6207、および YARN-9339) を修正しました。

StarRocks

ストレージと計算リソースが分離されたクラスターの作成をサポートします。

JindoCache

バージョン 6.8.2 にアップグレードしました。

EMRHOOK

安定性を向上させました。

リリースバージョン情報

DataLake クラスター

サービス

バージョン

Hadoop-Common

2.8.5

HDFS

2.8.5

OSS-HDFS

1.0.0

Hive

2.3.9

Spark2

2.4.8

Spark3

3.4.2

YARN

2.8.5

Trino

422

DeltaLake

3.0.0

Hudi

0.15.0

Iceberg

1.5.0

Flume

1.11.0

Kyuubi

1.9.2

Tez

0.10.2

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

Sqoop

1.4.7

DLF-Auth

2.0.2

Presto

0.283

Zookeeper

3.8.4

Knox

1.5.0

Celeborn

0.5.2

JindoCache

6.8.2

Paimon

1-ali-6.2

OLAP クラスター

サービス

バージョン

StarRocks2

2.5.22

StarRocks3

3.2.11

Doris

2.1.4

ClickHouse

23.8.2.7

Zookeeper

3.8.4

DataFlow クラスター

サービス

バージョン

Hadoop-Common

2.8.5

HDFS

2.8.5

OSS-HDFS

1.0.0

YARN

2.8.5

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

Zookeeper

3.8.4

Knox

1.5.0

Flink

1.17.2

Paimon

1-ali-6.2

DataServing クラスター

サービス

バージョン

Hadoop-Common

2.8.5

HDFS

2.8.5

OSS-HDFS

1.0.0

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

Zookeeper

3.8.4

Knox

1.5.0

HBase

1.7.1

JindoCache

6.8.2

Phoenix

4.16.1

カスタムクラスター

サービス

バージョン

Hadoop-Common

2.8.5

HDFS

2.8.5

OSS-HDFS

1.0.0

Hive

2.3.9

Spark2

2.4.8

Spark3

3.4.2

YARN

2.8.5

Trino

422

DeltaLake

3.0.0

Hudi

0.15.0

Iceberg

1.5.0

Flume

1.11.0

Kyuubi

1.9.2

Tez

0.10.2

OpenLDAP

2.4.46

Ranger

2.3.0

Ranger-plugin

1.0.0

Sqoop

1.4.7

DLF-Auth

2.0.2

Presto

0.283

StarRocks2

2.5.22

StarRocks3

3.2.11

Zookeeper

3.8.4

Knox

1.5.0

Celeborn

0.5.2

Flink

1.17.2

HBase

1.7.1

JindoCache

6.8.2

Paimon

1-ali-6.2

Phoenix

4.16.1

EMR 3.52.x

リリース日

バージョン

日付

EMR-3.52.1

2024 年 12 月 18 日

EMR-3.52.0 (新規購入はサポートされていません)

2024 年 12 月 4 日

更新内容

サービス

変更

Spark

  • スケールアウト中に発生した構成の問題を修正しました。

  • Kerberos クラスターで SASL 接続が時々失敗する問題を修正しました。

Hive

スケールアウト中に発生した構成の問題を修正しました。

Trino

LDAP を有効にした後に接続が失敗する問題を解決しました。

Presto

Zookeeper

カスタム構成の追加をサポートします。

Ranger

既存の Spark 3 Ranger プラグインを、オープンソースの Kyuubi プロジェクトによって提供されるバージョンに置き換えました。

Hudi

バージョン 0.15.0 にアップグレードしました。

Celeborn

バージョン 0.5.2 にアップグレードしました。

JindoCache

バージョン 6.5.3 にアップグレードしました。

StarRocks3

バージョン 3.2.11 にアップグレードしました。

Kyuubi

バージョン 1.9.2 にアップグレードしました。

StarRocks2

バージョン 2.5.22 にアップグレードしました。

Impala

このサービスは利用できません。代替として推奨サービスを使用するか、対応するサービスを手動でインストールできます。

Impala は Presto、Trino、ClickHouse、または StarRocks に置き換えることができます。

Kudu

Kafka

Kafka-Manager

EMR 3.51.x

リリース日

バージョン

日付

EMR-3.51.4

2024 年 12 月 18 日

EMR-3.51.3 (新規購入はサポートされていません)

2024 年 11 月 29 日

EMR-3.51.2 (新規購入はサポートされていません)

2024 年 8 月 29 日

EMR-3.51.1 (新規購入はサポートされていません)

2024 年 6 月 21 日

EMR-3.51.0 (新規購入はサポートされていません)

2024 年 4 月 23 日

更新内容

EMR-3.51.4

サービス

変更

JindoCache

バージョン 6.5.3 にアップグレードしました。

StarRocks2

バージョン 2.5.22 にアップグレードしました。

StarRocks3

バージョン 3.2.11 にアップグレードしました。

EMR-3.51.3

サービス

説明

JindoSDK

JindoSDK が更新され、デッドロックを引き起こす問題が解決されました。

EMR-3.51.2

サービス

説明

JindoCache

  • JindoCache が 6.5.1 に更新されました。

  • 分散ハッシュテーブルからのデータ読み取りおよびデータ書き込みのパフォーマンスが向上しました。

Spark

  • パーティションディレクトリを削除できない問題が修正されました。

  • Hive パッケージの依存関係に関する問題が修正されました。これにより、Spark と Metastore クライアント間の接続が中断されないことが保証されます。

Trino

  • スケールアウト中に変更された一部の構成が予期せず元の構成に復元されることがある問題が修正されました。

  • 高セキュリティクラスターにデプロイされている OSS-HDFS サービス内のデータをクエリできます。

  • DLF-Auth を有効にした後、Trino で例外が発生する問題が修正されました。

Presto

高セキュリティクラスターにインストールされている OSS-HDFS サービス内のデータをクエリできます。

HDFS

NameNode と DataNode のメモリサイズを変更できない問題が修正されました。

HBase-HDFS

YARN

  • ResourceManager は一度に複数のタイムラインイベントを送信できるため、処理能力が向上します。

  • ResourceManager のコンテナーとリソースの処理におけるロジックの問題が修正されました。

ZooKeeper

  • ノードグループのメモリ構成を変更できない問題が修正されました。

  • ログ構成ファイルを再構築できます。

Impala

自動スケーリングアクティビティ中にクライアント構成が予期せず変更される問題が修正されました。

Ranger

最新バージョンの JindoSDK がサポートされ、CPU 負荷が効果的に削減されます。

Knox

次の問題が修正されました: クラスターに Master Extend ノードグループが 1 つしかない場合、Knox の URL にアクセスできません。

Kafka

次の問題が修正されました: Kafka Connect がデプロイされている EMR クラスターを起動できません。

StarRocks

スケールアウト後に追加された BE ノードが表示されない問題が修正されました。

Doris

Doris が 2.1.4 に更新されました。

Paimon

Paimon が 0.9-ali-7 に更新されました。

EMR-HOOK

MaxCompute テーブルの系列情報を解析できます。

EMR-3.51.1

サービス

変更

Spark

Master-Extend ノードグループのデプロイをサポートします。

Hive

Kyuubi

Paimon

Flink の依存関係を VVR バージョンからコミュニティバージョンに置き換え、DLF カタログのサポートを追加しました。

Knox

JDK 8 を使用してパッケージ化されました。

Flink

EMR-3.51.0 で削除された DLF 構成と依存関係を復元しました。

EMR-3.51.0

サービス

変更

Spark

Spark3 をバージョン 3.4.2 にアップグレードしました。

Celeborn

バージョン 0.4.0 にアップグレードしました。

Doris

バージョン 2.1.0 にアップグレードしました。

StarRocks

  • StarRocks2 をバージョン 2.5.18 にアップグレードしました。

  • StarRocks3 をバージョン 3.2.4 にアップグレードしました。

DeltaLake

バージョン 3.0.0 にアップグレードしました。

Iceberg

バージョン 1.5.0 にアップグレードしました。

Zookeeper

バージョン 3.8.4 にアップグレードしました。

JindoCache

バージョン 6.2.5 にアップグレードしました。

Flink

バージョン 1.17.2 にアップグレードしました。

EMR 3.50.x

リリース日

バージョン

日付

EMR-3.50.0

2024 年 2 月 19 日

更新内容

サービス

変更

Hudi

バージョン 0.14.0 にアップグレードしました。

Flume

バージョン 1.11.0 にアップグレードしました。

Kyuubi

バージョン 1.7.3 にアップグレードしました。

Impala

バージョン 4.3.0 にアップグレードしました。

Celeborn

バージョン 0.3.2 にアップグレードしました。

JindoCache

バージョン 6.2.0 にアップグレードしました。

Paimon

バージョン 0.7-ali-1 にアップグレードしました。

Kafka

  • バージョン 3.6.1 にアップグレードしました。

  • Kafka Connect コンポーネントの SASL セキュリティ認証の脆弱性を修正しました。

Spark

Commons Text の脆弱性を修正しました。

StarRocks

  • StarRocks2 をバージョン 2.5.13 にアップグレードしました。

  • StarRocks3 をバージョン 3.1.5 にアップグレードしました。

Ranger

  • Commons Text の脆弱性を修正しました。

  • Spring Security のパス一致権限バイパスの脆弱性を修正しました。

  • Spring Security のフォワード/インクルード認証バイパスの脆弱性を修正しました。

  • 特別な一致パターン下での Spring Framework の ID 認証バイパスの脆弱性を修正しました。

  • Ranger が LDAP ユーザーを同期する期間の変更をサポートします。

EMR 3.49.x

リリース日

バージョン

日付

EMR-3.49.1

2023 年 11 月 16 日

EMR-3.49.0 (新規購入はサポートされていません)

2023 年 10 月 27 日

更新内容

サービス

変更

JindoCache

コンポーネントを追加しました。バージョンは 6.1.1 です。

JindoData

JindoData は利用できません。データキャッシングには JindoCache を、認証には DLF-Auth を使用できます。

Spark

[hive-site.xml] から jdo 関連の構成を削除しました。

HBase

設定項目を追加しました。必要に応じて、v1 と v2 を含む HBase Thrift Server のバージョンを選択できます。

StarRocks

StarRocks2 をバージョン 2.5.10 にアップグレードしました。

Doris

Doris をバージョン 1.2.7 にアップグレードしました。

Celeborn

Celeborn をバージョン 0.3.1 にアップグレードしました。

Paimon

Paimon をバージョン 0.6-ali-2 にアップグレードしました。

ClickHouse

ClickHouse をバージョン 23.8.2.7 にアップグレードしました。

EMR 3.48.x

リリース日

バージョン

日付

EMR-3.48.2

2023 年 8 月 17 日

更新内容

サービス

変更

Trino

  • Paimon コネクタが HDFS テーブルを正常にクエリできなかった問題を修正しました。

  • ワーカーの監視メトリックを読み取れなかった問題を修正しました。

Presto

  • バージョン 0.283 にアップグレードしました。

  • ワーカーの監視メトリックを読み取れなかった問題を修正しました。

ClickHouse

デフォルトでは、デフォルトユーザーにすべての権限が付与されます。

StarRocks

  • 以前の StarRocks の名前を StarRocks2 に変更しました。

  • StarRocks3、バージョン 3.1.2 を追加しました。デフォルトでは、ストレージとコンピューティングが結合されたバージョンとして作成されます。ストレージとコンピューティングが分離されたバージョンはサポートされていません。

Celeborn

バージョン 0.3.0 にアップグレードしました。

EMR 3.47.x

リリース日

バージョン

日付

EMR-3.47.0

2023 年 8 月 3 日

更新内容

サービス

変更

Hudi

バージョン 0.13.1 にアップグレードしました。

Paimon

バージョン 0.5-ali-1 にアップグレードしました。

StarRocks

バージョン 2.5.8 にアップグレードしました。

JindoData

バージョン 4.6.11 にアップグレードしました。

Trino

  • バージョン 422 にアップグレードしました。

  • Hudi コネクタは、Merge On Read (MOR) テーブルのクエリをサポートします。

  • 動的 UDF 読み込みのエラーメッセージを最適化しました。

EMR 3.46.x

リリース日

バージョン

日付

EMR-3.46.1

2023 年 7 月 13 日

EMR-3.46.0 (新規購入はサポートされていません)

2023 年 6 月 1 日

更新内容

EMR-3.46.1

サービス

説明

Spark

  • デフォルトでは、OSS-HDFS は Spark History Server のデータを格納するために使用されます。

  • OSS または OSS-HDFS は、Spark3 Native Engine のデータを格納するために使用されます。

Hive

デフォルトでは、OSS-HDFS は Hive ウェアハウスファイル内のデータを格納するために使用されます。

OSS-HDFS

OSS-HDFS サービスが追加されました。

YARN

デフォルトでは、OSS-HDFS はデータを格納するために使用されます。

HBase

  • デフォルトでは、OSS-HDFS は HBase データを HFile 形式で格納するために使用されます。

  • OSS-HDFS は、HBase の先行書き込みログ (WAL) ログを格納するために使用されます。

EMR-3.46.0

サービス

変更

Kyuubi

バージョン 1.7.1 にアップグレードしました。

Celeborn

バージョン 0.2.2 にアップグレードしました。

Paimon

  • Flink-Table-Store の名前を Paimon に変更しました。

  • バージョン 0.4-ali-1 にアップグレードしました。

Starrocks

バージョン 2.5.5 にアップグレードしました。

Doris

バージョン 1.2.4 にアップグレードしました。

ClickHouse

バージョン 22.8.17.17 にアップグレードしました。

Trino

監査ログを取得するために、デフォルトでシンプルなイベントリスナーが提供されます。

Phoenix

Hive on Phoenix をサポートします。

EMR 3.45.x

リリース日

バージョン

日付

EMR-3.45.1

2023 年 4 月 3 日

EMR-3.45.0 (新規購入はサポートされていません)

2023 年 2 月 28 日

更新内容

EMR-3.45.1

サービス

説明

ClickHouse

ClickHouse が 22.8.14.53 に更新されました。

Trino

[odps.properties] コネクタが追加されました。これにより、MaxCompute データをクエリできます。

JindoData

JindoData が 4.6.5 に更新されました。

JindoSDK

JindoSDK が 4.6.5 に更新されました。

Flink Table Store

Flink Table Store が 0.3-ali-2 に更新されました。

YARN

ノードラベル機能がサポートされています。

EMR-3.45.0

サービス

変更

Iceberg

バージョン 1.1.0 にアップグレードしました。

Hudi

  • バージョン 0.12.2 にアップグレードしました。

  • CDC 機能をサポートします。

Kudu

バージョン 1.16.0 にアップグレードしました。

Clickhouse

  • バージョン 22.3.8.39 にアップグレードしました。

  • ClickHouse サービスをインストールするときは、ZooKeeper サービスを選択する必要があります。

Celeborn

  • RSS の名前を Celeborn に変更しました。

  • Celeborn のバージョンは 0.2.0 です。

Presto

サービスを追加しました。カーネルはコミュニティ Facebook PrestoDB 0.278.3 です。デフォルトの HTTP ポートは 8889、HTTPS ポートは 7779 です。

DeltaLake

バージョン 2.2.0 にアップグレードしました。

StarRocks

バージョン 2.4.3 にアップグレードしました。

Doris

バージョン 1.2.1 にアップグレードしました。

Kafka-Manager

バージョン 3.0.0.6 にアップグレードしました。

Impala

サービスはオフラインです。

OpenLDAP

バージョン 2.4.46 にアップグレードしました。

Kyuubi

バージョン 1.6.1 にアップグレードしました。

Ranger

バージョン 2.3.0 にアップグレードしました。

HBase

  • ThriftServer2 をサポートします。

  • hbase.block.data.cachecompressed パラメーターのデフォルト値が true に変更されました。

Flink-Table-Store

コミュニティバージョン 0.3 に基づいてサービスを追加しました。

JindoData

バージョン 4.6.4 にアップグレードしました。

EMR 3.44.x

リリース日

EMR-3.44.0 は 2022 年 12 月 1 日にリリースされました。

更新内容

サービス

変更

Iceberg

バージョン 0.14.1 にアップグレードしました。

Flink

Flink1.15-vvr-6.0.2 にアップグレードしました。これはコミュニティ Flink 1.15 メジャーバージョンに対応しています。

Kafka

  • LDAP ユーザーのログイン認証と権限付与をサポートします。

  • ユーザーグループの権限付与をサポートします。

Trino

  • EMR Presto は、公式のコミュニティ名である Trino に名前が変更されました。

  • Ranger と DLF AUTH をサポートします。

  • ワンクリックで LDAP を有効にした後、ワーカーノードへの接続が失敗する問題を修正しました。

JindoSDK

バージョン 4.6.2 にアップグレードしました。

JindoData

バージョン 4.6.2 にアップグレードしました。

HBase

  • Ranger をサポートします。

  • サービスを追加するときに OSS-HDFS をストレージモードとして選択できない問題を修正しました。

YARN

高セキュリティモードでは、ACL はデフォルトで有効になっています。

Starrocks

バージョン 2.3.4 にアップグレードしました。

Doris

バージョン 1.1.5 にアップグレードしました。

Hudi

コンソールは hudi-defaults.conf の構成をサポートします。

Ranger

Trino、YARN、HBase、および Kafka との統合をサポートします。

DLF-Auth

  • バージョン 2.0.2 にアップグレードしました。

  • Trino と Impala をサポートします。

OpenLDAP

Nslcd コンポーネントと統合されました。

Kudu

Kudu Tserver は Task ノードグループにインストールできなくなりました。

Spark

バージョン 3.3.1 にアップグレードしました。

Tez

バージョン 0.10.2 にアップグレードしました。

Kyuubi

バージョン 1.6.0 にアップグレードしました。

EMR 3.43.x

リリース日

バージョン

日付

EMR-3.43.1

2022 年 11 月 8 日

EMR-3.43.0 (新規購入はサポートされていません)

2022 年 10 月 14 日

更新内容

EMR-3.43.1

サービス

変更

Kerberos

EMR 上の外部 KDC への接続をサポートします。

Kafka

サービス起動パラメーターをカスタマイズするための起動コマンド設定項目の追加をサポートします。

JindoData

  • バージョン 4.6.0 にアップグレードしました。

  • OSS-HDFS アクセスパスの再書き込みをサポートします。

Flink

バージョン 1.13_vvr_4.0.15 にアップグレードしました。

RSS

バージョン 0.1.4 にアップグレードしました。

EMR-3.43.0

サービス

変更

Spark

  • バージョン 3.3 にアップグレードしました。

  • Kerberos ID 認証の有効化をサポートします。

Hudi

  • バージョン 0.12.0 にアップグレードしました。

  • Spark 3.3 をサポートします。

  • クラウド MetaStore を使用してメタデータをホストし、アクセラレーション機能を有効にすることをサポートします。詳細については、「Hudi MetaStore の使用ガイド」をご参照ください。

Flink

  • Kerberos ID 認証の有効化をサポートします。

  • Data Lake Formation (DLF) との自動接続をサポートします。

Iceberg

  • バージョン 0.14.0 にアップグレードしました。

  • Spark 3.3 をサポートします。

  • Kerberos ID 認証の有効化をサポートします。

JindoData

  • バージョン 4.5.1 にアップグレードしました。

  • プレーンテキストの AccessKey なしで Alibaba Cloud リソースにアクセスすることをサポートします。

Hadoop-Common and HDFS

  • Kerberos ID 認証の有効化をサポートします。

  • セキュリティ脆弱性 CVE-2022-25168 を修正しました。

Knox

Ranger と統合されました。Ranger UI は [アクセスリンクとポート] タブからアクセスできます。

HBase

  • バージョン 1.7.1 にアップグレードしました。

  • Kerberos ID 認証の有効化をサポートします。

  • グループベースの構成をサポートします。

RSS

  • バージョン 0.1.2 にアップグレードしました。

  • Kerberos ID 認証の有効化をサポートします。

Doris

  • バージョン 1.1.2 にアップグレードしました。

  • Kerberos ID 認証の有効化をサポートします。

StarRocks

  • バージョン 2.2.6 にアップグレードしました。

  • Kerberos ID 認証の有効化をサポートします。

Kafka

  • バージョン 2.13_3.2.1 にアップグレードしました。

  • Kerberos ID 認証の有効化をサポートします。

DeltaLake

  • バージョン 2.1.0 にアップグレードしました。

  • Spark 3.3 をサポートします。

  • Kerberos ID 認証の有効化をサポートします。

Kudu

コンポーネントを追加しました。バージョンは 1.14.0 です。

Impala

  • DLF でのビューの作成をサポートします。

  • Kerberos ID 認証の有効化をサポートします。

YARN, Imapla, Ranger, Hive, Kyuubi, Tez, Kafka, Zookeeper, DLF-Auth, Phoenix, Sqoop, Presto

Kerberos ID 認証の有効化をサポートします。

EMR 3.42.x

リリース日

EMR-3.42.0 は 2022 年 8 月 5 日にリリースされました。

更新内容

サービス

変更

Hive

LDAP とのワンクリック統合をサポートします。

Presto

  • コミュニティバージョン 389 にアップグレードしました。

    コミュニティが提供するスタンドアロンの Delta Lake および Hudi コネクタを使用します。

    • このバージョンの Delta Lake コネクタは、Time Travel と Z-Order をサポートしていません。

    • このバージョンの Hudi コネクタは、MOR テーブルのクエリをサポートしていません。

  • LDAP とのワンクリック統合をサポートします。

DeltaLake

  • 自動化されたレイクテーブル管理のために DLF と統合されました。

  • Ranger 権限付与をサポートします。

  • タイムスタンプフィールドの統計を収集できない問題を修正しました。

  • optimize および vacuum コマンドがメトリック情報を返すようになりました。

Hudi

バージョン 0.11.1 にアップグレードしました。

HadoopCommon

HDFS、YARN、および JindoSDK の構成が互いに上書きされる問題を解決するために、新しいコンポーネントを追加しました。

YARN

弾力性のある機能を強化しました。

Ranger

  • Spark2 と Spark3 の両方をサポートします。

  • Ranger Usersync は LDAP とのワンクリック統合をサポートします。

Kafka

CruiseControl は起動時に自動的に関連トピックを作成します。

HBase

コンポーネントを追加しました。バージョンは 1.4.9 です。

Phoenix

コンポーネントを追加しました。バージョンは 4.14.1 です。

Doris

バージョン 1.1.1 にアップグレードしました。

StarRocks

バージョン 2.2.3 にアップグレードしました。

ClickHouse

OSS から大きなファイルを読み取るときのメモリオーバーフローの問題を修正しました。

EMR 3.40.x

リリース日

EMR-3.40.0 は 2022 年 4 月 21 日にリリースされました。

更新内容

サービス

変更

JindoData

コンポーネントを追加しました。バージョンは 4.3.0 です。

JindoSDK

バージョン 4.3.0 にアップグレードしました。

Spark

バージョン 3.2.1 にアップグレードしました。

Hive

  • Speculation が有効な場合に TEZ が繰り返しコミットするバグを修正しました。

  • 関数を再読み込みした後にのみ UDF を呼び出すことができるバグを修正しました。

Presto

Hadoop クラスターが初期化されたときに追加された Presto サービスを開始できないバグを修正しました。

DeltaLake

Streaming SQL との互換性の問題を修正しました。

Hudi

バージョン 0.10.1 にアップグレードしました。

Iceberg

バージョン 0.13.1 にアップグレードしました。

YARN

  • ApplicationMasters (AM) が CORE グループノードでのみ実行されるように制限する機能を追加しました。

  • mareduce.map.java.opts 構成に taihaodoctor がない問題を修正しました。

Zookeeper

JVM パラメーター構成を最適化しました。

Flink

JindoSDK 4.3.0 に適合しました。

Impala

Flume

Druid

Sqoop

PostgreSQL のバージョンをアップグレードしました。

Zeppelin

JDBC Interpreter の起動失敗の問題を解決しました。

Ranger

Ranger 1.2.0 Spark Plugin は Hudi をサポートします。

Oozie

Log4j をバージョン 2.17.2 にアップグレードしました。

HBase

HBase 1.4.9 で RegionServer を起動できない問題を修正しました。

DLF-Auth

バージョン 2.0.0 にアップグレードしました。

EMR 3.39.x

リリース日

バージョン

日付

EMR-3.39.2

2022 年 3 月 25 日

EMR-3.39.1 (新規購入はサポートされていません)

2022 年 2 月 15 日

更新内容

EMR-3.39.2

説明

新しい EMR コンソールの OLAP クラスターと DataFlow クラスターのみがこのバージョンをサポートします。

サービス

変更

Flink

  • アプリケーションパフォーマンス管理 (APM) ダッシュボードを改善し、sourceIdleTime などの新しい監視メトリックを追加しました。

  • CloudMonitor アラートをサポートします。

Kafka

  • SSL および SASL 構成をサポートします。

  • 一部のパラメーターのデフォルト値を変更しました。

Clickhouse

一部のパラメーターのデフォルト値を変更しました。

EMR-3.39.1

サービス

変更

SmartData

コンポーネントはオフラインです。

BIGBOOT

RSS

  • ESS サービスを RSS にアップグレードしました。詳細については、「RSS」をご参照ください。

  • サービスの機能と安定性を強化しました。

JindoSDK

  • アーキテクチャを JindoData にアップグレードしました。

  • EMR は初めて JindoSDK 4.0 を統合し、OSS や OSS-HDFS などのサービスをサポートします。。

Spark

  • Hive on Spark を最適化しました。

  • JindoSDK に適合しました。

Tez

JindoSDK に適合しました。

Hive

JindoSDK に適合しました。

Presto

  • 動的 UDF 読み込みをサポートします。

  • Delta Lake テーブルは、`for ... as of` 構文を使用した Time Travel クエリをサポートします。

  • スタンドアロンの Delta Lake Catalog を追加し、デフォルトの Delta コネクタ構成を提供し、スタンドアロンの Catalog に基づく ZOrder Dataskip 最適化をサポートしました。

  • Hudi コネクタが Hudi MOR テーブルをクエリできない問題を修正しました。Hive コネクタは Hudi MOR テーブルのクエリをサポートしていません。

  • JindoSDK に適合しました。

Delta Lake

  • メタデータ管理

    • Hive CLI API の代わりに組み込みの Spark Catalog を使用して、メタデータとパーティション情報を同期しました。

    • テーブル統計 (dataProfiling) を MetaStore に自動的に報告します。

  • SQL

    • Time Travel 構文をサポートします。

    • DropPartition SQL 構文をサポートします。

    • 指定された位置 (FIRST および AFTER) での ADD COLUMN 操作をサポートします。

  • テーブル管理機能の強化

    • デフォルトでテーブルサイズに基づいてファイルサイズを動的に調整することをサポートし、有効にします。

    • デフォルトで自動 Vacuum をサポートし、有効にします。同時 Vacuum をサポートします。

    • 自動圧縮のロジックを最適化しました。これはデフォルトで無効になっています。

    • Zorder 構文を追加し、Zorder プロセスを高速化しました。

Hudi

バージョン 0.10.0 にアップグレードしました。

HDFS

JindoSDK に適合しました。

YARN

JindoSDK に適合しました。

Flume

JindoSDK に適合しました。

Flink

  • デフォルトでは、Flink lib ディレクトリが HDFS クラスターにアップロードされるため、yarn.provided.lib.dirs パラメーターで使用できます。

  • JindoSDK に適合しました。

Impala

JindoSDK に適合しました。

Ranger

  • Spark History Server の起動失敗の問題を修正しました。

  • JindoSDK に適合しました。

HBase

  • デフォルトパラメーターの問題を修正しました。

  • GC ログの日付形式の問題を修正しました。

  • RS が IP アドレスを使用した場合の再起動の問題を修正しました。

Druid

JindoSDK に適合しました。

Clickhouse

ClickHouse コンポーネントが停止したときの処理ロジックを最適化しました。

Iceberg

  • バージョン 0.13.0 にアップグレードしました。

  • ユーザーエクスペリエンスを向上させるために、デフォルトの構成項目を非表示にしました。

DLF-Auth

Spark History Server の起動失敗の問題を修正しました。

StarRocks

新しいコンソールにサービスを追加しました。

バージョン 2.0.1 が公開されました。

EMR 3.38.x

リリース日

バージョン

日付

EMR-3.38.3

2021 年 12 月

EMR-3.38.2 (新規購入はサポートされていません)

2021 年 12 月

EMR-3.38.1 (新規購入はサポートされていません)

2021 年 11 月

EMR-3.38.0 (新規購入はサポートされていません)

2021 年 10 月

更新内容

EMR-3.38.3

関連するすべてのコンポーネントで Log4j のセキュリティ脆弱性を修正しました。詳細については、「脆弱性に関するお知らせ | Apache Log4j2 のリモートコード実行の脆弱性」をご参照ください。

サービス

変更

Presto

  • 高可用性クラスターで Presto が Hudi テーブルをクエリしたときに発生するエラーを修正しました。

  • Elasticsearch コネクタの Log4j の脆弱性を修正しました。

DLF Metastore

  • Metastore ログのデフォルト設定を有効から無効に変更しました。

  • Metastore gettablestats で URI が長すぎるために発生するエラーを修正しました。

Delta Lake

Metastore へのスキーマ変更の同期に関する問題を修正しました。

Flink

  • VVR をバージョン 4.0.11 にアップグレードしました。このバージョンは次の機能をサポートします:

    • 商用 Flink CDC 機能をリリースしました:

      • Schema Evolution をサポートします。

      • 完全なデータベース同期のための Flink SQL セマンティクスをサポートします。

    • Gemini Statebackend を使用して OSS に状態を保存することをサポートします。

  • メタデータ管理のために DLF を組み込んだ Hudi Connector のエンタープライズ版を提供しました。

Sqoop

Sqoop で HCatalog テーブルをインポートするときに Decimal 型の精度が失われる問題を修正しました。

EMR-3.38.2

サービス

変更

SmartData

  • SmartData をバージョン 3.8.0 にアップグレードしました。詳細については、「SmartData 3.8.x の概要」をご参照ください。

  • Kerberos と Ranger に基づく OSS の認証と権限付与管理をサポートします。

EMR-3.38.1

サービス

変更

SmartData

SmartData をバージョン 3.7.3 にアップグレードしました。詳細については、「SmartData 3.7.x の概要」をご参照ください。

Spark

  • 無効な Log4j MetricsAppender 構成を削除しました。

  • SparkContext の起動中の NullPointerException の問題を修正しました。

Presto

  • 高可用性 Hadoop クラスターで、Presto が Hive テーブルをクエリするためにホスト構成を必要とする問題を修正しました。

  • メモリが少ない場合にデフォルト構成で Presto が起動に失敗する問題を修正しました。

  • worker-jvm 構成への変更が有効にならない問題を修正しました。

  • Ranger をサポートします。

Impala

DLF メタデータテーブルをクエリするときに発生する no such method error を修正しました。

Ranger

  • Presto をサポートします。

  • ORC および PARQUET テーブルにデータを挿入するときの Ranger Spark の権限の問題を修正しました。

  • Kerberos を有効にした後、Ranger Hive ロールの権限が有効にならない問題を修正しました。

DLF-Auth

  • DLF-Auth をバージョン 1.0.1 にアップグレードしました。

  • Presto の権限を制御するための DLF 権限をサポートします。

  • RAM ユーザーのキャッシュに関する問題を修正しました。

EMR-3.38.0

サービス

変更

SmartData

SmartData をバージョン 3.7.2 にアップグレードしました。詳細については、「SmartData 3.7.x の概要」をご参照ください。

Spark

  • Spark をバージョン 2.4.8 にアップグレードしました。

  • Spark 2.4.8 と Spark 3.1.2 の両方をサポートします。

    説明

    Spark3 は Delta または Remote Shuffle Service をサポートしていません。

  • Spark 3.x シリーズでは、Distinct 計算の SparkSQL パフォーマンスが最適化されています。この最適化は、集計オペレーターに複数の count(distinct case ... when ...) 式が含まれている場合にトリガーされます。

  • 統計情報が欠落している場合に Adaptive Query Execution (AQE) で発生する、範囲外の配列インデックスの問題を修正しました。

  • 特定のシナリオで AQE と Cache で発生したエラーを修正しました。

Hive

Hive をバージョン 2.3.9 にアップグレードしました。

Presto

  • スタンドアロン Presto クラスターとしてリリースされました。

  • Presto をコミュニティバージョン 358 にアップグレードしました。

    重要

    このバージョンは Ranger をサポートしていません。

  • デフォルトで Hudi や MySQL などのコネクタをサポートし、デフォルトの構成を更新しました。

  • Presto クラスターはエラスティックスケーリングをサポートしています。

  • データレイク分析をサポートしています。

DeltaLake

  • Hive 2 および Hive 3 用の統合された delta コネクタ。

  • delta コネクタでマルチレベルパーティションテーブルをクエリする際に発生したエラーを修正しました。

Hudi

  • Hudi をバージョン 0.9.0 にアップグレードしました。

  • DeltaLake と Hudi 間の sql.extension の互換性の問題を修正しました。

HDFS

NameNode の予約容量のデフォルトパラメーターが自動的に増加するようになりました。これにより、ディスク領域が少なくなったときに NameNode が速やかにセーフモードに入るようになります。

Flink

  • Flink をバージョン 1.13-vvr-4.0.10 にアップグレードしました。これは、コミュニティの Flink 1.13.1 に対応しています。

  • Hologres コネクタなどの商用 Flink コネクタを追加しました。

  • 対応する Metric Reporter を追加し、モニタリングのために APM ダッシュボードと統合しました。

  • Kafka コネクタでは、SchemaRegistry に基づく Kafka Catalog を追加しました。これにより、DDL を使用せずに既存の Kafka Topic から直接読み取りおよび書き込みができます。

Storm

コンポーネントはオフラインです。

Zeppelin

Zeppelin をコミュニティバージョン 0.10.0 にアップグレードしました。

Ranger

Presto がコミュニティバージョン 358 の場合、このバージョンの Ranger は Presto のアクセスの制御をサポートしていません。

Hue

  • YARN ジョブブラウザーが、一部のケースでジョブを正常に表示または終了できなかった問題を修正しました。

  • デフォルトの構成で YARN ジョブブラウザーが有効になっています。

  • デフォルトの構成で Presto プロトコルがサポートされています。

Druid

サーバーの電源喪失後、残存する PID ファイルによってノードの再起動が失敗する問題を修正しました。

ClickHouse

  • デフォルトの構成を更新しました。

  • クラスターのスケールアウトをサポートします。

  • MetaChecker 機能をサポートします。

  • OSS テーブルエンジンと OSS テーブル関数を使用したデータの読み取りをサポートします。

  • テーブルレベルでのカスタム ZooKeeper アドレスをサポートします。

Iceberg

コンポーネントを追加しました。バージョンは 0.12.0-1.0.1 です。

Knox

Spark タスクへの最初のアクセスが失敗する問題を修正しました。

DLF-Auth

コンポーネントを追加。

DLF 権限による Hive と Spark の権限コントロールをサポートします。バージョンは 1.0.0 です。

ESS

ESS をバージョン 1.2.0 にアップグレードしました。

EMR 3.37.x

リリース日

バージョン

日付

EMR-3.37.1

2021 年 9 月

EMR-3.37.0 (新規購入はサポートされていません)

2021 年 8 月

更新の詳細

EMR-3.37.1

サービス

変更

SmartData

SmartData をバージョン 3.7.1 にアップグレードしました。

Hue

高セキュリティクラスターで Impala を使用できない問題を修正しました。

Kudu

Kerberos をサポートします。

EMR-3.37.0

サービス

変更

SmartData

SmartData をバージョン 3.7.0 にアップグレードしました。

Spark

Delta Lake との互換性の問題を修正しました。

Delta Lake

  • Delta-Connectors をアップグレードし、StorageHandler 構文を使用したテーブルの作成とクエリをサポートしました。

  • パーティションテーブルで INSERT OVERWRITE を使用したときに発生する問題を修正しました。

  • G-SCD シナリオで Optimize が仮想フィールドをファイルに書き込む問題を修正しました。

YARN

  • ノードの Containers REST API に appId、CPU、およびメモリのリソース使用量情報を追加しました。

  • Auto Scaling によってリリースされたノードで ApplicationMaster (AM) ログを表示できない問題を修正しました。

  • Auto Scaling によってデコミッションされた後にリリースされたノードをクリーンアップするサポートを追加しました。

  • Auto Scaling のグレースフルデコミッションロジックを改善しました。NodeManager (NM) プロセスが終了した後にのみ、ノードがオフラインとしてマークされるようになりました。

ZooKeeper

コミュニティバージョン 3.6.3 にアップグレードしました。

Flink

  • SmartData コンポーネントを追加しました。

  • Secure Shell (SSH) を介して DataFlow-Flink クラスターにジョブを送信する際に、OSS へのパスワードなしのアクセスが妨げられる問題を修正しました。

Impala

OSS パーティションディレクトリが直接削除された後にディレクトリを一覧表示すると無限ループが発生する問題を修正しました。

Hue

Hue を Oozie と共に使用した際のユーザーインターフェースの表示問題を修正しました。

Kudu

コミュニティバージョン 1.14.0 にアップグレードしました。

ClickHouse

デフォルトの構成を更新しました。

EMR-3.36.x

リリース日

EMR-3.36.1 は 2021 年 7 月 16 日にリリースされました。

更新

サービス

変更

SmartData

SmartData をバージョン 3.6.1 にアップグレードしました。

詳細については、「SmartData 3.6.x の概要」をご参照ください。

Hive

  • Hive をバージョン 2.3.8 にアップグレードしました。

  • Data Lake Formation (DLF) メタデータを使用して show create table コマンドを実行すると、誤った結果が返される問題を修正しました。

  • Hive のデフォルトパラメーターを最適化し、ジョブのパフォーマンスを向上させました。

  • E-MapReduce コンソールの Hive サービスの [設定] ページにある [hive-env] タブの設定項目の名前を、使いやすさのために大文字に変更しました。

  • Hive テーブルにデータを書き込む際に、ファイルシステムと Hive メタストア間の非互換性が原因で報告されるエラーメッセージを最適化しました。

HDFS

Zstandard (ZSTD) 圧縮フォーマットのサポートを追加しました。

Flink

Flink をバージョン 1.12-vvr-3.0.2 にアップグレードしました。

説明

Flink は Hadoop クラスターから削除されました。

Hudi

  • Hudi をバージョン 0.8.0 にアップグレードしました。

  • Spark SQL との統合のサポートを追加しました。

Spark

  • E-MapReduce コンソールの Spark サービスの [設定] ページにある [spark-defaults] タブの設定項目の名前を最適化しました。

  • ログ出力のパフォーマンスを最適化しました。

  • ZSTD 圧縮フォーマットのサポートを追加しました。

Impala

Hadoop 分散ファイルシステム (HDFS) を使用する際にコアダンプエラーが発生する問題を修正しました。

Tez

Tez のデフォルトパラメーターを最適化し、ジョブのパフォーマンスを向上させました。

Knox

  • Kudu コンポーネントのサポートを追加しました。

  • Impala コンポーネントのサポートを追加しました。

  • Hbase コンポーネントのサポートを追加しました。

Phoenix

Hive または Spark SQL を使用して Phoenix テーブルにアクセスする際に、「Java Database Connectivity (JDBC) Driver not found」エラーが報告される問題を修正しました。

ClickHouse

アプリケーションパフォーマンス管理 (APM) のモニタリングとアラートを有効にしました。

EMR-3.35.x

リリース日

EMR-3.35.0 は 2021 年 4 月 21 日にリリースされました。

更新

サービス

変更

SmartData

バージョン 3.5.0 にアップグレードされました。

詳細については、「SmartData 3.5.x の概要」をご参照ください。

Spark

  • 一部のシナリオで Adaptive Execution が有効にならない問題が修正されました。

  • 統計集計関数の動作が Hive の動作と一致しない問題が修正されました。

  • Hive ORC テーブルから char 型のデータが正しく読み取られない問題が修正されました。

HDFS

SM4 国家暗号化アルゴリズムのサポートが追加されました。

Hue

Hue がバージョン 4.9.0 にアップグレードされました。

Alluxio

Alluxio がバージョン 2.5.0 にアップグレードされました。

Druid

  • Druid がバージョン 0.20.1 にアップグレードされました。

  • セキュリティが強化されました。

Livy

Livy がバージョン 0.7.1 にアップグレードされました。

EMR 3.34.x

リリース日

EMR-3.34.0 は 2021 年 3 月 15 日にリリースされました。

変更

サービス

変更

SmartData

バージョン 3.4.0 にアップグレードされました。

詳細については、「SmartData 3.4.x の概要」をご参照ください。

Spark

    Hive

    • 一部のデフォルト構成が最適化されました。

    • パフォーマンスの最適化: コストベースオプティマイザー (CBO) が強化されました。

    • ワンクリックで LDAP 機能を有効または無効にする機能がサポートされました。

    • Calcite がバージョン 1.12.0 にアップグレードされました。

    • [hive.security.authorization.sqlstd.confwhitelist.append] パラメーターが追加されました。

    Presto

    ワンクリックで LDAP 機能を有効または無効にする機能がサポートされました。

    YARN

    Hadoop Web UI への不正アクセスに関連する重要なセキュリティ脅威が修正されました。この脅威は、Secure Shell (SSH) トンネルを介して YARN Web UI にアクセスする際に発生し、URL で user.name=name を明示的に指定する必要がありました。

    Zookeeper

    バージョン 3.6.2 にアップグレードされました。

    Flink

    初期化中に config.sh ファイルが更新され、HADOOP_CLASSPATH の問題が修正されました。

    Impala

    • Impala がバージョン 3.4.0 にアップグレードされました。

    • Shiro がバージョン 1.7.0 にアップグレードされました。

    • Data Lake Formation (DLF) メタデータがサポートされました。

    • Delta フォーマットのデータのクエリがサポートされました。

    • ワンクリックで LDAP 機能を有効または無効にする機能がサポートされました。

    Tez

    デフォルト構成が最適化されました。

    HAS

    HAS インストールフロー中にエラーが発生した後、admin.keytab ファイルを再初期化できない問題が修正されました。

    Ranger

    • Spark のフィルタープッシュダウンによって引き起こされる問題が修正されました。

    • Ranger で Presto を無効にした後、Presto を有効にできない問題が修正されました。

    • クリックで LDAP 認証を有効または無効にできます。

    Knox

    Druid 0.20.0 の Knox リンクに関する問題が修正されました。

    Hue

    ワンクリックで LDAP 機能を有効または無効にする機能がサポートされました。

    Hudi

      Delta Lake

        Superset

        • 管理者ユーザーが Web UI にログオンできない問題が修正されました。

        • データセットは Druid クラスターと互換性があります。

        • Spark SQL データセットはサポートされなくなりました。

        Sqoop

        Parquet フォーマットのファイルを Object Storage Service (OSS) にインポートする機能がサポートされました。

        Alluxio

        バージョン 2.4.1 にアップグレードされました。

        Phoenix

        Hive on Phoenix でバッキングフィールド設定がサポートされるようになりました。

        Pig

        削除されました。

        EMR-3.33.x

        リリース日

        EMR-3.33.0 は 2021 年 1 月 15 日にリリースされました。

        更新

        サービス

        変更

        SmartData

        バージョン 3.2.0 にアップグレードされました。

        詳細については、「SmartData 3.2.x の概要」をご参照ください。

        Spark

        • バージョン 2.4.7 にアップグレードされました。

        • jQuery がバージョン 3.5.1 にアップグレードされました。

        • テーブルとパーティションのサイズを自動的に更新するための Hive との互換性が追加されました。

        • Spark のメタデータとジョブ実行情報を DataWorks に出力する機能がサポートされました。

        Hive

        • バージョン 2.3.7 にアップグレードされました。

        • HCatalog が Data Lake Formation をサポートするようになりました。

        • Hive のメタデータとジョブ実行情報を DataWorks に出力する機能がサポートされました。

        Metastore

        • Hive Statistics 機能が追加されました。

        • HCatalog が Data Lake Formation をサポートするようになりました。

        • STS トークンを取得するメソッドが最適化されました。

        HDFS

        jQuery がバージョン 3.5.1 にアップグレードされました。

        YARN

        • jQuery がバージョン 3.5.1 にアップグレードされました。

        • Fair Scheduler の構成が調整されました。

        • Timeline Server が最適化されました。

        Zeppelin

        バージョン 0.9.0 にアップグレードされました。

        Ranger

        • Hive の監査ログ構成が追加されました。

        • Log4j の監査構成が追加されました。

        OpenLDAP

        • 監査機能が追加されました。

        • SSL ポート (10636) がデフォルトで有効になりました。

        • Presto のワンクリック起動がサポートされました。

        Knox

        • Spring の脆弱性が修正されました。

        • Spark UI の Executors ページの表示に関する問題が修正されました。

        • Oozie のジョブステータスページに関する問題が修正されました。

        Hue

        Presto がサポートされました。

        Druid

        バージョン 0.20.0 にアップグレードされました。

        EMRHook

        • 新しいソフトウェアサービスが追加されました。

        • hive-hook: Hive のメタデータとジョブ実行情報を DataWorks に出力する機能をサポートします。

        • spark-hook: Spark のメタデータとジョブ実行情報を DataWorks に出力する機能をサポートします。

        EMR-3.32.x

        リリース日

        EMR-3.32.0 は 2020 年 11 月 23 日にリリースされました。

        更新

        サービス

        変更

        SmartData

        バージョン 3.1.0 にアップグレードされました。

        詳細については、「SmartData 3.1.x の概要」をご参照ください。

        Alluxio

        • Alluxio 2.4.0 をサポートします。

        • デフォルトのパラメーター設定は、クラスターノードのサイズに応じてスケーリングされます。

        • EMR クラスターの HDFS をデフォルトの UnderFS として使用します。この機能はすぐに使用できます。

        • Alluxio OSS UnderFS が強化され、OSS の複数バージョン管理などの新機能をサポートするようになりました。

        • Hadoop、Hive、Spark、Presto などのエンジンと互換性があります。

        HUDI

        HUDI 0.6.0 をサポートします。

        Spark

        JindoTable は、データ収集機能の有効化または無効化をサポートします。

        Hive

        • HiveServer の接続プールリークの問題を修正しました。

        • JindoTable は、データ収集機能の有効化または無効化をサポートします。

        • ADD COLUMN のパフォーマンスを最適化しました。

        • HUDI テーブルから不正なデータが読み取られる問題を修正しました。

        • デフォルトのパラメーター設定は、クラスターノードのサイズに応じてスケーリングされます。

        HDFS

        より多くのスナップショットをサポートします。

        YARN

        デフォルトのパラメーター設定は、クラスターノードのサイズに応じてスケーリングされます。

        Tez

        デフォルトのパラメーター設定は、クラスターノードのサイズに応じてスケーリングされます。

        Sqoop

        Avro フォーマットのファイルのインポートに関する問題を修正しました。

        EMR 3.30.x

        リリース日

        EMR-3.30.0 は 2020 年 10 月 26 日にリリースされました。

        更新

        サービス

        更新

        SmartData

        3.0.0 にアップグレードされました。

        詳細については、「SmartData 3.0.x の概要」をご参照ください。

        Spark

        • Alibaba Cloud Data Lake Formation (DLF) メタデータのサポートが追加されました。

        • HAS 依存関係が 2.0.1 にアップグレードされました。

        • Streaming SQL のバックティックに関する問題が修正されました。

        • Delta JAR パッケージが削除されました。Delta は個別にデプロイされるようになりました。

        • すべてのログを HDFS に書き込むようにログパスが変更されました。

        Hive

        • Alibaba Cloud DLF メタデータのサポートが追加されました。

        • Delta テーブルの空のディレクトリを読み取るときに DUMMY ファイルが書き込まれる問題が解決されました。

        • HAS 依存関係が 2.0.1 にアップグレードされました。

        Presto

        • Alibaba Cloud DLF メタデータのサポートが追加されました。

        • Delta テーブルの読み取りを制限する問題が解決されました。

        • 高セキュリティモードで JVM 構成が欠落する問題が修正されました。

        • HAS 依存関係が 2.0.1 にアップグレードされました。

        HDFS

        • ホットスワップ可能なディスクモードのサポートが追加されました。

        • HAS 依存関係が 2.0.1 にアップグレードされました。

        YARN

        • YARN RMZKStateStore の問題が修正されました。

        • SLS によって出力される SNAPPY ファイルのサポートが追加されました。

        • MapReduce ローカルモードのディレクトリ構成が変更され、ディレクトリ権限のチェック問題が解決されました。

        • ホットスワップ可能なディスクモードのサポートが追加されました。

        • すべてのログを HDFS に書き込むようにログパスが設定されました。

        • HAS 依存関係が 2.0.1 にアップグレードされました。

        Zookeeper

        • 起動時にサービスポートを内部 IP アドレスにアタッチするサポートが追加されました。

        • HAS 依存関係が 2.0.1 にアップグレードされました。

        Flink-Vvp

        • バージョン 1.11-2.2.2 にアップグレードされました。

        • SQL および Autopilot 機能のサポートが追加されました。

        説明

        Dataflow クラスターのみが Flink-Vvp をサポートします。Hadoop クラスターは現時点では Flink-Vvp をサポートしていません。

        Flink

        • キャッシュモードでの OSS への書き込みのサポートが追加されました。この機能は、Flink Checkpoints と再開可能なソースと組み合わせることで、EXACTLY_ONCE セマンティクスを実現します。

        • Flink コミュニティバージョン 1.11.1 の機能と同期されました。SQL は複数の出力 (MULTI INSERT) をサポートするようになりました。

        • HAS 依存関係が 2.0.1 にアップグレードされました。

        Impala

        • catalogd.flgsimpalad.flgs、および statestored.flgs のカスタム構成のサポートが追加されました。

        • Shiro がバージョン 1.6.0 にアップグレードされました。

        • HAS 依存関係が 2.0.1 にアップグレードされました。

        Tez

        • Application Master (AM) のデフォルトのメモリパラメーターが最適化されました。

        • HAS 依存関係が 2.0.1 にアップグレードされました。

        HAS

        HAS 依存関係が 2.0.1 にアップグレードされました。

        Storm

        Zeppelin

        Ranger

        OpenLDAP

        Oozie

        Knox

        Kafka

        HUE

        HBase

        Druid

        EMR-3.29.x

        リリース日

        EMR-3.29.0 は 2020年7月29日 にリリースされました。

        更新

        サービス

        変更点

        Bigboot

        • バージョン 2.7.301 にアップグレードされました。

        • Jindo DistCp は、アーカイブまたは低頻度アクセスストレージタイプの OSS へのデータ書き込みをサポートするようになりました。

        • 複数の名前空間をサポートするために FUSE 機能が強化されました。

        • キャッシュモードのメタデータキャッシュ機能が改善されました。

        Spark

        • Spark が 2.4.5.2.0 にアップグレードされました。

        • サードパーティのメタストアのサポートが追加されました。

        • datalake metastore-client が追加されました。

        Hive

        • Hive が 2.3.5.6.0 にアップグレードされました。

        • サードパーティのメタストアのサポートが追加されました。

        • datalake metastore-client が追加されました。

        Presto

        バージョン 338 にアップグレードされました。

        Ranger

        • ソフトウェアパッケージが 1.2.0-1.5.0 にアップグレードされました。

        • Presto 338 のサポートが追加されました。

        • 構成ファイルに説明が追加されました。

        Hadoop 分散ファイルシステム (HDFS)

        データノードの予約領域サイズの適応構成が有効になりました。

        Knox

        Impala、Flink の新しいバージョン、および PAI がサポートされるようになりました。

        Druid

        バージョン 0.18.1 にアップグレードされました。

        SmartData

        バージョン 2.7.301 にアップグレードされました。

        EMR 3.28.x

        リリース日

        EMR-3.28.0 は 2020 年 6 月 12 日にリリースされました。

        新機能

        サービス

        変更

        Bigboot

        • テーブルとパーティションのホットスポット統計を提供する JindoTable の最初のバージョンをリリースしました。

        • ブロックモードでの完全なストレージポリシーと、低頻度アクセスやアーカイブなどの階層型ストレージポリシーのサポートを追加しました。

        • Jindo DistCp データ移行ツールを追加しました。

        • Jindo Fuse を改善および修正しました。

        • キャッシュモードでの JFS スキームと Hive エンジンおよび Jindo JobCommitter との統合を改善しました。

        • OSS から直接データを読み取るためにブロックモードで読み取り比率を設定する機能を追加しました。これにより、ローカルキャッシュからの読み取りのオーバーヘッドが削減されます。

        • JindoFS ソフトウェアモジュールを Bigboot (コントロールレイヤー)、Smartdata (分散サービス)、および JindoFS SDK に分離しました。各モジュールは個別にアップグレードおよび保守できます。

        更新

        サービス

        変更

        Flink

        オープンソースの Flink を Ververica Platform Enterprise Edition にアップグレードしました。このプラットフォームは、オープンソースの Flink 1.10 をベースに大幅にカスタマイズされており、自社開発の Gemini ストレージエンジンなどの付加価値機能を提供します。

        Bigboot

        バージョン 2.7.0 にアップグレードしました。

        Delta

        • バージョン 0.6.0 にアップグレードしました。

        • Delta コードを Spark コードから分離しました。

        Spark

        • バージョン 2.4.5 にアップグレードしました。

        • DataFactory の streaming-sql スクリプトをサポートします。

        • Delta 0.6.0 をサポートします。

        Hive

        Delta 0.6.0 をサポートします。

        Ranger

        • Hadoop 分散ファイルシステム (HDFS)、Hive、および Spark のカスタムデプロイメントをサポートします。

        • コンソールでの ranger-admin-site および ranger-ugsync-site の構成をサポートします。

        HDFS

        利用可能な DataNode がないために HDFS の書き込みが失敗した場合に、DataNode の例外情報を出力するようになりました (HDFS-9023)。

        Hue

        • Gateway クラスターへの Hue コンポーネントのインストールをサポートします。

        • 単一ノードへの複数の Hue インスタンスのデプロイをサポートします。

        DataFactory

        Delta 0.6.0 をサポートします。

        Druid

        バージョン 0.18.0 にアップグレードしました。

        Knox

        • バージョン 1.1.0-1.0.7 にアップグレードしました。

        • HBase UI をサポートします。

        EMR-3.27.x

        リリース日

        バージョン

        日付

        EMR-3.27.0

        2020年4月29日

        EMR-3.27.1 (新規購入はサポートされていません)

        2020年5月8日

        EMR-3.27.2 (新規購入はサポートされていません)

        2020年5月20日

        新機能

        機能

        変更

        カスタムコンポーネントのデプロイメント

        マスターノードでのコンポーネントのカスタムデプロイメントのサポートが追加されました。次のコンポーネントがサポートされています:

        • Hadoop

        • Spark

        • Hive

        • Zookeeper

        • Presto

        Auto Scaling のグレースフルシャットダウン

        グレースフルシャットダウンが有効になっている場合、ノードはすぐにはリリースされません。指定された期間内にタスクが完了した後にリリースされます。

        更新

        サービス

        変更

        Spark

        • CUBE が日付型のパーティションフィールドをサポートするようになりました。

        • Spark-Submit のスタック深度が増加しました。

        Delta

        • CREATE、SHOW、DESCRIBE などのコマンドを含む、データ定義言語 (DDL) 構文が強化されました。

        • Delta が ZOrder を使用した Optimize 構文をサポートするようになりました。

        Knox

        • Druid ユーザーインターフェイス (UI) に対応しました。

        • マルチマスターデプロイメントがサポートされています。

        Hive

        • hcatalog テーブルが magic committer をサポートするようになりました。

        • 古いデフォルト構成の一部が削除されました。

        Bigboot

        • バージョン 2.6.3 にアップグレードされました。

        • マルチマスターデプロイメントがサポートされています。

        SmartData

        • バージョン 2.6.3 にアップグレードされました。

        • マルチマスターデプロイメントがサポートされています。

        Ranger

        • Ranger が Solr コンポーネントをサポートするようになりました。

        • Ranger が PrestoSQL バージョン 311 をサポートするようになりました。

        Tez

        Tez が OSS 上での scratchdir の設定をサポートするようになりました。

        Presto

        バージョン 331 にアップグレードされました。

        Druid

        バージョン 0.17.1 にアップグレードされました。

        Superset

        バージョン 0.35.2 にアップグレードされました。

        Sqoop

        • MySQL Java Database Connectivity (JDBC) JAR パッケージがバージョン 5.1.48 にアップグレードされました。

        • MySQL ダイレクトエクスポートモードでは、--mysql-charset を使用してカスタムエンコーディングを設定できます。

        EMR-3.26.x

        リリース日

        バージョン

        日付

        EMR-3.26.3 (新規購入はサポートされていません)

        2020年4月16日

        更新

        サービス

        変更

        Bigboot

        • バージョン 2.6.3 にアップグレードされました。

        • OTS メタデータと Namespace HA のサポートが追加されました。

        SmartData

        Hive

        HCatalog テーブルがダイレクトコミッターをサポートするようになりました。

        YARN

        デフォルトのコミッターが JindoOssCommitter に変更されました。

        HDFS

        JindoFS 関連の構成がアップグレードされました。

        Spark

        デフォルトのコミッターが JindoOssCommitter に変更されました。

        EMR-3.25.x

        リリース日

        EMR-3.25.0 は 2020 年 1 月 13 日にリリースされました。

        新機能

        Ranger サービス: Ranger Presto 操作のサポートが追加されました。

        更新

        サービス

        変更

        Ranger

        • 高可用性 (HA) クラスター用に RangerAdmin データベースを初期化しました。

        • RangerUserSync 起動スクリプトのセキュリティ問題を修正しました。

        Spark

        • コンソールで spark.sql.extensions などの Delta 関連パラメーターを設定できるようになりました。

        • 入力フォーマットを設定せずに Hive が Delta テーブルを読み取れるようになりました。

        • ALTER TABLE SET TBLPROPERTIES および UNSET TBLPROPERTIES 文のサポートが追加されました。

        Delta

        Hive

        自動ローカルモードで MapReduce (MR) タスクの実行が失敗する問題を修正しました。

        Presto

        • バージョン 310 にアップグレードしました。

        • joda-time のバージョンを 2.10.5 にアップグレードしました。

        Tez

        • バージョン 0.9.2 にアップグレードしました。

        • Tez ユーザーインターフェース (UI) でアプリケーションの進捗が正しく表示されない問題を修正しました。

        • Tez UI でアプリケーションの履歴を表示できない問題を修正しました。

        Impala

        Impala が LZO テーブルにアクセスできない問題を修正しました。

        HDFS

        mongo-hadoop 関連の JAR パッケージを削除しました。

        Zookeeper

        バージョン 3.5.6 にアップグレードしました。

        YARN

        Tez UI に対応しました。[yarn-site] タブで、設定項目 [yarn.resourcemanager.system-metrics-publisher.enabled=true] を追加できるようになりました。

        Bigboot

        • バージョン 2.2.3 にアップグレードしました。

        • OSS キャッシュモードでの名前変更操作のサポートが追加されました。

        SmartData

        Knox

        依存関係パッケージのバージョンをアップグレードしました。

        Oozie

        依存関係パッケージのバージョンをアップグレードしました。

        EMR-3.24.x

        リリース日

        EMR-3.24.0 は 2019 年 11 月 18 日にリリースされました。

        新機能

        サービス

        変更

        Delta

        • ALTER、CONVERT、CREATE、CTAS、DELETE、DESC、INSERT、MERGE、OPTIMIZE、UPDATE、VACUUM などの SQL 構文をサポートします。

        • OPTIMIZE コマンドを組み込み、最適化しました。

        • Hive コネクタをサポートします。

        • 他の既存のオープンソース機能をサポートします。

        Grafana

        スタンドアロン Flink クラスターの新しいコンポーネントとして追加されました。バージョン: 6.4.2。

        Prometheus

        スタンドアロン Flink クラスターの新しいコンポーネントとして追加されました。バージョン: 2.13.0。

        AlertManager

        スタンドアロン Flink クラスターの新しいコンポーネントとして追加されました。バージョン: 0.19.0。

        TensorFlow on spark

        • Spark 上での TensorFlow の実行をサポートします。これにより、Spark と深層学習フレームワークが深く統合されます。この統合には、最適化されたタスクスケジューリングとデータ交換が含まれます。データの前処理からディープラーニングトレーニングまで、完全なワークフローを提供します。

        • ストリーミングタスクをサポートします。

        更新

        サービス

        変更

        SmartData

        • JindoFS の使用モードを最適化しました。Block モードの使用法は変更されていません。Cache モードは、元の使用法をサポートし、元の OSS ファイルシステムの使用法とも互換性があります。データとメタデータのキャッシュをサポートします。これらの機能は、構成によって個別に有効または無効にすることができ、デフォルトでは無効になっています。

        • Block モードと Cache モードの読み取りおよび書き込みパフォーマンスを最適化しました。

        • ディスククリーンアップを最適化しました。これにより、ローカルディスクにキャッシュされたホットデータに対して、より正確な統計とタイムリーなクリーンアップが提供されます。ディスク使用率がクォータを超えないように厳密に保証します。

        • Gateway クラスターのサポートを改善しました。Block モードと Cache モードが Gateway で使用できるようになりました。

        • 1 つのストレージクラスターが複数の計算クラスターから分離されるデプロイメントモードをサポートします。

        Spark

        • Delta 関連のパラメーターのサポートを追加しました。

        • Ranger Spark プラグイン構成のサポートを追加しました。

        • JindoCube をバージョン 0.3.0 にアップグレードしました。

        Hive

        • SQL 互換性チェック機能のロジックを追加しました。

        • Hive 2.3.5 と Hadoop 2.8.5 の組み合わせをリリースしました。

        • コンポーネントを再起動する際、hiveserver2-site.xml の内容は spark-conf 配下の hive-site.xml に同期されなくなりました。

        • MSCK コマンドを使用して増分フォルダを追加することをサポートします。

        • Hive が Tez コンテナーを再利用する際に発生するバグを修正しました。

        • MSCK コマンドを使用して列ベースのフォルダを最適化することをサポートします。

        Bigboot

        2.2.1 にアップグレードしました。一部のマシンモデルでのネイティブコードサポートに関する問題を修正しました。

        Ranger

        • Spark プラグインのデプロイメントメソッドをリファクタリングしました。

        • HA クラスターの header2 が keytab を取得しないバグを修正しました。

        Kudu

        起動ロジックを修正しました。

        Zookeeper

        4 文字の単語の構成を追加しました。これはデフォルトで有効になっています。

        HDFS

        JindoFS との互換性を追加しました。

        YARN

        • [yarn.scheduler.capacity.node-locality-delay] 構成のデフォルト値を -1 に変更しました。

        • JindoFS との互換性を追加しました。

        Has

        バックエンドとして OpenLDAP と統合しました。

        OpenLDAP

        Has との互換性を追加しました。

        Presto

        バージョン 0.228 にアップグレードしました。

        Kafka

        D1 の不良ディスクを削除しました。

        Druid

        0.16.0 にアップグレードしました。

        Flume

        1.9.0 にアップグレードしました。

        Flink

        • 1.9.1 にアップグレードしました。

        • スタンドアロン Flink クラスターをサポートします (ホワイトリストにリリース)。

        EMR-3.23.x

        リリース日

        EMR-3.23.0 は 2019 年 9 月 18 日にリリースされました。

        更新

        サービス

        変更

        Druid

        • 0.15.1 にアップグレードしました。

        • ルーターコンポーネントを追加しました。

        • fastjson をアップグレードしました。

        Spark

        • クラスローダーの問題を修正するために Spark Thrift Server を更新しました。

        • 安定性を向上させるために Spark トランザクションコードをリファクタリングしました。

        • 組み込みの Hive がバージョン 2.3 にアップグレードされた後、ORC フォーマットのファイルの読み書きに関する問題を修正しました。

        • MERGE INTO 構文のサポートを追加しました。

        • SCAN および STREAM 構文のサポートを追加しました。

        • Structured Streaming Kafka シンクが 1 回限りのセマンティクス (EOS) をサポートするようになりました。

        • Delta Lake を 0.4.0 に更新しました。

        Hive

        • 古いバージョンの Hive フックを削除しました。

        • 複数の COUNT(DISTINCT) フィールドのデータスキューを処理するための最適化を追加しました。

        • 異なるバケットバージョンのテーブルを結合する際にデータが失われる問題を修正しました。

        Flink

        1.8.2 にアップグレードしました。

        Bigboot

        • small ファイルツールを更新しました。

        • 非デーモンスレッドの問題を修正するために OSS JAR パッケージを更新しました。

        Kafka

        • Deployment Set awareness 機能のサポートを追加しました。

        • fastjson の依存関係を削除しました。

        HDFS

        • SmartData OSS JAR パッケージのデプロイメントロジックを最適化しました。

        • SmartData OSS JAR パッケージを更新しました。

        Flume

        fastjson をアップグレードしました。

        TensorFlow on Spark

        このサービスを追加しました。

        HAS

        fastjson をアップグレードしました。

        Livy

        fastjson をアップグレードしました。

        EMR-3.22.x

        リリース日

        EMR-3.22.0 は 2019 年 7 月 28 日にリリースされました。

        新機能

        サービス

        変更

        Kudu

        • 新しいコンポーネントとして Kudu を追加しました。Kudu は Hadoop エコシステムのギャップを埋めます。HBase と同様の高速なデータ挿入とランダムアクセスを提供し、データを変更できます。また、Hadoop 分散ファイルシステム (HDFS) や Parquet と同様の大規模なデータ分析およびクエリ機能も提供します。

          • カスタム開発用に C++ および Java API を提供します。

          • Impala、Spark、Hive Metastore と統合します。

        • このバージョンの Kudu は Apache Kudu 1.10.0 に基づいています。

        OpenLDAP

        • ApacheDS を置き換える新しいコンポーネントとして OpenLDAP を追加しました。ApacheDS はオフラインになりました。

        • 高可用性 (HA) をサポートします。

        更新

        コンポーネント

        詳細

        JindoFileSystem

        • 複数のストレージモード

          • ブロックモード: データはバックエンド OSS にブロックとして保存されます。ローカルの Namespace サービスがメタデータを維持します。ブロックモードは、より優れたメタデータとデータパフォーマンスを提供します。ブロックモードは、WARM (ローカルレプリカ、OSS レプリカ)、COLD (OSS レプリカのみ)、HOT (複数のローカルレプリカ、OSS レプリカ)、TEMP (ローカルレプリカのみ)、ALL_HDD (複数のローカルレプリカ) など、さまざまなストレージポリシーをサポートします。デフォルトのポリシーは WARM です。アプリケーションシナリオに基づいて、フォルダに異なるストレージポリシーを設定できます。

          • キャッシュモード: このモードは、既存の OSS ストレージメソッドと互換性があります。キャッシュモードでは、ファイルは OSS にオブジェクトとして保存されます。各ファイルのデータとメタデータは、アクセス頻度に基づいてローカルにキャッシュされます。これにより、データとメタデータのアクセスパフォーマンスが向上します。キャッシュモードは、さまざまなシナリオのニーズを満たすために、さまざまなメタデータ同期ポリシーを提供します。

        • 外部クライアントのサポート

          • クライアントソフトウェア開発キット (SDK) を使用すると、EMR クラスターの外部から EMR JindoFS ファイルシステムにアクセスできます。クライアントを使用してブロックモードで Namespace にアクセスできます。ただし、外部クライアントは、EMR クラスター内で EMR JindoFS によって構築されたデータキャッシュを使用できません。これにより、EMR クラスター内で使用する場合と比較してパフォーマンスが低下します。

          • キャッシュモードは、元の OSS ストレージセマンティクスを保持します。JindoFS を使用して、EMR クラスター内のデータキャッシュを高速化します。したがって、OSS SDK や EMR OssFileSystem などの OSS クライアントを使用して、EMR クラスターの外部からデータに直接アクセスできます。

        • エコシステムコンポーネントのサポート

          • JindoFS は、Spark、Flink、Hive、MapReduce、Impala、Presto など、EMR 上の多くのコンピュートエンジンをサポートするようになりました。

          • コンピューティングとストレージを分離するシナリオでは、YARN Container ログや Spark Event ログなどのジョブログを JindoFS に保存することもできます。

          • JindoFS は、HBase の HFile バックエンドストレージとして使用して、そのストレージ容量を拡張できます。

        OssFileSystem

        • 不良ディスクを自動的に検出するロジックを OssFileSystem に追加しました。これにより、不良ディスクが原因で OSS 書き込み中にキャッシュ書き込みが失敗する問題が修正されます。

        • OssFileSystem の関連構成を完了しました。

        Bigboot

        • バージョン 2.0.0 にアップグレードしました。

        • 複数の Namespace のサポート、ローカルデータブロックのラージファイルとしての保存、マルチモードストレージ、外部クライアントなど、いくつかの主要な更新が含まれています。

        • マシンの再起動中に Bigboot モニターのステータスが正しくない問題を修正しました。

        • Kudu コンポーネントのサービス仕様を追加しました。

        • すべてのサービス仕様の正当性チェックを追加しました。

        Hadoop

        • HDFS

          • HDFS Federation に対応しました。カスタム構成と API を使用して HDFS Federation クラスターを作成できるようになりました。これにより、Federation クラスターを作成する際の 2 回目のフォーマット操作が不要になります。

          • 不良ディスク検出ロジックを最適化しました。ローカルディスクのシナリオでは、dfsadmin によって DataNode ブロックレポートがトリガーされたときに、不良ディスク検出をトリガーできます。

        • YARN

          MapReduce ジョブの Container ログが JindoFS または OSS に保存されている場合に、MapReduce JobHistory ジョブリストが更新されない問題を修正しました。

        Spark

        • リレーショナルキャッシュ

          リレーショナルキャッシュのサポートを追加しました。リレーショナルキャッシュは、事前計算を使用してユーザーのクエリを高速化します。リレーショナルキャッシュを作成してデータを事前計算できます。ユーザーのクエリが実行されると、Spark Optimizer は自動的に適切なキャッシュを見つけ、SQL 実行計画を再書き込みし、キャッシュされたデータに基づいて計算を続行します。これにより、クエリ速度が向上します。この機能は、レポート、ダッシュボード、データ同期、多次元分析などのシナリオに適しています。

          • データ定義言語 (DDL) を使用して、CACHE、UNCACHE、ALTER、SHOW などの操作を実行します。キャッシュされたデータは、すべての Spark データソースとデータ形式をサポートします。

          • REFRESH コマンドを使用した自動キャッシュデータ更新と更新をサポートします。パーティションに基づく増分更新をサポートします。

          • リレーショナルキャッシュに基づく実行計画の最適化をサポートします。

        • ストリーミング SQL

          • Stream Query Writer のパラメーター構成を標準化しました。

          • Kafka データテーブルのスキーマ互換性チェックを最適化しました。

          • Kafka データテーブルのスキーマが存在しない場合、SchemaRegistry に自動的に作成されます。

          • Kafka スキーマに互換性がない場合のログ情報を最適化しました。

          • クエリ結果を Kafka テーブルに書き込むときに列名を明示的に指定する必要がある問題を修正しました。

          • ストリーミング SQL クエリが Kafka と Loghub のデータソースのみをサポートするという制限を削除しました。

        • Delta

          Delta を追加しました。Spark を使用して Delta データソースを作成し、ストリーミングデータの書き込み、トランザクションの読み取りと書き込み、データ検証、データ履歴などのシナリオをサポートできます。詳細については、「Delta の詳細」をご参照ください。

          • DataFrame API を使用して Delta からデータを読み取ったり、Delta にデータを書き込んだりすることをサポートします。

          • Structured Streaming API を使用して、ソースまたはシンクとして Delta から読み取ったり、Delta に書き込んだりすることをサポートします。

          • Delta API を使用して、更新、削除、マージ、バキューム、最適化などの操作を実行することをサポートします。

          • SQL を使用して、Delta ベースのテーブルの作成、Delta へのデータのインポート、Delta テーブルからのデータの読み取りなどの操作を実行することをサポートします。

        • その他

          • プライマリキーと外部キーをサポートする制約機能を追加しました。

          • サーブレットなどの JAR ファイルの競合を解決しました。

        Flink

        Log4j ログのロールバック

        Kafka

        • Log4j のログロールバック。

        • fastjson をアップグレードしました。

        Zeppelin

        依存する commons-lang3 パッケージをバージョン 3.7 にアップグレードしました。これにより、PySpark が OSS に書き込めない問題が修正されます。詳細については、「Zeppelin における Spark 2.4 と commons-lang3 の非互換性」をご参照ください。

        Ranger

        SHOW GRANTS のサポートを追加しました。

        Analytics-Zoo

        NumPy のインストールエラーを修正しました。

        Impala

        Apache Kudu 1.10.0 と互換性があります。

        Presto

        バージョン 0.221 にアップグレードしました。

        ZooKeeper

        バージョン 3.5.5 にアップグレードしました。

        EMR-3.22.x より前のバージョン

        EMR-3.1.1

        • オペレーティングシステム (OS) を CentOS 7.2 にアップグレードしました。

        • Spark をバージョン 2.1.1 にアップグレードしました。

        • emr-core をバージョン 1.2.6 にアップグレードしました。

        • OSS の AccessKey フリー操作に関連するバグを修正しました。

        EMR-3.0.2

        • emr-core をバージョン 1.2.5 にアップグレードしました。

        • OSS の AccessKey フリーサポートをより多くのリージョンに拡張しました。

        • ロールベースの AccessKey の置き換えポリシーを調整しました。

        • Hive と Hadoop のいくつかのバグを修正しました。

        EMR-3.0.1

        • インタラクティブモードと統合テーブル管理のサポートが追加されました。Hive メタデータを外部データベースに保存できるようになりました。これにより、複数のクラスターが同じメタデータを共有できます。

        • emr-core をバージョン 1.2.4 にアップグレードしました。これにより、Object Storage Service (OSS) の読み取りおよび書き込みパフォーマンスが最適化されます。

        • Spark をバージョン 2.0.2 にアップグレードしました。

        説明

        このバージョンは EMR-3.0.0 と完全な互換性があります。

        EMR-3.0.0

        初回リリース。