すべてのプロダクト
Search
ドキュメントセンター

E-MapReduce:メタデータサービスの選択

最終更新日:Apr 22, 2025

E-MapReduce(EMR)メタデータとは、EMR クラスタのデータストレージ、データ構造、およびアクセス権限に関連するコア情報のことです。EMR では、Data Lake Formation(DLF)、ApsaraDB RDS for MySQL、および組み込み MySQL にメタデータを保存できます。このトピックでは、メタデータサービス間の違いについて説明します。ビジネス要件に基づいてメタデータサービスを指定できます。

メタデータサービス間の違い

項目

DLF

セルフマネージド ApsaraDB RDS

組み込み MySQL

バックエンドストレージ

データは DLF に保存されます。

データは ApsaraDB RDS for MySQL インスタンスに保存されます。事前に ApsaraDB RDS for MySQL インスタンスを購入し、ネットワーク環境を設定する必要があります。

データは EMR クラスタの MySQL インスタンスに保存されます。

適用可能な環境

テスト環境および本番環境。

テスト環境および本番環境。

単一クラスタの概念実証(POC)テスト。

説明

組み込み MySQL は使用しないことをお勧めします。ローカル MySQL データベースは EMR クラスタのシングルノードにデプロイされます。その結果、サービスの高可用性が保証されず、安定性の問題が発生する可能性があります。

クラスタ間のメタデータ共有

サポートされています。

サポートされています。

サポートされていません。

エンジンの互換性

Hive、Spark、Presto、MaxCompute、および Hologres がサポートされています。

  • Hive、Spark、Presto がサポートされています。

  • MaxCompute および Hologres はサポートされていません。

  • Hive、Spark、Presto がサポートされています。

  • MaxCompute および Hologres はサポートされていません。

メタデータ管理

視覚化されたメタデータ検索、メタデータ管理、マルチバージョン管理、データ統計、およびライフサイクル管理がサポートされています。

なし。

なし。

高可用性(HA)

プライマリ/セカンダリ ディザスタリカバリがサポートされています。

プライマリ/セカンダリ ディザスタリカバリがサポートされています。

ディザスタリカバリはサポートされていません。

O&M コスト

自動スケーリングがサポートされています。O&M 操作を実行する必要はありません。

スペックアップやスケールアウトなどの O&M 操作を手動で実行する必要があります。セルフマネージド ApsaraDB RDS は、EMR クラスタを柔軟かつ詳細に管理したいシナリオに適しています。

ローカル MySQL データベースは EMR クラスタのシングルノードにデプロイされるため、スペックアップコストが増加します。

課金

現在、DLF は無料です。DLF の課金については、「課金」をご参照ください。

ApsaraDB RDS インスタンスの基本料金は、計算リソースの料金とストレージリソースの料金で構成されます。詳細については、「課金対象項目」をご参照ください。

なし。

説明

メタデータサービスを選択する際は、各メタデータサービスをサポートするリージョンに注意する必要があります。DLF でサポートされているリージョンについては、「サポートされているリージョンとエンドポイント」をご参照ください。

メタデータサービスのデプロイメントアーキテクチャ

DLF のデプロイメントアーキテクチャ

メタデータは DLF に保存されます。DLF は、複数のクラスタ間でのメタデータ共有をサポートしています。DLF クライアント SDK は、Hive Metastore と互換性のある API を提供します。これにより、特定のエンジンは DLF クライアント SDK を直接使用して DLF 内のメタデータにアクセスできます。ユーザーは DLF クライアントを使用して DLF 内のメタデータにアクセスすることもできます。詳細については、「製品紹介」ディレクトリのトピックをご参照ください。

単一クラスタにおける DLF のデプロイメントアーキテクチャ

複数クラスタにおける DLF のデプロイメントアーキテクチャ

セルフマネージド ApsaraDB RDS のデプロイメントアーキテクチャ

メタデータは ApsaraDB RDS for MySQL インスタンスに保存されます。セルフマネージド ApsaraDB RDS は、複数のクラスタ間でのメタデータ共有をサポートしており、これらのクラスタの Hive Metastore からメタデータにアクセスできます。

単一クラスタにおけるセルフマネージド ApsaraDB RDS のデプロイメントアーキテクチャ

複数クラスタにおけるセルフマネージド ApsaraDB RDS のデプロイメントアーキテクチャ

組み込み MySQL のデプロイメントアーキテクチャ

メタデータは MySQL に保存されます。MySQL Server インスタンスは EMR クラスタにデプロイされ、通常はクラスタのマスターノードにデプロイされます。各クラスタには MySQL データベースがあるため、メタデータを複数のクラスタ間で共有することはできません。

説明

組み込み MySQL にログインするために使用されるユーザー名は root で、パスワードは EMRroot1234 です。

単一クラスタにおける組み込み MySQL のデプロイメントアーキテクチャ

複数クラスタにおける組み込み MySQL のデプロイメントアーキテクチャ

関連情報