Alibaba Cloud E-MapReduce(EMR)は、エンタープライズレベルで便利で制御可能なオープンソースビッグデータサービスを提供します。Hadoop、Spark、Flink、Kafka、HBaseなどのオープンソースビッグデータサービスを簡単にデプロイできます。
安定した信頼性の高いオープンソースコンポーネント
オープンソースコンポーネントが使用されます。EMRの各バージョンは、オープンソースコンポーネントの最新バージョンを提供します。EMRバージョンとオープンソースコンポーネントバージョンのマッピングの詳細については、リリースバージョンをご参照ください。
EMRはオープンソースコンポーネントに完全に適合しており、さまざまなオープンソースコンポーネント間のバージョンの互換性の問題を解消しています。
EMRは、オープンソースコンポーネント向けにAlibaba Cloudで強化されたデプロイ環境を提供します。これにより、オープンソースコミュニティよりもはるかに高いパフォーマンスが保証されます。
費用対効果
固定構成を使用する従来のHDFSベースのクラスターと比較して、EMRクラスターは自動スケーリングと階層型ストレージメカニズムを使用しており、コストを50%以上削減できます。
プリエンティブルインスタンスを作成できます。従量課金制と比較して、プリエンティブルインスタンスは料金を50%~80%削減できます。詳細については、プリエンティブルインスタンスとはをご参照ください。
使いやすさ
数分でクラスターを作成またはスケールアウトできます。サービスを手動でデプロイまたは開始する必要はありません。
EMRは、クラスターのハードウェアとHadoopサービスを網羅する包括的な監視およびアラートシステムを提供します。アラートテンプレートを設定できます。
スケーラビリティ
コンピューティングとストレージの分離:コンピューティングとストレージは分離されており、リソースの柔軟な使用をサポートします。
カスタムクラスター環境:ブートストラップアクションとクラスタースクリプトを使用して、クラスター環境を柔軟に構成し、サードパーティの最適化ツールまたはクラスター管理ツールをEMRにデプロイできます。詳細については、ブートストラップアクションの管理とクラスタースクリプトをご参照ください。
セルフマネージドメンテナンス:クラスターのマスターノードにログオンし、クラスターのログとデプロイ環境を表示し、構成を最適化できます。詳細については、「頻繁に使用されるファイルのパス」をご参照ください。
自動スケーリング:EMRは、ビジネス要件に基づいてクラスターを自動的にスケールインまたはスケールアウトできます。
緊密な統合
Alibaba Cloud Elastic Compute Service(ECS)およびContainer Service for Kubernetes(ACK)に基づいてEMRクラスターをデプロイできます。さまざまなECSインスタンスタイプがサポートされています。ビジネス要件に基づいて、使用するインスタンスタイプを決定できます。詳細については、ECSインスタンスをご参照ください。
EMRはDataWorksに統合されています。DataWorksでEMRをジョブコンピューティングおよびデータストレージエンジンとして使用できます。
Data Lake Formation(DLF)はEMRに統合されています。データレイクシナリオでは、EMRを使用すると、複数のエンジンのメタデータを一元的に管理できます。