E-MapReduce(EMR)クラスターは、セルフマネージド Hadoop クラスターではサポートされていない自動スケーリングと自動 O&M 機能をサポートしています。これらの機能により、O&M の複雑さが軽減されます。EMR は、クラスターデータを保護するためのユーザー管理、データ暗号化、および権限管理機能も提供し、さまざまなオープンソースコンポーネントを統合して、ビッグデータの処理と分析を支援します。
比較項目 | EMR クラスター | セルフマネージド Hadoop クラスター |
コストと効率 | EMR クラスターは数分で作成できるため、ビジネス要件に迅速に対応できます。従量課金とサブスクリプションの課金方法がサポートされています。 | 事前にリソースを見積もり、サーバーを購入し、Hadoop コンポーネントをデプロイする必要があります。セルフマネージドクラスターの作成には数週間かかる場合があります。 |
EMR クラスターのリソースは柔軟に調整でき、データをさまざまなレイヤーに保存できます。リソース使用率は高くなります。 | リソースは比較的固定されています。リソース使用率は低くなります。 | |
追加のソフトウェアライセンス料は発生しません。 | Hadoop ディストリビューションが使用されます。そのため、追加のライセンス料が発生します。 | |
使いやすさ | デフォルトのパラメーターはクラスターの仕様に基づいて最適化され、コアコンポーネントの機能が強化されています。これにより、オープンソースコンポーネントのパフォーマンスが大幅に向上します。 | オープンソースコミュニティバージョンが使用されます。ビジネス要件に基づいてパフォーマンスを最適化する必要があります。これにより、開発の複雑さが増します。 |
EMR クラスターは大規模企業の環境で検証されており、オープンソースソフトウェアのバージョンに基づいて継続的にアップグレードされています。バグは定期的に修正されます。 | オープンソースコンポーネントをアップグレードする必要があります。 | |
EMR クラスターのコンポーネントは、専門的な互換性テストに合格しており、セルフマネージドクラスターよりも優れたユーザーエクスペリエンスを提供します。 | さまざまなコンポーネントのバージョン互換性をテストし、バグを修正する必要があります。 | |
O&M とモニタリング | クラスターのコンピューティングリソースは、時間またはクラスターの負荷によって動的に調整できるため、数分でコンピューティング能力を拡張できます。詳細については、「自動スケーリング」をご参照ください。 | クラスターリソースは、ビジネス負荷のピークとトラフに基づいて動的に調整することはできません。 |
EMR は、クラスター O&M の実装に役立つモニタリングおよび診断機能を提供します。詳細については、「ヘルス診断を開始する」および「レポートで毎日のクラスターレポートと分析結果を表示する」をご参照ください。 | クラスターのモニタリングと診断は、専門の O&M 担当者に依存しているため、問題の処理効率が低くなります。 | |
セキュリティとエコシステム | 企業は、EMR クラスターによって提供されるマルチテナンシー機能に基づいてリソースを管理し、テーブル、列、行の権限、および監査ログを管理できます。データの暗号化がサポートされています。 | マルチテナンシー機能を設定する必要があります。マルチテナンシー機能はさらなる最適化が必要であり、企業の要件を満たすことができません。 |
Alibaba Cloud エコシステムは、オープンソースエコシステムを統合し、DataWorks、Data Lake Formation(DLF)、CloudMonitor などの他のサービスに接続できます。 | クラスター機能はオープンソースエコシステムに基づいて構築されているため、コストが高く、時間がかかります。 | |
サービスサポート | 専門的かつ上級のビッグデータチームがアフターサービスサポートを提供できます。詳細については、「テクニカルサポートの範囲と連絡方法」をご参照ください。 | 公式のサービスサポートはありません。問題のトラブルシューティングはセルフマネージドチームに依存しているため、O&M の複雑さが増します。 |