このトピックでは、E-MapReduce(EMR)でサポートされているElastic Compute Service(ECS)インスタンスファミリーとその使用シナリオについて説明します。
EMRでサポートされているECSインスタンスファミリー
- 汎用
このインスタンスファミリーは、ストレージにクラウドディスクを使用します。 vCPUとメモリの比率は1:4です。たとえば、8 vCPUと 32 GiBのメモリです。
- コンピューティング最適化
このインスタンスファミリーは、ストレージにクラウドディスクを使用し、より多くのコンピューティングリソースを提供します。 vCPUとメモリの比率は1:2です。たとえば、8 vCPUと 16 GiBのメモリです。
- メモリ最適化
このインスタンスファミリーは、ストレージにクラウドディスクを使用し、より多くのメモリリソースを提供します。 vCPUとメモリの比率は1:8です。たとえば、8 vCPUと 64 GiBのメモリです。
- ビッグデータ
このインスタンスファミリーは、ストレージにローカルSATAディスクを使用します。これは非常に費用対効果が高いです。 大量のデータ(テラバイト)を保存する場合、このインスタンスファミリーを使用することをお勧めします。
説明 コアノードは、Hadoop、Data Science、Dataflow、およびDruidクラスターでのみ作成できます。 - ローカルSSDタイプ
このインスタンスファミリーは、ストレージにローカルSSDを使用します。これにより、高いランダムIOPSと高いスループットが提供されます。
- 共有タイプ(エントリレベル)
このインスタンスファミリーのインスタンスはCPUを共有するため、大量のコンピューティングを必要とするシナリオでは安定しません。 このインスタンスファミリーはエントリレベルのユーザーには適していますが、企業のお客様には適していません。
- GPU
このインスタンスファミリーは、異種GPUベースのモデルであり、機械学習などのシナリオに適用されます。
インスタンスファミリーの使用シナリオ
- マスターノード
汎用およびメモリ最適化インスタンスファミリーのインスタンスは、EMRのマスターノードとして機能できます。 データの信頼性を確保するために、データがクラウドディスクに保存されるシナリオに適しています。
- コアノード
- 汎用、コンピューティング最適化、およびメモリ最適化インスタンスファミリーのインスタンスは、EMRのコアノードとして機能できます。 データ量がテラバイト未満で、OSSがプライマリデータストレージとして使用されるシナリオに適しています。
- データ量が 10 テラバイト以上の場合は、ビッグデータタイプの方が費用対効果が高いため、使用することをお勧めします。重要 ローカルディスクを使用する場合、HDFSデータはローカルディスクに保存されるため、データの信頼性を確保できません。
- タスクノード
ビッグデータファミリーを除くすべてのインスタンスファミリーをタスクノードに使用して、クラスターのコンピューティング機能を向上させることができます。