全部产品
Search
文档中心

E-MapReduce:Apa itu EMR on ACK

更新时间:Nov 10, 2025

Alibaba Cloud E-MapReduce (EMR) on ACK menyediakan pendekatan baru untuk membangun platform data besar. Layanan ini memungkinkan Anda menerapkan layanan data besar open source di Alibaba Cloud Container Service for Kubernetes (ACK). Fitur penyebaran layanan dan manajemen kontainer dari ACK mengurangi beban operasi dan pemeliharaan (O&M) pada sumber daya kluster dasar, sehingga Anda dapat fokus pada tugas data besar.

Perbandingan fitur

Alibaba Cloud EMR menyediakan EMR on ECS dan EMR on ACK untuk memenuhi kebutuhan pengguna yang berbeda.

  • Jika Anda menggunakan EMR on ECS, Anda dapat membuat kluster EMR untuk menjalankan pekerjaan Spark dan Presto. Pengaturan ini memungkinkan aplikasi yang berbeda berbagi satu kluster ACK, serta memungkinkan sumber daya komputasi dibagi lintas zona.

  • Jika Anda sudah menjalankan pekerjaan data besar, seperti pekerjaan Spark dan Presto, pada kluster ACK, EMR on ACK mengotomatiskan penyebaran dan manajemen kluster. Integrasi EMR on ACK dengan EMR Shuffle Service secara signifikan meningkatkan kinerja pekerjaan Spark.

ECS-on-ACK

Jenis

Deskripsi

EMR on ECS

EMR menerapkan komponen ekosistem Hadoop open source pada instance ECS dan menjalankannya sebagai layanan. Anda dapat mengelola instance ECS dan layanan kluster di Konsol EMR.

Anda mengirimkan pekerjaan data besar Anda ke kluster EMR.

EMR on ACK

Pertama, terapkan kluster ACK. Setelah kluster ACK siap, EMR menerapkan komponen layanan data besar berdasarkan sumber daya ACK dan menjalankannya dalam kontainer.

Keunggulan EMR pada ACK

Keunggulan

Deskripsi

Hemat biaya

Anda dapat menjalankan pekerjaan data besar pada kluster ACK yang sudah ada dengan konfigurasi sederhana. Hal ini menghindari biaya pembelian kluster ACK terpisah untuk layanan data besar.

Anda dapat menggunakan kembali sumber daya menganggur pada kluster ACK yang sudah ada untuk menjalankan pekerjaan EMR, seperti pekerjaan Spark dan Presto, hanya dengan satu klik. Data besar dan aplikasi online dapat berbagi sumber daya kluster.

Dalam skenario beban kerja campuran yang mencakup tugas online dan offline, sumber daya dimanfaatkan secara penuh. Data besar dan aplikasi online berbagi sumber daya kluster, yang memungkinkan penggeseran beban puncak.

O&M disederhanakan

Satu sistem O&M dan manajemen kluster mencakup berbagai layanan, termasuk data besar dan aplikasi online. Hal ini menyederhanakan O&M.

Pengalaman pengguna yang dioptimalkan

Platform EMR mendukung dua model Infrastruktur sebagai Layanan (IaaS): EMR on ECS dan EMR on ACK. Anda dapat beralih antara kedua model tersebut secara mulus.

Pengiriman sumber daya yang cepat dari ACK dan Elastic Container Instance (ECI) mempersingkat waktu untuk mendapatkan sumber daya komputasi elastis. Hal ini membantu Anda menangani permintaan komputasi puncak.

Anda dapat menyesuaikan versi Spark pada tingkat pekerjaan. Hal ini memudahkan Anda mencoba fitur-fitur baru dan memenuhi berbagai kebutuhan versi bisnis.

Integrasi mendalam

EMR on ACK menggunakan arsitektur data lake cloud-native. Layanan ini menggunakan Alibaba Cloud ACK untuk komputasi, yang memungkinkan penskalaan sumber daya komputasi tanpa batas. Layanan ini menggunakan Alibaba Cloud Object Storage Service (OSS) untuk penyimpanan, yang memisahkan penyimpanan dari komputasi. Layanan ini menggunakan Data Lake Formation (DLF) untuk metadata guna membantu Anda membangun data lake Anda.