Node gateway memainkan peran penting dalam Alibaba Cloud E-MapReduce (EMR). Node ini dapat dikaitkan dengan kluster EMR yang ada dan berfungsi sebagai titik pengiriman tugas terpisah. Topik ini menjelaskan kluster gateway dan grup node gateway serta memberikan panduan untuk membuat kluster gateway dan grup node gateway berdasarkan kluster EMR yang ada.
Kluster gateway atau grup node gateway adalah kluster atau grup node independen yang terdiri dari beberapa node gateway dengan konfigurasi seragam. Klien seperti Hadoop Distributed File System (HDFS), YARN, Hive, Spark 2, Spark 3, JindoSDK, Flink, Sqoop, Impala, Presto, Hudi, Iceberg, Tez, dan Delta Lake diimplementasikan pada kluster tersebut. Tanpa kluster gateway atau grup node gateway, tugas-tugas kluster EMR, seperti kluster Hadoop, akan dikirimkan ke node master atau node inti dari kluster tersebut, sehingga mengonsumsi sumber daya kluster. Setelah kluster gateway dibuat, Anda dapat menggunakan kluster ini untuk mengirimkan tugas-tugas dari kluster yang terkait, sehingga mengurangi beban sumber daya kluster terkait dan meningkatkan stabilitas node inti serta node master.
Setiap kluster gateway atau grup node gateway memiliki lingkungan konfigurasi yang independen. Sebagai contoh, Anda dapat membuat beberapa kluster gateway atau grup node gateway untuk satu kluster EMR yang digunakan bersama oleh beberapa departemen guna memenuhi kebutuhan bisnis mereka yang berbeda. Kluster gateway atau grup node gateway dapat dibuat berdasarkan jenis dan versi kluster. Untuk informasi lebih lanjut tentang cara membuat kluster gateway dan grup node gateway, lihat referensi berikut.
Jenis kluster | Referensi | |
Hadoop | ||
DataLake dan Dataflow | EMR V5.10.1 atau versi minor yang lebih baru | Anda dapat membuat grup node gateway. Untuk informasi lebih lanjut, lihat Kelola grup node. |
Versi minor sebelum EMR V5.10.1 | ||
OLAP | ||