Gateway一般為獨立的一個叢集,由多台相同配置的節點群組成。

在建立Gateway叢集時,可以關聯到一個已經存在的Hadoop叢集上,該叢集上會部署Hadoop(HDFS+YARN)、Hive、Spark、Sqoop、Pig等用戶端,方便對叢集進行操作。這樣做的好處是:它可以作為一個獨立的提交點,不會佔用叢集的資源,尤其是在Master提交的方式,可以提高Master節點的穩定性。如果作業太多,可以動態增加節點。

您可以建立多個不同的Gateway叢集,來給不同的使用者使用,讓他們可以使用各自專屬的環境配置來滿足不同的業務需求。