配置Dataphin的Hadoop計算引擎-智能資料建設與治理 Dataphin-阿里雲

在您開始建立用於研發資料的專案空間前，需要先設定Dataphin執行個體的計算引擎。設定Dataphin執行個體的計算引擎後，系統支援為專案空間添加相應的計算源，為專案空間提供計算和儲存的資源。本文為您介紹如何設定Dataphin系統的計算引擎為Hadoop。

前提條件

已完成系統中繼資料的初始化，請參見使用Hadoop作為元倉計算引擎進行元倉初始化。

操作步驟

使用超級管理員帳號，登入Dataphin控制台。
在Dataphin首頁的頂部功能表列中，選擇管理中心 > 系統設定。

在計算設定頁面，選擇Hadoop類型的計算引擎並配置計算引擎參數。

Hadoop類型的計算引擎包括：Aliyun E-MapReduce3.x Hadoop、Aliyun E-MapReduce5.x Hadoop、CDH5.x

Hadoop、CDH6.x Hadoop、Cloudera Data Platform 7.x、華為 FusionInsight 8.x

Hadoop、亞信DP5.3 Hadoop。

說明

當計算引擎選擇為Aliyun E-MapReduce3.x Hadoop、Aliyun E-MapReduce5.x Hadoop、CDH5.x Hadoop、CDH6.x Hadoop、Cloudera Data Platform 7.x、亞信DP5.3 Hadoop、華為 FusionInsight 8.x Hadoop時，僅需選擇離線計算引擎類型，無需配置以下計算引擎參數。儲存計算引擎類型後，可單擊配置計算叢集，在規劃 > 計算源 > 管理Hadoop叢集頁面中新增或配置Hadoop叢集。

參數	描述
NameNode	Hadoop支援添加同叢集多個HDFS地址，只要有一個地址校正成功，即可完成中繼資料採集。例如`host=192.xxx.xx.xxx,webUiPort=500xxx,ipcPort=80xx`。
執行引擎	根據實際業務情況，選擇計算執行引擎。

單擊儲存。

後續步驟

完成Dataphin執行個體計算引擎的設定後，系統支援為建立的專案空間添加相應的計算源，為專案空間提供計算和儲存的資源。如何建立專案空間及添加計算源，請參見建立通用專案。