在您開始建立用於研發資料的專案空間前,需要先設定Dataphin執行個體的計算引擎。設定Dataphin執行個體的計算引擎後,系統支援為專案空間添加相應的計算源,為專案空間提供計算和儲存的資源。本文為您介紹如何設定Dataphin系統的計算引擎為Hadoop。
前提條件
已完成系統中繼資料的初始化,請參見使用Hadoop作為元倉計算引擎進行元倉初始化。
操作步驟
使用超級管理員帳號,登入Dataphin控制台。
在Dataphin首頁的頂部功能表列中,選擇管理中心 > 系統設定。
在計算設定頁面,選擇Hadoop類型的計算引擎並配置計算引擎參數。
Hadoop類型的計算引擎包括:Aliyun E-MapReduce3.x Hadoop、Aliyun E-MapReduce5.x Hadoop、CDH5.x
Hadoop、CDH6.x Hadoop、Cloudera Data Platform 7.x、華為 FusionInsight 8.x
Hadoop、亞信DP5.3 Hadoop。
說明當計算引擎選擇為Aliyun E-MapReduce3.x Hadoop、Aliyun E-MapReduce5.x Hadoop、CDH5.x Hadoop、CDH6.x Hadoop、Cloudera Data Platform 7.x、亞信DP5.3 Hadoop、華為 FusionInsight 8.x Hadoop時,僅需選擇離線計算引擎類型,無需配置以下計算引擎參數。儲存計算引擎類型後,可單擊配置計算叢集,在規劃 > 計算源 > 管理Hadoop叢集頁面中新增或配置Hadoop叢集。
參數
描述
NameNode
Hadoop支援添加同叢集多個HDFS地址,只要有一個地址校正成功,即可完成中繼資料採集。例如
host=192.xxx.xx.xxx,webUiPort=500xxx,ipcPort=80xx。執行引擎
根據實際業務情況,選擇計算執行引擎。
單擊儲存。
後續步驟
完成Dataphin執行個體計算引擎的設定後,系統支援為建立的專案空間添加相應的計算源,為專案空間提供計算和儲存的資源。如何建立專案空間及添加計算源,請參見建立通用專案。