全部產品
Search
文件中心

E-MapReduce:建立ClickHouse叢集

更新時間:Sep 02, 2025

本文為您介紹建立ClickHouse叢集的詳細操作步驟和相關配置。

背景資訊

機型、記憶體和磁碟的設定,請參見Usage Recommendations

前提條件

已在目標地區建立一個專用網路和交換器,詳情請參見建立和管理專用網路建立和管理交換器

操作步驟

  1. 進入建立叢集頁面。

    1. 登入EMR on ECS

    2. 可選:在頂部功能表列處,根據實際情況選擇地區和資源群組。

      • 地區:建立的叢集將會在對應的地區內,一旦建立不能修改。

      • 資源群組:預設顯示帳號全部資源。

    3. 單擊上方的建立叢集,進行建立。

  2. 配置叢集資訊。

    建立叢集時,您需要對叢集進行軟體配置、硬體設定、基礎配置和確認訂單。

    重要

    叢集建立完成後,除了叢集名稱以外,其他配置均無法修改,所以在建立時請仔細確認各項配置。

    1. 軟體配置。

      配置項

      說明

      地區

      建立的叢集將會在對應的地區內,一旦建立不能修改。

      業務情境

      選擇資料分析情境。

      產品版本

      預設最新的軟體版本。

      服務高可用

      預設關閉。

      可選服務

      需要選擇Clickhouse

      重要
      • EMR-5.11.0及後續版本、EMR-3.45.0及後續版本的叢集,選擇ClickHouse服務,預設會選擇ZooKeeper服務。

      • EMR-5.8.0(包含)至EMR-5.10.1(包含)版本的叢集,如果只選擇ClickHouse服務,則叢集會使用內建的ClickHouse Keeper來替換額外的ZooKeeper,但是內建的ClickHouse Keeper效能與ZooKeeper存在一定的差異,因此建議您選擇上ZooKeeper服務。

      • EMR-3.42.0至EMR-3.44.1(包含)版本的叢集:

        • 如果開啟了服務高可用開關,選擇ClickHouse服務時,預設會選擇ZooKeeper服務。

        • 如果未開啟服務高可用開關,選擇ClickHouse服務時,不會自動選擇ZooKeeper服務,但此時的ClickHouse沒有DDL的能力,因此建議您選擇上ZooKeeper服務。

      進階設定

      軟體自訂配置:可指定JSON檔案對叢集中的基礎軟體進行配置,詳細使用方法請參見配置自訂軟體。預設不開啟。

    2. 硬體設定。

      配置項

      說明

      付費類型

      預設訂用帳戶。當前支援的付費類型如下:

      • 隨用隨付:一種後付費模式,即先使用再付費。隨用隨付是根據實際使用的小時數來支付費用,每小時計費一次,適合短期的測試工作或是靈活的動態任務。

      • 訂用帳戶:一種預付費模式,即先付費再使用。

        說明

        建議測試情境下使用隨用隨付,測試正常後再建立一個訂用帳戶的生產叢集正式使用。

      可用性區域

      可用性區域為在同一地區下的不同物理地區,可用性區域之間內網互連。通常使用預設的可用性區域即可。

      專用網路

      如果沒有可用的VPC,單擊建立VPC前往建立。

      交換器

      選擇在對應VPC下可用性區域的交換器,如果在這個可用性區域沒有可用的交換器,則需要新建立一個。

      預設安全性群組

      預設選擇已有的安全性群組。安全性群組詳情請參見安全性群組概述

      您也可以單擊建立安全性群組來建立一個安全性群組。

      重要

      禁止使用ECS上建立的企業安全性群組。

      節點群組

      您可以根據需要選擇執行個體規格,詳情請參見執行個體規格類型系列

      • 系統硬碟:根據需要選擇ESSD雲端硬碟、SSD雲端硬碟或者高效雲端硬碟。

      • 系統硬碟大小:根據需要調整磁碟容量,預設為80 GB。取值範圍為80 ~ 5000 GB。

      • 資料盤:根據需要選擇ESSD雲端硬碟、SSD雲端硬碟或者高效雲端硬碟。

      • 資料盤大小:根據需要調整磁碟容量,預設為80 GB。取值範圍為40 ~ 32768 GB。

      • 執行個體數量

        • 關閉服務高可用開關:預設1台Master,1台Core。

        • 開啟服務高可用開關:預設3台Master,3台Core。

      • 掛載公網:叢集是否掛載Elastic IP Address地址,預設不開啟。

        說明

        建立後如果您需要使用公網IP地址訪問,請在ECS上申請開通公網IP地址,詳情請參見彈性公網 IP中的申請EIP的內容。

    3. 基礎配置。

      配置項

      說明

      叢集名稱

      叢集的名字,長度限制為1~64個字元,僅可使用中文、字母、數字、短劃線(-)和底線(_)。

      身份憑證

      金鑰組(預設):使用SSH金鑰組登入Linux執行個體。

      關於金鑰組的使用詳情,請參見SSH金鑰組

      密碼:設定Master節點的登入密碼,使用密碼對登入Linux執行個體。

      密碼規則:8~30個字元,且必須同時包含大寫字母、小寫字母、數字和特殊字元。

      特殊字元包括:驚嘆號(!)、at(@)、井號(#)、貨幣符號($)、百分比符號(%)、乘方(^)、and(&)和星號(*)。

      應用配置

      配置ClickHouse的副本(Replica)與分區(Shard)。

      進階設定

      • ECS應用角色:當您的程式在EMR計算節點上運行時,可不填寫阿里雲AccessKey來訪問相關的雲端服務(例如OSS),EMR會自動申請一個臨時AccessKey來授權本次訪問。ECS應用角色用於控制這個AccessKey的許可權。

      • 引導操作:可選配置,您可以在叢集啟動Hadoop前執行您自訂的指令碼,詳情請參見引導操作執行指令碼

      • 資源群組:可選配置。詳情請參見使用資源群組

  3. 當所有的資訊確認正確後,選中服務合約,單擊確認訂單

    重要
    • 隨用隨付叢集:立刻開始建立。 叢集建立完成後,叢集的狀態變為運行中

    • 訂用帳戶叢集:先產生訂單,支付完成訂單以後叢集才會開始建立。