Druid叢集整合了Superset工具。Superset對Druid做了深度整合,同時也支援多種關係型資料庫。由於Druid也支援SQL,所以可以通過Superset以兩種方式訪問Druid,即Druid原生查詢語言或者SQL。

Superset預設安裝在emr-header-1節點,目前還不支援HA。在使用該工具前,確保您的主機能夠正常訪問emr-header-1。您可以通過打 SSH 隧道 的方式串連到主機。

  1. 登入Superset。

    在瀏覽器地址欄中輸入 http://emr-header-1:18088 後斷行符號,開啟Superset登入介面,預設使用者名/密碼為 admin/admin,請您登入後及時修改密碼。



  2. 添加 Druid 叢集。

    登入後預設為英文介面,可點擊右上方的國旗表徵圖選擇合適的語言。接下來在上方功能表列中依次選擇資料來源 > Druid 叢集來添加一個 Druid 叢集。

    配置好協調機(Coordinator)和代理機(Broker)的地址,注意 E-MapReduce 中預設連接埠均為相應的開源連接埠前加數字1,例如開源 Broker 連接埠為 8082,E-MapReduce 中為 18082。

  3. 重新整理或者添加新資料來源。

    添加好 Druid 叢集之後,您可以單擊資料來源 > 掃描新的資料來源,這時 Druid 叢集上的資料來源(datasource)就可以自動被載入進來。

    您也可以在介面上單擊資料來源 > Druid 資料來源自訂新的資料來源(其操作等同於寫一個 data source ingestion 的 json 檔案),步驟如下:

    自訂資料來源時需要填寫必要的資訊,然後儲存。

    儲存之後點擊左側三個小表徵圖中的第二個,編輯該資料來源,填寫相應的維度列與指標列等資訊。

  4. 查詢 Druid。

    資料來源添加成功後,單擊資料來源名稱,進入查詢頁面進行查詢。



  5. (可選)將 Druid 作為 資料庫使用。

    Superset 提供了 SQLAlchemy 以多種方言支援各種各樣的資料庫,其支援的資料庫類型如下表所示。



    Superset 亦支援該方式訪問 Druid,Druid 對應的 SQLAlchemy URI 為 “druid://emr-header-1:18082/druid/v2/sql”,如下圖所示,將 Druid 作為一個資料庫添加:

    接下來就可以在 SQL 工具箱裡用 SQL 進行查詢了: