すべてのプロダクト
Search
ドキュメントセンター

E-MapReduce:Superset(既存ユーザーのみ利用可能)

最終更新日:Mar 21, 2025

Supersetは軽量のビジネスインテリジェンス(BI)ツールです。Supersetを複数のデータソースに接続し、分析、視覚化、チャートとダッシュボードの定義に使用できます。また、Supersetを使用して、ダッシュボードのインポートまたはエクスポート、ユーザーとロールの権限の管理を行うこともできます。このトピックでは、Supersetの使用方法について説明します。例では、E-MapReduce(EMR) V3.34.0クラスターを使用しています。

背景情報

SupersetはEMR Druidクラスターに深く統合されており、さまざまなリレーショナルデータベースをサポートしています。EMR DruidはSQLをサポートしています。Apache Druidのネイティブクエリ言語またはSQLを使用して、SupersetからEMR Druidにアクセスできます。

前提条件

EMR HadoopまたはDruidクラスターが作成され、クラスターの作成時にオプションサービスからSupersetが選択されています。詳細については、「クラスターの作成」をご参照ください。

制限事項

  • デフォルトでは、Supersetはクラスターのemr-header-1ノードにインストールされます。Supersetを高可用性(HA)モードでデプロイすることはできません。

  • Knoxを使用してSupersetのWeb UIにアクセスすることはできません。

  • Supersetを使用する前に、コンピューターがクラスターのemr-header-1ノードにアクセスできることを確認する必要があります。詳細については、「オープンソースコンポーネントの Web UI にアクセスするための SSH トンネルの作成」をご参照ください。

SupersetからEMR Druidにアクセスする

  1. SupersetのWeb UIにログオンします。

    SSHトンネルを作成して、SupersetのWeb UIにログオンします。詳細については、「オープンソースコンポーネントの Web UI にアクセスするための SSH トンネルの作成」をご参照ください。

    デフォルトのユーザー名とパスワードはどちらもadminです。Web UIにログオンしたら、パスワードを変更してください。

    説明

    初めてログオンすると、英語のWeb UIが表示されます。

  2. EMR Druidクラスターを追加します。

    1. [ソース] > [druidクラスター] を選択します。

    2. Add アイコンをクリックします。

    3. [druidクラスターの追加] ダイアログボックスで、パラメーターを設定します。

      Add Druid

      パラメーター

      説明

      Brokerホスト

      emr-header-1と入力します。これは固定値です。

      Brokerポート

      パラメーターを1+オープンソースブローカーのポート番号の形式の値に設定します。

      たとえば、オープンソースブローカーのポート番号が8082の場合は、このパラメーターを18082に設定します。

      クラスター名

      EMRコンソールで作成したDruidクラスターの名前を入力します。

    4. [保存] をクリックします。

  3. データソースを追加します。

    1. [ソース] > [druidデータソース] を選択します。

    2. Add アイコンをクリックします。

    3. [druidデータソースの追加] ダイアログボックスで、パラメーターを設定します。

      datasource

      パラメーター

      説明

      データソース名

      データベース名をカスタマイズします。

      クラスター

      追加したEMR Druidクラスターの名前。

    4. [保存] をクリックします。

      設定を保存した後、Edit アイコンをクリックして、ディメンション列とメトリック列を指定できます。

  4. 追加されたEMR Druidクラスターに関する情報を表示します。

    データソースが追加された後、データソース名をクリックして、追加されたEMR Druidクラスターに関する情報を表示できます。 check-datasource

SupersetからHiveデータベースにアクセスする

SQLAlchemyはSupersetに統合されており、MySQL、Oracle、PostgreSQL、Microsoft SQL Serverなど、複数の言語でさまざまなデータベースをサポートしています。Supersetは、Hive、Presto、Druidなどのビッグデータクエリエンジンもサポートしています。このセクションでは、SupersetからHiveデータベースにアクセスする方法について説明します。Hiveは、デフォルトでEMR Hadoopクラスターにインストールされています。Supersetから他のタイプのデータベースにアクセスする方法の詳細については、「SQLAlchemy」をご参照ください。

  1. SupersetのWeb UIにログオンします。

    Superset の Web UI にログインするために SSH トンネルを作成します。詳細については、「オープンソースコンポーネントの Web UI にアクセスするための SSH トンネルの作成」をご参照ください。

    デフォルトのユーザー名とパスワードはどちらもadminです。Web UIにログオンしたら、パスワードを変更してください。

  2. Hiveデータベースを追加します。

    1. [ソース] > [データベース] を選択します。

    2. Add アイコンをクリックします。

    3. [データベースの追加] ダイアログボックスで、パラメーターを設定します。

      DataBase

      パラメーター

      説明

      データベース

      追加するデータベースの名前。

      SQLAlchemy URI

      hive://emr-header-1:10000/ と入力します。

    4. [保存] をクリックします。

  3. テーブルを追加します。

    1. [ソース] > [テーブル] を選択します。

    2. Add アイコンをクリックします。

    3. [テーブル定義のインポート] ダイアログボックスで、パラメーターを設定します。

      add table

      パラメーター

      説明

      データベース

      追加したデータベースの名前。

      テーブル名

      追加したデータベースに格納されているテーブルの名前。

      この例では、testテーブルが追加されます。

    4. [保存] をクリックします。

  4. 追加したデータベースからデータをクエリします。

    1. [SQL Lab] > [SQLエディター] を選択します。

    2. 追加されたデータベース Hive JDBC Server を選択します。

    3. [default] モードを選択します。

    4. Hiveコマンドを実行して、データベースからデータをクエリします。

FAQ

  • 問題の説明:管理者ユーザーが、マイナーバージョンが V4.6 以前または V3.33 以前の EMR クラスターから Superset の Web UI に初めてログオンすると、「無効なログイン」メッセージが表示されます。

  • 解決策

    1. SSH モードで EMR クラスターのマスターノードにログオンします。詳細については、「クラスターにログオンする」をご参照ください。

      重要

      以下の手順は、rootユーザーとして実行する必要があります。

    2. 次のコマンドを実行して、Supersetコマンドラインインターフェース(CLI)に移動します。

      source /usr/lib/superset-current/bin/activate
    3. 次のコマンドを実行して、管理者を作成します。

      superset fab create-admin

      プロンプトが表示されたら、ユーザー名とパスワードを入力し、パスワードを確認します。

      Username [admin]:
      User first name [admin]:
      User last name [user]:
      Email [admin@fab.org]:
      Password:
      Repeat for confirmation:
      Recognized Database Authentications.
      Admin User admin created.
    4. 作成したユーザーを初期化します。

      1. 次のコマンドを実行して、データベースを初期化します。

        superset db upgrade
      2. 次のコマンドを実行して、Supersetを初期化します。

        superset init

        上記の手順を実行した後、オープンソースコンポーネントのWeb UIにアクセスするために使用するSSHトンネルを作成する必要があります。その後、作成したユーザーとしてSupersetのWeb UIにログオンできます。SSHトンネルの作成方法の詳細については、「オープンソースコンポーネントの Web UI にアクセスするための SSH トンネルの作成」をご参照ください。