Supersetは軽量のビジネスインテリジェンス(BI)ツールです。Supersetを複数のデータソースに接続し、分析、視覚化、チャートとダッシュボードの定義に使用できます。また、Supersetを使用して、ダッシュボードのインポートまたはエクスポート、ユーザーとロールの権限の管理を行うこともできます。このトピックでは、Supersetの使用方法について説明します。例では、E-MapReduce(EMR) V3.34.0クラスターを使用しています。
背景情報
SupersetはEMR Druidクラスターに深く統合されており、さまざまなリレーショナルデータベースをサポートしています。EMR DruidはSQLをサポートしています。Apache Druidのネイティブクエリ言語またはSQLを使用して、SupersetからEMR Druidにアクセスできます。
前提条件
EMR HadoopまたはDruidクラスターが作成され、クラスターの作成時にオプションサービスからSupersetが選択されています。詳細については、「クラスターの作成」をご参照ください。
制限事項
デフォルトでは、Supersetはクラスターのemr-header-1ノードにインストールされます。Supersetを高可用性(HA)モードでデプロイすることはできません。
Knoxを使用してSupersetのWeb UIにアクセスすることはできません。
Supersetを使用する前に、コンピューターがクラスターのemr-header-1ノードにアクセスできることを確認する必要があります。詳細については、「オープンソースコンポーネントの Web UI にアクセスするための SSH トンネルの作成」をご参照ください。
SupersetからEMR Druidにアクセスする
SupersetのWeb UIにログオンします。
SSHトンネルを作成して、SupersetのWeb UIにログオンします。詳細については、「オープンソースコンポーネントの Web UI にアクセスするための SSH トンネルの作成」をご参照ください。
デフォルトのユーザー名とパスワードはどちらもadminです。Web UIにログオンしたら、パスワードを変更してください。
説明初めてログオンすると、英語のWeb UIが表示されます。
EMR Druidクラスターを追加します。
を選択します。
アイコンをクリックします。[druidクラスターの追加] ダイアログボックスで、パラメーターを設定します。

パラメーター
説明
Brokerホスト
emr-header-1と入力します。これは固定値です。
Brokerポート
パラメーターを1+オープンソースブローカーのポート番号の形式の値に設定します。
たとえば、オープンソースブローカーのポート番号が8082の場合は、このパラメーターを18082に設定します。
クラスター名
EMRコンソールで作成したDruidクラスターの名前を入力します。
[保存] をクリックします。
データソースを追加します。
を選択します。
アイコンをクリックします。[druidデータソースの追加] ダイアログボックスで、パラメーターを設定します。

パラメーター
説明
データソース名
データベース名をカスタマイズします。
クラスター
追加したEMR Druidクラスターの名前。
[保存] をクリックします。
設定を保存した後、
アイコンをクリックして、ディメンション列とメトリック列を指定できます。
追加されたEMR Druidクラスターに関する情報を表示します。
データソースが追加された後、データソース名をクリックして、追加されたEMR Druidクラスターに関する情報を表示できます。

SupersetからHiveデータベースにアクセスする
SQLAlchemyはSupersetに統合されており、MySQL、Oracle、PostgreSQL、Microsoft SQL Serverなど、複数の言語でさまざまなデータベースをサポートしています。Supersetは、Hive、Presto、Druidなどのビッグデータクエリエンジンもサポートしています。このセクションでは、SupersetからHiveデータベースにアクセスする方法について説明します。Hiveは、デフォルトでEMR Hadoopクラスターにインストールされています。Supersetから他のタイプのデータベースにアクセスする方法の詳細については、「SQLAlchemy」をご参照ください。
SupersetのWeb UIにログオンします。
Superset の Web UI にログインするために SSH トンネルを作成します。詳細については、「オープンソースコンポーネントの Web UI にアクセスするための SSH トンネルの作成」をご参照ください。
デフォルトのユーザー名とパスワードはどちらもadminです。Web UIにログオンしたら、パスワードを変更してください。
Hiveデータベースを追加します。
を選択します。
アイコンをクリックします。[データベースの追加] ダイアログボックスで、パラメーターを設定します。

パラメーター
説明
データベース
追加するデータベースの名前。
SQLAlchemy URI
hive://emr-header-1:10000/ と入力します。
[保存] をクリックします。
テーブルを追加します。
を選択します。
アイコンをクリックします。[テーブル定義のインポート] ダイアログボックスで、パラメーターを設定します。

パラメーター
説明
データベース
追加したデータベースの名前。
テーブル名
追加したデータベースに格納されているテーブルの名前。
この例では、testテーブルが追加されます。
[保存] をクリックします。
追加したデータベースからデータをクエリします。
を選択します。
追加されたデータベース Hive JDBC Server を選択します。
[default] モードを選択します。
Hiveコマンドを実行して、データベースからデータをクエリします。
FAQ
問題の説明:管理者ユーザーが、マイナーバージョンが V4.6 以前または V3.33 以前の EMR クラスターから Superset の Web UI に初めてログオンすると、「無効なログイン」メッセージが表示されます。
解決策
SSH モードで EMR クラスターのマスターノードにログオンします。詳細については、「クラスターにログオンする」をご参照ください。
重要以下の手順は、rootユーザーとして実行する必要があります。
次のコマンドを実行して、Supersetコマンドラインインターフェース(CLI)に移動します。
source /usr/lib/superset-current/bin/activate次のコマンドを実行して、管理者を作成します。
superset fab create-adminプロンプトが表示されたら、ユーザー名とパスワードを入力し、パスワードを確認します。
Username [admin]: User first name [admin]: User last name [user]: Email [admin@fab.org]: Password: Repeat for confirmation: Recognized Database Authentications. Admin User admin created.作成したユーザーを初期化します。
次のコマンドを実行して、データベースを初期化します。
superset db upgrade次のコマンドを実行して、Supersetを初期化します。
superset init上記の手順を実行した後、オープンソースコンポーネントのWeb UIにアクセスするために使用するSSHトンネルを作成する必要があります。その後、作成したユーザーとしてSupersetのWeb UIにログオンできます。SSHトンネルの作成方法の詳細については、「オープンソースコンポーネントの Web UI にアクセスするための SSH トンネルの作成」をご参照ください。