全部产品
Search
文档中心

E-MapReduce:Superset (hanya tersedia untuk pengguna yang sudah ada)

更新时间:Jul 06, 2025

Superset adalah alat business intelligence (BI) ringan. Anda dapat menghubungkan Superset ke berbagai sumber data dan menggunakannya untuk menganalisis, memvisualisasikan, serta mendefinisikan grafik dan dasbor. Superset juga dapat digunakan untuk mengimpor atau mengekspor dasbor serta mengelola izin pengguna dan peran. Topik ini menjelaskan cara menggunakan Superset. Contoh dalam topik ini menggunakan kluster E-MapReduce (EMR) V3.34.0.

Informasi latar belakang

Superset terintegrasi secara mendalam dengan kluster EMR Druid dan mendukung berbagai database relasional. EMR Druid mendukung SQL. Anda dapat menggunakan bahasa query asli Apache Druid atau SQL untuk mengakses EMR Druid dari Superset.

Prasyarat

Kluster EMR Hadoop atau Druid telah dibuat, dan Superset dipilih dari layanan opsional saat pembuatan kluster. Untuk informasi lebih lanjut, lihat Buat Kluster.

Batasan

  • Secara default, Superset diinstal pada node emr-header-1 dari kluster. Superset tidak mendukung mode high-availability (HA).

  • Anda tidak dapat menggunakan Knox untuk mengakses antarmuka web Superset.

  • Sebelum menggunakan Superset, pastikan komputer Anda dapat mengakses node emr-header-1 dari kluster. Untuk informasi lebih lanjut, lihat Buat Terowongan SSH untuk Mengakses Antarmuka Web Komponen Open Source.

Akses EMR Druid dari Superset

  1. Masuk ke antarmuka web Superset.

    Buat terowongan SSH untuk masuk ke antarmuka web Superset. Untuk informasi lebih lanjut, lihat Buat Terowongan SSH untuk Mengakses Antarmuka Web Komponen Open Source.

    Nama pengguna dan kata sandi default keduanya adalah admin. Ubah kata sandi setelah masuk ke antarmuka web.

    Catatan

    Antarmuka web dalam bahasa Inggris akan muncul setelah login pertama kali.

  2. Tambahkan kluster EMR Druid.

    1. Pilih Sources > Druid Clusters.

    2. Klik ikon Add.

    3. Di kotak dialog Add Druid Cluster, konfigurasikan parameter.

      Add Druid

      Parameter

      Deskripsi

      Broker Host

      Masukkan emr-header-1. Ini adalah nilai tetap.

      Broker Port

      Atur parameter ini ke format 1+nomor port broker open source.

      Contohnya, jika nomor port broker open source adalah 8082, atur parameter ini menjadi 18082.

      Cluster Name

      Masukkan nama kluster Druid yang Anda buat di konsol EMR.

    4. Klik Save.

  3. Tambahkan sumber data.

    1. Pilih Sources > Druid Datasources.

    2. Klik ikon Add.

    3. Di kotak dialog Add Druid Datasource, konfigurasikan parameter.

      datasource

      Parameter

      Deskripsi

      Datasource Name

      Kustomisasi nama database.

      Cluster

      Nama kluster EMR Druid yang Anda tambahkan.

    4. Klik Save.

      Setelah menyimpan konfigurasi, Anda dapat mengklik ikon Edit untuk menentukan kolom dimensi dan kolom metrik.

  4. Lihat informasi tentang kluster EMR Druid yang ditambahkan.

    Setelah menambahkan sumber data, Anda dapat mengklik nama sumber data untuk melihat informasi tentang kluster EMR Druid yang ditambahkan. check-datasource

Akses database Hive dari Superset

SQLAlchemy terintegrasi ke dalam Superset untuk mendukung berbagai database dalam beberapa bahasa, seperti MySQL, Oracle, PostgreSQL, dan Microsoft SQL Server. Superset juga mendukung mesin query big data seperti Hive, Presto, dan Druid. Bagian ini menjelaskan cara mengakses database Hive dari Superset. Hive diinstal secara default di kluster EMR Hadoop. Untuk informasi lebih lanjut tentang cara mengakses jenis database lainnya dari Superset, lihat SQLAlchemy.

  1. Masuk ke antarmuka web Superset.

    Buat terowongan SSH untuk masuk ke antarmuka web Superset. Untuk informasi lebih lanjut, lihat Buat Terowongan SSH untuk Mengakses Antarmuka Web Komponen Open Source.

    Nama pengguna dan kata sandi default keduanya adalah admin. Ubah kata sandi setelah masuk ke antarmuka web.

  2. Tambahkan database Hive.

    1. Pilih Sources > Databases.

    2. Klik ikon Add.

    3. Di kotak dialog Add Database, konfigurasikan parameter.

      DataBase

      Parameter

      Deskripsi

      Database

      Nama database yang ingin Anda tambahkan.

      SQLAlchemy URI

      Masukkan hive://emr-header-1:10000/.

    4. Klik Save.

  3. Tambahkan tabel.

    1. Pilih Sources > Tables.

    2. Klik ikon Add.

    3. Di kotak dialog Import a table definition, konfigurasikan parameter.

      add table

      Parameter

      Deskripsi

      Database

      Nama database yang Anda tambahkan.

      Table Name

      Nama tabel yang disimpan di database yang Anda tambahkan.

      Dalam contoh ini, tabel uji ditambahkan.

    4. Klik Save.

  4. Kueri data dari database yang ditambahkan.

    1. Pilih SQL Lab > SQL Editor.

    2. Pilih database Hive JDBC Server yang telah ditambahkan.

    3. Pilih mode default.

    4. Jalankan perintah Hive untuk mengkueri data dari database.

FAQ

  • Deskripsi Masalah: Saat pengguna admin pertama kali masuk ke antarmuka web Superset dari kluster EMR dengan versi minor lebih awal dari V4.6 atau V3.33, muncul pesan "login tidak valid".

  • Solusi:

    1. Masuk ke node master kluster EMR Anda dalam mode SSH. Untuk informasi lebih lanjut, lihat Masuk ke Kluster.

      Penting

      Langkah-langkah berikut harus dilakukan sebagai pengguna root.

    2. Jalankan perintah berikut untuk masuk ke antarmuka baris perintah (CLI) Superset:

      source /usr/lib/superset-current/bin/activate
    3. Jalankan perintah berikut untuk membuat administrator:

      superset fab create-admin

      Masukkan nama pengguna dan kata sandi serta konfirmasi kata sandi sesuai petunjuk.

      Username [admin]:
      User first name [admin]:
      User last name [user]:
      Email [admin@fab.org]:
      Password:
      Repeat for confirmation:
      Recognized Database Authentications.
      Admin User admin created.
    4. Inisialisasi pengguna yang Anda buat.

      1. Jalankan perintah berikut untuk menginisialisasi database:

        superset db upgrade
      2. Jalankan perintah berikut untuk menginisialisasi Superset:

        superset init

        Setelah melakukan operasi sebelumnya, Anda harus membuat terowongan SSH yang digunakan untuk mengakses antarmuka web komponen open source. Kemudian, Anda dapat masuk ke antarmuka web Superset sebagai pengguna yang Anda buat. Untuk informasi lebih lanjut tentang cara membuat terowongan SSH, lihat Buat Terowongan SSH untuk Mengakses Antarmuka Web Komponen Open Source.