Superset adalah alat business intelligence (BI) ringan. Anda dapat menghubungkan Superset ke berbagai sumber data dan menggunakannya untuk menganalisis, memvisualisasikan, serta mendefinisikan grafik dan dasbor. Superset juga dapat digunakan untuk mengimpor atau mengekspor dasbor serta mengelola izin pengguna dan peran. Topik ini menjelaskan cara menggunakan Superset. Contoh dalam topik ini menggunakan kluster E-MapReduce (EMR) V3.34.0.
Informasi latar belakang
Superset terintegrasi secara mendalam dengan kluster EMR Druid dan mendukung berbagai database relasional. EMR Druid mendukung SQL. Anda dapat menggunakan bahasa query asli Apache Druid atau SQL untuk mengakses EMR Druid dari Superset.
Prasyarat
Kluster EMR Hadoop atau Druid telah dibuat, dan Superset dipilih dari layanan opsional saat pembuatan kluster. Untuk informasi lebih lanjut, lihat Buat Kluster.
Batasan
Secara default, Superset diinstal pada node emr-header-1 dari kluster. Superset tidak mendukung mode high-availability (HA).
Anda tidak dapat menggunakan Knox untuk mengakses antarmuka web Superset.
Sebelum menggunakan Superset, pastikan komputer Anda dapat mengakses node emr-header-1 dari kluster. Untuk informasi lebih lanjut, lihat Buat Terowongan SSH untuk Mengakses Antarmuka Web Komponen Open Source.
Akses EMR Druid dari Superset
Masuk ke antarmuka web Superset.
Buat terowongan SSH untuk masuk ke antarmuka web Superset. Untuk informasi lebih lanjut, lihat Buat Terowongan SSH untuk Mengakses Antarmuka Web Komponen Open Source.
Nama pengguna dan kata sandi default keduanya adalah admin. Ubah kata sandi setelah masuk ke antarmuka web.
CatatanAntarmuka web dalam bahasa Inggris akan muncul setelah login pertama kali.
Tambahkan kluster EMR Druid.
Pilih .
Klik ikon
.Di kotak dialog Add Druid Cluster, konfigurasikan parameter.

Parameter
Deskripsi
Broker Host
Masukkan emr-header-1. Ini adalah nilai tetap.
Broker Port
Atur parameter ini ke format 1+nomor port broker open source.
Contohnya, jika nomor port broker open source adalah 8082, atur parameter ini menjadi 18082.
Cluster Name
Masukkan nama kluster Druid yang Anda buat di konsol EMR.
Klik Save.
Tambahkan sumber data.
Pilih .
Klik ikon
.Di kotak dialog Add Druid Datasource, konfigurasikan parameter.

Parameter
Deskripsi
Datasource Name
Kustomisasi nama database.
Cluster
Nama kluster EMR Druid yang Anda tambahkan.
Klik Save.
Setelah menyimpan konfigurasi, Anda dapat mengklik ikon
untuk menentukan kolom dimensi dan kolom metrik.
Lihat informasi tentang kluster EMR Druid yang ditambahkan.
Setelah menambahkan sumber data, Anda dapat mengklik nama sumber data untuk melihat informasi tentang kluster EMR Druid yang ditambahkan.

Akses database Hive dari Superset
SQLAlchemy terintegrasi ke dalam Superset untuk mendukung berbagai database dalam beberapa bahasa, seperti MySQL, Oracle, PostgreSQL, dan Microsoft SQL Server. Superset juga mendukung mesin query big data seperti Hive, Presto, dan Druid. Bagian ini menjelaskan cara mengakses database Hive dari Superset. Hive diinstal secara default di kluster EMR Hadoop. Untuk informasi lebih lanjut tentang cara mengakses jenis database lainnya dari Superset, lihat SQLAlchemy.
Masuk ke antarmuka web Superset.
Buat terowongan SSH untuk masuk ke antarmuka web Superset. Untuk informasi lebih lanjut, lihat Buat Terowongan SSH untuk Mengakses Antarmuka Web Komponen Open Source.
Nama pengguna dan kata sandi default keduanya adalah admin. Ubah kata sandi setelah masuk ke antarmuka web.
Tambahkan database Hive.
Pilih .
Klik ikon
.Di kotak dialog Add Database, konfigurasikan parameter.

Parameter
Deskripsi
Database
Nama database yang ingin Anda tambahkan.
SQLAlchemy URI
Masukkan hive://emr-header-1:10000/.
Klik Save.
Tambahkan tabel.
Pilih .
Klik ikon
.Di kotak dialog Import a table definition, konfigurasikan parameter.

Parameter
Deskripsi
Database
Nama database yang Anda tambahkan.
Table Name
Nama tabel yang disimpan di database yang Anda tambahkan.
Dalam contoh ini, tabel uji ditambahkan.
Klik Save.
Kueri data dari database yang ditambahkan.
Pilih .
Pilih database Hive JDBC Server yang telah ditambahkan.
Pilih mode default.
Jalankan perintah Hive untuk mengkueri data dari database.
FAQ
Deskripsi Masalah: Saat pengguna admin pertama kali masuk ke antarmuka web Superset dari kluster EMR dengan versi minor lebih awal dari V4.6 atau V3.33, muncul pesan "login tidak valid".
Solusi:
Masuk ke node master kluster EMR Anda dalam mode SSH. Untuk informasi lebih lanjut, lihat Masuk ke Kluster.
PentingLangkah-langkah berikut harus dilakukan sebagai pengguna root.
Jalankan perintah berikut untuk masuk ke antarmuka baris perintah (CLI) Superset:
source /usr/lib/superset-current/bin/activateJalankan perintah berikut untuk membuat administrator:
superset fab create-adminMasukkan nama pengguna dan kata sandi serta konfirmasi kata sandi sesuai petunjuk.
Username [admin]: User first name [admin]: User last name [user]: Email [admin@fab.org]: Password: Repeat for confirmation: Recognized Database Authentications. Admin User admin created.Inisialisasi pengguna yang Anda buat.
Jalankan perintah berikut untuk menginisialisasi database:
superset db upgradeJalankan perintah berikut untuk menginisialisasi Superset:
superset initSetelah melakukan operasi sebelumnya, Anda harus membuat terowongan SSH yang digunakan untuk mengakses antarmuka web komponen open source. Kemudian, Anda dapat masuk ke antarmuka web Superset sebagai pengguna yang Anda buat. Untuk informasi lebih lanjut tentang cara membuat terowongan SSH, lihat Buat Terowongan SSH untuk Mengakses Antarmuka Web Komponen Open Source.