Setelah mendaftarkan kluster E-MapReduce (EMR) ke DataWorks, Anda dapat mengonfigurasi informasi koneksi Kyuubi sesuai dengan kebutuhan bisnis. Gunakan sepasang nama pengguna dan kata sandi kustom untuk masuk ke Kyuubi dan menjalankan tugas terkait. Topik ini menjelaskan cara mengonfigurasi informasi koneksi Kyuubi untuk kluster EMR di DataWorks.
Informasi latar belakang
Apache Kyuubi adalah gerbang terdistribusi dan multi-penyewa yang menyediakan layanan kueri seperti SQL untuk mesin kueri data lake, termasuk Spark, Flink, dan Trino. Untuk informasi lebih lanjut, lihat Kyuubi.
Prasyarat
Layanan Kyuubi telah ditambahkan ke kluster EMR Anda. Untuk informasi lebih lanjut, lihat Tambahkan Layanan.
Kluster EMR telah dikaitkan sebagai sumber daya komputasi untuk DataWorks. Untuk informasi lebih lanjut, lihat Data Studio: Tautkan Sumber Daya Komputasi EMR.
Konfigurasikan informasi koneksi Kyuubi
Buka halaman konfigurasi Kyuubi.
Buka halaman SettingCenter.
Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih Wilayah yang diinginkan. Di panel navigasi sisi kiri, pilih . Pada halaman yang muncul, pilih ruang kerja dari daftar drop-down dan klik Go to Management Center.
Di panel navigasi sisi kiri halaman SettingCenter, klik Computing Resources.
Temukan kluster EMR yang diinginkan, klik tab . Halaman konfigurasi Kyuubi akan muncul.
Konfigurasikan informasi koneksi Kyuubi.
Ikuti petunjuk di layar untuk menyetel parameter Mode Koneksi berdasarkan kebutuhan bisnis Anda.
Connection Information of Alibaba Cloud EMR Cluster: Jika memilih mode koneksi ini, default access identity yang ditentukan saat mendaftarkan kluster EMR digunakan untuk masuk ke Kyuubi. Mode ini dipilih secara default.
Custom Configuration Information: Jika memilih mode koneksi ini, sepasang nama pengguna dan kata sandi kustom digunakan untuk masuk ke Kyuubi. Nilai untuk parameter JDBC URL berada dalam format
jdbc:hive2://host:port/;user=<Nama Pengguna untuk Masuk>;password=<Kata Sandi untuk Masuk>.CatatanPertama kali memilih Custom Configuration Information, nilai parameter JDBC URL akan diisi otomatis berdasarkan informasi akun yang dikonfigurasikan saat mendaftarkan kluster EMR. Anda dapat memodifikasi JDBC URL sesuai kebutuhan bisnis.
Jika memilih Kirim Informasi Pengguna Proxy saat mendaftarkan kluster EMR, informasi konfigurasi
hive.server2.proxy.userdisambungkan ke JDBC URL setelah tugas EMR dijalankan di DataWorks. Aturan penyambungan:Jika placeholder
DATAWORKS_PROXY_USERtidak ditentukan dalam JDBC URL untuk custom configuration information, platform akan menyambungkan informasi konfigurasihive.server2.proxy.userdi akhir JDBC URL secara default saat tugas EMR dieksekusi.Jika placeholder
DATAWORKS_PROXY_USERditentukan dalam JDBC URL untuk custom configuration information, platform secara dinamis mengganti placeholder dengan informasi konfigurasihive.server2.proxy.usersaat tugas EMR dieksekusi.
Apa yang harus dilakukan selanjutnya
Untuk informasi tentang cara mengonfigurasi lingkungan komponen terkait dan melakukan operasi pengembangan data di DataWorks, lihat Proses Pengembangan Umum.