Data Studio memungkinkan Anda untuk membuat dan mengelola sumber daya Jar dan file CDH secara visual. Anda dapat menggunakan sumber daya ini untuk membuat fungsi yang ditentukan pengguna (UDF) atau untuk pengembangan data. Topik ini menjelaskan cara membuat berbagai jenis sumber daya dan fungsi CDH di panel MANAJEMEN SUMBER DAYA halaman Data Studio di konsol DataWorks.
Prasyarat
Sebuah kluster CDH telah didaftarkan ke DataWorks. Pembuatan sumber daya dan fungsi CDH bergantung pada sumber daya komputasi CDH.
File sumber daya telah dikembangkan dan dapat diunggah dari mesin lokal Anda.
Akses manajemen sumber daya
Buka halaman Workspaces di konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Temukan workspace yang sesuai dan pilih di kolom Actions.
Di panel navigasi sisi kiri, klik tombol Manajemen Sumber Daya
untuk membuka halaman Resource Management.Di halaman Resource Management, klik tombol
untuk membuat sumber daya atau fungsi baru. Anda juga dapat terlebih dahulu Create Folder untuk merencanakan direktori manajemen sumber daya Anda, lalu klik kanan pada direktori yang sesuai dan pilih Create untuk memilih jenis sumber daya atau fungsi yang ingin dibuat.
Buat dan gunakan sumber daya
Deskripsi sumber daya
Di panel MANAJEMEN SUMBER DAYA, Anda dapat mengunggah sumber daya dari mesin lokal Anda ke kluster CDH menggunakan DataWorks. DataWorks mendukung pembuatan berbagai jenis sumber daya CDH. Anda dapat menggunakan sumber daya tersebut untuk mengembangkan pekerjaan CDH atau membuat UDF di DataWorks.
Jenis sumber daya | Deskripsi | Metode unggah yang didukung | |
Mesin lokal | OSS | ||
CDH Jar | Paket JAR yang sudah dikompilasi yang digunakan untuk menjalankan program Java. Nama sumber daya jenis ini diakhiri dengan |
|
|
CDH File | Anda dapat mengunggah file dari semua jenis ke DataWorks sebagai sumber daya file. Anda dapat memeriksa apakah mesin komputasi terkait mendukung jenis sumber daya ini sebelum Anda menggunakannya. | ||
Batasan
Sumber daya yang ingin diunggah harus memenuhi persyaratan berikut:
Ukuran Sumber Daya: Ukuran maksimum yang didukung adalah 500MB.
Penyebaran Sumber Daya: Jika Anda menggunakan workspace dalam mode standar, Anda perlu menyebarkan sumber daya ke lingkungan produksi. Setelah penyebaran, sumber daya akan tersedia di proyek di lingkungan produksi.
CatatanInformasi tentang sumber data mungkin berbeda antara lingkungan pengembangan dan produksi. Pastikan Anda mengetahui informasi sumber data di lingkungan tempat Anda ingin menanyakan data. Hal ini memastikan bahwa Anda dapat menanyakan tabel dan data sumber daya yang valid dalam operasi selanjutnya.
Manajemen Sumber Daya: DataWorks hanya mendukung melihat dan mengelola sumber daya yang diunggah melalui DataWorks.
Buat sumber daya
Anda dapat mengunggah sumber daya dari mesin lokal Anda ke sumber daya komputasi CDH di DataWorks. Setelah sumber daya CDH dibuat, Anda dapat mereferensikan sumber daya dalam pengembangan data atau membuat sumber daya sebagai fungsi.
Di halaman Manajemen Sumber Daya, ketika Anda membuat sumber daya dan membuka kotak dialog Create Resource And Function, konfigurasikan Type sumber daya, Path penyimpanan, dan Name sumber daya.
Ketika Anda membuat sumber daya CDH, unggah file lokal sebagai sumber file. Tabel berikut menjelaskan parameter utama yang perlu dikonfigurasi saat mengunggah file lokal.
Parameter
Deskripsi
Storage Path
Nilai defaultnya adalah
/user/admin/lib.CatatanJika otentikasi Kerberos diaktifkan, Anda harus memberikan izin tulis pada direktori ke akun login saat ini.
Data Source
Pilih sumber data CDH yang telah disiapkan.
Resource Group
Pilih grup sumber daya serverless yang terhubung ke kluster CDH.
Di bilah alat atas tab konfigurasi sumber daya, klik Save dan Deploy. Anda dapat menggunakan sumber daya di Data Studio hanya jika sumber daya tersebut disebarkan.
Gunakan sumber daya
Setelah sumber daya dibuat, Anda dapat menggunakannya dalam pengembangan data. Klik Resource Management di panel navigasi sisi kiri halaman Data Studio, temukan sumber daya yang telah dibuat di panel MANAJEMEN SUMBER DAYA, klik kanan nama sumber daya, lalu pilih Reference Resources. Setelah sumber daya direferensikan, baris kode dalam format ##@resource_reference{"Nama sumber daya"} akan ditampilkan.
Sebagai contoh, jika Anda mereferensikan sumber daya dalam node CDH Hive, ##@resource_reference{"contoh"} akan ditampilkan. Format tampilan kode bervariasi berdasarkan jenis node yang mereferensikan sumber daya. Anda dapat melihat kode yang ditampilkan di konsol DataWorks untuk mempelajari format tampilannya.
Selain menggunakan sumber daya secara langsung, Anda juga dapat membuat sumber daya sebagai fungsi dan kemudian menggunakannya di node Data Studio.
Buat dan gunakan fungsi
Deskripsi fungsi
Data Studio memungkinkan Anda untuk mendaftarkan sumber daya sebagai fungsi CDH. Dalam pengembangan data atau kueri SQL, Anda dapat menggunakan fungsi bawaan yang disediakan oleh Hive dan fungsi kustom.
Buat fungsi
Di halaman Manajemen Sumber Daya, ketika Anda membuat fungsi dan membuka kotak dialog Create Resource And Function, konfigurasikan Type fungsi, Path penyimpanan, dan Name fungsi dari daftar drop-down.
Klik OK untuk membuat fungsi serta mengonfigurasi parameter sesuai dengan jenis fungsinya.
Sebelum mengonfigurasi fungsi CDH, pastikan bahwa mesin CDH telah didaftarkan sebagai sumber daya komputasi di DataWorks dan sumber daya CDH telah diunggah ke DataWorks. Tabel berikut menjelaskan konfigurasi utama dari fungsi CDH.
Parameter
Deskripsi
Function Type
Jenis fungsi. Nilai yang valid: MATH, AGGREGATE, STRING, DATE, ANALYTIC, dan OTHER.
Data Source
Pilih sumber data CDH dari daftar drop-down Sumber Data.
Class Name
Nama kelas yang mengimplementasikan UDF. Konfigurasikan parameter ini dalam format
Nama sumber daya.Nama kelas. Nama sumber daya bisa berupa nama paket Java atau sumber daya file.DataWorks memungkinkan Anda untuk membuat UDF berdasarkan sumber daya Jar CDH atau file. Jika jenis sumber daya adalah JAR, konfigurasikan parameter Class Name dalam format
Nama paket JAR.Nama kelas sebenarnya. Anda dapat menanyakan nama kelas dengan mengeksekusi pernyataanCopy ReferencediIntelliJ IDEA. Sebagai contoh, jikacom.aliyun.cdh.examples.udfadalah nama paket Java danUDAFExampleadalah nama kelas, maka nilai parameter Class Name adalahcom.aliyun.cdh.examples.udf.UDAFExample.
CatatanAnda tidak perlu menyertakan akhiran
.jardalam nama sumber daya.Anda dapat menggunakan sumber daya setelah sumber daya tersebut diterapkan.
Resources
Sumber daya yang ingin Anda gunakan. Anda dapat memilih sumber daya CDH Jar atau CDH file dari daftar drop-down.
Command Syntax
Contoh cara menggunakan UDF.
Di bilah alat atas tab konfigurasi fungsi, klik Save dan Deploy. Anda dapat menggunakan fungsi di Data Studio hanya jika fungsi tersebut disebarkan.
Gunakan fungsi
Setelah fungsi dibuat dan disebar, Anda dapat mereferensikan fungsi tersebut secara langsung dalam pengembangan data atau kueri SQL.
Saat mengedit node pengembangan data, klik Resource Management di panel navigasi sisi kiri, temukan sumber daya atau fungsi target, dan klik kanan untuk memilih Reference Function.
Setelah berhasil mereferensikan fungsi, nama fungsi kustom akan dibuat dengan cepat di halaman pengeditan node saat ini, misalnya:
example_function().Saat mengedit kueri SQL, Anda dapat langsung menggunakan fungsi yang telah dibuat.
SELECT example_function(column_name) FROM table;Kelola sumber daya dan fungsi
Setelah mengunggah sumber daya atau membuat fungsi melalui antarmuka visual Data Studio, Anda dapat mengelola sumber daya atau fungsi dengan mengklik sumber daya atau fungsi target di halaman Manajemen Sumber Daya.
Lihat Versi Historis: Klik tombol versi di sisi kanan halaman pengeditan sumber daya atau fungsi untuk melihat dan membandingkan versi fungsi yang disimpan atau dikirimkan serta mendapatkan informasi tentang perubahan dalam versi sumber daya yang berbeda.
CatatanSaat membandingkan versi sumber daya, Anda harus memilih setidaknya dua versi untuk perbandingan.
Hapus Sumber Daya atau Fungsi: Klik kanan pada sumber daya atau fungsi target dan pilih tombol Delete untuk menghapus sumber daya atau fungsi.
Jika Anda perlu menghapus sumber daya atau fungsi di lingkungan produksi, Anda perlu mempublikasikan tugas dan memublikasikan operasi penghapusan sumber daya ke lingkungan produksi. Setelah publikasi berhasil, fungsi sumber daya di lingkungan produksi akan dihapus secara sinkron.