全部产品
Search
文档中心

DataWorks:Sumber daya dan fungsi CDH

更新时间:Jul 06, 2025

Data Studio memungkinkan Anda untuk membuat dan mengelola sumber daya Jar dan file CDH secara visual. Anda dapat menggunakan sumber daya ini untuk membuat fungsi yang ditentukan pengguna (UDF) atau untuk pengembangan data. Topik ini menjelaskan cara membuat berbagai jenis sumber daya dan fungsi CDH di panel MANAJEMEN SUMBER DAYA halaman Data Studio di konsol DataWorks.

Prasyarat

Akses manajemen sumber daya

  1. Buka halaman Workspaces di konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Temukan workspace yang sesuai dan pilih Shortcuts > Data Studio di kolom Actions.

  2. Di panel navigasi sisi kiri, klik tombol Manajemen Sumber Daya image untuk membuka halaman Resource Management.

  3. Di halaman Resource Management, klik tombol image untuk membuat sumber daya atau fungsi baru. Anda juga dapat terlebih dahulu Create Folder untuk merencanakan direktori manajemen sumber daya Anda, lalu klik kanan pada direktori yang sesuai dan pilih Create untuk memilih jenis sumber daya atau fungsi yang ingin dibuat.

Buat dan gunakan sumber daya

Deskripsi sumber daya

Di panel MANAJEMEN SUMBER DAYA, Anda dapat mengunggah sumber daya dari mesin lokal Anda ke kluster CDH menggunakan DataWorks. DataWorks mendukung pembuatan berbagai jenis sumber daya CDH. Anda dapat menggunakan sumber daya tersebut untuk mengembangkan pekerjaan CDH atau membuat UDF di DataWorks.

Jenis sumber daya

Deskripsi

Metode unggah yang didukung

Mesin lokal

OSS

CDH Jar

Paket JAR yang sudah dikompilasi yang digunakan untuk menjalankan program Java. Nama sumber daya jenis ini diakhiri dengan .jar.

image

image

CDH File

Anda dapat mengunggah file dari semua jenis ke DataWorks sebagai sumber daya file. Anda dapat memeriksa apakah mesin komputasi terkait mendukung jenis sumber daya ini sebelum Anda menggunakannya.

Batasan

Sumber daya yang ingin diunggah harus memenuhi persyaratan berikut:

  • Ukuran Sumber Daya: Ukuran maksimum yang didukung adalah 500MB.

  • Penyebaran Sumber Daya: Jika Anda menggunakan workspace dalam mode standar, Anda perlu menyebarkan sumber daya ke lingkungan produksi. Setelah penyebaran, sumber daya akan tersedia di proyek di lingkungan produksi.

    Catatan

    Informasi tentang sumber data mungkin berbeda antara lingkungan pengembangan dan produksi. Pastikan Anda mengetahui informasi sumber data di lingkungan tempat Anda ingin menanyakan data. Hal ini memastikan bahwa Anda dapat menanyakan tabel dan data sumber daya yang valid dalam operasi selanjutnya.

  • Manajemen Sumber Daya: DataWorks hanya mendukung melihat dan mengelola sumber daya yang diunggah melalui DataWorks.

Buat sumber daya

Anda dapat mengunggah sumber daya dari mesin lokal Anda ke sumber daya komputasi CDH di DataWorks. Setelah sumber daya CDH dibuat, Anda dapat mereferensikan sumber daya dalam pengembangan data atau membuat sumber daya sebagai fungsi.

  1. Di halaman Manajemen Sumber Daya, ketika Anda membuat sumber daya dan membuka kotak dialog Create Resource And Function, konfigurasikan Type sumber daya, Path penyimpanan, dan Name sumber daya.

  2. Ketika Anda membuat sumber daya CDH, unggah file lokal sebagai sumber file. Tabel berikut menjelaskan parameter utama yang perlu dikonfigurasi saat mengunggah file lokal.

    Parameter

    Deskripsi

    Storage Path

    Nilai defaultnya adalah /user/admin/lib.

    Catatan

    Jika otentikasi Kerberos diaktifkan, Anda harus memberikan izin tulis pada direktori ke akun login saat ini.

    Data Source

    Pilih sumber data CDH yang telah disiapkan.

    Resource Group

    Pilih grup sumber daya serverless yang terhubung ke kluster CDH.

  3. Di bilah alat atas tab konfigurasi sumber daya, klik Save dan Deploy. Anda dapat menggunakan sumber daya di Data Studio hanya jika sumber daya tersebut disebarkan.

Gunakan sumber daya

Setelah sumber daya dibuat, Anda dapat menggunakannya dalam pengembangan data. Klik Resource Management di panel navigasi sisi kiri halaman Data Studio, temukan sumber daya yang telah dibuat di panel MANAJEMEN SUMBER DAYA, klik kanan nama sumber daya, lalu pilih Reference Resources. Setelah sumber daya direferensikan, baris kode dalam format ##@resource_reference{"Nama sumber daya"} akan ditampilkan.

Catatan

Sebagai contoh, jika Anda mereferensikan sumber daya dalam node CDH Hive, ##@resource_reference{"contoh"} akan ditampilkan. Format tampilan kode bervariasi berdasarkan jenis node yang mereferensikan sumber daya. Anda dapat melihat kode yang ditampilkan di konsol DataWorks untuk mempelajari format tampilannya.

Selain menggunakan sumber daya secara langsung, Anda juga dapat membuat sumber daya sebagai fungsi dan kemudian menggunakannya di node Data Studio.

Buat dan gunakan fungsi

Deskripsi fungsi

Data Studio memungkinkan Anda untuk mendaftarkan sumber daya sebagai fungsi CDH. Dalam pengembangan data atau kueri SQL, Anda dapat menggunakan fungsi bawaan yang disediakan oleh Hive dan fungsi kustom.

Buat fungsi

  1. Di halaman Manajemen Sumber Daya, ketika Anda membuat fungsi dan membuka kotak dialog Create Resource And Function, konfigurasikan Type fungsi, Path penyimpanan, dan Name fungsi dari daftar drop-down.

  2. Klik OK untuk membuat fungsi serta mengonfigurasi parameter sesuai dengan jenis fungsinya.

    Sebelum mengonfigurasi fungsi CDH, pastikan bahwa mesin CDH telah didaftarkan sebagai sumber daya komputasi di DataWorks dan sumber daya CDH telah diunggah ke DataWorks. Tabel berikut menjelaskan konfigurasi utama dari fungsi CDH.

    Parameter

    Deskripsi

    Function Type

    Jenis fungsi. Nilai yang valid: MATH, AGGREGATE, STRING, DATE, ANALYTIC, dan OTHER.

    Data Source

    Pilih sumber data CDH dari daftar drop-down Sumber Data.

    Class Name

    • Nama kelas yang mengimplementasikan UDF. Konfigurasikan parameter ini dalam format Nama sumber daya.Nama kelas. Nama sumber daya bisa berupa nama paket Java atau sumber daya file.

    • DataWorks memungkinkan Anda untuk membuat UDF berdasarkan sumber daya Jar CDH atau file. Jika jenis sumber daya adalah JAR, konfigurasikan parameter Class Name dalam format Nama paket JAR.Nama kelas sebenarnya. Anda dapat menanyakan nama kelas dengan mengeksekusi pernyataan Copy Reference di IntelliJ IDEA. Sebagai contoh, jika com.aliyun.cdh.examples.udf adalah nama paket Java dan UDAFExample adalah nama kelas, maka nilai parameter Class Name adalah com.aliyun.cdh.examples.udf.UDAFExample.

    Catatan
    • Anda tidak perlu menyertakan akhiran .jar dalam nama sumber daya.

    • Anda dapat menggunakan sumber daya setelah sumber daya tersebut diterapkan.

    Resources

    Sumber daya yang ingin Anda gunakan. Anda dapat memilih sumber daya CDH Jar atau CDH file dari daftar drop-down.

    Command Syntax

    Contoh cara menggunakan UDF.

  3. Di bilah alat atas tab konfigurasi fungsi, klik Save dan Deploy. Anda dapat menggunakan fungsi di Data Studio hanya jika fungsi tersebut disebarkan.

Gunakan fungsi

Setelah fungsi dibuat dan disebar, Anda dapat mereferensikan fungsi tersebut secara langsung dalam pengembangan data atau kueri SQL.

  • Saat mengedit node pengembangan data, klik Resource Management di panel navigasi sisi kiri, temukan sumber daya atau fungsi target, dan klik kanan untuk memilih Reference Function.

    Setelah berhasil mereferensikan fungsi, nama fungsi kustom akan dibuat dengan cepat di halaman pengeditan node saat ini, misalnya: example_function().

  • Saat mengedit kueri SQL, Anda dapat langsung menggunakan fungsi yang telah dibuat.

SELECT example_function(column_name) FROM table;

Kelola sumber daya dan fungsi

Setelah mengunggah sumber daya atau membuat fungsi melalui antarmuka visual Data Studio, Anda dapat mengelola sumber daya atau fungsi dengan mengklik sumber daya atau fungsi target di halaman Manajemen Sumber Daya.

  • Lihat Versi Historis: Klik tombol versi di sisi kanan halaman pengeditan sumber daya atau fungsi untuk melihat dan membandingkan versi fungsi yang disimpan atau dikirimkan serta mendapatkan informasi tentang perubahan dalam versi sumber daya yang berbeda.

    Catatan

    Saat membandingkan versi sumber daya, Anda harus memilih setidaknya dua versi untuk perbandingan.

  • Hapus Sumber Daya atau Fungsi: Klik kanan pada sumber daya atau fungsi target dan pilih tombol Delete untuk menghapus sumber daya atau fungsi.

    Jika Anda perlu menghapus sumber daya atau fungsi di lingkungan produksi, Anda perlu mempublikasikan tugas dan memublikasikan operasi penghapusan sumber daya ke lingkungan produksi. Setelah publikasi berhasil, fungsi sumber daya di lingkungan produksi akan dihapus secara sinkron.