全部产品
Search
文档中心

DataWorks:Membuat dan menggunakan sumber daya EMR

更新时间:Jul 02, 2025

DataWorks memungkinkan Anda membuat sumber daya E-MapReduce (EMR) JAR atau file EMR di Konsol DataWorks. Anda dapat mengunggah file yang berisi fungsi yang ditentukan pengguna (UDF) atau kode MapReduce open source sebagai sumber daya EMR dan menyerahkan sumber daya tersebut. Setelah itu, Anda dapat merujuk sumber daya tersebut di node komputasi EMR. Topik ini menjelaskan cara membuat sumber daya dengan mengunggah file, menyerahkan sumber daya, serta merujuk sumber daya di node komputasi EMR.

Prasyarat

Anda hanya dapat membuat sumber daya EMR berdasarkan kluster DataLake EMR atau kluster Hadoop EMR. Persiapan yang diperlukan untuk membuat sumber daya bervariasi tergantung pada jenis kluster EMR. Pastikan Anda telah menyelesaikan persiapan yang diperlukan di sisi EMR dan DataWorks sesuai kebutuhan bisnis sebelum melanjutkan operasi dalam topik ini. Untuk informasi lebih lanjut, lihat topik-topik berikut:

Membuat sumber daya EMR

  1. Masuk ke Konsol DataWorks. Di bilah navigasi atas, pilih wilayah yang diinginkan. Di panel navigasi kiri, pilih Data Development and O&M > Data Development. Pada halaman yang muncul, pilih ruang kerja dari daftar drop-down dan klik Go to Data Development.

  2. Arahkan pointer ke ikon 新建 lalu pilih Create Resource > EMR > EMR JAR atau Create Resource > EMR > EMR File.

    Anda juga dapat menemukan alur kerja yang diinginkan, klik kanan nama alur kerja, lalu pilih Create Resource > EMR > EMR JAR atau Create Resource > EMR > EMR File.

  3. Dalam kotak dialog Create Resource, konfigurasikan parameter berikut. Penjelasan parameter dapat ditemukan pada tabel di bawah ini.

    新建资源

    Parameter

    Deskripsi

    Engine Type

    Nilai parameter ini tetap sebagai EMR. Anda tidak dapat mengubah nilai parameter ini.

    Engine Instance

    Pilih mesin komputasi yang diinginkan dari daftar drop-down.

    Catatan

    Daftar drop-down menampilkan semua mesin komputasi EMR yang terhubung dengan ruang kerja Anda.

    Resource Type

    Tipe sumber daya. Nilai valid: EMR File dan EMR JAR.

    Path

    Alur kerja tempat Anda ingin membuat sumber daya.

    Storage path

    Path penyimpanan sumber daya. Nilai valid: OSS dan HDFS.

    • Jika Anda memilih OSS, Anda harus mengklik Otorisasi di sebelah OSS untuk memberi otorisasi DataWorks mengakses Object Storage Service (OSS). Lalu, pilih folder.

      Catatan

      Anda harus menggunakan akun Alibaba Cloud Anda untuk melakukan otorisasi.

    • Jika Anda memilih HDFS, Anda harus memasukkan path penyimpanan.

    Catatan

    Paket JAR dapat disimpan di objek berikut:

    • Node master dari kluster EMR.

    • OSS. Kami merekomendasikan Anda menyimpan paket JAR di OSS. Untuk informasi lebih lanjut tentang cara menyimpan paket JAR di OSS, lihat Operasi di konsol OSS.

    File Source

    Sumber file yang ingin Anda unggah. Nilai valid: Local dan OSS.

    • Jika Anda memilih Local, klik Upload di bidang File untuk mengunggah file dari mesin lokal Anda.

    • Jika Anda memilih OSS, pilih objek OSS untuk Select File atau klik Create in OSS untuk membuat objek OSS.

    Name

    Nama sumber daya EMR yang ingin Anda buat. Jika Anda mengunggah file JAR sebagai sumber daya, Anda harus menambahkan ekstensi nama file .jar ke nama sumber daya.

  4. Klik Create.

  5. Klik ikon 保存 dan 提交 di bilah alat atas untuk menyimpan dan menyerahkan sumber daya ke server untuk penjadwalan tugas dan pengembangan.

    Catatan

    Anda harus memilih grup sumber daya untuk penjadwalan saat menyerahkan tabel. Jika menggunakan grup sumber daya tanpa server untuk menyerahkan tabel, DataWorks akan mengeluarkan tugas pembuatan tabel ke mesin komputasi dan menampilkan log proses. Jika terjadi kesalahan saat menyerahkan tabel, Anda dapat menggunakan log proses untuk memecahkan masalah. Jika tidak ada grup sumber daya tanpa server yang tersedia, Anda dapat membeli dan mengonfigurasi grup sumber daya tanpa server. Untuk informasi lebih lanjut, lihat Buat dan Gunakan Grup Sumber Daya Tanpa Server.

Gunakan sumber daya untuk mendaftarkan fungsi

DataWorks memungkinkan Anda menggunakan sumber daya untuk mendaftarkan fungsi di Konsol DataWorks. Setelah mengunggah sumber daya yang diperlukan untuk mendaftarkan fungsi ke Konsol DataWorks, Anda dapat menggunakan sumber daya tersebut saat mendaftarkan fungsi.注册函数

Gunakan sumber daya dalam kode node

Setelah membuat sumber daya EMR JAR, Anda dapat merujuk sumber daya dalam kode node dengan langkah berikut: Temukan sumber daya yang dibuat di Resource, klik kanan nama sumber daya, lalu pilih Insert Resource Path. Gambar berikut menunjukkan langkah-langkah referensi.节点中使用资源

Catatan

Setelah sumber daya dirujuk oleh node, kode dalam format @resource_reference{"Nama Sumber Daya"} akan ditampilkan.

Untuk informasi lebih lanjut tentang cara merujuk sumber daya, lihat Buat Node MR EMR.

Kelola versi sumber daya

Setiap kali Anda menyerahkan sumber daya, versi sumber daya akan dibuat. Anda dapat mengklik kanan nama sumber daya dan memilih View Versions untuk melihat informasi detail atau mengunduh sumber daya versi tertentu.资源版本