全部产品
Search
文档中心

E-MapReduce:Gunakan EMR Workflow

更新时间:Jul 06, 2025

Topik ini menjelaskan cara menggunakan E-MapReduce (EMR) Workflow. Sebagai contoh, digunakan sebuah node HIVECLI.

Prasyarat

Prosedur

Langkah 1: Asosiasikan kluster EMR

  1. Masuk ke Konsol EMR.

  2. Di panel navigasi sebelah kiri, pilih EMR Studio > Workflow.

  3. Di halaman yang muncul, klik tab Security.

  4. Di halaman Cluster Manage, klik Bind Cluster.

  5. Di kotak dialog Bind Kluster, konfigurasikan parameter Tipe Kluster, ID Kluster, dan ID vSwitch lalu klik Confirm.

    Anda dapat menyegarkan halaman Kelola Kluster untuk melihat kemajuan asosiasi. Jika Associated ditampilkan di kolom State, kluster tersebut terkait.

    Catatan

    Proses asosiasi membutuhkan waktu sekitar 5 hingga 10 menit. Tunggu hingga asosiasi selesai.

Langkah 2: Buat proyek

  1. Klik tab Project.

  2. Di tab Project, klik Create Project.

  3. Di kotak dialog Create Project, tentukan nama untuk proyek dan klik Confirm.

    Sebagai contoh, proyek diberi nama project_test.

Langkah 3: Edit alur kerja

  1. Di tab Project, klik project_test.

  2. Di halaman detail proyek, pilih Workflow > Workflow Definition di panel navigasi sebelah kiri.

  3. Di halaman Workflow Definition, klik Create Workflow.

  4. Di halaman Create Workflow, seret node HIVECLI ke kanvas.

    Sebagai contoh, digunakan sebuah node HIVECLI. Untuk informasi lebih lanjut tentang HIVECLI, lihat Tipe Node.

  5. Di kotak dialog Pengaturan Node Saat Ini, konfigurasikan parameter Node Name dan Script lalu klik Confirm.

    Tabel berikut menggambarkan pengaturan parameter Nama Node dan Skrip. Tentukan nilai default untuk parameter lainnya. Untuk informasi lebih lanjut, lihat HIVECLI.

    Parameter

    Contoh

    Node Name

    hivecli

    Script

    create table if not exists mytable(a string, b int);
    insert into mytable values ('abc', 1), ('def', 2);
    select a, sum(b) from mytable group by a;
  6. Simpan alur kerja.

    1. Klik Save di pojok kanan atas kanvas.

    2. Di kotak dialog Informasi Dasar, konfigurasikan parameter Workflow Name dan klik Confirm.

      Sebagai contoh, parameter Nama Alur Kerja disetel ke workflow_test.

Langkah 4: Jalankan alur kerja

  1. Di halaman Workflow Definition, temukan alur kerja workflow_test dan klik ikon image..png di kolom Operasi.

  2. Klik ikon image..png.

  3. Di kotak dialog Silakan atur parameter sebelum memulai, pilih kluster yang diasosiasikan di Langkah 1 dari daftar drop-down Execution Cluster dan klik Confirm.

Langkah 5: Lihat log instance tugas

  1. Di halaman detail proyek, pilih Workflow > Workflow Instance pada panel navigasi di sebelah kiri.

  2. Di halaman detail proyek, pilih Task > Task Instance di panel navigasi sebelah kiri.

  3. Di halaman Task Instance, temukan instance tugas yang ingin Anda lihat lognya dan klik ikon image..png di kolom Operasi untuk melihat log run tugas tersebut.

Langkah 6: (Opsional) Ubah status alur kerja menjadi Offline

Di halaman Workflow Definition, temukan alur kerja yang ingin Anda kelola dan klik ikon image..png di kolom Operasi.

Referensi

  • Untuk informasi lebih lanjut tentang tipe node, lihat Tipe Node.

  • Untuk informasi lebih lanjut tentang cara mengelola alur kerja, lihat Kelola alur kerja.