Topik ini menjelaskan cara menggunakan E-MapReduce (EMR) Workflow. Sebagai contoh, digunakan sebuah node HIVECLI.
Prasyarat
Otorisasi untuk EMR Workflow telah selesai. Untuk informasi lebih lanjut, lihat Tetapkan peran default EMR Workbench Workflow ke akun Alibaba Cloud.
Kluster dibuat di halaman EMR pada ECS. Untuk informasi lebih lanjut, lihat Buat kluster.
Kluster yang dibuat adalah kluster danau data EMR, kluster Hadoop, atau kluster kustom.
Prosedur
Langkah 1: Asosiasikan kluster EMR
Masuk ke Konsol EMR.
Di panel navigasi sebelah kiri, pilih EMR Studio > Workflow.
Di halaman yang muncul, klik tab Security.
Di halaman Cluster Manage, klik Bind Cluster.
Di kotak dialog Bind Kluster, konfigurasikan parameter Tipe Kluster, ID Kluster, dan ID vSwitch lalu klik Confirm.
Anda dapat menyegarkan halaman Kelola Kluster untuk melihat kemajuan asosiasi. Jika Associated ditampilkan di kolom State, kluster tersebut terkait.
CatatanProses asosiasi membutuhkan waktu sekitar 5 hingga 10 menit. Tunggu hingga asosiasi selesai.
Langkah 2: Buat proyek
Klik tab Project.
Di tab Project, klik Create Project.
Di kotak dialog Create Project, tentukan nama untuk proyek dan klik Confirm.
Sebagai contoh, proyek diberi nama project_test.
Langkah 3: Edit alur kerja
Di tab Project, klik project_test.
Di halaman detail proyek, pilih di panel navigasi sebelah kiri.
Di halaman Workflow Definition, klik Create Workflow.
Di halaman Create Workflow, seret node HIVECLI ke kanvas.
Sebagai contoh, digunakan sebuah node HIVECLI. Untuk informasi lebih lanjut tentang HIVECLI, lihat Tipe Node.
Di kotak dialog Pengaturan Node Saat Ini, konfigurasikan parameter Node Name dan Script lalu klik Confirm.
Tabel berikut menggambarkan pengaturan parameter Nama Node dan Skrip. Tentukan nilai default untuk parameter lainnya. Untuk informasi lebih lanjut, lihat HIVECLI.
Parameter
Contoh
Node Name
hivecli
Script
create table if not exists mytable(a string, b int); insert into mytable values ('abc', 1), ('def', 2); select a, sum(b) from mytable group by a;Simpan alur kerja.
Klik Save di pojok kanan atas kanvas.
Di kotak dialog Informasi Dasar, konfigurasikan parameter Workflow Name dan klik Confirm.
Sebagai contoh, parameter Nama Alur Kerja disetel ke workflow_test.
Langkah 4: Jalankan alur kerja
Di halaman Workflow Definition, temukan alur kerja workflow_test dan klik ikon
di kolom Operasi.Klik ikon
.Di kotak dialog Silakan atur parameter sebelum memulai, pilih kluster yang diasosiasikan di Langkah 1 dari daftar drop-down Execution Cluster dan klik Confirm.
Langkah 5: Lihat log instance tugas
Di halaman detail proyek, pilih Workflow > Workflow Instance pada panel navigasi di sebelah kiri.
Di halaman detail proyek, pilih Task > Task Instance di panel navigasi sebelah kiri.
Di halaman Task Instance, temukan instance tugas yang ingin Anda lihat lognya dan klik ikon
di kolom Operasi untuk melihat log run tugas tersebut.
Langkah 6: (Opsional) Ubah status alur kerja menjadi Offline
Di halaman Workflow Definition, temukan alur kerja yang ingin Anda kelola dan klik ikon
di kolom Operasi.
Referensi
Untuk informasi lebih lanjut tentang tipe node, lihat Tipe Node.
Untuk informasi lebih lanjut tentang cara mengelola alur kerja, lihat Kelola alur kerja.