DolphinScheduler adalah platform orkestrasi alur kerja open source yang terdistribusi dan dapat diperluas dengan antarmuka visual Directed Acyclic Graph (DAG) yang kuat. DolphinScheduler membantu Anda mengeksekusi dan mengelola alur kerja untuk sejumlah besar data secara efisien. Anda dapat membuat, mengedit, dan menjadwalkan pekerjaan Spark dari AnalyticDB for MySQL melalui antarmuka web DolphinScheduler.
Prasyarat
Kluster AnalyticDB for MySQL Enterprise Edition, Basic Edition, atau Data Lakehouse Edition telah dibuat.
Grup sumber daya pekerjaan atau grup sumber daya interaktif Spark telah dibuat untuk kluster AnalyticDB for MySQL.
Java Development Kit (JDK) versi 1.8 atau yang lebih baru telah diinstal.
Alamat IP server yang menjalankan DolphinScheduler telah ditambahkan ke Daftar putih alamat IP dari kluster AnalyticDB for MySQL.
Jadwalkan pekerjaan Spark SQL
AnalyticDB for MySQL memungkinkan Anda mengeksekusi Spark SQL dalam mode batch atau interaktif. Prosedur penjadwalan bervariasi berdasarkan mode eksekusi.
Mode batch
Instal alat baris perintah spark-submit dan tentukan parameter yang relevan.
CatatanAnda hanya perlu menentukan parameter berikut:
keyId,secretId,regionId,clusterId, danrgName.Buat proyek.
Akses antarmuka web DolphinScheduler. Di bilah navigasi atas, klik Project.
Klik Create Project.
Di kotak dialog Create Project, konfigurasikan parameter seperti Project Name dan Owned Users.
Buat alur kerja.
Klik nama proyek yang telah dibuat. Di panel navigasi kiri, pilih Alur Kerja > Definisi Alur Kerja untuk masuk ke halaman Workflow Definition.
Klik Create Workflow untuk masuk ke halaman workflow DAG edit.
Di daftar sisi kiri halaman, pilih SHELL lalu seret ke kanvas sisi kanan.
Di kotak dialog Current node settings, konfigurasikan parameter yang dijelaskan dalam tabel berikut.
Parameter
Deskripsi
Node Name
Nama node alur kerja.
Script
Path instalasi alat spark-submit dan kode bisnis pekerjaan Spark. Contoh:
/root/adb-spark-toolkit-submit/bin/spark-submit --class com.aliyun.adb.spark.sql.OfflineSqlTemplate local:///opt/spark/jars/offline-sql.jar "show databases" "select 100".PentingSaat menggunakan alat spark-submit untuk menjadwalkan pekerjaan Spark, Anda harus menentukan path instalasi alat spark-submit dalam skrip. Jika tidak, tugas penjadwalan mungkin gagal menemukan perintah spark-submit.
CatatanUntuk informasi tentang parameter lainnya, lihat Lampiran Parameter Tugas DolphinScheduler.
Klik Confirm.
Di pojok kanan atas halaman, klik Save. Di kotak dialog Basic Information, konfigurasikan parameter seperti Workflow Name. Klik Confirm.
Jalankan alur kerja.
Temukan alur kerja yang telah dibuat dan klik ikon
di kolom Operation untuk mempublikasikan alur kerja.Klik ikon
di kolom Operation.Di kotak dialog Please set the parameters before starting, konfigurasikan parameter.
Klik Confirm untuk menjalankan alur kerja.
Lihat detail alur kerja.
Di panel navigasi kiri, pilih Tugas > Task Instance.
Temukan tugas dari alur kerja dan klik ikon
di kolom Operation untuk melihat hasil eksekusi dan log alur kerja.
Mode interaktif
Dapatkan URL koneksi grup sumber daya interaktif Spark.
Masuk ke konsol AnalyticDB for MySQL. Di pojok kiri atas konsol, pilih wilayah. Di panel navigasi kiri, klik Clusters. Temukan kluster yang ingin Anda kelola dan klik ID kluster.
Di panel navigasi kiri, pilih . Pada halaman yang muncul, klik tab Resource Groups.
Temukan grup sumber daya interaktif Spark yang telah Anda buat dan klik Details di kolom Actions untuk melihat URL koneksi internal atau publik dari grup sumber daya. Anda dapat mengklik ikon
di dalam tanda kurung di sebelah nomor port yang sesuai untuk menyalin URL koneksi.Klik Apply for Endpoint di sebelah Public Endpoint untuk mengajukan endpoint publik secara manual dalam skenario berikut:
Alat klien yang digunakan untuk mengirimkan pekerjaan Spark SQL diterapkan di server lokal atau eksternal.
Alat klien yang digunakan untuk mengirimkan pekerjaan Spark SQL diterapkan pada instance Elastic Compute Service (ECS) yang berada di virtual private cloud (VPC) yang berbeda dari kluster AnalyticDB for MySQL Anda.
Buat sumber data.
Akses antarmuka web DolphinScheduler. Di bilah navigasi atas, klik Datasource..
Klik Create DataSource.
Di kotak dialog Buat Sumber Data, konfigurasikan parameter yang dijelaskan dalam tabel berikut.
Parameter
Deskripsi
DataSource
Jenis sumber data. Pilih SPARK.
Datasource Name
Nama sumber data.
IP
Endpoint yang diperoleh di Langkah 1. Ganti
defaultdi endpoint dengan nama database aktual dan hapus akhiranresource_group=<resource group name>dari endpoint.Contoh:
jdbc:hive2://amv-t4naxpqk****sparkwho.ads.aliyuncs.com:10000/adb_demo.Port
Nomor port untuk grup sumber daya interaktif Spark. Atur nilainya menjadi 10000.
User Name
Nama akun database dari kluster AnalyticDB for MySQL.
Database Name
Nama database di kluster AnalyticDB for MySQL.
CatatanUntuk informasi tentang parameter opsional lainnya, lihat MySQL.
Klik Test Connect. Setelah tes berhasil, klik Confirm.
Buat proyek.
Akses antarmuka web DolphinScheduler. Di bilah navigasi atas, klik Project.
Klik Create Project.
Di kotak dialog Create Project, konfigurasikan parameter seperti Project Name dan Owned Users.
Buat alur kerja.
Klik nama proyek yang telah dibuat. Di panel navigasi kiri, pilih Alur Kerja > Definisi Alur Kerja untuk masuk ke halaman Workflow Definition.
Klik Create Workflow untuk masuk ke halaman workflow DAG edit.
Di daftar sisi kiri halaman, pilih SQL, lalu seret ke kanvas sisi kanan.
Dalam kotak dialog Current node settings, konfigurasikan parameter yang dijelaskan pada tabel berikut.
Parameter
Deskripsi
Datasource types
Jenis sumber data. Pilih SPARK.
Datasource instances
Sumber data yang dibuat di Langkah 1.
SQL Type
Jenis pekerjaan SQL. Nilai yang valid: Query dan Non Query.
SQL Statement
Pernyataan SQL.
Klik Confirm.
Di pojok kanan atas halaman, klik Save. Di kotak dialog Basic Information, konfigurasikan parameter seperti Workflow Name. Klik Confirm.
Jalankan alur kerja.
Temukan alur kerja yang telah dibuat dan klik ikon
di kolom Operation untuk mempublikasikan alur kerja.Klik ikon
di kolom Operation.Di kotak dialog Please set the parameters before starting, konfigurasikan parameter.
Klik Confirm untuk menjalankan alur kerja.
Lihat detail alur kerja.
Di panel navigasi kiri, pilih Tugas > Task Instance.
Temukan tugas dari alur kerja dan klik ikon
di kolom Operation untuk melihat hasil eksekusi dan log alur kerja.
Jadwalkan pekerjaan Spark JAR
Instal alat baris perintah spark-submit dan tentukan parameter yang relevan.
CatatanAnda hanya perlu menentukan parameter berikut:
keyId,secretId,regionId,clusterId, danrgName. Jika paket Spark JAR Anda disimpan di perangkat lokal Anda, Anda harus menentukan parameter Object Storage Service (OSS) sepertiossUploadPath.Buat proyek.
Akses antarmuka web DolphinScheduler. Di bilah navigasi atas, klik Project.
Klik Create Project.
Di kotak dialog Create Project, konfigurasikan parameter seperti Project Name dan Owned Users.
Buat alur kerja.
Klik nama proyek yang telah dibuat. Di panel navigasi kiri, pilih Alur Kerja > Definisi Alur Kerja untuk masuk ke halaman Workflow Definition.
Klik Create Workflow untuk masuk ke halaman workflow DAG edit.
Di daftar sisi kiri halaman, pilih SHELL dan seret ke kanvas di sisi kanan.
Di kotak dialog Current node settings, konfigurasikan parameter berikut sesuai dengan tabel di bawah ini.
Parameter
Deskripsi
Nama Node
Nama node alur kerja.
Skrip
Path instalasi alat spark-submit dan kode bisnis pekerjaan Spark. Contoh:
/root/adb-spark-toolkit-submit/bin/spark-submit --class org.apache.spark.examples.SparkPi --name SparkPi --conf spark.driver.resourceSpec=medium --conf spark.executor.instances=2 --conf spark.executor.resourceSpec=medium local:///tmp/spark-examples.jar 1000.PentingSaat menjadwalkan pekerjaan Spark, Anda harus menentukan path instalasi alat spark-submit dalam skrip. Jika tidak, tugas penjadwalan mungkin gagal menemukan perintah spark-submit.
CatatanUntuk informasi tentang parameter lainnya, lihat Lampiran Parameter Tugas DolphinScheduler.
Klik Confirm.
Di pojok kanan atas halaman, klik Save. Di kotak dialog Basic Information, konfigurasikan parameter seperti Workflow Name. Klik Confirm.
Jalankan alur kerja.
Temukan alur kerja yang telah dibuat dan klik ikon
di kolom Operation untuk mempublikasikan alur kerja.Klik ikon
di kolom Operation.Di kotak dialog Please set the parameters before starting, konfigurasikan parameter.
Klik Confirm untuk menjalankan alur kerja.
Lihat detail alur kerja.
Di panel navigasi kiri, pilih Tugas > Task Instance.
Temukan tugas dari alur kerja dan klik ikon
di kolom Operation untuk melihat hasil eksekusi dan log alur kerja.