Serverless Spark menyediakan berbagai parameter bawaan. Topik ini menjelaskan parameter tersebut beserta kasus penggunaannya untuk membantu Anda mengonfigurasi lingkungan runtime dan mengoptimalkan eksekusi tugas.
Parameter | Deskripsi | Skenario |
spark.emr.serverless.user.defined.jars | Menambahkan paket JAR yang diunggah ke ClassPath driver dan pelaksana Serverless Spark.
| Gunakan parameter ini untuk menambahkan paket JAR kustom dari OSS ke driver dan pelaksana Spark saat Anda mengirimkan tugas Spark menggunakan alat Spark-Submit, pekerjaan batch, atau Airflow Serverless Spark Operator, atau saat membuat sumber daya sesi. |
spark.emr.serverless.fusion | Menentukan apakah akan mengaktifkan Fusion untuk sesi atau tugas pemrosesan batch yang dimulai oleh Kyuubi dan Livy. Nilai yang valid:
| Anda dapat menggunakan parameter Spark Configuration dalam tugas atau sesi untuk mengaktifkan Fusion. |
spark.emr.serverless.environmentId | Menentukan ID lingkungan runtime yang digunakan untuk sumber daya komputasi. | Gunakan parameter ini untuk menentukan lingkungan runtime saat Anda mengirimkan tugas Serverless Spark menggunakan Airflow atau alat Spark-Submit. Secara default, pustaka dependensi pihak ketiga diinstal di lingkungan runtime. |
spark.emr.serverless.network.service.name | Menentukan nama koneksi jaringan untuk mengaktifkan konektivitas jaringan antara sumber daya komputasi dan sumber data di VPC lain. | Gunakan parameter ini untuk menambahkan koneksi jaringan saat Anda mengirimkan tugas Serverless Spark, sehingga memungkinkan akses ke sumber data di Virtual Private Cloud (VPC) lain. |
spark.emr.serverless.excludedModules | Menghapus pustaka bawaan dari Serverless Spark.
| Parameter ini biasanya digunakan saat Anda perlu menggunakan paket JAR kustom. Parameter ini memungkinkan Anda menghapus pustaka Serverless Spark bawaan saat Anda mengirimkan tugas Spark dari Konsol Serverless Spark, alat Spark-Submit, pekerjaan batch, Airflow Serverless Spark Operator, Kyuubi, atau Livy, atau saat membuat sumber daya sesi. |
spark.emr.serverless.kyuubi.engine.queue | Menentukan nama antrian ruang kerja tempat aplikasi Spark yang dimulai oleh Kyuubi akan berjalan. | Parameter ini dapat diatur di bagian konfigurasi Kyuubi atau ditentukan dalam URL JDBC saat Anda membuat koneksi. |
spark.emr.serverless.templateId | Menentukan ID templat konfigurasi default untuk aplikasi Spark. Dengan mereferensikan templat ruang kerja yang telah ditentukan sebelumnya, Anda dapat menyederhanakan konfigurasi parameter saat mengirimkan tugas. Anda dapat memperoleh ID templat di halaman . Misalnya, | Parameter ini hanya didukung oleh alat Spark-Submit. |
spark.emr.serverless.livy.config.mode | Mengontrol apakah akan menggunakan pengaturan dari file
| Atur parameter ini ke |
spark.emr.serverless.tag.xxxx | Anda dapat menambahkan tag ke pekerjaan batch yang dikirimkan melalui Livy dalam format | Gunakan parameter ini untuk menambahkan tag ke pekerjaan Spark yang dikirimkan melalui Livy Gateway. Anda kemudian dapat memfilter pekerjaan berdasarkan tag-tag tersebut dalam riwayat pekerjaan. |