Topik ini menjelaskan secara rinci file konfigurasi inti dan parameter Livy untuk membantu Anda mengonfigurasi Livy Gateway dengan benar serta menggunakan fitur terkait di Alibaba Cloud EMR Serverless Spark.
spark-defaults.conf
Tujuan
File spark-defaults.conf menetapkan parameter default untuk pekerjaan Spark yang dikirim melalui Livy Gateway. Saat pengguna membuat pekerjaan batch Livy atau sesi, nilai default ini akan diterapkan secara otomatis jika parameter tertentu tidak didefinisikan secara eksplisit.
Contoh konfigurasi
Berikut adalah beberapa konfigurasi parameter default umum.
spark.driver.cores 2
spark.driver.memory 7g
spark.dynamicAllocation.enabled true
spark.dynamicAllocation.initialExecutors 2
spark.dynamicAllocation.maxExecutors 100
spark.dynamicAllocation.minExecutors 1Deskripsi parameter adalah sebagai berikut:
spark.driver.coresdanspark.driver.memory: Menentukan jumlah core CPU dan ukuran memori untuk Driver.Parameter alokasi sumber daya dinamis:
spark.dynamicAllocation.enabled=true: Mengaktifkan alokasi sumber daya dinamis.spark.dynamicAllocation.minExecutorsdanspark.dynamicAllocation.maxExecutors: Membatasi jumlah minimum dan maksimum Executor.spark.dynamicAllocation.initialExecutors: Jumlah awal Executor yang dialokasikan.
Parameter tambahan yang didukung
Parameter tambahan yang didukung mengacu pada fitur tambahan atau item konfigurasi ekstensi yang disediakan oleh Alibaba Cloud EMR Serverless Spark guna meningkatkan keamanan, fleksibilitas, dan kinerja sistem. Parameter ini umumnya dirancang untuk skenario tertentu, seperti lingkungan multitenancy dan pengelolaan izin, untuk membantu pengguna mengontrol perilaku tugas serta alokasi sumber daya secara lebih efektif.
Parameter | Deskripsi |
| Digunakan untuk menentukan proxy user saat mengirim pekerjaan Spark. Nilai defaultnya adalah Parameter ini hanya berlaku ketika |
livy.conf
Tujuan
File livy.conf adalah file konfigurasi inti untuk Livy, digunakan untuk mendefinisikan perilaku global Livy Gateway, termasuk metode autentikasi, pengaturan timeout, manajemen sesi, dan lainnya.
Parameter utama
Parameter | Deskripsi |
| Apakah mengizinkan pengguna untuk menyamar sebagai pengguna Spark melalui parameter |
| Periode batas waktu sesi. Sesi inaktif yang melebihi durasi ini akan ditutup secara otomatis. Nilai defaultnya adalah |
| Apakah memeriksa sesi yang timeout. Nilai defaultnya adalah Jika disetel ke |
| Apakah melewati sesi sibuk saat memeriksa sesi yang timeout. Jika dilewati, sesi yang sedang mengeksekusi tugas tidak akan ditutup. Nilai defaultnya adalah |
| Menentukan metode autentikasi untuk Livy Gateway. Sebagai contoh, atur ke |
| Alamat LDAP. Sebagai contoh, |
| LDAP base DN. Sebagai contoh, |
| Apakah mengaktifkan enkripsi TLS untuk LDAP. Nilai defaultnya adalah |
| Metode otentikasi keamanan LDAP. Nilai defaultnya adalah |
| Jangka waktu retensi sesi yang selesai di dalam memori. Nilai defaultnya adalah |
| Jumlah maksimum sesi yang dapat dibuat secara bersamaan. Nilai defaultnya adalah |
| Membatasi jumlah sesi yang dapat dibuat oleh setiap pengguna. Parameter ini hanya berlaku ketika |
livy-client.conf
Tujuan
File livy-client.conf mendefinisikan parameter runtime dari klien HTTP Livy, terutama digunakan untuk mengoptimalkan perilaku interaksi antara klien dan Livy Gateway.
Parameter utama
Parameter | Deskripsi |
| Jumlah maksimum pernyataan yang disimpan di dalam memori sesi. Nilai defaultnya adalah 100. |
| Jumlah maksimum baris yang dikembalikan oleh interpreter SQL. Nilai defaultnya adalah 1000. |
spark-blacklist.conf
Tujuan
File spark-blacklist.conf membatasi parameter yang tidak diizinkan untuk diubah oleh pengguna dalam tugas yang dikirim melalui Livy Gateway. Parameter yang terdaftar dalam daftar hitam akan diabaikan secara paksa oleh sistem, dan pengguna tidak dapat memodifikasi parameter tersebut.
Contoh konfigurasi
Berikut adalah beberapa contoh parameter daftar hitam umum.
spark.driver.cores
spark.driver.memory
spark.executor.cores
spark.executor.memoryKonfigurasi ini menunjukkan bahwa pengguna tidak dapat menetapkan sendiri sumber daya (seperti core CPU dan ukuran memori) untuk Spark Driver dan Executor, sehingga mencegah penyalahgunaan sumber daya.
Parameter tambahan yang didukung
File spark-blacklist.conf juga mendukung parameter tambahan berikut untuk lebih meningkatkan keamanan dan stabilitas tugas.
Parameter | Deskripsi |
| Mencegah pengguna menetapkan masa hidup data (TTL) untuk sesi. Memastikan bahwa TTL sesi dikelola secara seragam oleh administrator, menghindari pemborosan sumber daya atau gangguan tugas akibat pengguna menetapkan TTL terlalu lama atau terlalu pendek. |
| Mencegah pengguna menetapkan antrian untuk pengiriman tugas. Semua tugas menggunakan antrian default Livy Gateway, menghindari alokasi sumber daya yang tidak merata akibat pengguna memilih antrian secara sembarangan. |
| Mencegah pengguna menetapkan proxy user. Defaultnya adalah pengguna root. |