Sebelum menjalankan pekerjaan, Anda dapat mengunggah sumber daya seperti berkas atau paket JAR, serta memuat direktori berkas ke E-MapReduce (EMR) Serverless Spark. Hal ini memastikan bahwa EMR Serverless Spark dapat mengakses sumber daya yang diperlukan saat menjalankan pekerjaan. Topik ini menjelaskan operasi yang dapat dilakukan pada tab Managed File Directory dan Integrated File Directory di halaman Files di konsol EMR.
Informasi latar belakang
Managed File Directory: Di tab ini, Anda dapat mengunggah berkas dari mesin lokal. Ini memungkinkan EMR Serverless Spark mengakses berkas tersebut saat menjalankan pekerjaan.
Integrated File Directory: Di tab ini, Anda dapat memasang bucket Object Storage Service (OSS) sebagai sistem berkas ke sesi notebook. Ini memungkinkan sesi notebook mengakses berkas yang disimpan di OSS tanpa perlu mengunggah berkas secara manual.
Batasan
Saat menggunakan fitur folder terkelola, Anda hanya dapat mengunggah berkas dengan ukuran maksimum 500 MB per berkas.
Managed File Directory
Unggah berkas
Buka halaman Files.
Masuk ke konsol EMR.
Di panel navigasi sebelah kiri, pilih .
Di halaman Spark, klik nama ruang kerja yang diinginkan.
Di panel navigasi sebelah kiri halaman EMR Serverless Spark, klik Files.
Pada tab Managed File Directory di halaman Files, klik Upload File.
Di kotak dialog Upload File, klik area dalam kotak garis putus-putus untuk memilih berkas atau seret berkas ke area tersebut.
Kelola berkas dan folder
Di tab Managed File Directory, Anda dapat mengelola berkas dan folder.
Kelola Berkas
Unduh berkas: Temukan berkas yang diinginkan dan klik Download File di kolom Actions.
Salin jalur berkas: Temukan berkas yang diinginkan dan klik Copy Address di kolom Actions.
Hapus berkas: Temukan berkas yang diinginkan dan klik Delete di kolom Actions.
Buat dan Kelola Folder
Buat folder: Klik Create Folder. Di kotak dialog Create Folder, konfigurasikan parameter Name dan klik OK.
Untuk mengganti nama folder, temukan folder yang diinginkan dan klik Rename di kolom Actions.
Hapus folder: Temukan folder yang diinginkan dan klik Delete di kolom Actions.
Integrated File Directory
Anda hanya dapat memasang direktori berkas terintegrasi ke driver notebook.
Setelah membuat direktori berkas terintegrasi, pengguna dengan izin pengeditan dapat mengedit berkas dan folder di halaman Files, sedangkan pengguna dengan izin pengembangan data dapat melakukan operasi baca dan tulis pada berkas dan folder menggunakan notebook.
Buat direktori berkas
Di tab Integrated File Directory halaman Files, klik Create File Directory.
Di kotak dialog Create File Directory, konfigurasikan parameter dan klik OK.
Parameter
Deskripsi
Name
Nama direktori berkas.
OSS Path
Pilih jalur OSS dari daftar drop-down. Pastikan Anda memiliki izin untuk mengakses jalur tersebut.
Mount Directory
Nilai default adalah
/mnt/workspace. Anda dapat memodifikasiworkspacedi jalur/mntberdasarkan kebutuhan bisnis Anda.
Hapus direktori berkas
Saat menghapus direktori berkas, direktori dilepas dari OSS, tetapi berkas di jalur OSS tidak dihapus.
Di halaman Integrated File Directory, temukan direktori berkas dan klik Delete di kolom Actions.
Di pesan Delete File Directory, klik OK.
Apa yang harus dilakukan selanjutnya
Setelah mengunggah sumber daya, Anda dapat menggunakan berkas yang telah diunggah sebagai dependensi atau sumber data masukan saat mengembangkan pekerjaan.