Ruang kerja adalah unit dasar dalam Serverless Spark yang digunakan untuk mengelola pekerjaan, anggota, peran, dan izin. Semua pengembangan pekerjaan harus dilakukan di dalam ruang kerja. Oleh karena itu, Anda harus membuat ruang kerja sebelum memulai pengembangan pekerjaan. Topik ini menjelaskan cara dengan cepat membuat ruang kerja di halaman EMR Serverless Spark.
Prasyarat
Anda telah mendaftarkan Akun Alibaba Cloud dan menyelesaikan verifikasi nama asli.
Akun yang Anda gunakan untuk membuat ruang kerja memiliki izin yang diperlukan.
Jika Anda menggunakan Akun Alibaba Cloud untuk membuat ruang kerja, lihat Tetapkan peran ke Akun Alibaba Cloud untuk informasi lebih lanjut.
Jika Anda menggunakan Pengguna Resource Access Management (RAM) atau Peran RAM untuk membuat ruang kerja, pastikan bahwa kebijakan akses AliyunEMRServerlessSparkFullAccess, AliyunOSSFullAccess, dan AliyunDLFFullAccess disambungkan ke Pengguna RAM atau Peran RAM. Kemudian, tambahkan Pengguna RAM atau Peran RAM pada halaman Resource Access Management dari EMR Serverless Spark dan berikan peran administrator. Untuk informasi lebih lanjut, lihat Berikan izin kepada Pengguna RAM dan Kelola pengguna dan peran.
Data Lake Formation (DLF) telah diaktifkan. Untuk informasi lebih lanjut, lihat Memulai Cepat. Untuk daftar Wilayah yang didukung, lihat Wilayah dan Titik akhir.
Object Storage Service (OSS) telah diaktifkan dan bucket telah dibuat. Untuk informasi lebih lanjut, lihat Aktifkan OSS dan Buat bucket.
Perhatian
Lingkungan runtime kode dikelola dan dikonfigurasi oleh pemilik lingkungan tersebut.
Prosedur
Pergi ke halaman EMR Serverless Spark.
Masuk ke Konsol EMR.
Di bilah navigasi kiri, pilih .
Di bilah navigasi atas, pilih Wilayah yang diperlukan.
PentingAnda tidak dapat mengubah Wilayah ruang kerja setelah dibuat.
Klik Create Workspace.
Di halaman EMR Serverless Spark, konfigurasikan parameter yang diperlukan.
Parameter
Deskripsi
Contoh
Region
Kami sarankan Anda memilih Wilayah tempat data Anda disimpan.
Tiongkok (Hangzhou)
Billing Method
Metode penagihan Subscription dan Pay-as-you-go didukung.
Bayar sesuai penggunaan
Workspace Name
Nama tersebut harus memiliki panjang 1 hingga 64 karakter dan hanya dapat berisi karakter Cina, huruf, angka, tanda hubung (-), dan garis bawah (_).
CatatanNama ruang kerja dalam Akun Alibaba Cloud yang sama harus unik. Jika Anda memasukkan nama ruang kerja yang sudah ada, sistem akan meminta Anda untuk memasukkan nama lain.
emr-serverless-spark
Maximum Instantaneous Quota
Jumlah maksimum unit komputasi (CUs) yang dapat digunakan secara bersamaan untuk memproses pekerjaan di ruang kerja.
1.000
Workspace Base Path
Jalur yang digunakan untuk menyimpan file data, seperti log tugas, event yang sedang berjalan, dan sumber daya.
Kami sarankan Anda memilih bucket tempat OSS-HDFS diaktifkan. Ini memberikan kompatibilitas dengan antarmuka Sistem File Terdistribusi Hadoop (HDFS) asli. Jika skenario aplikasi Anda tidak melibatkan HDFS, Anda dapat memilih bucket OSS standar.
emr-oss-hdfs
DLF As Metadata Service
Digunakan untuk menyimpan dan mengelola metadata Anda.
Setelah Anda mengaktifkan DLF, sistem memilih katalog data default untuk Anda. Katalog data default dinamai berdasarkan UID Anda. Jika Anda ingin menggunakan katalog data yang berbeda untuk kluster yang berbeda, Anda dapat membuat katalog data.
Klik Create Data Catalog. Di kotak dialog yang muncul, masukkan Catalog ID dan klik OK.
Dari daftar drop-down, pilih katalog data yang Anda buat.
emr-dlf
Execution Role
Nama peran yang digunakan EMR Serverless Spark untuk menjalankan pekerjaan. Peran defaultnya adalah AliyunEMRSparkJobRunDefaultRole.
EMR Spark menggunakan peran ini untuk mengakses sumber daya Anda di produk cloud lainnya, seperti OSS dan DLF. Jika Anda ingin mengontrol izin peran eksekusi, Anda dapat menggunakan peran eksekusi kustom. Untuk informasi lebih lanjut, lihat Peran eksekusi.
AliyunEMRSparkJobRunDefaultRole
(Opsional) Advanced Settings
Tags: Tag digunakan untuk mengidentifikasi sumber daya cloud. Anda dapat menggunakan tag untuk mengklasifikasikan, mencari, dan mengumpulkan sumber daya cloud yang memiliki karakteristik yang sama dari dimensi yang berbeda. Ini meningkatkan efisiensi manajemen sumber daya. Anda dapat menyambungkan maksimal 20 tag ke setiap ruang kerja. Setiap tag terdiri dari kunci tag kustom dan nilai tag untuk memenuhi kebutuhan manajemen yang beragam. Anda juga dapat menggunakan tag untuk alokasi biaya dan manajemen detail halus sumber daya bayar sesuai penggunaan.
Anda dapat menyambungkan tag saat membuat ruang kerja, atau menambahkan atau memodifikasi tag di halaman daftar ruang kerja kapan saja setelah ruang kerja dibuat. Dengan menyambungkan tag ke sumber daya, Anda dapat dengan mudah menerapkan klasifikasi sumber daya dan optimasi operasional.
Untuk informasi lebih lanjut tentang tag, lihat Apa itu tag?.
Masukkan kunci tag kustom dan nilai tag
Klik Create Workspace.
Referensi
Setelah membuat ruang kerja, Anda dapat mulai mengembangkan pekerjaan seperti pekerjaan SparkSQL. Untuk informasi lebih lanjut, lihat Memulai cepat untuk pengembangan SparkSQL.