Ruang kerja merupakan unit dasar dalam EMR Serverless Spark yang menyediakan batasan untuk mengelola pekerjaan, anggota, role, dan izin. Anda harus membuat ruang kerja sebelum menjalankan pekerjaan apa pun.
Sebelum memulai
Akun dan izin
Anda telah mendaftarkan Akun Alibaba Cloud dan menyelesaikan verifikasi nama asli.
Akun yang digunakan untuk membuat ruang kerja memiliki izin yang diperlukan:
Akun Alibaba Cloud: Berikan role yang diperlukan kepada akun tersebut. Untuk detailnya, lihat Tetapkan role ke Akun Alibaba Cloud.
RAM user atau RAM role: Sambungkan kebijakan AliyunEMRServerlessSparkFullAccess, AliyunOSSFullAccess, dan AliyunDLFFullAccess ke RAM user atau RAM role tersebut. Lalu tambahkan RAM user atau RAM role tersebut pada halaman Access Control EMR Serverless Spark dan berikan role administrator. Untuk detailnya, lihat Berikan izin kepada RAM user dan Kelola pengguna dan role.
Layanan yang diperlukan
Data Lake Formation (DLF): Aktifkan DLF sebelum membuat ruang kerja. DLF menyimpan dan mengelola metadata untuk pekerjaan Spark Anda. Untuk detailnya, lihat Quick Start. Untuk daftar wilayah yang didukung, lihat Wilayah dan titik akhir.
Object Storage Service (OSS): Aktifkan OSS dan buat bucket. Bucket tersebut berfungsi sebagai direktori ruang kerja untuk menyimpan log tugas, event berjalan, dan sumber daya. Untuk detailnya, lihat Aktifkan OSS dan Buat bucket.
Buat ruang kerja
Masuk ke Konsol EMR.
Pada panel navigasi kiri, pilih EMR Serverless > Spark.
Pada bilah navigasi atas, pilih wilayah tempat Anda ingin membuat ruang kerja.
PentingAnda tidak dapat mengubah wilayah ruang kerja setelah dibuat.
Klik Create Workspace.
Konfigurasikan parameter ruang kerja.
Parameter Deskripsi Contoh Region Kami menyarankan Anda memilih wilayah tempat data Anda disimpan. China (Hangzhou) Billing method Metode penagihan Subscription dan Pay-as-you-go didukung. Pay-as-you-go Workspace name Masukkan nama dengan panjang 1 hingga 64 karakter. Nama hanya boleh berisi karakter Tionghoa, huruf, angka, tanda hubung (-), dan garis bawah (_). Nama ruang kerja harus unik dalam satu Akun Alibaba Cloud. Jika Anda memasukkan nama ruang kerja yang sudah ada, sistem akan meminta Anda memasukkan nama lain. emr-serverless-spark Maximum quota Jumlah maksimum unit komputasi (CUs) yang dapat digunakan secara bersamaan untuk memproses pekerjaan di ruang kerja. 1000 Workspace directory Path yang digunakan untuk menyimpan file data seperti log tugas, event berjalan, dan sumber daya. Pilih bucket dengan OSS-HDFS diaktifkan agar kompatibel dengan antarmuka native Hadoop Distributed File System (HDFS). Jika skenario Anda tidak memerlukan HDFS, bucket OSS standar sudah cukup. emr-oss-hdfs DLF for metadata storage Katalog data yang digunakan untuk menyimpan dan mengelola metadata Anda. Setelah Anda mengaktifkan DLF, sistem akan memilih katalog data default yang dinamai sesuai UID Anda. Untuk menggunakan katalog data terpisah: (1) Klik Create Catalog, masukkan Catalog ID, lalu klik OK. (2) Pilih katalog tersebut dari daftar drop-down. emr-dlf Execution role RAM role yang digunakan EMR Serverless Spark untuk menjalankan pekerjaan. Role default-nya adalah AliyunEMRSparkJobRunDefaultRole. Role ini memberikan akses ke sumber daya di produk cloud lainnya, seperti OSS dan DLF. Untuk mengontrol izin secara lebih detail, gunakan execution role kustom. Untuk detailnya, lihat Execution role. AliyunEMRSparkJobRunDefaultRole (Opsional) Advanced settings > Tags Tag digunakan untuk mengidentifikasi dan mengklasifikasikan sumber daya cloud. Setiap ruang kerja mendukung hingga 20 tag. Setiap tag terdiri dari kunci dan nilai. Anda juga dapat menggunakan tag untuk alokasi biaya dan manajemen detail halus terhadap sumber daya pay-as-you-go. Anda dapat menyambungkan tag saat membuat ruang kerja atau menambahkan serta mengubahnya nanti melalui halaman daftar ruang kerja. Untuk detailnya, lihat Apa itu tag?. Masukkan kunci dan nilai tag kustom CatatanLingkungan runtime kode dikelola dan dikonfigurasi oleh pemilik lingkungan tersebut.
Klik Create Workspace.
Langkah berikutnya
Setelah ruang kerja siap, mulailah mengembangkan pekerjaan. Untuk pengembangan pekerjaan SparkSQL, lihat Quick start untuk pengembangan SparkSQL.