Siapkan ruang kerja Notebook di DMS untuk mengkueri dan menganalisis data dengan Spark atau Python. Panduan ini memandu Anda melalui pembuatan ruang kerja, konfigurasi penyimpanan, penambahan resource komputasi, serta akses ke data Anda.
Prasyarat
Sebelum memulai, pastikan Anda telah memiliki:
Bucket Object Storage Service (OSS) di wilayah Singapura dengan kelas penyimpanan Standard. Jika belum memiliki, buat bucket terlebih dahulu.
Kluster AnalyticDB for MySQL yang telah terdaftar di DMS (wajib hanya jika Anda berencana menggunakan image Spark). Jika kluster belum terdaftar, lihat Register an Alibaba Cloud database instance.
Virtual private cloud (VPC) dengan vSwitch dan security group yang telah dikonfigurasi.
Langkah 1: Buat ruang kerja
Masuk ke DMS console V5.0.
Klik ikon
di pojok kiri atas dan pilih All Features > Data Development > Notebook.CatatanJika Anda tidak menggunakan DMS dalam mode simple, pilih Data Development > Notebook pada bilah navigasi atas.
Klik Create Workspace. Pada kotak dialog Create Workspace, atur Workspace Name dan Region, lalu klik OK.
CatatanNama ruang kerja dapat berisi huruf, angka, dan garis bawah (_).
Anda hanya dapat memilih wilayah Singapura untuk ruang kerja.
Pada daftar ruang kerja, klik Go to Workspace di kolom Actions.
CatatanHanya pembuat ruang kerja yang dapat mengakses ruang kerja secara default. Untuk mengaktifkan pengembangan kolaboratif, berikan izin pengembangan kepada pengguna yang memerlukan akses.
Langkah 2: Tambahkan anggota ruang kerja (opsional)
Lewati langkah ini jika Anda bekerja sendiri.
Jika beberapa pengguna memerlukan akses, tetapkan peran untuk setiap pengguna. Pengguna harus ditambahkan ke DMS sebelum Anda dapat menetapkan peran. Untuk detailnya, lihat Manage users.

Langkah 3: Konfigurasikan bucket OSS untuk penyimpanan kode
Di ruang kerja Anda, klik Storage Management pada tab
.Klik ikon
di samping Code Storage Space.Pada kotak dialog Select OSS Directory, pilih sebuah bucket. Bucket tersebut harus berada di wilayah yang sama dengan ruang kerja Anda dan menggunakan kelas penyimpanan Standard.
Klik OK.
Langkah 4: Tambahkan resource komputasi
Tambahkan dan mulai resource komputasi sebelum menggunakan Notebook untuk mengkueri dan menganalisis data.
Resource akan dilepas secara otomatis ketika semua kernel notebook keluar dan periode idle maksimum telah berlalu. Sesuaikan ukuran resource berdasarkan workload Anda untuk menghindari biaya yang tidak perlu.
Pada tab
, klik Resource Configuration.Klik Add Resource dan konfigurasikan parameter berikut.
Parameter Deskripsi Resource Name Nama untuk resource tersebut. Resource Introduction Deskripsi resource tersebut. Image Lingkungan runtime. Opsi: Spark 3.5+Python 3.9, Spark 3.3+Python 3.9, Python 3.9. Pilih image Spark jika Anda memerlukan pemrosesan terdistribusi; pilih Python 3.9 untuk eksplorasi data ringan. AnalyticDB Instance Kluster AnalyticDB for MySQL yang akan digunakan. Wajib saat Image diatur ke Spark 3.3 atau Spark 3.5. AnalyticDB Resource Group Kelompok sumber daya dalam kluster AnalyticDB for MySQL. Executor Spec Spesifikasi resource untuk setiap executor Spark. Sebagai referensi, lihat kolom Type di Spark application configuration parameters. Executor Count Jumlah executor Spark. Selama pratinjau publik, maksimum adalah 6 executor per notebook. Hubungi dukungan teknis DMS jika Anda memerlukan lebih banyak. Driver Specifications Spesifikasi resource untuk driver Spark. Nilai yang valid: General_XSmall_v1 (2 core CPU, 8 GB memori), General_Small_v1 (4 core CPU, 16 GB memori), General_Medium_v1 (8 core CPU, 32 GB memori), General_Large_v1 (16 core CPU, 64 GB memori). Untuk workload ringan, General_XSmall_v1 sudah cukup. Untuk pekerjaan Spark besar, pertimbangkan General_Medium_v1 atau lebih tinggi. NotebookQuantity Spesifikasi komputasi untuk notebook Python 3.9. Hanya muncul saat Image diatur ke Python 3.9. Nilai yang valid sama seperti Driver Specifications. VPC ID VPC tempat resource berjalan. Zone ID Zona dari VPC tersebut. vSwitch ID vSwitch di dalam VPC. Security Group ID Security group untuk resource tersebut. Klik Save.
Temukan resource tersebut dalam daftar, klik Start di kolom Action, lalu klik OK. Resource akan masuk ke status Running setelah sekitar 1 menit.
Langkah 5: Konfigurasikan bucket OSS untuk data pengguna (opsional)
Lewati langkah ini jika Anda hanya perlu mengakses data yang sudah ada di DMS.
Untuk membaca data dari bucket OSS eksternal di notebook Anda, konfigurasikan satu atau beberapa path OSS di area User Storage Space.
Di ruang kerja Anda, klik Storage Management pada tab
.Di area User Storage Space, konfigurasikan path OSS.
CatatanPath mount harus dimulai dengan
/mnt/.
Klik ikon
untuk menyimpan path tersebut.
Langkah 6: Lihat data
Di ruang kerja Anda, klik tab
untuk membuka SQL Console.Gunakan SQL Console untuk mengkueri data dan menjelajahi definisi tabel:
Kueri data: Masukkan pernyataan SQL secara langsung, atau gunakan Copilot untuk menghasilkannya. Sintaksis SQL mengikuti standar gudang data logis, yang mendukung sintaksis MySQL di berbagai database (seperti AnalyticDB for MySQL dan ApsaraDB RDS for MySQL). DMS secara otomatis mengonversi dan mengoptimalkan pernyataan Anda. Saat Anda menggunakan Copilot, SQL yang dihasilkan didasarkan pada metadata database, tabel, dan kolom. Jika hasil yang dihasilkan tidak akurat, edit pengetahuan yang digunakan Copilot untuk meningkatkan akurasi di masa depan. Anda juga dapat memberi like pada hasil yang akurat untuk terus meningkatkan kualitas seiring waktu.
Lihat catatan penggunaan tabel: Klik database untuk memperluasnya, lalu klik ganda nama tabel untuk membuka halaman detail tabel. Lihat atau edit deskripsi tabel pada tab Usage Notes.
Manage resources
Di halaman Resource Configuration, Anda dapat mengelola sumber daya kapan saja. Untuk informasi selengkapnya tentang cara menavigasi ke halaman ini, lihat Langkah 4: Menambahkan sumber daya komputasi.
| Operasi | Deskripsi |
|---|---|
| Stop | Hentikan resource yang sedang berjalan secara manual. |
| Edit | Edit konfigurasi resource. Resource harus dihentikan terlebih dahulu sebelum Anda dapat mengeditnya. |
| Start | Mulai secara manual sumber daya yang telah dihentikan. |
| Auto-release | Resource dilepas secara otomatis ketika semua kernel notebook keluar dan periode idle maksimum telah berlalu. |
| View Spark jobs | Klik SparkUI di kolom Action untuk membuka halaman History Server, lalu klik ID aplikasi untuk melihat pekerjaan Spark-nya. SparkUI hanya tersedia jika resource default digunakan dan resource tersebut berisi image Spark. |