All Products
Search
Document Center

AnalyticDB:Kembangkan pekerjaan Spark dengan Notebook

Last Updated:Jun 21, 2026

Fitur Notebook AnalyticDB for MySQL adalah platform interaktif untuk analitik data dan pengembangan yang menawarkan fitur seperti pengeditan pekerjaan, analisis data, dan visualisasi data. Topik ini menjelaskan cara menggunakan fitur Notebook di Data Management (DMS) untuk mengembangkan pekerjaan Spark SQL.

Prasyarat

Batasan

Fitur Notebook hanya tersedia di wilayah-wilayah berikut: .

Prosedur

  1. Buat proyek dan masuk ke ruang kerja.

    1. Login ke DMS 5.0.

    2. Arahkan penunjuk ke ikon 2023-01-28_15-57-17.png di pojok kiri atas lalu pilih All Features > Data+AI > Notebook.

      Catatan

      Jika Anda menggunakan konsol DMS dalam mode normal, pilih Data+AI > Notebook di bilah navigasi atas.

    3. Klik Create Workspace. Di kotak dialog yang muncul, masukkan Workspace Name, pilih Region, lalu klik OK.

    4. Pada kolom Actions ruang kerja yang dituju, klik Go to Workspace.

  2. (Opsional) Tambahkan anggota proyek. Jika beberapa pengguna bekerja dalam ruang kerja yang sama, Anda harus menyelesaikan langkah ini untuk memberikan peran ruang kerja yang berbeda kepada mereka.

  3. Konfigurasikan storage space kode.

    1. Pada tab Project Settings image, klik Storage Management .

    2. Konfigurasikan jalur OSS untuk Code Storage.

  4. Tambahkan resource.

    1. Pada tab Project Settings image, klik Resource Settings.

    2. Klik Add Resource lalu konfigurasikan parameter-parameter untuk resource tersebut.

      Parameter

      Wajib

      Deskripsi

      Resource Name

      Ya

      Nama resource tersebut. Anda dapat menentukan nama kustom.

      Resource Introduction

      Ya

      Deskripsi penggunaan yang dimaksudkan untuk resource tersebut. Nilai ini dapat dikustomisasi.

      Image

      Ya

      Hanya image Spark3.5+Python3.9 yang didukung.

      AnalyticDB Instance

      Ya

      ID kluster AnalyticDB for MySQL.

      Catatan

      Jika kluster yang ingin Anda kelola tidak ditampilkan, periksa apakah kluster tersebut telah ditambahkan ke DMS.

      AnalyticDB Resource Group

      Ya

      Pilih kelompok sumber daya pekerjaan tujuan.

      Executor Specifications

      Ya

      Spesifikasi sumber daya untuk executor Spark. Contoh ini menggunakan nilai default, medium.

      Untuk informasi lebih lanjut tentang spesifikasi yang sesuai dengan model berbeda, lihat kolom Model di parameter konfigurasi aplikasi Spark.

      Max Executors

      Min Executors

      Ya

      Jumlah executor Spark.

      Setelah Anda memilih image Spark3.5+Python3.9, Min Executors diatur ke 2 dan Max Executors diatur ke 8 secara default.

      Notebook Spec

      Ya

      Pilih spesifikasi Notebook. Contoh ini menggunakan General_Tiny_v1 (1-core dan memori 4 GB).

      VPC ID

      Ya

      Pilih Virtual Private Cloud (VPC) tempat kluster AnalyticDB for MySQL berada untuk memastikan Notebook dapat berkomunikasi dengan kluster tersebut.

      Penting

      Jika nanti Anda mengganti kluster AnalyticDB for MySQL ke Virtual Private Cloud (VPC) dan vSwitch baru, Anda harus memperbarui VPC ID dan vSwitch ID dari resource tersebut. Jika tidak, pengiriman pekerjaan akan gagal.

      Zone ID

      Ya

      Pilih zona tempat kluster AnalyticDB for MySQL berada.

      vSwitch ID

      Ya

      Pilih vSwitch tempat kluster AnalyticDB for MySQL berada.

      Security group ID

      Ya

      Pilih security group yang tersedia untuk memastikan Notebook dapat berkomunikasi dengan kluster AnalyticDB for MySQL.

      Release resource

      Ya

      Resource tersebut akan dilepas secara otomatis setelah periode idle tertentu.

      Dependent Jars

      Tidak

      Jalur penyimpanan OSS untuk paket JAR. Parameter ini hanya diperlukan untuk pekerjaan Python yang menggunakan paket JAR.

      SparkConf

      Tidak

      Item konfigurasi sebagian besar sama dengan Spark open source. Parameter dalam format key: value. Untuk informasi lebih lanjut tentang parameter konfigurasi yang berbeda dari Spark open source dan parameter yang unik untuk AnalyticDB for MySQL, lihat parameter konfigurasi aplikasi Spark.

    3. Klik Save.

    4. Pada kolom Actions resource tersebut, klik Enable.

  5. Inisialisasi data.

    1. Di pojok kiri atas konsol, klik ikon 2023-01-28_15-57-17.png lalu pilih All features > Instance Management > Data Assets > Instance Management > Instance Management.

    2. Klik +New. Di kotak dialog Add Instance, konfigurasikan parameter berikut:

      Parameter

      Deskripsi

      Data Source

      Pada tab Alibaba Cloud, pilih OSS.

      Basic Information

      Files and logs

      Pilih OSS.

      Instance Region

      Pilih wilayah tempat kluster AnalyticDB for MySQL berada.

      Import Method

      Pilih Connection String.

      Connection String

      Masukkan oss-cn-hangzhou.aliyuncs.com.

      Bucket

      Pilih nama bucket.

      Access Mode

      Mode akses. Contoh ini menggunakan Security Hosting - Manual.

      AccessKey ID

      ID AccessKey dari akun Alibaba Cloud atau pengguna RAM yang memiliki izin untuk mengakses OSS.

      Untuk informasi lebih lanjut tentang cara memperoleh ID AccessKey dan Secret AccessKey, lihat Akun dan izin.

      AccessKey Secret

      Secret AccessKey dari akun Alibaba Cloud atau pengguna RAM yang memiliki izin untuk mengakses OSS.

      Untuk informasi lebih lanjut tentang cara memperoleh ID AccessKey dan Secret AccessKey, lihat Akun dan izin.

      Advanced Information

      Parameter opsional. Untuk informasi lebih lanjut, lihat Advanced Information.

    3. Setelah mengonfigurasi parameter, klik Test Connection di pojok kiri bawah.

      Catatan

      Jika uji konektivitas gagal, periksa informasi instans yang Anda masukkan berdasarkan pesan error.

    4. Setelah muncul pesan Successful connection, klik Submit.

    5. Masuk ke ruang kerja lalu klik tab image.

    6. Pada tab Data Lake Data, klik Add OSS lalu pilih bucket yang telah Anda tambahkan pada langkah b.

  6. Buat Notebook.

    Pada tab Files image, klik image lalu pilih Notebook.

  7. Kembangkan pekerjaan Spark SQL pada halaman Notebook.

    Catatan

    Untuk informasi lebih lanjut tentang tombol-tombol di halaman Notebook, lihat Antarmuka Notebook.

    1. Jalankan perintah berikut untuk mengunduh dependensi Python:

      pip install delta
    2. Ubah tipe sel menjadi SQL lalu jalankan pernyataan berikut untuk membuat database.

      Catatan

      Database db_delta yang dibuat pada langkah ini dan tabel eksternal sample_data yang dibuat pada langkah berikutnya akan ditampilkan secara otomatis di AnalyticDB for MySQL. Anda kemudian dapat menganalisis tabel sample_data di Konsol AnalyticDB for MySQL.

      CREATE DATABASE db_delta 
      LOCATION 'oss://testBucketName/db_delta/';    -- Tentukan jalur penyimpanan untuk data di database db_delta.
    3. Ubah tipe sel menjadi Code, jalankan kode berikut untuk membuat tabel eksternal sample_data, lalu masukkan data ke dalam tabel tersebut. Tindakan ini menyimpan data untuk tabel eksternal sample_data di jalur OSS yang ditentukan pada langkah sebelumnya.

      # -*- coding: utf-8 -*-
      import pyspark
      from delta import *
      from pyspark.sql.types import *
      from pyspark.sql.functions import *
      print("Starting Delta table creation")
      data = [
          ("Robert", "Baratheon", "Baratheon", "Storms End", 48),
          ("Eddard", "Stark", "Stark", "Winterfell", 46),
          ("Jamie", "Lannister", "Lannister", "Casterly Rock", 29),
          ("Robert", "Baratheon", "Baratheon", "Storms End", 48),
          ("Eddard", "Stark", "Stark", "Winterfell", 46),
          ("Jamie", "Lannister", "Lannister", "Casterly Rock", 29),
          ("Robert", "Baratheon", "Baratheon", "Storms End", 48),
          ("Eddard", "Stark", "Stark", "Winterfell", 46),
          ("Jamie", "Lannister", "Lannister", "Casterly Rock", 29)
              ]
      schema = StructType([
          StructField("firstname", StringType(), True),
          StructField("lastname", StringType(), True),
          StructField("house", StringType(), True),
          StructField("location", StringType(), True),
          StructField("age", IntegerType(), True)
      ])
      sample_dataframe = spark.createDataFrame(data=data, schema=schema)
      sample_dataframe.write.format('delta').mode("overwrite").option('mergeSchema','true').saveAsTable("db_delta.sample_data")
    4. Ubah tipe sel menjadi SQL lalu jalankan pernyataan berikut untuk mengkueri data di tabel sample_data.

      SELECT * FROM db_delta.sample_data;
  8. Untuk menganalisis tabel sample_data dengan Spark SQL di Konsol AnalyticDB for MySQL, ikuti langkah-langkah berikut.

    1. Login ke Konsol AnalyticDB for MySQL. Di pojok kiri atas konsol, pilih wilayah. Di panel navigasi kiri, klik Clusters. Temukan kluster yang ingin Anda kelola lalu klik ID kluster tersebut.

    2. Di panel navigasi kiri, pilih Job Development > SQL Development > SQL Development. Pilih engine Spark dan kelompok sumber daya Interaktif.

    3. Kueri tabel sample_data.

      SELECT * FROM db_delta.sample_data LIMIT 1000;

Dokumentasi terkait

Notebook (legacy): Pelajari lebih lanjut tentang fitur Notebook.