All Products
Search
Document Center

E-MapReduce:Konfigurasikan RDS yang Dikelola Sendiri

Last Updated:Jun 21, 2026

Anda dapat menggunakan instans RDS for MySQL yang dikelola sendiri atau instans ApsaraDB RDS for MySQL sebagai metastore untuk kluster DataLake, Custom, dan Hadoop di E-MapReduce (EMR).

Prasyarat

Instans RDS for MySQL diperlukan.

Topik ini menggunakan instans ApsaraDB RDS for MySQL sebagai contoh. Untuk informasi selengkapnya, lihat Buat instans ApsaraDB RDS for MySQL.

Catatan Penggunaan

Pastikan kluster EMR yang Anda buat dapat terhubung ke instans RDS for MySQL.

Jika Anda menggunakan instans ApsaraDB RDS for MySQL:

  • VPC yang sama:

    • Kluster EMR dan instans RDS for MySQL dapat berkomunikasi melalui jaringan pribadi secara default. Namun, Anda harus menambahkan blok CIDR IPv4 dari VPC kluster EMR ke daftar putih instans RDS for MySQL.

    • Langkah ini memungkinkan koneksi antara kluster EMR dan instans RDS for MySQL.

  • VPC yang berbeda:

    • Jika kluster EMR dan instans RDS for MySQL berada di VPC yang berbeda, Anda harus membuat koneksi jaringan di antara keduanya, misalnya dengan menggunakan Koneksi peering VPC. Untuk informasi selengkapnya, lihat Gunakan Koneksi peering VPC untuk mengaktifkan komunikasi pribadi antar-VPC.

    • Setelah koneksi jaringan dibuat, Anda juga harus menambahkan blok CIDR IPv4 dari VPC kluster EMR ke daftar putih instans RDS for MySQL.

Prosedur

Langkah 1: Siapkan metadatabase

  1. Buat database. Untuk informasi selengkapnya, lihat Buat database.

  2. Buat akun pengguna standar dan berikan izin baca dan tulis. Untuk informasi selengkapnya, lihat Buat akun.

    Catatan

    Catat username dan password. Anda akan membutuhkannya di Langkah 2: Buat kluster.

  3. Dapatkan titik akhir internal database.

    1. Tambahkan blok CIDR IPv4 dari VPC kluster EMR ke daftar putih instans RDS for MySQL. Untuk informasi selengkapnya, lihat Konfigurasikan daftar putih IP.

    2. Pada halaman detail instans, klik Database Connection di panel navigasi sebelah kiri.

    3. Pada halaman Database Connection, klik titik akhir internal untuk menyalinnya.

      Catatan

      Catat titik akhir internal. Anda akan membutuhkannya di Langkah 2: Buat kluster.

Langkah 2: Buat kluster

Pada halaman Software Configuration wizard pembuatan kluster, konfigurasikan parameter berikut. Untuk informasi tentang parameter lainnya, lihat Buat kluster.

DataLake dan Parameter Kustom

Parameter Hadoop

Deskripsi

Metadata

Pilih Self-managed RDS.

Catatan

Parameter Metadata hanya ditampilkan setelah Anda memilih layanan HDFS (OSS-HDFS), YARN, dan Hive untuk kluster DataLake atau Custom.

javax.jdo.option.ConnectionURL

RDS Endpoint

Masukkan URL koneksi dalam format jdbc:mysql://rm-xxxxxx.mysql.rds.aliyuncs.com/<Database name>.

javax.jdo.option.ConnectionUserName

RDS Username

Masukkan username akun dari Langkah 1: Siapkan metadatabase.

javax.jdo.option.ConnectionPassword

RDS Password

Masukkan password akun dari Langkah 1: Siapkan metadatabase.

(Opsional) Langkah 3: Inisialisasi metastore

Penting
  • Anda harus melakukan inisialisasi metastore jika membuat kluster Hadoop versi lama (EMR V3.38.x atau lebih lama, EMR V4.9.x atau lebih lama, atau EMR V5.4.x atau lebih lama), atau jika ingin mengganti metastore kluster yang sudah ada ke instans RDS for MySQL.

    Sebelum inisialisasi, layanan Hive Metastore, HiveServer2, dan Spark ThriftServer mungkin tidak berfungsi dengan benar. Layanan-layanan ini akan dipulihkan secara otomatis setelah inisialisasi selesai.

  • Kluster DataLake dan Custom secara otomatis melakukan inisialisasi metadatabase Hive selama pembuatan menggunakan parameter koneksi database yang diberikan. Oleh karena itu, Anda dapat melewati langkah ini.

  1. Login ke node master kluster menggunakan SSH. Untuk informasi selengkapnya, lihat Login ke kluster.

  2. Jalankan perintah berikut untuk beralih ke pengguna hadoop.

    su - hadoop
  3. Jalankan perintah berikut untuk menginisialisasi metastore.

    schematool -initSchema -dbType mysql

    Instans RDS for MySQL kini telah dikonfigurasi sebagai metadatabase Hive.