Anda dapat menggunakan instans RDS for MySQL yang dikelola sendiri atau instans ApsaraDB RDS for MySQL sebagai metastore untuk kluster DataLake, Custom, dan Hadoop di E-MapReduce (EMR).
Prasyarat
Instans RDS for MySQL diperlukan.
Topik ini menggunakan instans ApsaraDB RDS for MySQL sebagai contoh. Untuk informasi selengkapnya, lihat Buat instans ApsaraDB RDS for MySQL.
Catatan Penggunaan
Pastikan kluster EMR yang Anda buat dapat terhubung ke instans RDS for MySQL.
Jika Anda menggunakan instans ApsaraDB RDS for MySQL:
-
VPC yang sama:
-
Kluster EMR dan instans RDS for MySQL dapat berkomunikasi melalui jaringan pribadi secara default. Namun, Anda harus menambahkan blok CIDR IPv4 dari VPC kluster EMR ke daftar putih instans RDS for MySQL.
-
Langkah ini memungkinkan koneksi antara kluster EMR dan instans RDS for MySQL.
-
-
VPC yang berbeda:
-
Jika kluster EMR dan instans RDS for MySQL berada di VPC yang berbeda, Anda harus membuat koneksi jaringan di antara keduanya, misalnya dengan menggunakan Koneksi peering VPC. Untuk informasi selengkapnya, lihat Gunakan Koneksi peering VPC untuk mengaktifkan komunikasi pribadi antar-VPC.
-
Setelah koneksi jaringan dibuat, Anda juga harus menambahkan blok CIDR IPv4 dari VPC kluster EMR ke daftar putih instans RDS for MySQL.
-
Prosedur
Langkah 1: Siapkan metadatabase
-
Buat database. Untuk informasi selengkapnya, lihat Buat database.
-
Buat akun pengguna standar dan berikan izin baca dan tulis. Untuk informasi selengkapnya, lihat Buat akun.
CatatanCatat username dan password. Anda akan membutuhkannya di Langkah 2: Buat kluster.
-
Dapatkan titik akhir internal database.
-
Tambahkan blok CIDR IPv4 dari VPC kluster EMR ke daftar putih instans RDS for MySQL. Untuk informasi selengkapnya, lihat Konfigurasikan daftar putih IP.
-
Pada halaman detail instans, klik Database Connection di panel navigasi sebelah kiri.
-
Pada halaman Database Connection, klik titik akhir internal untuk menyalinnya.
CatatanCatat titik akhir internal. Anda akan membutuhkannya di Langkah 2: Buat kluster.
-
Langkah 2: Buat kluster
Pada halaman Software Configuration wizard pembuatan kluster, konfigurasikan parameter berikut. Untuk informasi tentang parameter lainnya, lihat Buat kluster.
|
DataLake dan Parameter Kustom |
Parameter Hadoop |
Deskripsi |
|
|
Metadata |
Pilih Self-managed RDS. Catatan
Parameter Metadata hanya ditampilkan setelah Anda memilih layanan HDFS (OSS-HDFS), YARN, dan Hive untuk kluster DataLake atau Custom. |
||
|
javax.jdo.option.ConnectionURL |
RDS Endpoint |
Masukkan URL koneksi dalam format
|
|
|
javax.jdo.option.ConnectionUserName |
RDS Username |
Masukkan username akun dari Langkah 1: Siapkan metadatabase. |
|
|
javax.jdo.option.ConnectionPassword |
RDS Password |
Masukkan password akun dari Langkah 1: Siapkan metadatabase. |
|
(Opsional) Langkah 3: Inisialisasi metastore
-
Anda harus melakukan inisialisasi metastore jika membuat kluster Hadoop versi lama (EMR V3.38.x atau lebih lama, EMR V4.9.x atau lebih lama, atau EMR V5.4.x atau lebih lama), atau jika ingin mengganti metastore kluster yang sudah ada ke instans RDS for MySQL.
Sebelum inisialisasi, layanan Hive Metastore, HiveServer2, dan Spark ThriftServer mungkin tidak berfungsi dengan benar. Layanan-layanan ini akan dipulihkan secara otomatis setelah inisialisasi selesai.
-
Kluster DataLake dan Custom secara otomatis melakukan inisialisasi metadatabase Hive selama pembuatan menggunakan parameter koneksi database yang diberikan. Oleh karena itu, Anda dapat melewati langkah ini.
-
Login ke node master kluster menggunakan SSH. Untuk informasi selengkapnya, lihat Login ke kluster.
-
Jalankan perintah berikut untuk beralih ke pengguna
hadoop.su - hadoop -
Jalankan perintah berikut untuk menginisialisasi metastore.
schematool -initSchema -dbType mysqlInstans RDS for MySQL kini telah dikonfigurasi sebagai metadatabase Hive.