全部产品
Search
文档中心

Data Lake Formation:Katalog Data

更新时间:Jun 29, 2025

Katalog data adalah entitas tingkat teratas dari metadata di Data Lake Formation (DLF). Katalog ini dapat berisi beberapa database. Topik ini menjelaskan operasi dasar katalog data.

Skenario

Katalog data digunakan dalam skenario isolasi metadata. Sebagai contoh, beberapa kluster E-MapReduce (EMR), masing-masing terhubung ke katalog yang berbeda. Metadata antara kluster EMR tidak saling terlihat.

Operasi Dasar

Membuat katalog data

  1. Masuk ke Konsol DLF.

  2. Di panel navigasi sebelah kiri, pilih Metadata > Metadata.

  3. Klik tab Catalog List, lalu klik New Catalog.

  4. Masukkan informasi berikut di kotak input, lalu klik OK.

    • Catalog ID: Wajib. Ini adalah pengenal unik dan tidak boleh diduplikasi.

    • Description: Opsional. Masukkan deskripsi.

    • Location: Opsional. Masukkan jalur penyimpanan default. Hanya jalur Object Storage Service (OSS) yang didukung.

Menampilkan katalog data

  1. Di panel navigasi sebelah kiri, pilih Metadata > Metadata.

  2. Klik tab Catalog List untuk melihat daftar katalog.

Memodifikasi katalog data

  1. Di panel navigasi sebelah kiri, pilih Metadata > Metadata.

  2. Klik tab Catalog List.

  3. Di halaman daftar katalog data, klik Edit di kolom Actions.

  4. Modifikasi informasi berikut di kotak input, lalu klik OK.

    • Description: Opsional. Masukkan deskripsi.

    • Location: Opsional. Masukkan jalur penyimpanan default; hanya jalur OSS yang didukung.

Menghapus katalog data

Peringatan

Setelah dihapus, data tidak dapat dipulihkan.

  1. Di panel navigasi sebelah kiri, pilih Metadata > Metadata.

  2. Klik tab Catalog List.

  3. Di halaman daftar katalog data, klik Delete pada kolom Actions.

  4. Di kotak dialog konfirmasi yang muncul, klik Delete untuk menyelesaikan penghapusan katalog.

Operasi adaptasi dengan mesin komputasi

Cara memodifikasi katalog data dari kluster E-MapReduce

Penting

Setelah memodifikasi Catalog ID DLF yang terikat pada kluster E-MapReduce, kluster tersebut akan menunjuk ke Catalog ID baru. Perubahan ini menyebabkan operasi pada database, tabel, dan pekerjaan yang sedang berjalan di katalog asli menjadi tidak valid. Harap pertimbangkan sepenuhnya dampaknya sebelum beralih.

Adaptasi mesin Hive

  1. Di file core-site.xml layanan Hive, tambahkan item konfigurasi berikut. Untuk informasi lebih lanjut, lihat Mengelola Item Konfigurasi.

    Kunci

    Nilai

    dlf.catalog.id

    ID Katalog DLF.

  2. Terapkan konfigurasi ini.

    1. Klik Save. Setelah disimpan, klik Deploy Client Configuration.

    2. Di kotak dialog yang muncul, masukkan Execution Reason, lalu klik OK.

  3. Mulai ulang layanan Hive.

    1. Di halaman konfigurasi layanan Hive, klik More > Restart.

    2. Di kotak dialog yang muncul, masukkan Execution Reason, lalu klik OK.

      Setelah berhasil dimulai ulang, status Hive menjadi Healthy, dan modifikasi ID Katalog selesai.

Adaptasi mesin Spark

Modifikasi file hive-site.xml layanan Spark. Untuk informasi lebih lanjut, lihat Adaptasi Mesin Hive.

Catatan

Untuk EMR 5.6.0, 3.40.0, dan versi sebelumnya, Anda tidak perlu memodifikasi konfigurasi ini secara terpisah untuk Spark. Ini menggunakan konfigurasi Hive, dan hanya konfigurasi Hive yang perlu dimodifikasi.

Adaptasi mesin Presto

Modifikasi file hive.properties layanan Presto. Untuk informasi lebih lanjut, lihat Adaptasi Mesin Hive.

Catatan

Fitur ini hanya didukung di EMR 5.8.0, 3.42.0, dan versi selanjutnya.

Adaptasi mesin Impala

Catatan

Anda tidak perlu memodifikasi konfigurasi Impala secara terpisah. Ini menggunakan konfigurasi Hive, dan hanya konfigurasi Hive yang perlu dimodifikasi.