Topik ini menjelaskan parameter yang perlu dikonfigurasikan saat menggunakan metadata Data Lake Formation (DLF) dalam tabel Iceberg.
Berikut adalah mesin komputasi yang didukung:
Spark
Alibaba Cloud Object Storage Service (OSS) digunakan sebagai sistem file. Nama katalog default dan parameter yang harus dikonfigurasikan bervariasi tergantung pada versi kluster Anda.
EMR V3.40 atau versi minor lebih baru, dan EMR V5.6.0 atau lebih baru
CatatanNama katalog default adalah iceberg.
Parameter
Deskripsi
Catatan
spark.sql.extensions
Modul ekstensi SQL Spark.
Atur nilainya menjadi org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions.
CatatanParameter ini diperkenalkan di Iceberg 0.11.0. Hanya Spark 3.x yang mendukung parameter ini.
spark.sql.catalog.<catalog-name>
Nama katalog.
Atur nilainya menjadi org.apache.iceberg.spark.SparkCatalog.
spark.sql.catalog.<catalog-name>.catalog-impl
Nama kelas katalog.
Atur nilainya menjadi org.apache.iceberg.aliyun.dlf.hive.DlfCatalog.
EMR V3.39.X dan EMR V5.5.X
CatatanNama katalog default adalah dlf.
Parameter
Deskripsi
Catatan
spark.sql.extensions
Modul ekstensi SQL Spark.
Atur nilainya menjadi org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions.
CatatanParameter ini diperkenalkan di Apache Iceberg 0.11.0. Hanya Apache Spark 3.x yang mendukung parameter ini.
spark.sql.catalog.<catalog-name>
Nama katalog.
Atur nilainya menjadi org.apache.iceberg.spark.SparkCatalog.
spark.sql.catalog.<catalog-name>.catalog-impl
Nama kelas katalog.
Atur nilainya menjadi org.apache.iceberg.aliyun.dlf.hive.DlfCatalog.
EMR V3.38.X, EMR V5.3.X, dan EMR V5.4.X
CatatanNama katalog default adalah dlf_catalog.
Parameter
Deskripsi
Catatan
spark.sql.extensions
Modul ekstensi SQL Spark.
Atur nilainya menjadi org.apache.iceberg.spark.extensions.IcebergSparkSessionExtensions.
CatatanParameter ini diperkenalkan di Apache Iceberg 0.11.0. Hanya Apache Spark 3.x yang mendukung parameter ini.
spark.sql.catalog.<catalog-name>
Nama katalog.
Atur nilainya menjadi org.apache.iceberg.spark.SparkCatalog.
spark.sql.catalog.<catalog-name>.catalog-impl
Nama kelas katalog.
Atur nilainya menjadi org.apache.iceberg.aliyun.dlf.DlfCatalog.
spark.sql.catalog.<catalog-name>.io-impl
Nama kelas yang ditulis ke katalog selama operasi I/O.
Atur nilainya menjadi org.apache.iceberg.hadoop.HadoopFileIO.
spark.sql.catalog.<catalog-name>.oss.endpoint
Titik akhir Bucket OSS Anda.
Untuk informasi lebih lanjut, lihat Wilayah dan Titik Akhir.
Kami merekomendasikan mengatur parameter ini ke titik akhir virtual private cloud (VPC) dari Bucket OSS. Sebagai contoh, jika Anda memilih wilayah China (Hangzhou), atur parameter ini menjadi oss-cn-hangzhou-internal.aliyuncs.com.
CatatanJika Anda ingin mengakses OSS lintas VPC, atur parameter ini ke titik akhir publik Bucket OSS.
spark.sql.catalog.<catalog-name>.warehouse
Jalur OSS tempat data tabel disimpan.
Tidak ada.
spark.sql.catalog.<catalog-name>.access.key.id
ID AccessKey akun Alibaba Cloud Anda.
Untuk informasi lebih lanjut tentang cara mendapatkan ID AccessKey akun Alibaba Cloud, lihat Memperoleh Pasangan AccessKey.
spark.sql.catalog.<catalog-name>.access.key.secret
Rahasia AccessKey akun Alibaba Cloud Anda.
Untuk informasi lebih lanjut tentang cara mendapatkan rahasia AccessKey akun Alibaba Cloud, lihat Memperoleh Pasangan AccessKey.
spark.sql.catalog.<catalog-name>.dlf.catalog-id
ID akun Alibaba Cloud Anda.
Untuk mendapatkan ID akun Alibaba Cloud Anda, buka halaman Pengaturan Keamanan.

spark.sql.catalog.<catalog-name>.dlf.endpoint
Titik akhir DLF.
Kami merekomendasikan mengatur parameter ini ke titik akhir VPC DLF. Sebagai contoh, jika Anda memilih wilayah China (Hangzhou), atur parameter ini menjadi dlf-vpc.cn-hangzhou.aliyuncs.com.
CatatanAnda dapat mengatur parameter ini ke titik akhir publik DLF. Jika Anda memilih wilayah China (Hangzhou), atur parameter ini menjadi dlf.cn-hangzhou.aliyuncs.com.
spark.sql.catalog.<catalog-name>.dlf.region-id
ID wilayah tempat DLF diaktifkan.
Pastikan wilayah yang Anda tentukan dalam parameter ini sesuai dengan titik akhir yang Anda tentukan dalam parameter spark.sql.catalog.<catalog-name>.dlf.endpoint.
Hive
Anda dapat mengonfigurasi parameter berikut berdasarkan versi kluster Anda.
EMR V3.39.0 atau versi minor lebih baru, dan EMR V5.5.0 atau lebih baru
CatatanNama katalog default adalah dlf.
Parameter
Deskripsi
Catatan
iceberg.catalog.<catalog-name>.catalog-impl
Nama kelas katalog.
Atur nilainya menjadi org.apache.iceberg.aliyun.dlf.hive.DlfCatalog.
EMR V3.38.X, EMR V5.3.X, dan EMR V5.4.X
CatatanNama katalog default adalah dlf_catalog.
Parameter
Deskripsi
Catatan
iceberg.catalog
Nama katalog.
Atur nilainya menjadi nama kustom.
iceberg.catalog.<catalog-name>.type
Tipe katalog.
Atur nilainya menjadi custom.
iceberg.catalog.<catalog-name>.catalog-impl
Nama kelas katalog.
Atur nilainya menjadi org.apache.iceberg.aliyun.dlf.DlfCatalog.
iceberg.catalog.<catalog-name>.io-impl
Nama kelas yang ditulis ke katalog selama operasi I/O.
Atur nilainya menjadi org.apache.iceberg.hadoop.HadoopFileIO.
iceberg.catalog.<catalog-name>.warehouse
Jalur gudang tempat data tabel disimpan.
Data tabel dapat disimpan di Hadoop Distributed File System (HDFS) atau OSS.
iceberg.catalog.<catalog-name>.access.key.id
ID AccessKey akun Alibaba Cloud Anda.
Untuk informasi lebih lanjut tentang cara mendapatkan ID AccessKey akun Alibaba Cloud, lihat Memperoleh Pasangan AccessKey.
iceberg.catalog.<catalog-name>.access.key.secret
Rahasia AccessKey akun Alibaba Cloud Anda.
Untuk informasi lebih lanjut tentang cara mendapatkan rahasia AccessKey akun Alibaba Cloud, lihat Memperoleh Pasangan AccessKey.
iceberg.catalog.<catalog-name>.dlf.catalog-id
ID akun Alibaba Cloud Anda.
Untuk mendapatkan ID akun Alibaba Cloud Anda, buka halaman Pengaturan Keamanan.

iceberg.catalog.<catalog-name>.dlf.endpoint
Titik akhir DLF.
Kami merekomendasikan mengatur parameter ini ke titik akhir VPC DLF. Sebagai contoh, jika Anda memilih wilayah China (Hangzhou), atur parameter ini menjadi dlf-vpc.cn-hangzhou.aliyuncs.com.
CatatanAnda dapat mengatur parameter ini ke titik akhir publik DLF. Jika Anda memilih wilayah China (Hangzhou), atur parameter ini menjadi dlf.cn-hangzhou.aliyuncs.com.
iceberg.catalog.<catalog-name>.dlf.region-id
ID wilayah tempat DLF diaktifkan.
Pastikan wilayah yang Anda tentukan dalam parameter ini sesuai dengan titik akhir yang Anda tentukan dalam parameter iceberg.catalog.<catalog-name>.dlf.endpoint.