Setelah membuat data catalog di DLF, Anda perlu mendaftarkannya di Flink agar Flink dapat mengakses metadata-nya. Topik ini menjelaskan cara menautkan katalog Paimon ke lingkungan Flink dan mengelolanya.
Sebelum memulai
Persyaratan versi
VVR 8.0.5 atau yang lebih baru: Diperlukan untuk membuat katalog dan tabel Paimon.
VVR 11.1 atau yang lebih baru: Diperlukan untuk menggunakan DLF sebagai metastore.
-
Persyaratan Penyimpanan
Paimon menyimpan data dan metadata di OSS. Konfigurasikan bucket OSS Anda sebagai berikut:
-
Storage class: Gunakan kelas penyimpanan Standard. Untuk informasi selengkapnya, lihat Storage class.
-
Pengaturan bucket: Buat bucket khusus di wilayah yang sama dengan ruang kerja Flink Anda. Jangan gunakan kembali bucket sistem default untuk menghindari konflik data.
-
-
Izin Akses
Pastikan pasangan AccessKey memiliki izin baca dan tulis pada bucket OSS atau direktori DLF Anda. -
Kompatibilitas Format
Katalog Paimon hanya mendukung data dalam format Paimon. Format data lake lain seperti Lance atau Iceberg tidak didukung.
-
Penyegaran Konsol
Setelah membuat atau menghapus katalog, database, atau tabel, klik tombol refresh
untuk memperbarui tampilan konsol.
Pemetaan versi Paimon
Versi Apache Paimon
Versi VVR
1.3
11.4
1.2
11.2、11.3
1.1
11
1.0
8.0.11
0.9
8.0.7, 8.0.8, 8.0.9, dan 8.0.10
0.8
8.0.6
0.7
8.0.5
0.6
8.0.4
0.6
8.0.3
Buat katalog
Katalog Paimon mengelola metadata menggunakan berbagai jenis metastore. Pilih jenis yang paling sesuai dengan skenario Anda:
Katalog Filesystem: Menyimpan metadata di OSS. Paling cocok untuk penerapan sederhana.
Katalog DLF: Menyimpan metadata di Data Lake Formation (DLF). Paling cocok untuk skenario enterprise dengan manajemen metadata terpadu.
Buat katalog Filesystem
Opsi 1: Gunakan konsol (Direkomendasikan)
Buka halaman Catalogs.
Login ke Management Portal. Temukan ruang kerja target dan klik Console di kolom Actions.
Di panel navigasi kiri, klik Catalogs.
Klik Create Catalog, pilih Apache Paimon, lalu klik Next.
Atur
metastoremenjadifilesystemdan konfigurasikan pengaturan katalog lainnya.
Opsi 2: Gunakan SQL
Jalankan perintah berikut di editor SQL dari Development > Scripts:
CREATE CATALOG `my-catalog` WITH (
'type' = 'paimon',
'metastore' = 'filesystem',
'warehouse' = '<warehouse>',
'fs.oss.endpoint' = '<fs.oss.endpoint>',
'fs.oss.accessKeyId' = '<fs.oss.accessKeyId>',
'fs.oss.accessKeySecret' = '<fs.oss.accessKeySecret>'
);Parameter umum
Item konfigurasi
Deskripsi
Wajib
Keterangan
my-catalogNama katalog Paimon.
Ya
Masukkan nama kustom.
typeJenis katalog.
Ya
Atur ke
paimon.metastoreJenis metastore.
Ya
Nilai yang valid:
filesystem: Menyimpan metadata di OSS.dlf: Menyimpan metadata di DLF.
Parameter OSS
Item konfigurasi
Deskripsi
Wajib
Keterangan
warehouse
Direktori gudang data di OSS.
Ya
Formatnya adalah
oss://<bucket>/<object>, dengan:bucket: nama bucket OSS Anda.object: jalur tempat data Anda disimpan.
Lihat nama bucket dan object Anda di OSS console.
fs.oss.endpoint
Titik akhir layanan OSS.
Ya
Jika Flink dan DLF berada di wilayah yang sama, gunakan titik akhir VPC. Jika tidak, gunakan titik akhir jaringan publik.
Parameter ini wajib jika bucket OSS yang ditentukan untuk warehouse tidak berada di wilayah yang sama dengan ruang kerja Flink, atau jika Anda menggunakan bucket OSS milik Akun Alibaba Cloud lain.
Untuk informasi selengkapnya, lihat Regions and Endpoints dan Create an AccessKey.
fs.oss.accessKeyId
ID AccessKey dari Akun Alibaba Cloud atau Pengguna RAM yang memiliki izin baca dan tulis pada OSS.
Ya
fs.oss.accessKeySecret
Rahasia AccessKey dari Akun Alibaba Cloud atau Pengguna RAM yang memiliki izin baca dan tulis pada OSS.
Ya
Buat katalog DLF
DLF
Buka konsol DLF dan buat katalog di wilayah yang sama dengan ruang kerja Flink Anda. Untuk informasi selengkapnya, lihat Quickly use DLF.
Daftarkan katalog Paimon di Development Console.
CatatanOperasi ini hanya membuat pemetaan ke katalog DLF. Membuat atau menghapus pemetaan katalog ini di Flink tidak memengaruhi data aktual di DLF.
Login ke Realtime Compute for Apache Flink's Management Portal.
Klik nama ruang kerja target.
Daftarkan katalog menggunakan UI atau perintah SQL.
UI
Di panel navigasi kiri, klik Catalogs.
Di halaman Catalogs, klik Create Catalog.
Pilih Apache Paimon dan klik Next.
Atur metastore ke DLF, pilih katalog DLF yang akan dikaitkan di kolom catalog name, lalu klik OK. Katalog tersebut terdaftar di Flink.
SQL
Di editor SQL dari , jalankan pernyataan SQL berikut untuk mendaftarkan katalog.
CREATE CATALOG `flink_catalog_name` WITH ( 'type' = 'paimon', 'metastore' = 'rest', 'token.provider' = 'dlf', 'uri' = 'http://cn-hangzhou-vpc.dlf.aliyuncs.com', 'warehouse' = 'dlf_test' );Parameter:
Parameter
Deskripsi
Wajib
Contoh
typeJenis katalog. Atur ke
paimon.Ya
paimon
metastoreJenis metastore. Atur nilainya ke
rest.Ya
rest
token.providerPenyedia token. Atur nilainya ke
dlf.Ya
dlf
uriURI yang digunakan untuk mengakses DLF REST Catalog Server. Formatnya adalah
http://[region-id]-vpc.dlf.aliyuncs.com. Untuk informasi selengkapnya tentang ID wilayah, lihat Endpoints.Ya
http://cn-hangzhou-vpc.dlf.aliyuncs.com
warehouseNama katalog DLF.
Ya
dlf_test
DLF-Legacy
Buka konsol DLF dan buat katalog di wilayah yang sama dengan ruang kerja Flink Anda. Untuk informasi selengkapnya, lihat Getting Started.
Daftarkan katalog Paimon di Development Console.
Opsi 1: Gunakan konsol (Direkomendasikan)
Buka halaman Catalogs.
Login ke Management Portal dan klik Console di kolom Actions ruang kerja target.
Klik Catalogs.
Klik Create Catalog. Pilih Apache Paimon dan klik Next.
Atur metastore ke DLF dan pilih katalog DLF V1.0 yang akan dikaitkan dari daftar drop-down catalog name. Lalu, konfigurasikan pengaturan katalog lainnya.
Opsi 2: Gunakan SQL
Jalankan perintah berikut di editor SQL dari Development > Scripts:
CREATE CATALOG `my-catalog` WITH ( 'type' = 'paimon', 'metastore' = 'dlf', 'warehouse' = '<warehouse>', 'dlf.catalog.id' = '<dlf.catalog.id>', 'dlf.catalog.accessKeyId' = '<dlf.catalog.accessKeyId>', 'dlf.catalog.accessKeySecret' = '<dlf.catalog.accessKeySecret>', 'dlf.catalog.endpoint' = '<dlf.catalog.endpoint>', 'dlf.catalog.region' = '<dlf.catalog.region>', 'fs.oss.endpoint' = '<fs.oss.endpoint>', 'fs.oss.accessKeyId' = '<fs.oss.accessKeyId>', 'fs.oss.accessKeySecret' = '<fs.oss.accessKeySecret>' );Tabel berikut menjelaskan parameter-parameter tersebut.
Umum
Item konfigurasi
Deskripsi
Wajib
Keterangan
my-catalog
Nama katalog Paimon.
Ya
Masukkan nama kustom.
type
Jenis katalog.
Ya
Nilainya tetap
paimon.metastore
Jenis metastore.
Ya
Nilainya tetap
dlf.OSS
Item konfigurasi
Deskripsi
Wajib
Keterangan
warehouse
Direktori gudang data di OSS.
Ya
Formatnya adalah
oss://<bucket>/<object>, dengan:bucket: nama bucket OSS Anda.object: jalur tempat data Anda disimpan.
Lihat nama bucket dan object Anda di OSS console.
fs.oss.endpoint
Titik akhir layanan OSS.
Ya
Jika Flink dan DLF berada di wilayah yang sama, gunakan titik akhir VPC. Jika tidak, gunakan titik akhir jaringan publik.
Jika Anda ingin menyimpan tabel Paimon di OSS-HDFS, atur nilai parameter
fs.oss.endpointmenjadicn-<region>.oss-dls.aliyuncs.com, misalnya,cn-hangzhou.oss-dls.aliyuncs.com.
fs.oss.accessKeyId
ID AccessKey dari Akun Alibaba Cloud atau Pengguna RAM yang memiliki izin baca dan tulis pada OSS.
Ya
Untuk informasi selengkapnya, lihat Regions and endpoints dan Create an AccessKey pair.
fs.oss.accessKeySecret
Rahasia AccessKey dari Akun Alibaba Cloud atau Pengguna RAM yang memiliki izin baca dan tulis pada OSS.
Ya
DLF
Item konfigurasi
Deskripsi
Wajib
Keterangan
dlf.catalog.id
ID katalog data DLF.
Ya
Lihat ID katalog data di konsol Data Lake Formation.
dlf.catalog.accessKeyId
ID AccessKey yang diperlukan untuk mengakses layanan DLF.
Ya
Untuk informasi selengkapnya, lihat Create an AccessKey pair.
dlf.catalog.accessKeySecret
Rahasia AccessKey yang diperlukan untuk mengakses layanan DLF.
Ya
Untuk informasi selengkapnya, lihat Create an AccessKey pair.
dlf.catalog.endpoint
Titik akhir layanan DLF.
Ya
Untuk informasi selengkapnya, lihat Regions and endpoints.
CatatanJika Flink dan DLF berada di wilayah yang sama, gunakan titik akhir VPC. Jika tidak, gunakan titik akhir jaringan publik.
dlf.catalog.region
Wilayah tempat DLF berada.
Ya
Untuk informasi selengkapnya, lihat Regions and endpoints.
CatatanPastikan wilayahnya sama dengan yang ditentukan untuk dlf.catalog.endpoint.
Kelola database
Jalankan perintah berikut di editor SQL dari Development > Scripts.
Buat database
Setelah mendaftarkan katalog Paimon, database bernama
defaultsecara otomatis dibuat di katalog tersebut. Untuk membuat database tambahan, jalankan pernyataan SQL berikut:-- Ganti my-catalog dengan nama katalog Paimon Anda. USE CATALOG `my-catalog`; -- Ganti my_db dengan nama database kustom dalam bahasa Inggris. CREATE DATABASE `my_db`;Hapus database
PentingDatabase
defaulttidak dapat dihapus dari katalog DLF. Namun, Anda dapat menghapusnya dari katalog Filesystem.-- Ganti my-catalog dengan nama katalog Paimon Anda. USE CATALOG `my-catalog`; -- Ganti my_db dengan nama database yang ingin Anda hapus. DROP DATABASE `my_db`; -- Menghapus database hanya jika tidak berisi tabel. DROP DATABASE `my_db` CASCADE; -- Menghapus database beserta semua tabel di dalamnya.
Kelola tabel
Buat tabel
Ubah skema tabel
Hapus tabel
Lihat atau hapus katalog
Di Management Portal, klik Console di kolom Actions untuk ruang kerja target.
Di halaman Catalogs, lihat atau hapus katalog Apache Paimon.
Di halaman Catalogs, lihat nama dan jenis katalog. Untuk melihat database dan tabel dalam katalog, klik View di kolom Actions.
Di halaman Catalogs, klik Delete di kolom Actions untuk katalog yang akan dihapus.
CatatanMenghapus katalog Paimon dari Flink hanya menghapus definisinya (metadata) dari lingkungan Flink. File data tabel Paimon yang mendasarinya tetap tidak terpengaruh. Anda kemudian dapat mendaftarkan ulang katalog tersebut di Flink untuk mendapatkan kembali akses ke tabel-tabel Paimon tersebut.
Atau, di editor SQL dari Development > Scripts, Anda dapat memasukkan
DROP CATALOG <catalog name>;, pilih kode tersebut, lalu klik Run.
