Setelah mengonfigurasi katalog Apache Paimon, Anda dapat langsung mengakses tabel Apache Paimon dalam katalog yang disimpan di Data Lake Formation (DLF) dari Realtime Compute for Apache Flink. Topik ini menjelaskan cara membuat, melihat, dan menghapus katalog Apache Paimon serta mengelola database dan tabel Apache Paimon di Konsol pengembangan Realtime Compute for Apache Flink.
Catatan penggunaan
Hanya Ververica Runtime (VVR) 8.0.5 atau yang lebih baru yang mendukung pembuatan dan konfigurasi katalog serta tabel Apache Paimon.
OSS digunakan untuk menyimpan file yang terkait dengan tabel Apache Paimon, termasuk file data dan file metadata. Pastikan OSS telah diaktifkan dan kelas penyimpanan bucket OSS yang digunakan adalah Jenis Penyimpanan Standar. Untuk informasi selengkapnya, lihat Memulai dengan konsol OSS dan Ikhtisar kelas penyimpanan.
PentingMeskipun Anda dapat menggunakan bucket OSS yang ditentukan saat membuat ruang kerja Realtime Compute for Apache Flink, kami menyarankan untuk membuat dan menggunakan bucket OSS terpisah di wilayah yang sama guna meningkatkan isolasi data dan meminimalkan risiko kesalahan operasi.
Pasangan AccessKey yang digunakan untuk mendaftarkan katalog Paimon harus dimiliki oleh akun yang memiliki akses baca dan tulis ke bucket OSS dan katalog DLF Anda.
Setelah membuat atau menghapus katalog, database, atau tabel menggunakan pernyataan SQL, Anda dapat mengklik ikon
untuk menyegarkan halaman Catalogs.Tabel berikut mencantumkan kompatibilitas antara berbagai versi Apache Paimon dan VVR.
Versi Apache Paimon
Versi VVR
1.1
11
1.0
8.0.11
0.9
8.0.7, 8.0.8, 8.0.9, dan 8.0.10
0.8
8.0.6
0.7
8.0.5
0.6
8.0.4
0.6
8.0.3
Buat katalog Apache Paimon
Buat katalog Filesystem Apache Paimon
Buat katalog DLF Apache Paimon di konsol
Buka halaman Catalogs.
Masuk ke Konsol Realtime Compute for Apache Flink. Temukan ruang kerja yang ingin Anda kelola dan klik Console di kolom Actions.
Di panel navigasi sebelah kiri, klik Catalogs.
Klik Create Catalog. Pada tab Katalog Bawaan di wizard yang muncul, pilih Apache Paimon, lalu klik Next.
Pada langkah Konfigurasi Katalog, atur parameter berikut.
Buat katalog Apache Paimon melalui SQL
Jalankan pernyataan SQL berikut di editor SQL. Untuk petunjuk lebih rinci, lihat Skrip.
CREATE CATALOG `my-catalog` WITH (
'type' = 'paimon',
'metastore' = 'filesystem',
'warehouse' = '<warehouse>',
'fs.oss.endpoint' = '<fs.oss.endpoint>',
'fs.oss.accessKeyId' = '<fs.oss.accessKeyId>',
'fs.oss.accessKeySecret' = '<fs.oss.accessKeySecret>'
);Tabel berikut menjelaskan parameter dalam pernyataan SQL tersebut.
Umum
Parameter
Deskripsi
Wajib
Keterangan
my-catalog
Nama katalog Apache Paimon.
Ya
Masukkan nama kustom.
type
Tipe katalog.
Ya
Atur nilainya ke paimon.
metastore
Tipe penyimpanan metadata.
Ya
Nilai yang valid:
filesystem: Membuat katalog Filesystem Apache Paimon.
dlf: Membuat katalog DLF Apache Paimon.
maxcompute: Membuat katalog MaxCompute Apache Paimon.
sync: Membuat katalog Sync Apache Paimon.
OSS
Parameter
Deskripsi
Wajib
Keterangan
warehouse
Direktori gudang data yang ditentukan di OSS.
Ya
Format: oss://<bucket>/<object>. Deskripsi bidang:
bucket: nama bucket OSS yang telah Anda buat.
object: jalur tempat data Anda disimpan.
Anda dapat melihat nilai bidang bucket dan object di konsol OSS.
fs.oss.endpoint
Titik akhir OSS.
Ya
Jika DLF berada di wilayah yang sama dengan ruang kerja Realtime Compute for Apache Flink Anda, gunakan titik akhir VPC. Jika tidak berada di wilayah yang sama, gunakan titik akhir publik.
Parameter ini diperlukan jika bucket OSS yang ditentukan oleh parameter warehouse tidak berada di wilayah yang sama dengan ruang kerja Realtime Compute for Apache Flink atau jika bucket OSS dalam akun Alibaba Cloud lain digunakan.
Untuk informasi lebih lanjut tentang cara mendapatkan informasi yang diperlukan, lihat Wilayah, titik akhir, dan port terbuka dan Buat pasangan AccessKey.
fs.oss.accessKeyId
ID AccessKey dari akun Alibaba Cloud atau Pengguna RAM yang memiliki izin baca dan tulis pada OSS.
Ya
fs.oss.accessKeySecret
Rahasia AccessKey dari akun Alibaba Cloud atau Pengguna RAM yang memiliki izin baca dan tulis pada OSS.
Ya
Buat katalog Paimon di DLF
DLF-Legacy
- Catatan
Katalog DLF-Legacy harus berada di wilayah yang sama dengan ruang kerja Realtime Compute for Apache Flink Anda.
Daftarkan katalog di Konsol Pengembangan Realtime Compute for Apache Flink.
UI
Buka halaman Catalogs.
Masuk ke Konsol Manajemen Realtime Compute for Apache Flink.
Klik Console di kolom Actions ruang kerja Anda.
Konsol Pengembangan akan muncul.
Di panel navigasi kiri, klik Catalogs.
Klik Create Catalog.
Di wizard Create Catalog, pada tab Built-in Catalog, klik Apache Paimon, lalu klik Next.
Untuk metastore, pilih dlf.
Untuk catalog name, pilih katalog DLF-Legacy Anda.
Kode SQL
Masuk ke Konsol Manajemen Realtime Compute for Apache Flink.
Klik Console di kolom Actions ruang kerja Anda.
Konsol Pengembangan akan muncul.
Di panel navigasi kiri, pilih .
Jalankan pernyataan SQL berikut di editor SQL. Untuk petunjuk lebih rinci, lihat Skrip.
CREATE CATALOG `my-catalog` WITH ( 'type' = 'paimon', 'metastore' = 'dlf', 'warehouse' = '<warehouse>', 'dlf.catalog.id' = '<dlf.catalog.id>', 'dlf.catalog.accessKeyId' = '<dlf.catalog.accessKeyId>', 'dlf.catalog.accessKeySecret' = '<dlf.catalog.accessKeySecret>', 'dlf.catalog.endpoint' = '<dlf.catalog.endpoint>', 'dlf.catalog.region' = '<dlf.catalog.region>', 'fs.oss.endpoint' = '<fs.oss.endpoint>', 'fs.oss.accessKeyId' = '<fs.oss.accessKeyId>', 'fs.oss.accessKeySecret' = '<fs.oss.accessKeySecret>' );Ganti nilai placeholder dengan nilai aktual Anda:
Umum
Parameter
Deskripsi
Wajib
Keterangan
my-catalog
Nama katalog Apache Paimon.
Ya
Masukkan nama kustom.
type
Tipe katalog.
Ya
Atur nilainya ke paimon.
metastore
Tipe penyimpanan metadata.
Ya
Atur nilainya ke dlf.
OSS
Parameter
Deskripsi
Wajib
Keterangan
warehouse
Direktori gudang data yang ditentukan di OSS.
Ya
Format: oss://<bucket>/<object>. Deskripsi bidang:
bucket: nama bucket OSS yang telah Anda buat.
object: jalur tempat data Anda disimpan.
Anda dapat melihat nilai bidang bucket dan object di konsol OSS.
fs.oss.endpoint
Titik akhir OSS.
Ya
Jika DLF berada di wilayah yang sama dengan ruang kerja Realtime Compute for Apache Flink Anda, gunakan titik akhir VPC. Jika tidak berada di wilayah yang sama, gunakan titik akhir publik.
Jika Anda ingin menyimpan tabel Apache Paimon di OSS-Apsara File Storage for HDFS (HDFS), atur nilai parameter fs.oss.endpoint dalam format berikut:
cn-<region>.oss-dls.aliyuncs.com. Contoh:cn-hangzhou.oss-dls.aliyuncs.com.
fs.oss.accessKeyId
ID AccessKey dari akun Alibaba Cloud atau Pengguna RAM yang memiliki izin baca dan tulis pada OSS.
Ya
Untuk informasi lebih lanjut tentang cara mendapatkan informasi yang diperlukan, lihat Wilayah, titik akhir, dan port terbuka dan Buat pasangan AccessKey.
fs.oss.accessKeySecret
Rahasia AccessKey dari akun Alibaba Cloud atau Pengguna RAM yang memiliki izin baca dan tulis pada OSS.
Ya
DLF
Parameter
Deskripsi
Wajib
Keterangan
dlf.catalog.id
ID direktori data DLF.
Ya
Anda dapat melihat ID direktori data di konsol DLF.
dlf.catalog.accessKeyId
ID AccessKey yang digunakan untuk mengakses layanan DLF.
Ya
Untuk informasi lebih lanjut tentang cara mendapatkan ID AccessKey, lihat Buat pasangan AccessKey.
dlf.catalog.accessKeySecret
Rahasia AccessKey yang digunakan untuk mengakses layanan DLF.
Ya
Untuk informasi lebih lanjut tentang cara mendapatkan rahasia AccessKey, lihat Buat pasangan AccessKey.
dlf.catalog.endpoint
Titik akhir DLF.
Ya
Untuk informasi lebih lanjut, lihat Wilayah dan titik akhir yang didukung.
CatatanJika DLF berada di wilayah yang sama dengan ruang kerja Realtime Compute for Apache Flink Anda, gunakan titik akhir VPC. Jika tidak berada di wilayah yang sama, gunakan titik akhir publik.
dlf.catalog.region
Wilayah tempat DLF diterapkan.
Ya
Untuk informasi lebih lanjut, lihat Wilayah dan titik akhir yang didukung.
CatatanPastikan nilai parameter ini sesuai dengan titik akhir yang ditentukan oleh parameter dlf.catalog.endpoint.
Kelola database Apache Paimon
Anda dapat mengelola database Apache Paimon dengan menjalankan perintah berikut di halaman Editor SQL. Untuk informasi selengkapnya, lihat Skrip.
Buat database
Setelah membuat katalog Apache Paimon, database bernama
defaultsecara otomatis dibuat dalam katalog tersebut.-- Ganti my-catalog dengan nama katalog Apache Paimon yang sebenarnya. USE CATALOG `my-catalog`; -- Ganti my_db dengan nama database kustom. CREATE DATABASE `my_db`;Hapus database
PentingAnda tidak dapat menghapus database default dari katalog Paimon di DLF. Anda hanya dapat menghapus database default dari katalog Paimon bertipe Filesystem.
-- Ganti my-catalog dengan nama katalog Apache Paimon yang sebenarnya. USE CATALOG `my-catalog`; -- Ganti my_db dengan nama database yang ingin dihapus. DROP DATABASE 'my_db'; -- Hapus database kosong. DROP DATABASE `my_db` CASCADE; -- Hapus database beserta semua tabel terkait.
Kelola tabel Apache Paimon
Buat tabel Apache Paimon
Ubah skema tabel Apache Paimon
Hapus tabel Apache Paimon
Lihat atau hapus katalog Apache Paimon
Di konsol Realtime Compute for Apache Flink, temukan ruang kerja yang ingin Anda kelola dan klik Console di kolom Actions.
Di panel navigasi sebelah kiri, klik Catalogs. Daftar katalog Apache Paimon akan ditampilkan.
Lihat katalog Apache Paimon: Di bagian Catalog List, temukan katalog yang ingin Anda kelola, lalu Anda dapat melihat Name dan Type-nya. Untuk melihat database dan tabel dalam katalog tersebut, klik View di kolom Tindakan.
Hapus katalog Apache Paimon: Di bagian Catalog List, temukan katalog yang ingin Anda kelola lalu klik Delete di kolom Actions.
CatatanSetelah katalog Apache Paimon dihapus, hanya informasi katalog di halaman Catalogs dalam namespace Flink yang dihapus. File data tabel Apache Paimon tetap ada. Setelah katalog Apache Paimon dihapus, Anda dapat membuat ulang katalog tersebut dengan menjalankan pernyataan SQL, lalu menggunakan kembali tabel Apache Paimon dalam katalog tersebut.
Anda juga dapat menghapus katalog Apache Paimon dengan menjalankan perintah
DROP CATALOG <catalog name>;di halaman Editor SQL. Untuk informasi selengkapnya, lihat Skrip.
Referensi
Setelah mendaftarkan tabel Apache Paimon di Flink, Anda dapat membaca atau menulis data ke Paimon. Untuk informasi selengkapnya, lihat Tulis data ke dan konsumsi data dari tabel Paimon.
Jika katalog bawaan Realtime Compute for Apache Flink tidak memenuhi kebutuhan bisnis Anda, Anda dapat menggunakan katalog kustom. Untuk informasi selengkapnya, lihat Kelola katalog kustom.
Untuk informasi selengkapnya tentang metode optimasi umum untuk tabel kunci primer Apache Paimon dan tabel berskala-tambah dalam berbagai skenario, lihat Optimasi kinerja.
