Topik ini menjelaskan pembaruan utama dan perbaikan bug pada versi Realtime Compute for Apache Flink yang dirilis pada 22 Juli 2024.
Peningkatan ini diluncurkan secara bertahap menggunakan strategi rilis canary. Fitur baru dalam rilis ini hanya tersedia setelah peningkatan selesai untuk akun Anda. Periksa jadwal peningkatan terbaru di sisi kanan Konsol Realtime Compute for Apache Flink. Untuk meminta peningkatan lebih awal, submit a ticket.
Ikhtisar
Rilis ini menyediakan 13 fitur baru dan 7 perbaikan bug di seluruh lapisan platform dan engine.
Sorotan platform: Peran kustom dengan izin detail halus, peningkatan UI pada detail pekerjaan dan konfigurasi resource, serta pembuatan katalog MaxCompute dari Konsol.
Sorotan engine: Ververica Runtime (VVR) 8.0.8, berbasis Apache Flink 1.17.2, dengan peningkatan konektor untuk Elasticsearch, Hologres, StarRocks, Simple Log Service (SLS), MySQL, dan MaxCompute; fungsi bawaan SQL baru; serta peningkatan performa dan keamanan.
Setelah peningkatan selesai untuk akun Anda, tingkatkan engine VVR ke versi 8.0.8. Untuk petunjuknya, lihat Peningkatan versi engine suatu deployment.
Fitur baru
Fitur | Deskripsi | Referensi |
Peran kustom | Buat peran kustom dan tetapkan izin detail halus sesuai kebutuhan bisnis Anda. Hal ini memberikan kontrol tepat atas siapa yang dapat melakukan operasi terkait pekerjaan tertentu, sehingga mengurangi risiko akun dengan izin berlebihan. | Berikan otorisasi akun untuk melakukan operasi dalam namespace |
Optimasi UI: detail pekerjaan | Lihat konfigurasi parameter yang digunakan untuk memulai pekerjaan langsung dari halaman detail deployment: klik tab Status, lalu klik Job Details di bagian Actions. Hal ini menghilangkan kebutuhan untuk mencari riwayat konfigurasi saat melakukan debugging pekerjaan yang sedang berjalan. | N/A |
Optimasi UI: konfigurasi resource | Nilai maksimum yang diizinkan untuk parameter resource kini ditampilkan di bagian Resources pada tab Configuration. Hal ini mencegah kesalahan konfigurasi akibat melebihi batas parameter. | N/A |
Pembuatan katalog MaxCompute di Konsol | Katalog MaxCompute dapat dibuat melalui antarmuka grafis (GUI), yang mempermudah konfigurasi dan manajemen pekerjaan Flink serta meningkatkan efisiensi pengembangan dan manajemen data. | N/A |
Konektor StarRocks: dukungan JSON | Konektor StarRocks kini mendukung tipe data JSON. Hal ini mengatasi exception yang terjadi saat menulis data JSON dari MySQL ke StarRocks. | |
Peningkatan konektor Elasticsearch |
| |
Konektor Simple Log Service (SLS): mode startup | Konsumsi data SLS mulai dari offset terbaru atau paling awal. Hal ini memberi Anda kendali atas apakah pekerjaan baru hanya mengambil data baru atau memproses ulang data historis. | |
Peningkatan image Docker PyFlink | Image dasar Docker untuk PyFlink ditingkatkan untuk meningkatkan kompatibilitas dengan berbagai versi Python dan glibc. Hal ini mengurangi hambatan saat menjalankan pekerjaan PyFlink di lingkungan berbasis kontainer. | N/A |
Fungsi URL_DECODE dan URL_ENCODE | Dua fungsi bawaan SQL untuk encoding dan decoding URL telah ditambahkan. Hal ini menghilangkan kebutuhan akan UDF kustom saat memproses string berformat URL-encoded dalam pekerjaan SQL Anda. | |
Konektor MySQL: dukungan endpoint ApsaraDB RDS untuk MySQL | Konfigurasikan endpoint ApsaraDB RDS untuk MySQL di konektor MySQL. MySQL Change Data Capture (CDC) kini dapat membaca log biner yang disimpan di bucket Object Storage Service (OSS) terkait. | |
Konektor Hologres: kebijakan penghapusan per kolom | Konfigurasikan kebijakan penghapusan secara independen untuk setiap kolom dalam tabel sink Hologres. Misalnya, hapus seluruh baris, atau atur nilai kolom non-primary-key menjadi null tanpa memengaruhi kolom lain dalam skenario pembaruan parsial. | |
Partitioner kustom untuk join tabel dimensi | Konfigurasikan strategi shuffle untuk operasi join tabel dimensi. Hal ini memungkinkan Anda mengoptimalkan distribusi data di seluruh tugas paralel dan meningkatkan throughput join secara keseluruhan. | |
Konektor MaxCompute: format Arrow dan alokasi shard dinamis | Baca data sumber MaxCompute dalam format Arrow dengan alokasi shard dinamis. Hal ini secara signifikan meningkatkan throughput baca dan mengurangi beban kerja penulisan data pada kluster Flink. |
Peningkatan performa
Join tabel dimensi Apache Paimon: Performa join untuk tabel dimensi Apache Paimon ditingkatkan.
Tulisan MySQL CDC ke Hologres: Kecepatan menulis data penuh maupun inkremental ke Hologres menggunakan MySQL CDC ditingkatkan.
Pembacaan tabel sumber MaxCompute: Kecepatan membaca dari tabel sumber MaxCompute ditingkatkan, dan beban kerja penulisan data pada kluster Flink dikurangi.
Peningkatan keamanan
Password dalam topologi pekerjaan kini dienkripsi, sehingga mencegah kredensial sensitif terekspos dalam graf pekerjaan.
Isu yang diperbaiki
Terjadi konflik data ketika beberapa aliran menulis ke tabel Apache Paimon yang sama selama pembaruan parsial.
Ketika MySQL CDC mengalami error kehabisan memori (OOM) saat menguraikan sejumlah besar log biner, sistem diam-diam mencoba ulang tanpa menampilkan error tersebut. Mulai rilis ini, sistem melemparkan exception dan memicu failover pekerjaan.
Ketika GeminiStateBackend mengalami error OOM, sistem diam-diam mencoba ulang tanpa menampilkan error tersebut. Mulai rilis ini, sistem melemparkan exception dan memicu failover pekerjaan.
Status konsumsi konektor ApsaraMQ for RocketMQ tidak ditampilkan di Konsol ApsaraMQ for RocketMQ.
Jika skema tabel sumber Hologres berubah (misalnya, akibat operasi TRUNCATE) pada pekerjaan yang dimulai dari data state, pemulihan snapshot gagal.
Error
java.lang.NoClassDefFoundError: StringUtilsdapat terjadi saat menggunakan konektor StarRocks.Semua isu yang diperbaiki dalam Apache Flink 1.17.2. Untuk daftar lengkapnya, lihat Pengumuman Rilis Apache Flink 1.17.2.