Rilis ini menyediakan VVR 11.2 (dibangun di atas Apache Flink 1.20.2) dengan fungsi SQL yang diperluas, kemampuan konektor baru, serta enam fitur platform yang meningkatkan efisiensi sumber daya dan kontrol akses.
Peningkatan dilakukan secara bertahap. Periksa Konsol Realtime Compute for Apache Flink untuk status peningkatan terbaru. Fitur baru hanya tersedia setelah peningkatan selesai untuk akun Anda. Untuk meminta percepatan peningkatan, submit a ticket.
Ikhtisar
| Area | Highlight |
|---|---|
| Engine (VVR 11.2) | 13 fungsi Flink SQL baru, tipe Variant, dialek Hive untuk Table API, kontrol overflow fungsi AI |
| Konektor | Optimisasi bidang VARCHAR MySQL CDC, dukungan Canal-JSON, INSERT IGNORE untuk AnalyticDB for MySQL, otorisasi berbasis RAM untuk Paimon dan OSS, join lookup asinkron untuk Tair, penguraian oplog konkuren untuk MongoDB CDC |
| Platform | Pekerjaan batch multi-pernyataan, penyegaran terjadwal tabel materialized, pelepasan otomatis kluster sesi menganggur, periode blackout untuk tuning otomatis, integrasi Git yang diperluas, kontrol akses kueri data granular |
| API | Dua API baru, dua API yang ditinggalkan — tingkatkan dependensi pom ke versi 1.8.0 |
Engine: Ververica Runtime (VVR) 11.2
Flink SQL: 13 fungsi bawaan baru
VVR 11.2 menambahkan 13 fungsi skalar bawaan, mengurangi kebutuhan akan UDF kustom.
Pemrosesan string: PRINTF, TRANSLATE, ELT, BTRIM, STARTSWITH, ENDSWITH
Pemrosesan JSON: JSON_QUOTE, JSON_UNQUOTE
Ekspresi reguler: REGEXP_SUBSTR, REGEXP_INSTR, REGEXP_COUNT, REGEXP_EXTRACT_ALL
Aritmetika: UNHEX
Untuk referensi lengkap fungsi, lihat Fungsi yang didukung.
Flink SQL: Tipe Variant
Flink SQL kini mendukung tipe data Variant. Gunakan tipe ini ketika skema kolom bersifat semi-terstruktur atau berkembang seiring waktu—misalnya, saat melakukan ingesti JSON dari sumber heterogen. Variant menyediakan wadah fleksibel tanpa memerlukan skema kaku di awal.
Untuk aturan konversi tipe, lihat Konversi tipe data.
Table API: Dialek SQL Hive
Pekerjaan Table API kini dapat menggunakan dialek SQL Hive. Jika tim Anda sudah terbiasa dengan sintaks HiveQL, Anda dapat menulis pekerjaan Table API tanpa perlu mempelajari varian SQL khusus Flink.
Fungsi AI: Perilaku overflow yang dapat dikonfigurasi
Saat sebuah pesan melebihi jendela konteks model AI, Anda dapat memilih cara menanganinya: Discard pesan tersebut atau Truncate agar sesuai. Ini menggantikan perilaku tetap sebelumnya dan memungkinkan Anda menyesuaikan pertukaran antara kelengkapan data dan stabilitas pekerjaan.
Konfigurasikan strategi tersebut dalam DDL model. Lihat DDL Model.
Konektor
MySQL CDC: Optimisasi bidang VARCHAR
Konektor MySQL CDC kini menangani bidang VARCHAR secara lebih efisien, meningkatkan throughput dan stabilitas sinkronisasi untuk skema yang banyak menggunakan VARCHAR.
Lihat MySQL.
Flink CDC: Format Canal-JSON dan ekstraksi timestamp
Pekerjaan CDC kini dapat mengonsumsi data berformat Canal-JSON dari Apache Kafka. Konektor mengekstraksi baik timestamp event (ts) maupun urutan event (es), memungkinkan pengurutan dan deduplikasi yang akurat dalam pipeline downstream.
Lihat MySQL dan Sinkronkan data binary logging MySQL ke Kafka.
AnalyticDB for MySQL: Dukungan INSERT IGNORE
Konektor AnalyticDB for MySQL kini mendukung sintaks INSERT IGNORE. Catatan duplikat selama operasi tulis tidak lagi menyebabkan kegagalan pekerjaan—konektor melewati baris yang bentrok dan melanjutkan pemrosesan.
Paimon dan OSS: Otorisasi berbasis RAM
Konektor Paimon dan konektor Object Storage Service (OSS) kini mendukung otorisasi melalui peran Resource Access Management (RAM), menggantikan pasangan AccessKey. Peran RAM memberikan kontrol izin yang lebih granular dan menghilangkan kebutuhan untuk menyematkan kredensial jangka panjang dalam konfigurasi konektor.
Lihat Kelola katalog Paimon.
Tair (Redis OSS-compatible): Join lookup asinkron
Konektor Tair kini mendukung join lookup asinkron. Permintaan join lookup tidak lagi memblokir pipeline pemrosesan, meningkatkan efisiensi akses cache dan throughput pekerjaan secara keseluruhan.
MongoDB CDC: Penguraian oplog konkuren
Konektor MongoDB CDC kini mengurai oplog secara konkuren, bukan sekuensial. Hal ini meningkatkan stabilitas dan keandalan sinkronisasi untuk change stream MongoDB.
Lihat MongoDB.
Ingesti Kafka-Paimon: Evolusi skema otomatis
Saat melakukan ingesti data dari Apache Kafka ke Paimon, perubahan skema pada topik Kafka kini secara otomatis dipropagasikan ke tabel Paimon. Hal ini menghilangkan langkah migrasi skema manual selama ingesti data lake.
PyFlink: Penggunaan langsung konektor bawaan
Pekerjaan PyFlink kini dapat menggunakan konektor bawaan secara langsung, tanpa perlu mengelola dependensi JAR konektor secara manual. Hal ini menyederhanakan penyiapan pengembangan untuk pekerjaan Flink berbasis Python.
Lihat Gunakan dependensi Python.
Platform
Jalankan beberapa pernyataan DDL/DML dalam satu pekerjaan batch
Satu pekerjaan batch kini dapat mengeksekusi beberapa pernyataan DDL dan DML secara berurutan—membuat tabel, menjalankan komputasi, dan menghapus tabel, semuanya dalam satu pengiriman pekerjaan. Hal ini menghilangkan kebutuhan untuk merangkai pekerjaan terpisah untuk alur kerja batch multi-langkah.
Segarkan partisi historis sesuai jadwal
Tabel materialized kini mendukung penyegaran terjadwal untuk partisi historis. Gunakan fitur ini untuk mengisi ulang data yang datang terlambat ke partisi masa lalu, mempertahankan konsistensi akhir tanpa intervensi manual.
Pelepasan otomatis kluster sesi menganggur
Kluster sesi baru yang tetap menganggur lebih dari 30 menit akan dilepaskan secara otomatis. Hal ini mencegah kluster menganggur mengonsumsi sumber daya dan mengurangi penggunaan CU yang tidak perlu.
Periode blackout untuk tuning otomatis
Tentukan periode blackout untuk mencegah penskalaan sumber daya otomatis selama jam-jam kritis bisnis. Platform tetap menghasilkan rekomendasi tuning selama periode blackout, tetapi tidak menerapkannya—memberi Anda kontrol penuh atas kapan penskalaan terjadi.
Integrasi Git yang diperluas
Integrasi Git kini mendukung alat tambahan, termasuk Alibaba Cloud DevOps. Tarik struktur direktori langsung dari repositori yang terhubung, dan pesan error selama operasi Git kini mencakup panduan troubleshooting yang dapat ditindaklanjuti.
Kontrol akses granular untuk kueri data
Operasi kueri data kini mendukung kontrol akses yang lebih granular, memungkinkan batasan izin yang lebih tepat untuk tim yang berbagi ruang kerja.
Penyempurnaan pengalaman platform
-
Manajemen model AI melalui konsol: Buat, modifikasi, dan hapus model AI langsung dari halaman Catalogs, tanpa perlu panggilan API.
-
Penggunaan CU pekerjaan batch per jam: Konsol kini menampilkan konsumsi CU yang dipecah per jam untuk pekerjaan batch, memudahkan identifikasi lonjakan biaya dan optimalisasi penggunaan sumber daya.
-
Pencarian fuzzy alur kerja: Cari alur kerja berdasarkan nama parsial di halaman Workflows.
-
Pembuatan katalog Iceberg melalui konsol: Buat katalog Apache Iceberg langsung dari konsol tanpa konfigurasi manual.
Perubahan API
Untuk menggunakan API baru, tingkatkan kluster Anda dan perbarui dependensi pom ke versi 1.8.0.
API Baru
Sebelumnya, API Resource dan DeploymentTarget tidak dapat mengelola ruang kerja dengan penagihan hibrida. Rilis ini menambahkan dua API baru untuk mengatasi hal tersebut:
| API | Deskripsi |
|---|---|
CreateDeploymentTargetV2 |
Membuat target penerapan dengan dukungan ruang kerja penagihan hibrida |
UpdateDeploymentTargetV2 |
Memperbarui target penerapan dengan dukungan ruang kerja penagihan hibrida |
Objek Resource juga mendapatkan bidang baru untuk mengonfigurasi ruang kerja penagihan hibrida.
API yang Ditinggalkan
CreateDeploymentTarget dan UpdateDeploymentTarget telah ditinggalkan. Migrasikan ke API V2 sesegera mungkin.
Perbaikan bug
| API | Perbaikan |
|---|---|
createDeploymentDraft, modifyDeploymentDraft |
Jumlah maksimum label kini divalidasi saat input |
listDeployments |
Parameter sortName dan sortOrder kini memvalidasi input: hanya huruf (a–z, A–Z) dan garis bawah (_) yang diterima |
Perbaikan bug penting
Konektor
| Komponen | Perbaikan |
|---|---|
| Konektor Apache Kafka | Masalah konversi zona waktu dan error sinkronisasi data telah diselesaikan |
| Konektor MySQL | Error izin yang menghalangi konektivitas telah diselesaikan |
| Konektor Paimon | Masalah validasi presisi timestamp Apache Avro telah diperbaiki; crash checkpoint telah ditambal |
| Data Lake Formation (DLF) | Kegagalan konektivitas akibat kedaluwarsa token akses data telah diselesaikan |
| MySQL 8.0 | Masalah kompatibilitas dengan MySQL 8.0 telah diselesaikan |
SQL dan transformasi data
-
Perbaikan penguraian sintaks
LIKEdi Paimon. -
Perbaikan penanganan tanggal dan error
REGEXP_REPLACEdi skrip YAML. -
Resolusi
NullPointerExceptionsaat mengakses registri skema.
Stabilitas dan performa
-
Perbaikan inkonsistensi metadata yang dapat terjadi setelah failover pekerjaan.
-
Perbaikan pembersihan sumber daya saat pekerjaan berhenti secara tak terduga.
-
Optimalisasi mekanisme retry konektor untuk ketahanan pekerjaan yang lebih baik.