Topik ini menjelaskan perubahan fitur utama dan perbaikan bug dalam Realtime Compute for Apache Flink yang dirilis pada 4 Juni 2025.
Peningkatan versi diluncurkan secara bertahap kepada pengguna. Untuk informasi lebih lanjut, lihat pengumuman terbaru di Konsol Realtime Compute for Apache Flink. Anda hanya dapat menggunakan fitur baru setelah peningkatan selesai untuk akun Anda. Untuk meminta peningkatan dipercepat, ajukan tiket.
Ikhtisar
Rilis ini mencakup pembaruan platform, mesin, dan konektor, serta optimalisasi kinerja dan perbaikan bug.
Pembaruan platform
Pembaruan platform berfokus pada pengalaman pengguna dan efisiensi operasional. Sorotan:
Integrasi Git: Dukungan integrasi dengan repositori jarak jauh GitHub, GitLab, dan Gitee untuk mengoptimalkan manajemen versi kode dan meningkatkan kolaborasi tim.
Integrasi SLS: Penyimpanan log startup pekerjaan, log acara runtime, dan data penggunaan sumber daya ke Layanan Log Sederhana Alibaba Cloud (SLS) untuk kueri historis dan audit.
Optimasi Pengalaman Log Pekerjaan: Konfigurasi output log dioptimalkan dengan dukungan operasi visual, mengurangi risiko kesalahan operasi.
Optimasi Peringatan CloudMonitor: Notifikasi peringatan menampilkan nama pekerjaan untuk memudahkan identifikasi pekerjaan abnormal.
Pembaruan mesin
Ververica Runtime (VVR) versi 11.1 resmi dirilis, dibangun di atas Apache Flink 1.20.1. VVR 11.1 menyediakan optimalisasi dan peningkatan tambahan. Sorotan:
Sebelum Anda meningkatkan
Lihat Tingkatkan versi mesin dari suatu deployment dan Strategi penomoran versi VVR.
Perubahan tidak kompatibel
Java SDK: JDK 11 menjadi lingkungan runtime standar. Dukungan untuk JDK 8 diakhiri. Untuk pekerjaan JAR yang dikompilasi dengan JDK 8, kompilasi ulang dan repaketkan program menggunakan JDK 11. Pekerjaan SQL tidak terpengaruh.
Konektor Hologres: Konektor Hologres telah dioptimalkan arsitekturnya, dengan beberapa opsi dimodifikasi atau dihapus.
Fitur baru
Vektorisasi Waktu Nyata dan Inferensi Didukung oleh LLM
Konstruksi Vektor: Integrasi dengan Alibaba Cloud Model Studio untuk memvektorisasi data streaming secara real-time, mendukung komputasi fitur waktu nyata untuk sistem rekomendasi dan pencarian cerdas.
Inferensi Teks: Menghasilkan ringkasan, terjemahan, dan konten lainnya secara dinamis menggunakan model pra-latih, mendukung pemrosesan teks cerdas untuk kasus penggunaan bisnis.
Peningkatan kemampuan
Pengisian Ulang Data Historis di Tabel Materialized Secara Terjadwal: Mendukung pengisian ulang data di tabel materialized sesuai jadwal.
Join Lookup Waktu Nyata dengan Tabel Dimensi StarRocks
SLS CDC dan Evolusi Skema SLS-Paimon: YAML CDC menambahkan dukungan untuk sumber data SLS dan evolusi skema otomatis dari SLS ke Paimon, menyederhanakan manajemen metadata dalam skenario data lakehouse.
Mesin Ingest Data Ditingkatkan ke Flink CDC Versi 3.4: Mendukung kemampuan inti Flink CDC versi 3.4 dengan peningkatan penangkapan data.
Ingest Data dari SLS melalui YAML: Mendukung ingest data dan evolusi skema dari SLS ke Paimon.
Ingest Data ke MaxCompute melalui YAML: Mengingest hingga satu terabyte data ke MaxCompute.
Optimasi Operasi Set Flink SQL: Mendukung retensi alias bidang dalam hasil debugging draft yang berisi
UNION ALL.
Peningkatan kinerja
Peningkatan Kinerja Pembacaan Snapshot untuk Konektor PostgreSQL CDC: Implementasi mekanisme segmentasi data dioptimalkan dengan pembacaan paralel dan segmentasi asinkron, meningkatkan kinerja pembacaan snapshot secara signifikan.
Peningkatan Kebijakan Cache untuk Konektor Tair (Redis OSS-compatible): Mendukung fungsi penonaktifan cache berbasis waktu, membantu mencegah persaingan sumber daya selama jam sibuk dan meningkatkan stabilitas cache.
Optimasi pengalaman
Pelacakan Volume Input/Output: Memantau volume input dan output di operator sumber dan sink, memungkinkan pengguna memverifikasi integritas data dan mengoptimalkan kinerja pekerjaan.
Peningkatan keamanan
Peningkatan Keamanan untuk Konektor Tair (Redis OSS-compatible): Konektor Tair (Redis OSS-compatible) mendukung koneksi TLS/SSL, memungkinkan komunikasi data aman. Ini bermanfaat untuk industri dengan persyaratan keamanan ketat seperti keuangan dan layanan pemerintah.
Perbaikan Kerentanan Apache Parquet: Apache Parquet diperbarui ke versi 1.15.1 untuk memperbaiki kerentanan eksekusi kode jarak jauh (RCE) terkait deserialisasi data dalam format Parquet, mengurangi risiko keamanan potensial.
Pelaporan Identitas MaxCompute: Layanan ini mendukung pelaporan applicationName ke server MaxCompute, memungkinkan layanan pihak ketiga melacak penggunaan sumber daya oleh pekerjaan Flink secara akurat, meningkatkan auditabilitas akses lintas sistem.
Fitur
Fitur | Deskripsi | Referensi |
Mengintegrasikan dengan repositori Git | Mendukung sinkronisasi dua arah kode SQL dan konfigurasi pekerjaan dengan repositori Git jarak jauh (GitHub, GitLab, dan Gitee), dengan mekanisme resolusi konflik bawaan. | |
Mengirim pesan ke SLS | Mengirim log startup pekerjaan, acara runtime, dan data penggunaan sumber daya ke SLS. | |
Optimasi pengalaman halaman konfigurasi log | Mengekspor log pekerjaan ke datastore lain (seperti SLS, OSS, dan Kafka) di konsol. | |
Ingest data ke MaxCompute melalui YAML | Mendukung penggunaan konektor MaxCompute sebagai sink ingest data untuk pekerjaan yang dikembangkan dalam YAML. | |
Optimalkan ingest data | Opsi | |
Optimasi konektor Elasticsearch | Mendukung mengabaikan nilai null saat memperbarui tabel Elasticsearch, meningkatkan keandalan penulisan data. | |
Optimasi konektor Hologres | Menyesuaikan dan menghapus beberapa opsi konektor untuk mengoptimalkan arsitektur sistem dan meningkatkan efisiensi pemeliharaan. Implementasi fungsionalitas dan penggunaan bervariasi berdasarkan versi VVR yang Anda gunakan. Untuk memastikan kompatibilitas pekerjaan dan stabilitas operasional, lihat dokumen spesifik untuk versi VVR Anda. | |
Optimasi konektor MongoDB | Menambahkan opsi | |
Optimasi konektor MySQL | Nilai default opsi property-version diubah menjadi 1. | |
Optimasi konektor Kafka |
| |
Optimasi konektor ApsaraMQ untuk RocketMQ | Menambahkan opsi konektor | |
Optimasi konektor Tair (Redis OSS-compatible) |
| |
Optimasi konektor StarRocks |
| |
Optimasi konektor Paimon |
| |
Optimasi konektor AnalyticDB untuk PostgreSQL | Opsi | |
Optimasi tabel materialized |
| |
Dukungan Flink SQL untuk autentikasi Kerberos Hive | Mengakses data Hive secara aman di kluster yang menggunakan Kerberos melalui SQL. Ini memastikan verifikasi identitas dua arah dan transmisi terenkripsi antara klien dan server, secara efektif mencegah pencurian data dan akses tidak sah. | |
Peningkatan Docker image PyFlink | Image Docker dasar PyFlink ditingkatkan untuk meningkatkan kompatibilitas dengan berbagai versi Python dan glibc. | |
Optimasi fungsi jendela | Mendukung perilaku SESSION WINDOW yang ditingkatkan di Apache Flink versi 1.20, yang menawarkan fleksibilitas lebih dibandingkan SESSION WINDOW di VVR versi 8.x yang memerlukan penggabungan dengan pernyataan agregasi. Kami merekomendasikan peningkatan ke versi terbaru untuk memanfaatkan peningkatan ini. | |
Dukungan bawaan untuk konektor SelectDB | Konektor SelectDB telah menyelesaikan pratinjau publiknya dan sekarang menjadi konektor bawaan dari Realtime Compute for Apache Flink. | |
Optimasi pekerjaan Table API | Mendukung pemanggilan fungsi bawaan dalam kueri Table API. | |
Vektorisasi waktu nyata dan inferensi yang didukung oleh LLM |
|
Perbaikan bug utama
Konektor
Memperbaiki masalah berikut:
Null dikembalikan saat konektor SLS menggunakan arsitektur baru untuk mengonsumsi karakter escape.
Pesan hilang dalam topik ApsaraMQ untuk RocketMQ yang tertunda.
Konflik terjadi selama penulisan bersamaan ke dua database Tair (Redis OSS-compatible).
Kesalahan NullPointerException terjadi selama join lookup dengan tabel dimensi Hologres.
Kesalahan IllegalStateException terjadi saat data ditulis ke tabel Paimon dengan kunci utama.
Hanya satu baris yang cocok selama join lookup dengan tabel dimensi Lindorm.
SQL dan transformasi
Memperbaiki masalah berikut:
Masalah dengan operator transformasi YAML, yaitu kesalahan kompilasi yang disebabkan oleh parser Calcite tidak mengenali operator perbandingan string.
Konflik terjadi selama konsolidasi skema melalui CTAS.
Akses ke tabel non-Hive dalam katalog Hive ditolak.
Stabilitas dan kinerja
Memperbaiki masalah berikut:
Sink Paimon membutuhkan waktu terlalu lama untuk ditutup.
Pengecualian penyaringan tabel. Ini dapat dilewati menggunakan opsi
debezium.table.exclude.list.Data tidak konsisten karena MiniBatch.
Masalah ketidakcocokan antara PyFlink Table API dan fungsi bawaan Realtime Compute for Apache Flink.