Apache Paimon adalah penyimpanan data lake yang mendukung pemrosesan data dalam mode streaming dan batch. Apache Paimon menawarkan penulisan data dengan throughput tinggi serta kueri data dengan latensi rendah. Apache Paimon kompatibel dengan mesin komputasi umum dari Alibaba Cloud E-MapReduce (EMR), seperti Flink, Spark, Hive, dan Trino. Anda dapat menggunakan Apache Paimon untuk mengimplementasikan layanan penyimpanan data lake secara efisien pada Hadoop Distributed File System (HDFS) atau Alibaba Cloud Object Storage Service (OSS), serta menghubungkan layanan tersebut ke mesin komputasi untuk analitik data lake.
Apache Paimon menyediakan fitur-fitur berikut:
Membangun layanan penyimpanan data lake ringan berbiaya rendah berbasis HDFS atau OSS.
Mendukung operasi baca dan tulis pada dataset skala besar dalam mode streaming dan batch.
Mendukung kueri batch dan kueri pemrosesan analitik online (OLAP) dalam hitungan menit atau bahkan detik.
Mendukung konsumsi dan pembuatan data inkremental. Apache Paimon dapat digunakan untuk penyimpanan bertingkat gudang data tradisional dan gudang data streaming.
Mendukung pra-agregasi data untuk mengurangi biaya penyimpanan dan beban komputasi hilir.
Mendukung pelacakan balik data versi historis.
Mendukung penyaringan data yang efisien.
Mendukung perubahan skema tabel.
Untuk informasi lebih lanjut, lihat Apache Paimon.