MaxCompute menyediakan arsitektur lakehouse terbuka tingkat enterprise yang menawarkan manajemen metadata terpadu, penyimpanan terbuka, beragam solusi komputasi, keamanan andal, serta efisiensi biaya.
Pelanggan sasaran
Data warehouse terutama berisi data terstruktur, tetapi juga memerlukan keterbukaan data lake untuk mendukung akses lintas tim dan multi-engine.
Pelanggan dengan persyaratan keamanan dan kepatuhan tinggi yang membutuhkan fitur tingkat enterprise seperti izin tingkat baris dan kolom, penyamaran data, disaster recovery, dan backup.
Fitur
Metadata terpadu
MaxCompute menyediakan katalog data dan solusi tata kelola data terpadu untuk objek data, termasuk tabel, tampilan, snapshot, dan model, sehingga memungkinkan kontrol akses detail halus dan auditing. Kebijakan keamanan didefinisikan sekali dan diterapkan secara global.
Anda dapat mengelola kredensial akses untuk Layanan Alibaba Cloud melalui koneksi. MaxCompute secara otomatis mendeteksi file data terstruktur dan tidak terstruktur di data lake eksternal, seperti Object Storage Service (OSS), lalu mendaftarkannya sebagai tabel eksternal. Akses data melalui tabel tersebut menyederhanakan alur analitik data, sedangkan caching statistik untuk tabel lake meningkatkan performa komputasi.
Penyimpanan terbuka
Penyimpanan terbuka memungkinkan satu salinan data digunakan oleh berbagai compute engine. Storage API membuat data tabel yang dikelola oleh MaxCompute tersedia bagi compute engine pihak ketiga.
Anda dapat mengintegrasikan MaxCompute dengan ekosistem komputasi seperti Spark, Flink, Flink CDC, StarRocks, DBT, Presto, Trino, PAI, dan PyTorch.
Storage API menyediakan metode membaca data yang efisien, berlatensi rendah, dan aman. Data ditransfer dalam format Arrow dan mendukung optimasi performa seperti predicate pushdown, partisi, serta column pruning. API ini juga mendukung fitur keamanan seperti izin tingkat baris dan kolom serta penyamaran data, sehingga menyeimbangkan efisiensi kolaborasi lintas tim dengan kepatuhan.
Komputasi terbuka
Mesin SQL dan MaxFrame buatan sendiri dari MaxCompute memberikan pengalaman komputasi terpadu di berbagai sumber data dalam ekosistem lakehouse. Mesin-mesin tersebut memungkinkan akses transparan ke berbagai sistem penyimpanan eksternal melalui tabel eksternal dan proyek eksternal. Anda dapat secara fleksibel menggunakan data dari tabel internal maupun eksternal dalam tugas ekstrak, transformasi, dan muat (ETL), analitik data, serta pembelajaran mesin.
