全部产品
Search
文档中心

MaxCompute:Apa itu MaxCompute?

更新时间:Jul 06, 2025

MaxCompute adalah gudang data cloud tingkat perusahaan berbasis model Software as a Service (SaaS). Dirancang untuk skenario analisis data, MaxCompute menyediakan layanan gudang data online yang cepat dan sepenuhnya dikelola dalam arsitektur serverless. Solusi ini menghilangkan batasan skalabilitas sumber daya dan elastisitas dari platform data tradisional, meminimalkan biaya operasi dan pemeliharaan (O&M), serta memungkinkan pemrosesan dan analisis data besar secara efisien dengan biaya rendah.

Seiring berkembangnya teknik pengumpulan data, perusahaan di berbagai industri mengumpulkan data dalam ukuran terabyte, petabyte, bahkan exabyte. Peningkatan pesat volume data melampaui kapasitas pemrosesan perangkat lunak tradisional. MaxCompute menawarkan akses data offline dan real-time, mendukung komputasi data skala besar dan percepatan kueri, serta menyediakan solusi gudang data dan layanan analitik serta pemodelan untuk berbagai skenario komputasi. MaxCompute juga menyediakan solusi impor data komprehensif dan berbagai model komputasi terdistribusi, memungkinkan Anda menyelesaikan analitik big data tanpa pengetahuan mendalam tentang komputasi terdistribusi atau pemeliharaan.

MaxCompute cocok untuk skenario di mana lebih dari 100 GB data perlu disimpan atau diproses. Dengan kemampuan memproses hingga exabyte data, MaxCompute banyak digunakan di Alibaba Group. Solusi ini mendukung berbagai skenario pemrosesan big data seperti gudang data dan analisis business intelligence (BI) untuk perusahaan Internet besar, analisis log situs web, analisis transaksi e-commerce, serta eksplorasi karakteristik dan minat pengguna.

MaxCompute terintegrasi mendalam dengan layanan cloud Alibaba berikut:

  • DataWorks

    DataWorks menyediakan fitur-fitur seperti sinkronisasi data ujung ke ujung, desain alur kerja, pengembangan data, manajemen data, dan O&M untuk MaxCompute.

  • Platform for AI (PAI)

    Komponen algoritma PAI dapat digunakan untuk melatih model berdasarkan data di MaxCompute.

  • Hologres

    Anda dapat menggunakan tabel eksternal di Hologres untuk mempercepat kueri pada data MaxCompute. Data juga dapat diekspor ke Hologres untuk analitik interaktif.

  • Quick BI

    Quick BI memungkinkan Anda membuat laporan untuk data di MaxCompute dan menganalisis data tersebut secara visual.

Fitur inti

Fitur

Deskripsi

Layanan gudang data online sepenuhnya dikelola dalam arsitektur serverless

  • Mendukung akses melalui API. Layanan online ini siap pakai.

  • Menyediakan sumber daya kluster dalam jumlah besar. Anda dapat membeli sumber daya sesuai kebutuhan dengan metode penagihan bayar sesuai pemakaian.

  • Tidak memerlukan operasi dan pemeliharaan (O&M) platform, meminimalkan investasi O&M.

Elastisitas dan skalabilitas tinggi

  • Memperluas kemampuan penyimpanan dan komputasi secara terpisah. MaxCompute memungkinkan perusahaan menganalisis semua aset data pada platform yang sama, menghilangkan silo data.

  • Mengalokasikan sumber daya secara real-time berdasarkan puncak dan lembah bisnis Anda.

Kemampuan komputasi dan penyimpanan terpusat yang kaya

  • Mendukung berbagai model komputasi dan fungsi yang ditentukan pengguna (UDF).

  • Mendukung kompresi kolom, yang mengurangi ukuran data menjadi 20% dari ukuran aslinya dalam sebagian besar kasus, sehingga mengurangi biaya penyimpanan secara signifikan.

Kemampuan pemodelan, pengembangan, dan tata kelola data

Mengimplementasikan agregasi data global, integrasi, pemrosesan, dan tata kelola berdasarkan platform pengembangan dan tata kelola data ujung ke ujung DataWorks. DataWorks dapat digunakan untuk mengelola proyek MaxCompute dan mengedit kode kueri di sisi web.

Kemampuan AI terintegrasi

  • Terintegrasi mulus dengan Platform for AI untuk memberikan kemampuan pembelajaran mesin yang kuat.

  • Memungkinkan Anda menggunakan Spark ML untuk analisis BI.

  • Menggunakan pustaka Python pihak ketiga untuk pembelajaran mesin.

Integrasi mendalam dengan mesin Spark

  • Menyediakan mesin Apache Spark bawaan, yang mendukung semua fitur Spark.

  • Mengintegrasikan secara mendalam sumber daya komputasi, data, dan sistem izin MaxCompute ke dalam mesin Spark.

Lakehouse

  • Terintegrasi dengan danau data seperti Object Storage Service (OSS) dan Hadoop Distributed File System (HDFS). MaxCompute memungkinkan Anda menganalisis data di danau data menggunakan tabel eksternal. Anda juga dapat menggunakan Spark untuk mengakses langsung danau data dan menganalisis data tersebut.

  • Mendukung analisis asosiasi antara danau data dan gudang data berdasarkan satu set layanan gudang data dan antarmuka pengguna.

Untuk informasi lebih lanjut, lihat Lakehouse of MaxCompute.

Integrasi pemrosesan data offline dan real-time

  • MaxCompute terintegrasi mendalam dengan Hologres untuk mendukung kueri data menggunakan tabel eksternal di Hologres dan pembacaan data langsung di lapisan penyimpanan. Efisiensi kueri menggunakan tabel eksternal di Hologres lebih dari lima kali lebih baik daripada menggunakan tabel eksternal jenis lain.

  • Hologres mendukung percepatan kueri untuk MaxCompute tanpa perlu migrasi data. Efisiensi kueri meningkat lebih dari sepuluh kali lipat.

  • Hologres memungkinkan Anda mengimpor metadata MaxCompute secara batch tanpa perlu membuat tabel eksternal secara manual.

Penulisan streaming dan analitik hampir real-time

  • Memungkinkan Anda menulis data streaming secara real-time dan menganalisis data tersebut di gudang data.

  • Terintegrasi mendalam dengan layanan streaming utama di cloud untuk membaca data streaming dari berbagai sumber.

  • Mendukung kueri paralel elastis dalam skala detik untuk memenuhi persyaratan analisis hampir real-time.

Perlindungan data berbasis SaaS secara berkelanjutan di cloud

Memberikan lebih dari 20 fitur keamanan di tiga tingkat, seperti infrastruktur, pusat data, jaringan, pasokan daya, kemampuan keamanan platform, manajemen izin pengguna, dan perlindungan privasi. MaxCompute juga menyediakan kemampuan keamanan yang sama dengan layanan big data open source dan database yang dikelola.

Arsitektur layanan

Gambar berikut menunjukkan arsitektur MaxCompute.

image

Tabel berikut menjelaskan modul inti.

Modul

Deskripsi

Mesin penyimpanan

MaxCompute menyediakan mesin penyimpanan MaxCompute (penyimpanan internal) untuk menyimpan tabel dan sumber daya MaxCompute. Anda juga dapat menggunakan tabel eksternal untuk membaca data yang disimpan di layanan seperti OSS, Tablestore, dan ApsaraDB RDS.

Mesin penyimpanan MaxCompute terutama menggunakan penyimpanan berorientasi kolom. Dalam sebagian besar kasus, ukuran data terkompresi adalah seperlima dari ukuran data asli.

Mesin komputasi

MaxCompute menyediakan mesin SQL MaxCompute dan platform komputasi Cupid.

  • Mesin SQL MaxCompute: memungkinkan Anda langsung menjalankan tugas SQL MaxCompute. Untuk informasi lebih lanjut tentang persyaratan sintaksis dan contoh pengembangan pernyataan dan fungsi SQL MaxCompute, lihat Ikhtisar SQL MaxCompute.

  • Platform komputasi Cupid: memungkinkan Anda menjalankan tugas mesin pihak ketiga, seperti tugas Spark dan tugas Mars. Untuk informasi lebih lanjut tentang persyaratan pengembangan dan contoh pengembangan multi-mesin, lihat PyODPS.

Lapisan layanan cloud

MaxCompute memungkinkan Anda membuat antrian tugas yang berbeda dan mengonfigurasi sumber daya dan prioritas yang berbeda untuk setiap antrian. Ini membantu Anda mengelola tugas secara rinci. MaxCompute juga menyediakan sistem penjadwalan yang kuat untuk mengelola dan mengoptimalkan alokasi dan penggunaan sumber daya komputasi. Ini membantu meningkatkan efisiensi keseluruhan sistem. MaxCompute memberikan perlindungan multi-lapis untuk keamanan data, termasuk isolasi proyek, manajemen izin, dan enkripsi data untuk memastikan keamanan dan privasi data.

Sistem metadata dan keamanan terpadu

MaxCompute menyediakan layanan Skema Informasi untuk Anda gunakan metadata tingkat tenant secara offline. Skema Informasi juga memungkinkan Anda menanyakan data berdasarkan log historis MaxCompute. Dengan cara ini, Anda dapat menganalisis informasi berjalan pekerjaan, seperti konsumsi sumber daya, durasi berjalan, dan jumlah data yang diproses, untuk mengoptimalkan pekerjaan atau merencanakan kapasitas sumber daya.

MaxCompute juga menyediakan sistem manajemen keamanan yang komprehensif, seperti sistem kontrol akses, enkripsi data, dan penyembunyian data dinamis, untuk memastikan keamanan data. Untuk informasi lebih lanjut tentang keamanan, lihat Fitur keamanan.

Antarmuka pengguna dan keterbukaan

MaxCompute menyediakan antarmuka pengguna berikut:

Ekosistem data

MaxCompute terintegrasi mendalam dengan DataWorks. Anda dapat menggunakan DataWorks untuk mengimplementasikan pengembangan data ujung ke ujung, analitik, dan tata kelola. DataWorks mendukung skenario pengembangan dan analitik data berikut:

  • Danau data

  • Integrasi data

  • Tata kelola data

  • Pengembangan data menggunakan mesin pihak ketiga

  • Analitik data visual

TopConsole (konsol MaxCompute)

Konsol MaxCompute menyediakan kemampuan manajemen konfigurasi dasar, seperti manajemen proyek MaxCompute, manajemen kuota, dan manajemen tenant. Konsol MaxCompute juga menyediakan kemampuan O&M dasar, seperti O&M pekerjaan dan observasi sumber daya, serta kemampuan O&M yang ditingkatkan, seperti tampilan material dan analitik serta optimasi biaya. Untuk informasi lebih lanjut, lihat Manajemen dan penggunaan sumber daya.

Manfaat

MaxCompute memiliki manfaat berikut:

  • Kemudahan Penggunaan

    • Membantu Anda membangun gudang data dengan penyimpanan dan komputasi berperforma tinggi.

    • Pratinjau terintegrasi dengan beberapa layanan, menyederhanakan pengembangan SQL standar.

    • Menyediakan kemampuan manajemen dan keamanan yang komprehensif.

    • Tanpa O&M dan mendukung metode penagihan bayar sesuai pemakaian. Biaya komputasi hanya dihasilkan untuk sumber daya yang Anda gunakan.

  • Skalabilitas Tinggi untuk Memenuhi Kebutuhan Bisnis

    Mendukung perluasan kemampuan penyimpanan dan komputasi secara terpisah. Fitur penskalaan dinamis membebaskan Anda dari perencanaan kapasitas di muka dan dapat memenuhi kebutuhan penyimpanan dan komputasi pertumbuhan bisnis yang cepat.

  • Berbagai Skenario Analisis

    Menggunakan platform terbuka dan terpadu untuk memenuhi kebutuhan bisnis dalam berbagai skenario, seperti gudang data, BI, analisis hampir real-time, analisis danau data, dan pembelajaran mesin.

  • Platform Terbuka

    • Mendukung antarmuka terbuka dan ekosistem data, memastikan migrasi data fleksibel, migrasi aplikasi, dan pengembangan perangkat lunak kustom.

    • Mendukung kombinasi fleksibel dengan layanan komersial atau open source, seperti Airflow dan Tableau, untuk membangun berbagai aplikasi data.

Hubungi kami

Jika Anda memiliki pertanyaan atau saran tentang MaxCompute, Anda dapat mengisi formulir aplikasi grup DingTalk untuk bergabung dengan grup DingTalk untuk umpan balik.