MaxCompute提供企業級湖倉開放架構,具備統一中繼資料管理、開放儲存、多元計算方案、高安全性和高性價比的技術優勢。
適用客群
倉內結構化資料佔比較高,同時需要湖的開放性支撐跨團隊多引擎訪問。
對企業級能力有需求,如行列級許可權、資料脫敏、容災與備份及安全合規性要求較高。
功能簡介
統一中繼資料
MaxCompute提供統一的資料目錄、資料治理方案,覆蓋表、視圖、快照、模型等資料對象,實現精細化存取控制與審計,安全性原則一次定義,全域生效。
支援通過Connection託管雲端服務的訪問憑證,主動發現OSS等外部儲存湖上的結構化與非結構化資料檔案,並註冊成外部表格,通過表的訪問方式簡化資料分析流程,同時緩衝的湖表統計資訊提升計算效能。
開放儲存
開放儲存滿足一份資料存放區多引擎使用需求,通過Storage API將MaxCompute託管的表資料資源開放給第三方計算引擎使用。
支援對接 Spark、Flink、Flink CDC、StarRocks、DBT、Presto、Trino、PAI、PyTorch等計算生態。
Storage API提供了高效、低延遲、安全的資料讀方式,通過Arrow格式傳輸,支援謂詞下推、分區和列裁剪等效能最佳化,支援行列級許可權、脫敏等安全特性,兼顧跨團隊協作效率與合規。
開放計算
MaxCompute自研的 SQL、MaxFrame引擎支援在湖倉生態的多樣化資料來源中提供統一計算體驗,通過外部表格、外部項目實現多種外部儲存的透明訪問,使用者可以在ETL、資料分析、機器學習任務中靈活調用內外表資料。

實踐教程
通過MaxLake可以實現資料入湖入倉及多情境分析聯動,以車連網資料為例,通過車輛上報的GPS定位資訊分析行駛裡程和速度,並聯動多引擎滿足即時查詢報表、跨團隊協作與脫敏分享、AI訓練等應用情境,實現一份資料,多重價值。詳情參見MaxCompute湖上資料加工和多情境聯動實踐。