Alluxio是一個面向雲端式的資料分析和人工智慧的開源的資料編排技術。Alluxio為資料驅動型應用和儲存系統構建了橋樑,將資料從儲存層移動到距離資料驅動型應用更近的位置,從而能夠更容易被訪問, 同時使得應用程式能夠通過一個公用介面串連到許多儲存系統。
背景資訊
在巨量資料生態系統中,Alluxio位於資料驅動架構或應用(例如Apache Spark、Presto、TensorFlow、Apache Flink和Apache Hive等)和各種持久化儲存系統(例如HDFS和阿里雲OSS)之間,使得上層的計算應用可以通過統一的用戶端API和全域命名空間訪問包括HDFS和OSS在內的持久化儲存系統。
優勢
提供記憶體級I/O吞吐率,同時降低具有彈性擴張特性的資料驅動型應用的成本開銷。
簡化雲端儲存和Object Storage Service接入。
簡化資料管理,提供對多資料來源的單點訪問。
應用程式部署簡易。
Alluxio的詳細資料,請參見Alluxio。