Alluxio は、データ分析と AI 向けのクラウド指向のオープンソースデータオーケストレーションテクノロジーです。データ駆動型アプリケーションとストレージシステム間のギャップを埋め、ストレージ層からデータ駆動型アプリケーションにデータを近づけます。これにより、データアクセスが容易になり、アプリケーションは共通インターフェースを介して多数のストレージシステムに接続できます。
背景情報
ビッグデータエコシステムでは、Alluxio は、Apache Spark、Presto、TensorFlow、Apache Hive、Apache Flink などのデータ駆動型アプリケーションまたはフレームワークと、Hadoop Distributed File System(HDFS)や Alibaba Cloud Object Storage Service(OSS)などのさまざまな永続ストレージシステムの間に位置します。 Alluxio は、統合クライアント API とグローバル名前空間を提供し、上位層のコンピューティングアプリケーションまたはフレームワークが永続ストレージシステムに格納されているデータにアクセスできるようにします。
メリット
メモリ速度の I/O スループットを提供し、自動スケーリングをサポートするデータ駆動型アプリケーションのコストを削減します。
クラウドストレージおよびオブジェクトストレージシステムへのデータアクセスを簡素化します。
データ管理を簡素化します。 Alluxio は、複数のデータソースへの単一アクセス ポイントを提供します。
簡単なアプリケーション展開をサポートします。
Alluxio の詳細については、「Alluxio」をご参照ください。