Fluid は、クラウドネイティブなシナリオ (ビッグデータ アプリケーションや AI アプリケーションなど) におけるデータ集約型アプリケーション向けの、オープンソースで Kubernetes ネイティブの分散データセット オーケストレーターおよびアクセラレーターです。このトピックでは、Fluid の概要と機能について説明します。
機能
Fluid は、データセットとランタイム オブジェクトを定義することで機能を提供します。次の図は、機能を示しています。
Fluid は、データセットの抽象化をネイティブでサポートしています。この機能は、データ集約型アプリケーションの基本的なサポートを提供し、効率的なデータアクセスを可能にし、複数の側面でデータ管理の費用対効果を向上させます。
Fluid は、サードパーティのストレージ サービスとの統合のための統一されたインターフェイスを備えた、拡張可能なデータ エンジン プラグインを提供します。さまざまなランタイムがサポートされています。
Fluid はデータ操作を自動化し、自動 O&M システムと統合するための複数のモードをサポートしています。
Fluid は、データ キャッシング技術とエラスティック スケーリングおよびデータ アフィニティ スケジューリングを組み合わせることで、データアクセスを高速化します。
Fluid はランタイム プラットフォームに依存せず、Kubernetes クラスター、Container Service for Kubernetes (ACK) Edge クラスター、および Serverless Kubernetes クラスターをサポートしています。Fluid は、マルチクラスター シナリオとハイブリッドクラウド シナリオにも適しています。
用語
データセット: コンピューティング エンジンで使用される、論理的に関連付けられたデータのセット。たとえば、Apache Spark はビッグデータ シナリオでデータセットを使用し、TensorFlow は AI シナリオでデータセットを使用します。データセットはインテリジェント アプリケーションを可能にし、さまざまな業界でコアバリューを生み出すのに役立ちます。データセット管理には、セキュリティ、バージョン、データ アクセラレーションなど、複数の側面が関係します。
ランタイム: データセットのセキュリティ、バージョン管理、およびデータ アクセラレーションを実装する実行エンジン。ランタイムは、一連のライフサイクル インターフェイスも定義します。これらのインターフェイスは、データセットの管理と高速化に使用されます。
AlluxioRuntime: オープンソースの Alluxio の実行エンジン。AlluxioRuntime は、データセットの管理とキャッシングをサポートし、永続ボリューム要求 (PVC)、Ceph、および Cloud Parallel File System (CPFS) へのアクセスを高速化します。ハイブリッドクラウド シナリオで AlluxioRuntime を使用できます。
JuiceFSRuntime: JuiceFS に基づいて開発された分散キャッシュ アクセラレーション エンジン。JuiceFSRuntime は、シナリオ固有のデータ キャッシングとアクセラレーションをサポートしています。JuiceFS の詳細については、「JuiceFS の概要」をご参照ください。Fluid での JuiceFS の使用方法の詳細については、「Fluid での JuiceFS の使用」をご参照ください。
JindoRuntime: Alibaba Cloud E-MapReduce (EMR) チームによって開発された JindoFS の実行エンジン。JindoRuntime は C++ に基づいており、データセットの管理とキャッシングをサポートしています。JindoRuntime は、Object Storage Service (OSS)、OSS/OSS-HDFS、および Hadoop 分散ファイルシステム (HDFS) へのアクセスも高速化します。
EFCRuntime: File Storage NAS (NAS) 技術チームによって開発された EFC エラスティック アクセラレーション クライアントのランタイム。EFCRuntime は、NAS および CPFS へのアクセスを高速化し、ホット アップデートとフォールトトレランスをサポートします。
ThinRuntime: さまざまなストレージ システムにローコードでアクセスできる、拡張可能な汎用ストレージ システム。ThinRuntime は、Fluid によって提供されるデータ オーケストレーション管理機能とコア機能を再利用して、ランタイム プラットフォームと統合します。
ack-fluid の分散キャッシュ アクセラレーション エンジンである AlluxioRuntime と JuiceFSRuntime は、サードパーティのオープンソース コミュニティまたは企業によって提供される無料のオープンソース コンポーネントです。対応するサーバーとクライアント コンポーネントをインストールして、分散キャッシュ アクセラレーション サービスを使用することを選択できます。
ただし、Alibaba Cloud は、サードパーティ コンポーネントの安定性、サービス制限、およびセキュリティ コンプライアンスについて責任を負いません。サードパーティのオープンソース コミュニティまたは企業の公式 Web サイトとコード ホスティング プラットフォームの更新に細心の注意を払い、オープンソース ライセンスを読んで遵守する必要があります。サードパーティ コンポーネントの使用に起因するアプリケーション開発、メンテナンス、トラブルシューティング、およびセキュリティに関連する潜在的なリスクについては、お客様が責任を負います。
機能 | Alluxio | JuiceFS | Jindo | EFC |
基盤となるストレージ | PVC、Ceph、HDFS、CPFS、ネットワーク ファイル システム (NFS)、および OSS | JuiceFS | OSS、OSS-HDFS、および PVC | NAS および CPFS |
サポート元 | オープンソース プロジェクト | オープンソース プロジェクト | Alibaba Cloud サービス | Alibaba Cloud サービス |