JindoCache(旧称 JindoFSx)は、Alibaba Cloud E-MapReduce(EMR)が提供するサービスであり、クラウドネイティブデータレイクへのアクセスを高速化します。 JindoCache は、データキャッシングやメタデータキャッシングなどの高速化機能を提供し、使用する CacheSet に基づいて異なる読み取りおよび書き込みポリシーを提供します。 これにより、さまざまなシナリオでのアクセス高速化に関するデータレイクの要件を満たすことができます。
背景情報
CacheSet は、JindoCache のキャッシュの抽象化です。 実際のシナリオでは、一部のデータではキャッシングベースの高速化は必要ありません。 JindoCache は、データレイクの多様なコンピューティング要件と使用シナリオに基づいて、きめ細かいアクセス ポリシーを提供します。 ビジネス要件に基づいてアクセス ポリシーを構成できます。 積極的なメタデータ キャッシング ポリシーを選択することも、特定のデータをキャッシュしないように選択して、最適なパフォーマンスとリソース使用率を実現することもできます。
シナリオ
JindoCache は、以下のシナリオで使用できます。
オンライン分析処理(OLAP)シナリオでの Presto クエリ:クエリのパフォーマンスを向上させ、クエリ時間を短縮します。
DataServing シナリオでの HBase の使用:P99 レイテンシとリクエスト料金を大幅に削減します。
ビッグデータ分析用の Hive または Spark レポート:レポートの生成に必要な時間とコンピューティング クラスタのコストを削減します。
レイクとウェアハウスの統合:リクエスト料金とデータカタログの応答レイテンシを削減します。
人工知能(AI):トレーニングとその他のシナリオでの AI オペレーションを高速化し、AI クラスタのコストを削減し、包括的な機能サポートを提供します。
キャッシング ポリシー
JindoCache は、データ キャッシングとメタデータ キャッシングをサポートしています。 データ キャッシング タイプには、分散データ キャッシング、整合性ハッシュベースのデータ キャッシング、ローカル キャッシングが含まれます。