すべてのプロダクト
Search
ドキュメントセンター

E-MapReduce:SmartData 3.6.X の概要

最終更新日:Jan 11, 2025

SmartData は、E-MapReduce(EMR)Jindo エンジンのストレージサービスです。SmartData は、EMR コンピューティングエンジンに一元化されたストレージ、キャッシング、およびコンピューティングの最適化を提供します。 このサービスは追加機能も提供します。 SmartData は、JindoFS、JindoTable、および関連ツールで構成されています。 このトピックでは、SmartData 3.6.X の更新内容について説明します。

JindoFS

次の表に、JindoFS の更新内容を示します。

機能説明
Amazon Simple Storage Service(S3)および S3 プロトコルを使用するその他のサービスへのクロス クラウドアクセス、およびこれらのサービスへのアクセスのためのキャッシュベースの高速化JindoFS は S3 プロトコルをサポートしており、Amazon S3 および S3 プロトコルを使用するその他のシステムにアクセスできます。 キャッシュベースの高速化機能を使用して、これらのシステムへのアクセスを高速化できます。
HDFS へのアクセスのためのキャッシュベースの高速化キャッシュベースの高速化機能を使用して、HDFS へのアクセスを高速化できます。
トランザクションの読み込みオプション MetaSync およびデータキャッシュ2 つのトランザクションの読み込みオプションである MetaSync とデータキャッシュが JindoFS に追加されました。 これにより、プリロードタスクのトランザクションプロパティが確保され、読み込みプロセス中に中間ステータスがメタデータビューに表示されないことが保証されます。
キャッシュプリロードメカニズムの最適化
  • メタデータとデータのキャッシュをプリロードするメカニズムが最適化されています。 これにより、プリロード効率が向上します。
  • 進捗フィードバック機能が最適化されています。
  • 超大型ディレクトリのタスクがサポートされています。

JindoSDK

次の表に、JindoSDK の更新内容を示します。

機能説明
ローカルキャッシングJindoSDK では、ローカルキャッシングポリシーを構成できます。これにより、SmartData サービスがデプロイされていない場合でもローカルデータキャッシングが可能になります。 これにより、Object Storage Service(OSS)データへのアクセスが高速化されます。
FileSystem API と同じレベルの Object Store APIObject Store API が JindoSDK に追加されました。 これは、既存の FileSystem API と同じレベルです。 Object Store API は、OSS などのストレージシステムにより適しており、これらのシステムへのアクセスを容易にします。 また、Object Store API は、コピー操作と名前変更操作の効率も向上させます。
OSS サーバー側キャッシングの最適化OSS アクセスアクセラレータが提供されています。 アクセラレータを起動した後、アクセラレータの容量に基づいて OSS データにアクセスするための帯域幅をカスタマイズできます。
OSS セカンドレベルドメインセカンドレベルドメインを使用した OSS へのアクセスがサポートされています。 この機能を有効にすると、一部の特殊な環境でセカンドレベルドメインまたは IP アドレスを使用して OSS にアクセスできます。 この機能はデフォルトで無効になっています。

JindoTable

次の表に、JindoTable の更新内容を示します。

機能説明
OSS での HDFS データの階層化ストレージとアーカイブMoveTo コマンドを実行して、複数のテーブルまたはパーティションのデータを一度に OSS に移行できます。 このコマンドはメタデータも自動的に更新します。 フィルター条件を指定してパーティションをフィルタリングし、ストレージポリシーを構成してデータを OSS に移行できます。 既に OSS にある大量のデータを一度にアーカイブできます。
OSS でのデータのアーカイブ解除と取得unarchiveTable コマンドを実行して、OSS にアーカイブされている大量のデータをアーカイブ解除して取得できます。
Presto が Parquet 形式のファイルをクエリする速度の高速化JindoTable が提供するネイティブエンジンを使用して、Presto が Parquet 形式のファイルをクエリする速度を高速化できます。
Spark 3 が Parquet または ORC 形式のファイルをクエリする速度の高速化JindoTable が提供するネイティブエンジンを使用して、Spark 3 が Parquet または ORC 形式のファイルをクエリする速度を高速化できます。
Spark または Presto が HDFS のデータをクエリする速度の高速化JindoTable が提供するネイティブエンジンを使用して、Spark または Presto が HDFS のデータをクエリする速度を高速化できます。
OSS アクセスログの分析SQL ステートメントを実行して、OSS アクセスログを分析できます。

JindoFuse

次の表に、JindoFuse の更新内容を示します。

機能説明
トレーニングとオンラインマウントのシナリオファイルシステムを特定の JindoFS 名前空間または OSS ディレクトリにマウントできます。 SDK モードで OSS ディレクトリを指定できます。