すべてのプロダクト
Search
ドキュメントセンター

E-MapReduce:OSS/OSS-HDFS

最終更新日:Jan 17, 2025

このトピックでは、Alibaba Cloud Object Storage Service (OSS) と OSS-HDFS の使用方法、メリット、および機能について説明します。

制限

OSS は、安全で費用対効果が高く、信頼性の高いクラウドストレージサービスであり、大量のデータを保存できます。OSS は、99.9999999999%(12 個の 9)のデータ耐久性と 99.995% のデータ可用性を提供するように設計されています。OSS は、ストレージコストを管理および削減するのに役立つ複数のストレージタイプを提供します。詳細については、「OSS とは」をご参照ください。

OSS-HDFS (JindoFS) は、クラウドネイティブのデータレイクストレージサービスです。OSS-HDFS は、一元化されたメタデータ管理機能を提供し、Hadoop 分散ファイルシステム (HDFS) API と完全に互換性があります。OSS-HDFS は、移植可能なオペレーティングシステムインタフェース (POSIX) もサポートしています。OSS-HDFS を使用して、ビッグデータおよび AI 分野のデータレイクベースのコンピューティングシナリオでデータを管理できます。詳細については、「OSS-HDFS とは」をご参照ください。

JindoData は、Alibaba Cloud ビッグデータチームがデータレイクシステムのストレージアクセラレーションのために開発したスイートです。JindoData は、Alibaba Cloud およびその他のベンダーのビッグデータおよび AI シナリオにおけるデータレイクシステム向けのエンドツーエンドのソリューションを提供します。JindoData は、統合アーキテクチャとカーネル上に構築されています。JindoData は、JindoFS(ブロックストレージモードの元の JindoFS)、JindoFSx(キャッシュモードの元の JindoFS)、および JindoSDK などのコンポーネントを提供します。 5.0 以降、JindoFSx は JindoCache に名前が変更されました。JindoData は、JindoFuse や Jindo DistCp などの完全に互換性のあるツールやプラグインも提供します。詳細については、「JindoData」をご参照ください。

注意事項

OSS または OSS-HDFS の安定性とパフォーマンスを確保するために、バージョン管理機能が有効になっている OSS または OSS-HDFS バケットで JindoSDK を使用しないことをお勧めします。詳細については、「JindoSDK を使用して OSS にアクセスするときに Reached timeout エラーが発生した場合の対処方法」および「OSS-HDFS の手順」をご参照ください。

使用方法

  • デフォルトでは、JindoSDK は E-MapReduce (EMR) クラスタにデプロイされています。 JindoSDK を使用して OSS または OSS-HDFS にアクセスできます。

  • 他の Alibaba Cloud サービスでは、最新バージョンの JindoSDK JAR パッケージをダウンロードし、JindoSDK をインストールしてから、JindoSDK を使用できます。詳細については、「EMR 以外の環境に JindoSDK をデプロイする」をご参照ください。

メリット

OSS または OSS-HDFS を基盤となるストレージサービスとして使用する場合、次のメリットがあります。

  • すぐに使用可能。OSS と OSS-HDFS はクラウドネイティブのストレージサービスです。サービスをデプロイすることなく、RESTful API を呼び出すことで、OSS および OSS-HDFS を使用できます。デフォルトでは、JindoSDK は EMR クラスタにデプロイされています。 JindoSDK を使用して OSS または OSS-HDFS にアクセスできます。

  • 費用対効果が高い。OSS または OSS-HDFS を使用して、ストレージコストを削減できます。 OSS および OSS-HDFS は、低頻度アクセス (IA)、アーカイブ、コールドアーカイブなど、さまざまなストレージタイプを提供しており、データの保存に使用できます。これにより、コールドデータのストレージコストが削減されます。

  • 拡張性が高い。OSS および OSS-HDFS は拡張性が高いです。 OSS または OSS-HDFS のストレージ容量は、ハードディスク容量によって制限されません。ストレージ容量を手動で拡張する必要はありません。

機能

次の表に、OSS と OSS-HDFS の機能の違いを示します。

シナリオ

機能

OSS

OSS-HDFS

ビッグデータ シナリオ (Hadoop)

ファイルとディレクトリの操作、および関連操作

サポート対象

サポート対象

ファイルとディレクトリに対する権限の付与のサポート

サポートされていません

サポートされています

ディレクトリおよび名前変更操作のアトミック操作

サポートされています (パフォーマンスが低い)

サポートされています (ミリ秒単位の粒度の名前変更操作)

setTimes を使用した特定の時点の指定のサポート

サポートされていません

サポートされています

拡張属性 ( XAttrs )

サポートされていません

サポートされています

ACL

サポートされていません

サポートされています

オンプレミス読み取りキャッシュの高速化のサポート

サポート対象

サポート対象

スナップショット

サポートされていません

サポートされています

ファイル関連の操作 (フラッシュ、同期、切り詰め、追加など)

サポートされていません

サポートされています

ファイルに対する切り捨て操作

サポートされていません

サポートされています

チェックサム検証

サポート対象

サポート対象

HDFS ゴミ箱の自動クリーンアップ

サポートされていません

サポートされています

ビッグデータシナリオ (Hadoop)

ファイルとディレクトリの操作、および関連操作

サポート

サポート

ファイルとディレクトリへの権限付与のサポート

サポートされています(ただし、操作には制限があります。詳細については、「制限」をご参照ください。)

サポート

ディレクトリの原子操作と名前変更操作

サポート(パフォーマンスが低い)

サポート(ミリ秒単位の名前変更操作)

ファイルへのランダム書き込み

setTimes を使用した特定の時点の指定のサポート