このトピックでは、Alibaba Cloud Object Storage Service (OSS) と OSS-HDFS の使用方法、メリット、および機能について説明します。
制限
OSS は、安全で費用対効果が高く、信頼性の高いクラウドストレージサービスであり、大量のデータを保存できます。OSS は、99.9999999999%(12 個の 9)のデータ耐久性と 99.995% のデータ可用性を提供するように設計されています。OSS は、ストレージコストを管理および削減するのに役立つ複数のストレージタイプを提供します。詳細については、「OSS とは」をご参照ください。
OSS-HDFS (JindoFS) は、クラウドネイティブのデータレイクストレージサービスです。OSS-HDFS は、一元化されたメタデータ管理機能を提供し、Hadoop 分散ファイルシステム (HDFS) API と完全に互換性があります。OSS-HDFS は、移植可能なオペレーティングシステムインタフェース (POSIX) もサポートしています。OSS-HDFS を使用して、ビッグデータおよび AI 分野のデータレイクベースのコンピューティングシナリオでデータを管理できます。詳細については、「OSS-HDFS とは」をご参照ください。
JindoData は、Alibaba Cloud ビッグデータチームがデータレイクシステムのストレージアクセラレーションのために開発したスイートです。JindoData は、Alibaba Cloud およびその他のベンダーのビッグデータおよび AI シナリオにおけるデータレイクシステム向けのエンドツーエンドのソリューションを提供します。JindoData は、統合アーキテクチャとカーネル上に構築されています。JindoData は、JindoFS(ブロックストレージモードの元の JindoFS)、JindoFSx(キャッシュモードの元の JindoFS)、および JindoSDK などのコンポーネントを提供します。 5.0 以降、JindoFSx は JindoCache に名前が変更されました。JindoData は、JindoFuse や Jindo DistCp などの完全に互換性のあるツールやプラグインも提供します。詳細については、「JindoData」をご参照ください。
注意事項
OSS または OSS-HDFS の安定性とパフォーマンスを確保するために、バージョン管理機能が有効になっている OSS または OSS-HDFS バケットで JindoSDK を使用しないことをお勧めします。詳細については、「JindoSDK を使用して OSS にアクセスするときに Reached timeout エラーが発生した場合の対処方法」および「OSS-HDFS の手順」をご参照ください。
使用方法
デフォルトでは、JindoSDK は E-MapReduce (EMR) クラスタにデプロイされています。 JindoSDK を使用して OSS または OSS-HDFS にアクセスできます。
他の Alibaba Cloud サービスでは、最新バージョンの JindoSDK JAR パッケージをダウンロードし、JindoSDK をインストールしてから、JindoSDK を使用できます。詳細については、「EMR 以外の環境に JindoSDK をデプロイする」をご参照ください。
メリット
OSS または OSS-HDFS を基盤となるストレージサービスとして使用する場合、次のメリットがあります。
すぐに使用可能。OSS と OSS-HDFS はクラウドネイティブのストレージサービスです。サービスをデプロイすることなく、RESTful API を呼び出すことで、OSS および OSS-HDFS を使用できます。デフォルトでは、JindoSDK は EMR クラスタにデプロイされています。 JindoSDK を使用して OSS または OSS-HDFS にアクセスできます。
費用対効果が高い。OSS または OSS-HDFS を使用して、ストレージコストを削減できます。 OSS および OSS-HDFS は、低頻度アクセス (IA)、アーカイブ、コールドアーカイブなど、さまざまなストレージタイプを提供しており、データの保存に使用できます。これにより、コールドデータのストレージコストが削減されます。
拡張性が高い。OSS および OSS-HDFS は拡張性が高いです。 OSS または OSS-HDFS のストレージ容量は、ハードディスク容量によって制限されません。ストレージ容量を手動で拡張する必要はありません。
機能
次の表に、OSS と OSS-HDFS の機能の違いを示します。
シナリオ | 機能 | OSS | OSS-HDFS |
ビッグデータ シナリオ (Hadoop) | ファイルとディレクトリの操作、および関連操作 | サポート対象 | サポート対象 |
ファイルとディレクトリに対する権限の付与のサポート | サポートされていません | サポートされています | |
ディレクトリおよび名前変更操作のアトミック操作 | サポートされています (パフォーマンスが低い) | サポートされています (ミリ秒単位の粒度の名前変更操作) | |
setTimes を使用した特定の時点の指定のサポート | サポートされていません | サポートされています | |
拡張属性 ( XAttrs ) | サポートされていません | サポートされています | |
ACL | サポートされていません | サポートされています | |
オンプレミス読み取りキャッシュの高速化のサポート | サポート対象 | サポート対象 | |
スナップショット | サポートされていません | サポートされています | |
ファイル関連の操作 (フラッシュ、同期、切り詰め、追加など) | サポートされていません | サポートされています | |
ファイルに対する切り捨て操作 | サポートされていません | サポートされています | |
チェックサム検証 | サポート対象 | サポート対象 | |
HDFS ゴミ箱の自動クリーンアップ | サポートされていません | サポートされています | |
ビッグデータシナリオ (Hadoop) | ファイルとディレクトリの操作、および関連操作 | サポート | サポート |
ファイルとディレクトリへの権限付与のサポート | サポートされています(ただし、操作には制限があります。詳細については、「制限」をご参照ください。) | サポート | |
ディレクトリの原子操作と名前変更操作 | サポート(パフォーマンスが低い) | サポート(ミリ秒単位の名前変更操作) | |
ファイルへのランダム書き込み | setTimes を使用した特定の時点の指定のサポート |