ブロックストレージモードは、効率的な読み取りおよび書き込み操作と高いメタデータアクセス性を保証します。JindoFS は、データをブロックとして OSS に保存し、クラスターのローカルディスクにデータをキャッシュしてデータアクセスを高速化します。 JindoFS は Namespace Service を使用してメタデータを管理し、高いメタデータアクセス性を保証します。このトピックでは、JindoFS をブロックストレージモードで使用する方法について説明します。
背景情報
JindoFS のブロックストレージモードには、次の機能があります。- JindoFS は、OSS をストレージバックエンドとして使用することにより、非常に大きくスケーラブルなストレージ容量を提供します。ストレージ容量は EMR クラスターの規模に依存しません。ローカルクラスターは必要に応じてスケールインまたはスケールアウトできます。
- JindoFS は、読み取り操作を高速化するために、ローカルクラスターに一部のバックアップデータを保存します。これにより、特に Write Once Read Many(WORM)ソリューションの場合、限られたローカルストレージ容量を使用してスループットが向上します。
- JindoFS は、HDFS と同様の効率的なメタデータクエリを提供します。 OssFileSystem と比較して、JindoFS はメタデータクエリの時間を大幅に節約します。さらに、JindoFS は、データとメタデータに頻繁にアクセスする場合のシステムの不安定さを回避します。
- JindoFS は、EMR クラスターでジョブが実行されるときに、最大限のデータローカリティを保証します。これにより、ネットワーク転送の負荷が軽減され、読み取りパフォーマンスが向上します。
ブロックストレージモードを構成する
- SmartData サービスに移動します。
- Alibaba Cloud EMR コンソールにログインします。
- 上部のナビゲーションバーで、クラスターが存在するリージョンを選択します。必要に応じてリソースグループを選択します。デフォルトでは、アカウントのすべてのリソースが表示されます。
- [クラスター管理] タブをクリックします。
- 表示される [クラスター管理] ページで、ターゲットクラスターを見つけ、[アクション] 列の [詳細] をクリックします。
- 左側のナビゲーションペインで、[クラスターサービス] をクリックし、次に [smartdata] をクリックします。
- Alibaba Cloud EMR コンソールにログインします。
- SmartData サービスの [namespace] タブに移動します。
- [構成] タブをクリックします。
- [サービス構成] セクションの [namespace] タブをクリックします。
- 必要なパラメーターを構成します。JindoFS では、複数の名前空間を構成できます。このトピックでは、test という名前の名前空間を使用します。
- [jfs.namespaces] を [test] に設定します。複数の名前空間を構成する場合は、コンマ(,)で区切ります。
- [サービス構成] セクションの右上隅にある [カスタム構成] をクリックします。 [構成項目の追加] ダイアログボックスで、次の表に示すパラメーターを追加します。
パラメーター 説明 例 jfs.namespaces.test.oss.uri test 名前空間のストレージバックエンド。 oss://<oss_bucket>/<oss_dir>/ 説明 このパラメーターを OSS バケットのディレクトリに設定することをお勧めします。名前空間はこのディレクトリにデータブロックを保存します。jfs.namespaces.test.mode test 名前空間のストレージモード。このパラメーターを block に設定します。 block jfs.namespaces.test.oss.access.key ストレージバックエンドとして機能する OSS バケットの AccessKey ID。 xxxx 説明 EMR クラスターと同じリージョンおよび同じアカウントにある OSS バケットにデータを保存することをお勧めします。これにより、高パフォーマンスと安定性が確保されます。この場合、OSS バケットは EMR クラスターからのパスワードなしアクセスを許可するため、AccessKey ID と AccessKey シークレットを構成する必要はありません。jfs.namespaces.test.oss.access.secret ストレージバックエンドとして機能する OSS バケットの AccessKey シークレット。 - [OK] をクリックします。
- [jfs.namespaces] を [test] に設定します。
- [サービス構成] セクションの右上隅にある [保存] をクリックします。
- 右上隅にある Jindo Namespace Service の再起動[アクション] ドロップダウンリストから を選択します。Namespace Service が再起動した後、
jfs://test/<path_of_file>
を使用して JindoFS 内のファイルにアクセスできます。
ディスク容量の使用量を制御する
JindoFS は OSS をデータストレージバックエンドとして使用するため、大量のデータを保存できます。ただし、ローカルディスクの容量は限られています。 JindoFS は、ローカルディスクのコールドデータを自動的に削除します。storage.watermark.high.ratio
パラメーターと storage.watermark.low.ratio
パラメーターは、ローカルディスクの容量使用率を調整するために使用されます。パラメーターは 0 から 1 の間の10進数に設定できます。
- ディスク使用量の構成を変更します。SmartData サービスの [サービス構成] セクションで、[storage] タブをクリックし、次の表に示すパラメーターを構成します。
パラメーター 説明 storage.watermark.high.ratio ディスク使用量の上限。 JindoFS データのディスク使用量がこの制限を超えると、JindoFS はディスク内のデータを自動的に削除します。デフォルト値:0.4。 storage.watermark.low.ratio ディスク使用量の下限。自動データ削除がトリガーされると、JindoFS データのディスク使用量がこの制限まで減少するまで、JindoFS はデータの削除を開始します。デフォルト値:0.2。 説明 上限と下限を構成して、JindoFS に割り当てられたディスク容量を調整できます。上限が下限よりも大きいことを確認してください。 - 構成を保存します。
- [サービス構成] セクションの右上隅にある [保存] をクリックします。
- [変更の確認] ダイアログボックスで、[説明] を指定し、[構成の自動更新] をオンにします。
- [OK] をクリックします。
- 構成を適用するために Jindo Storage Service を再起動します。
- 右上隅にある を選択します。
- [クラスターアクティビティ] ダイアログボックスで、関連パラメーターを指定します。
- [OK] をクリックします。
- [確認] メッセージで、[OK] をクリックします。