OSS-HDFS の自動ストレージ階層化は、保持する必要があるものの、ほとんど読み取られないコンプライアンスデータやアーカイブデータのストレージコストを削減します。この機能は、アクセスパターンに基づいてストレージクラス間でデータを移動します。コールドデータを Infrequent Access (IA)、Archive、Cold Archive、または Deep Cold Archive にプッシュし、必要なときにホットデータを Standard にプルバックします。
仕組み
自動ストレージ階層化は、連携して動作する2つのレイヤーを使用します。
ストレージポリシー (JindoFS レイヤー):
setStoragePolicyコマンドを実行して、ディレクトリ内のオブジェクトにターゲットストレージクラスのタグを付けます (例:transition-storage-class: IA)。ライフサイクルルール (OSS レイヤー): OSS コンソールでこの機能を有効にすると、OSS はこれらのタグに基づいて動作するライフサイクルルールを自動的に作成します。
.dlsdata/ディレクトリ内のオブジェクトで、一致するタグを持つものは、最終変更から1日後にターゲットストレージクラスに変換されます。
この2層モデルは、JindoFS コマンドが移行のためにデータをマークし、OSS が日次スケジュールで実際のクラス変換を実行することを意味します。
| ストレージクラス | ポリシー値 | タグ値 |
|---|---|---|
| IA | CLOUD_IA | IA |
| Archive | CLOUD_AR | Archive |
| Cold Archive | CLOUD_COLD_AR | ColdArchive |
| Deep Cold Archive | CLOUD_DEEP_COLD_AR | DeepColdArchive |
サポートされている移行:
ホットからコールドへ: Standard → IA → Archive → Cold Archive → Deep Cold Archive
コールドからホットへ: Deep Cold Archive → Cold Archive → Archive → IA → Standard
制限事項と前提条件
サポートされているリージョン
| ストレージクラス | サポートされているリージョン |
|---|---|
| IA、Archive、Cold Archive | 中国 (杭州)、中国 (上海)、中国 (北京)、中国 (深セン)、中国 (張家口)、中国 (ウランチャブ)、中国 (香港)、シンガポール、ドイツ (フランクフルト)、米国 (シリコンバレー)、米国 (バージニア)、インドネシア (ジャカルタ) |
| Deep Cold Archive | 中国 (杭州)、中国 (上海)、中国 (北京)、中国 (深セン)、中国 (張家口)、中国 (ウランチャブ)、シンガポール |
JindoSDK バージョン
JindoSDK 6.8.0 以降が必要です。
JindoSDK のバージョンが 6.8.0 より古い場合、IA、Archive、Cold Archive、または Deep Cold Archive ディレクトリにオブジェクトを直接作成することはできません。回避策として、Standard ディレクトリにオブジェクトを作成し、rename 操作を使用して移動してください。
チケットが必要
この機能を使用する前に、サポートチケットを提出する必要があります。
IA、Archive、Cold Archive: 1つのチケットで3つのクラスすべてをカバーします。
Deep Cold Archive: 個別のチケットを提出してください。
初回アクティベーション: アカウントでこの機能が一度も有効にされていない場合、1つのチケットで4つのストレージクラスすべてをアクティベートします。
変換サイズ制限
Archive、Cold Archive、または Deep Cold Archive オブジェクトを Standard または IA に1回の操作で変換する場合: 合計最大 5 TB。
処理中の状態にある Archive、Cold Archive、または Deep Cold Archive オブジェクト: 最大 50 TB。
ライフサイクルルールの安全性
自動ストレージ階層化を有効にすると、OSS は各タグ値に対してライフサイクルルールを自動的に作成します。これらのルールを変更または削除しないでください。変更または削除すると、データ損失や OSS-HDFS エラーが発生する可能性があります。
課金
データ取得料金
IA、Archive、Cold Archive、または Deep Cold Archive オブジェクトの読み取りには、データ取得料金が発生します。頻繁にアクセスされるデータをこれらのストレージクラスに保存することは避けてください。「データ処理料金」をご参照ください。
タグ料金
ストレージポリシーを設定すると、各データブロックに transition-storage-class タグが追加されます。タグは OSS オブジェクトタグ付けルールに基づいて課金されます。「オブジェクトタグ付け料金」をご参照ください。
最小保存期間
各ストレージクラスには最小保存期間があります。最小期間に達する前に移行されたオブジェクトは、最小期間全体に対して課金されます。
| ストレージクラス | 最小期間 |
|---|---|
| IA | 30 日 |
| Archive | 60 日 |
| Cold Archive | 180 日 |
| Deep Cold Archive | 180 日 |
ターゲットクラスによってカウント方法が異なります:
IA と Archive: クロックは変換時にリセットされません。以前のクラスで費やされた日数は最小期間にカウントされるため、以前の保存期間は残りの義務を軽減します。
Cold Archive と Deep Cold Archive: クロックは変換時にリセットされます。以前の保存期間に関係なく、変換日から180日間の最小期間全体が適用されます。
例:
| 変換パス | コンバージョン前の年齢 | 残りの最小期間 | 以前のクラスの課金 |
|---|---|---|---|
| Standard (10 日) → IA | 10 日 | IA でさらに 20 日 | Standard: 10 日 |
| IA (10 日) → Archive | 10 日 | Archive でさらに 50 日 | IA: 10 日 |
| Standard (10 日) → Cold Archive | 10 日 | Cold Archive でさらに 180 日 | Standard: 10 日 |
| Standard (10 日) → Deep Cold Archive | 10 日 | Deep Cold Archive でさらに 180 日 | Standard: 10 日 |
| Cold Archive (10 日) → IA | 10 日 | Cold Archive でさらに 170 日、または 変換後 IA で 30 日 | Cold Archive: 10 日 |
自動ストレージ階層化を有効にする
ステップ 1: JindoFS SDK のセットアップ
開始する前に、以下を確認してください。
OSS-HDFS にデータが書き込まれていること
JindoSDK 6.8.0 以降がインストールされていること (「非 EMR クラスターを OSS-HDFS に接続」をご参照ください)
サポートチケットが提出されていること (「チケットが必要」をご参照ください)
Elastic Compute Service (ECS) インスタンスに接続します。「インスタンスに接続」をご参照ください。
JindoFS SDK の JAR パッケージをダウンロードします。
展開されたパッケージの
binディレクトリに移動します。cd jindofs-sdk-x.x.x-linux/bin/binディレクトリにjindosdk.cfgという名前の構成ファイルを作成します。[client] fs.oss.accessKeyId = <your-access-key-id> fs.oss.accessKeySecret = <your-access-key-secret> fs.oss.endpoint = cn-hangzhou.oss-dls.aliyuncs.comcn-hangzhou.oss-dls.aliyuncs.comをご利用のリージョンのエンドポイントに置き換えてください。JINDOSDK_CONF_DIR環境変数を、jindosdk.cfg構成ファイルの絶対パスに設定します:export JINDOSDK_CONF_DIR=<JINDOSDK_CONF_DIR>
ステップ 2: ストレージポリシーの割り当て
階層化するデータを含むディレクトリで setStoragePolicy を実行します。このコマンドは、そのディレクトリ内のすべてのオブジェクトを変換のためにタグ付けします。
| 対象ストレージクラス | コマンド |
|---|---|
| IA | ./jindofs fs -setStoragePolicy -path oss://examplebucket/dir1 -policy CLOUD_IA |
| Archive | ./jindofs fs -setStoragePolicy -path oss://examplebucket/dir2 -policy CLOUD_AR |
| Cold Archive | ./jindofs fs -setStoragePolicy -path oss://examplebucket/dir3 -policy CLOUD_COLD_AR |
| Deep Cold Archive | ./jindofs fs -setStoragePolicy -path oss://examplebucket/dir4 -policy CLOUD_DEEP_COLD_AR |
オブジェクトまたはサブディレクトリにポリシーが設定されていない場合、親ディレクトリのポリシーを継承します。
ステップ 3: OSS コンソールで機能を有効にする
OSS コンソールにログインします。
左側のナビゲーションウィンドウで、[バケット] をクリックし、対象のバケット名をクリックします。
左側のナビゲーションツリーで、[Data Lake] > [OSS-HDFS] を選択します。
「OSS-HDFS」タブで、「設定」をクリックします。
「基本設定」セクションで、「自動ストレージ階層化」パネルの「ステータス」を有効化します。OSS は、各タグ値に対して自動的にライフサイクルルールを作成します。各ルールは、対応するタグが付与された
.dlsdata/内のオブジェクトを、最終更新日から 1 日後に変換します。
[OK] をクリックします。
機能を有効にした後:
OSS は作成から 24 時間以内にライフサイクルルールをロードします。
ライフサイクルルールは、毎日 08:00 (UTC+8) に1回実行されます。正確な完了時間はオブジェクト数によって異なります。
オブジェクトが対象のストレージクラスに到達するには、少なくとも48時間かかります。
ストレージポリシーコマンド
setStoragePolicy
./jindofs fs -setStoragePolicy -path <path> -policy <policy>パス内のすべてのオブジェクトにストレージポリシーを割り当てます。
| パラメーター | 説明 |
|---|---|
-path | オブジェクトまたはディレクトリのパス |
-policy | 適用するストレージポリシー。有効な値: CLOUD_STD (標準ストレージ)、CLOUD_IA (IA)、CLOUD_AR (Archive)、CLOUD_COLD_AR (Cold Archive)、CLOUD_DEEP_COLD_AR (Deep Cold Archive)、CLOUD_AR_RESTORED (一時的に解凍された Archive)、CLOUD_COLD_AR_RESTORED (一時的に解凍された Cold Archive)、CLOUD_DEEP_COLD_AR_RESTORED (一時的に解凍された Deep Cold Archive) |
getStoragePolicy
./jindofs fs -getStoragePolicy -path <path>パスに割り当てられたストレージポリシーを返します。
unsetStoragePolicy
./jindofs fs -unsetStoragePolicy -path <path>パスからストレージポリシーを削除します。
checkStoragePolicy
./jindofs fs -checkStoragePolicy -path <path>パス内のオブジェクトの変換タスクのステータスを返します。
| ステータス | 意味 |
|---|---|
Pending | 変換タスクはキューに入っています |
Submitted | 変換タスクが送信されました |
Processing | 変換タスクが実行中です |
Finalized | 変換タスクが完了しました |
このコマンドは、OSS-HDFS メタデータ変換タスクのステータスのみを報告します。OSS に送信されたタスクの処理ステータスは反映されません。
アーカイブオブジェクトまたはコールドティアオブジェクトを復元する
./jindofs fs -setStoragePolicy -path <path> -policy <policy> -restoreDays <days>Archive、Cold Archive、または Deep Cold Archive オブジェクトを直接アクセスするために一時的に解凍します。
| パラメーター | 説明 |
|---|---|
-policy | CLOUD_AR_RESTORED (Archive)、CLOUD_COLD_AR_RESTORED (Cold Archive)、または CLOUD_DEEP_COLD_AR_RESTORED (Deep Cold Archive) |
-restoreDays | 解凍されたオブジェクトの保持期間 (日数)。デフォルト: 1。有効範囲: Archive の場合は 1~7、Cold Archive および Deep Cold Archive の場合は 1~365 |
復元する前
CLOUD_AR、CLOUD_COLD_AR、またはCLOUD_DEEP_COLD_ARを適用した後、解凍を実行するまで少なくとも 2 日間待ってください。解凍が開始された後、Archive オブジェクトは数分以内に読み取り可能になります。Cold Archive および Deep Cold Archive オブジェクトは数時間かかります。
保持期間が終了した後、オブジェクトは読み取れなくなります。アクセスを延長するには、保持期間中に再度解凍してください。解凍操作の間には少なくとも 2 日間空けてください。
1回の操作で Standard または IA に変換できる Archive、Cold Archive、または Deep Cold Archive オブジェクトの合計サイズは 5 TB を超えることはできません。処理中の状態にある Archive、Cold Archive、または Deep Cold Archive オブジェクトの合計サイズは 50 TB を超えることはできません。