HBase は、ストレージコストを削減し、読み取りパフォーマンスを向上させるために、複数の圧縮アルゴリズムとデータブロックエンコーディングをサポートしています。
圧縮アルゴリズム
Alibaba Cloud HBase は、LZO、ZSTD、GZ、LZ4、SNAPPY、および NONE (圧縮なし) をサポートしています。
|
業務タイプ |
非圧縮テーブルサイズ |
LZO (圧縮率/解凍速度 (MB/s)) |
ZSTD (圧縮率/解凍速度 (MB/s)) |
LZ4 (圧縮率/解凍速度 (MB/s)) |
|
モニタリング |
419.75 TB |
5.82/372 |
13.09/256 |
5.19/463.8 |
|
ログ |
77.26 TB |
4.11/333 |
6.0/287 |
4.16/496.1 |
|
リスク管理 |
147.83 TB |
4.29/297.7 |
5.93/270 |
4.19/441.38 |
|
利用記録 |
108.04 TB |
5.93/316.8 |
10.51/288.3 |
5.55/520.3 |
説明
-
低レイテンシーワークロードには LZ4 を使用してください。
-
モニタリングや IoT などのスループット指向のワークロードには ZSTD を使用してください。
エンコーディング
データブロックエンコーディングは、キーと値のペア間の冗長性を排除することでストレージ使用量を削減します。DATA_BLOCK_ENCODING を DIFF に設定してください。
操作手順
-
1. テーブルで圧縮とエンコーディングを有効にします。
alter 'test', {NAME => 'f', COMPRESSION => 'lz4', DATA_BLOCK_ENCODING =>'DIFF'} -
2. 圧縮とエンコーディングは、メジャーコンパクションの実行後に有効になります。この処理には時間がかかる場合があるため、オフピーク時間にコンパクションを実行してください。
major_compact 'test'
説明
圧縮とエンコーディングの詳細については、「Alibaba Cloud HBase におけるデータ圧縮とエンコーディングの解説」をご参照ください。