Mulai dari E-MapReduce (EMR) V3.30, JindoFS menyediakan penyimpanan berjenjang. Gunakan perintah penyimpanan berjenjang untuk memindahkan data antara disk lokal dan kelas penyimpanan OSS guna menyeimbangkan kecepatan akses dengan biaya penyimpanan.
Semua perintah penyimpanan berjenjang bersifat asinkron—mereka mengirimkan sebuah task dan langsung mengembalikan respons. Untuk memantau progres atau menunggu hingga selesai, gunakan perintah Status.
Prasyarat
-
Kluster EMR versi V3.30 atau yang lebih baru
Kelas penyimpanan
OSS menyediakan tiga kelas penyimpanan. Pilih kelas berdasarkan frekuensi akses terhadap data:
| Storage class | Access speed | Cost | Best for |
|---|---|---|---|
| Standard | Tercepat | Tertinggi | Data panas yang sering diakses |
| Infrequent Access (IA) | Cepat | Lebih rendah | Data hangat yang diakses kurang dari sekali per bulan |
| Archive | Memerlukan restore (hingga 1 hari) | Terendah | Data dingin yang jarang diakses |
Untuk informasi lebih lanjut mengenai kelas penyimpanan OSS, lihat Overview.
Transisi kelas penyimpanan
| From | To | Command |
|---|---|---|
| Local disk | OSS Standard | uncache |
| Local disk | OSS IA | archive -i |
| Local disk | OSS Archive | archive -a |
| OSS Archive | OSS Standard | unarchive |
| OSS Archive | OSS IA | unarchive -i |
| OSS Archive | Temporarily readable | unarchive -o |
| OSS Standard | Local disk | cache |
Perintah
Cache
Mencadangkan data dari jalur tertentu ke disk lokal. Setelah di-cache, operasi baca dilayani dari disk lokal alih-alih OSS.
jindo jfs -cache -p <path>
| Option | Description |
|---|---|
-p |
Pin data lokal agar tidak dihapus berdasarkan penggunaan disk |
Uncache
Hapus cadangan disk lokal untuk suatu jalur. Data hanya disimpan di penyimpanan OSS Standard.
jindo jfs -uncache <path>
Archive
Pindahkan data dari disk lokal ke penyimpanan OSS Akses Jarang (IA) atau Arsip. Cadangan di disk lokal akan dihapus setelah data dipindahkan.
jindo jfs -archive -i|-a <path>
| Option | Target storage class |
|---|---|
-i |
Infrequent Access (IA) |
-a |
Archive |
Unarchive
Konversi data dari penyimpanan Archive ke kelas penyimpanan yang lebih mudah diakses, atau pulihkan sementara untuk dibaca.
jindo jfs -unarchive [-i|-o] <path>
| Option | Target storage class | Notes |
|---|---|---|
| *(none)* | Standard | Perilaku default |
-i |
Infrequent Access (IA) | |
-o |
Temporarily readable | Data menjadi dapat dibaca dalam waktu satu hari; bukan perubahan permanen pada kelas penyimpanan |
Status
Lihat progres task penyimpanan berjenjang.
jindo jfs -status [-detail|-sync] <path>
| Option | Behavior |
|---|---|
| *(none)* | Tampilkan jumlah file yang ditargetkan untuk penyimpanan berjenjang dalam direktori dan data tempat penyimpanan berjenjang telah diterapkan |
-detail |
Tampilkan progres penyimpanan per file |
-sync |
Blokir hingga task penyimpanan berjenjang selesai, lalu keluar |
Karena semua perintah penyimpanan berjenjang bersifat asinkron, gunakan -sync dalam skrip yang harus menunggu task selesai sebelum melanjutkan—misalnya, arsip data lalu validasi hasilnya.
ls2
Lihat kelas penyimpanan file pada suatu path. Perintah ls2 memperluas perintah Hadoop ls standar dengan menambahkan kolom kelas penyimpanan.
hadoop fs -ls2 <path>
Contoh output:
drwxrwxrwx - - 0 2020-06-05 04:27 oss://xxxx/warehouse
-rw-rw-rw- 1 Archive 1484 2020-09-23 16:40 oss://xxxx/wikipedia_data.csv
-rw-rw-rw- 1 Standard 1676 2020-06-07 20:04 oss://xxxx/wikipedia_data.json
Kolom ketiga menunjukkan kelas penyimpanan setiap file. Nilai yang mungkin: Standard, Archive.
Dapatkan bantuan
Jalankan perintah berikut untuk melihat informasi bantuan mengenai perintah penyimpanan berjenjang:
jindo jfs -help archive