Manajemen siklus hidup mendukung berbagai jenis aturan untuk mengelola siklus hidup data di danau data. Anda dapat membuat aturan siklus hidup yang berbeda untuk menghemat biaya penyimpanan. Topik ini menjelaskan operasi dasar dari aturan siklus hidup.
Deskripsi Fitur
Manajemen siklus hidup memungkinkan Anda mengonfigurasi aturan pengelolaan data untuk basis data dan tabel dalam danau data. Anda dapat mengonversi kelas penyimpanan secara berkala berdasarkan tipe aturan seperti Waktu Akses Terakhir Data, Nilai Partisi Berdasarkan Waktu, Waktu Pembuatan Partisi/Tabel, dan Waktu Pembaruan Terakhir Partisi/Tabel. Hal ini membantu mengurangi biaya penyimpanan data.
Skenario
Sejumlah besar data historis disimpan di danau data tetapi tidak lagi digunakan seiring waktu. Dalam kasus ini, Anda dapat mengonversi kelas penyimpanan data historis ke Infrequent Access (IA), Arsip, atau Penyimpanan Arsip Dingin untuk mengurangi biaya. Contoh:
Tabel pesanan memiliki partisi berdasarkan waktu, seperti 20220101. Hanya data tiga tahun terakhir yang perlu dianalisis. Kelas penyimpanan partisi historis dapat diubah menjadi Penyimpanan Arsip Dingin menggunakan aturan Nilai Partisi Berdasarkan Waktu.
Basis Data A dari Bisnis A tidak lagi aktif dikembangkan. Data historisnya dapat diarsipkan dengan mengubah kelas penyimpanannya menjadi Penyimpanan Arsip Dingin.
Berhati-hatilah saat mengonfigurasi aturan manajemen data.
Data yang kelas penyimpanannya diubah menjadi Arsip atau Penyimpanan Arsip Dingin tidak akan dapat diakses oleh mesin komputasi. Anda harus memulihkan data secara manual sebelum dapat menggunakannya, yang akan menimbulkan biaya terkait. Untuk informasi lebih lanjut, lihat Kelas Penyimpanan OSS dan Konversi Kelas Penyimpanan.
Data yang disimpan dalam kelas IA mungkin menunjukkan efisiensi akses yang lebih rendah ketika diambil oleh mesin komputasi.
Batasan
Metadata dikelola menggunakan Data Lake Formation (DLF), dan data disimpan di Object Storage Service (OSS).
Pengelolaan data tidak terstruktur tidak didukung. Jika Anda memerlukan pengelolaan data tidak terstruktur, lihat dokumentasi Siklus Hidup dalam OSS.
Penagihan
Jika Anda ingin menggunakan fitur manajemen siklus hidup, biaya berikut terlibat:
Fitur manajemen siklus hidup DLF sedang dalam pratinjau publik dan gratis.
Untuk informasi lebih lanjut tentang biaya terkait aturan siklus hidup, lihat Biaya terkait aturan siklus hidup.
Peringatan
Jika kelas penyimpanan data diubah menjadi Arsip atau Penyimpanan Arsip Dingin, data tidak dapat diakses oleh mesin komputasi. Anda harus memulihkan data secara manual sebelum menggunakannya, dan biaya terkait akan timbul. Untuk informasi lebih lanjut, lihat Kelas Penyimpanan dan Konversi Kelas Penyimpanan.
Konfigurasikan aturan siklus hidup sesuai dengan kebutuhan bisnis Anda.
Jika kelas penyimpanan data diubah menjadi IA, performa data menurun ketika diakses oleh mesin komputasi. Konfigurasikan aturan siklus hidup sesuai dengan kebutuhan bisnis Anda.
Setelah mengaktifkan sakelar Penjadwalan Eksekusi untuk tugas aturan siklus hidup, tugas tersebut dieksekusi secara berkala setiap malam dan mulai berlaku sebelum pukul 08:00 keesokan harinya. Untuk tugas yang dieksekusi secara manual, tugas langsung berlaku setelah eksekusi.
Petunjuk
Prasyarat
OSS telah diaktifkan. Jika belum, buka Konsol OSS untuk mengaktifkannya.
Izin pada basis data dan tabel untuk manajemen siklus hidup tunduk pada kontrol izin data yang diberlakukan oleh DLF. Akibatnya, Anda hanya dapat mengonfigurasi aturan siklus hidup untuk basis data dan tabel dalam izin yang diberikan kepada Anda.
Membuat aturan siklus hidup
Ikuti langkah-langkah berikut untuk membuat aturan siklus hidup:
Masuk ke Konsol Data Lake Formation.
Di panel navigasi di sebelah kiri, pilih Lake Management > Lifecycle Management.
Klik Create Rule untuk mengonfigurasi aturan.
Isi informasi dasar: Name, Description, Catalog List, Resource Type.
Resource Type dapat diatur ke Basis Data atau Tabel, sesuai dengan metadatabase atau metadata tabel untuk konfigurasi aturan siklus hidup.
Pilih tipe aturan. DLF mendukung empat tipe aturan berikut:
Waktu Akses Terakhir Data: Tentukan siklus hidup berdasarkan waktu saat data terakhir diakses.
Nilai Partisi Berdasarkan Waktu: Tentukan siklus hidup berdasarkan nilai partisi. Cocok untuk tabel dengan format waktu di level-1 partisi.
Waktu Pembaruan Terakhir Partisi/Tabel: Tentukan siklus hidup berdasarkan waktu saat partisi atau tabel dimodifikasi.
Waktu Pembuatan Partisi/Tabel: Tentukan siklus hidup berdasarkan waktu saat partisi atau tabel dibuat.
Pilih interval saat kelas penyimpanan data dikonversi menjadi IA, Arsip, atau Penyimpanan Arsip Dingin.
Konfigurasikan mekanisme eksekusi.
Aktifkan sakelar Execution Scheduling jika ingin DLF mengeksekusi aturan secara otomatis setiap hari. Jika tidak, klik Manual Execution di halaman Manajemen Siklus Hidup untuk mengeksekusi aturan secara manual. Eksekusi periodik selesai sebelum pukul 08:00 setiap hari.
Klik Next untuk memilih metadatabase atau metadata tabel yang akan diarsipkan.
Klik Add Database Resource, pilih sumber daya untuk diikat, dan klik Add.
Setelah menambahkan sumber daya, klik OK untuk melihat hasil pengikatan sumber daya.
Jika pengikatan berhasil, Anda dapat melihat jumlah sumber daya yang berhasil diikat. Jika gagal, Anda dapat melihat alasan kegagalannya.
CatatanJika parameter Tipe Sumber Daya diatur ke Basis Data, Anda dapat menambahkan sumber daya basis data. Jika diatur ke Tabel, Anda dapat menambahkan sumber daya tabel.
Prioritas aturan tabel lebih tinggi daripada aturan basis data. Jika sebuah tabel telah dikaitkan dengan aturan basis data, aturan basis data asli yang terkait dengan tabel diganti.
Setiap basis data atau tabel hanya dapat dikaitkan dengan satu aturan siklus hidup pada satu waktu.
Setiap aturan siklus hidup dapat dikaitkan dengan maksimal 1.000 sumber daya.
Anda dapat mengonfigurasi aturan siklus hidup dan kemudian mengaitkan sumber daya dengan aturan tersebut. Setelah mengaitkan sumber daya, klik Simpan.
Edit aturan siklus hidup
Untuk memodifikasi aturan siklus hidup, temukan aturan yang diinginkan dan klik Edit di kolom Actions di halaman Lifecycle Management.
Setelah aturan dimodifikasi, modifikasi mulai berlaku keesokan harinya jika Anda mengaktifkan sakelar Penjadwalan Eksekusi.
Setelah aturan yang dimodifikasi dieksekusi kembali, semua sumber daya yang terkait terpengaruh:
Jika kelas penyimpanan data diatur ke IA, Arsip, atau Penyimpanan Arsip Dingin, kelas penyimpanan saat ini tetap tidak berubah.
Jika kelas penyimpanan data tidak diatur ke IA, Arsip, atau Penyimpanan Arsip Dingin, aturan siklus hidup yang dimodifikasi mulai berlaku.
Lihat aturan siklus hidup
Di panel navigasi di sebelah kiri, pilih Lake Management > Lifecycle Management.
Pilih aturan dan klik ID aturan untuk melihat informasi saat ini dari aturan tersebut.
Basic Information: Di tab Basic Information, Anda dapat memeriksa informasi dasar, detail aturan, serta mekanisme eksekusi.
Resource Information: Di tab Resource Information, Anda dapat memeriksa informasi terkait database atau tabel.
Execution History: Informasi historis eksekusi manual dan terjadwal dari aturan.
Hapus aturan siklus hidup
Di panel navigasi di sebelah kiri, pilih Lake Management > Lifecycle Management.
Temukan aturan yang ingin dihapus, klik Delete di kolom Actions, dan klik Delete di kotak pop-up.
Setelah menghapus aturan siklus hidup, aturan tersebut tidak dapat dieksekusi baik secara manual maupun otomatis.
Data yang sebelumnya terpengaruh oleh aturan akan tetap dalam kondisi saat ini.
Eksekusi manual aturan siklus hidup
Di panel navigasi di sebelah kiri, pilih Lake Management > Lifecycle Management.
Temukan aturan yang ingin dieksekusi secara manual, klik Manual Execution di kolom Actions, baca prompt pop-up dengan cermat, dan klik OK untuk memulai tugas.
Operasi yang dieksekusi secara manual akan dieksekusi segera dan dapat memengaruhi akses bisnis. Evaluasi risiko dengan akurat sebelum eksekusi.
Lihat catatan eksekusi tugas
Di panel navigasi di sebelah kiri, pilih Lake Management > Lifecycle Management.
Klik tab Execution History untuk melihat semua tugas arsip eksekusi historis dan log eksekusi.
Klik nama tugas untuk melihat informasi eksekusi tugas dan log eksekusi.
Pulihkan tabel
Di panel navigasi di sebelah kiri, pilih Metadata > Metadata.
Klik tab Table dan klik nama tabel.
Klik tab Storage Rule. Produk DLF mendukung pemulihan tabel. Klik Restore Table untuk mengonversi kelas penyimpanan menjadi Penyimpanan Standar.
Jika ingin mengonversi data dingin menjadi data panas, lihat topik-topik berikut: