Topik ini menjelaskan tinjauan data tabel.
Deskripsi
Data Lake Formation (DLF) menyediakan metrik rinci untuk setiap tabel berdasarkan statistik metadata dan data yang tersimpan. Metrik tersebut mencakup ukuran penyimpanan tabel, jumlah total file di tabel, waktu pembaruan DDL terakhir, waktu pembaruan data terakhir, jumlah kunjungan ke tabel, jumlah partisi, jumlah file terpartisi, serta waktu pembaruan partisi terakhir. Jika fitur manajemen danau data telah diaktifkan, Anda juga dapat menanyakan statistik distribusi kelas penyimpanan dan distribusi ukuran file.
Skenario
Seiring dengan berkembangnya bisnis, jika Anda ingin menganalisis ukuran data yang disimpan di setiap tabel untuk optimasi penyimpanan yang lebih spesifik, Anda dapat menggunakan metrik Ukuran.
Saat volume data meningkat, jika Anda ingin menemukan dan mengarsipkan tabel yang jarang diakses untuk menghemat biaya penyimpanan, Anda dapat menggunakan metrik Kunjungan File.
Jika Anda ingin menemukan tabel yang tidak diperbarui untuk waktu lama dan kemudian membersihkan atau mengoptimalkannya, Anda dapat menggunakan metrik Data Terakhir Diperbarui Pada.
Metrik
Metrik | Deskripsi | Sumber |
Ukuran | Ukuran semua data yang disimpan dalam sebuah tabel. | Jika lokasinya di-hosting di DLF, nilai metrik ini berasal dari statistik Object Storage Service (OSS). Jika tidak, nilai metrik ini berasal dari statistik E-MapReduce (EMR). |
Total Jumlah Tabel | Jumlah total file yang disimpan dalam sebuah tabel. | Jika lokasinya di-hosting di DLF, nilai metrik ini berasal dari statistik OSS. Jika tidak, nilai metrik ini berasal dari statistik EMR. |
Jumlah Partisi | Jumlah total partisi dalam sebuah tabel. | Nilai metrik ini berasal dari metadata. |
Pembaruan DDL Terakhir | Waktu ketika tabel terakhir diperbarui menggunakan pernyataan bahasa deskripsi data (DDL). | Jika lokasinya di-hosting di DLF, nilai metrik ini berasal dari statistik OSS. |
Data Terakhir Diperbarui | Waktu ketika data terakhir diperbarui. | Jika lokasinya di-hosting di DLF, nilai metrik ini berasal dari statistik OSS. |
Kunjungan File dalam Sehari Terakhir | Jumlah kunjungan ke sebuah tabel pada hari terakhir. | Data ini berasal dari berbagai mesin komputasi. Saat ini, data ini hanya berasal dari mesin EMR. Kondisi yang berlaku:
|
Kunjungan File dalam Tujuh Hari Terakhir | Jumlah kunjungan ke sebuah tabel dalam tujuh hari terakhir. | |
Kunjungan File dalam 30 Hari Terakhir | Jumlah kunjungan ke sebuah tabel dalam 30 hari terakhir. |
Prosedur
Masuk ke Konsol DLF.
Di panel navigasi di sebelah kiri, pilih .
Klik tab Table, konfigurasikan parameter Catalog List dan Database Name, lalu masukkan nama tabel yang ingin Anda cari.
Klik nama tabel untuk masuk ke halaman detail tabel.
Klik tab Data Overview.