All Products
Search
Document Center

Data Lake Formation:Tinjauan data tabel data

Last Updated:Jul 02, 2025

Topik ini menjelaskan tinjauan data tabel.

Deskripsi

Data Lake Formation (DLF) menyediakan metrik rinci untuk setiap tabel berdasarkan statistik metadata dan data yang tersimpan. Metrik tersebut mencakup ukuran penyimpanan tabel, jumlah total file di tabel, waktu pembaruan DDL terakhir, waktu pembaruan data terakhir, jumlah kunjungan ke tabel, jumlah partisi, jumlah file terpartisi, serta waktu pembaruan partisi terakhir. Jika fitur manajemen danau data telah diaktifkan, Anda juga dapat menanyakan statistik distribusi kelas penyimpanan dan distribusi ukuran file.

Skenario

  • Seiring dengan berkembangnya bisnis, jika Anda ingin menganalisis ukuran data yang disimpan di setiap tabel untuk optimasi penyimpanan yang lebih spesifik, Anda dapat menggunakan metrik Ukuran.

  • Saat volume data meningkat, jika Anda ingin menemukan dan mengarsipkan tabel yang jarang diakses untuk menghemat biaya penyimpanan, Anda dapat menggunakan metrik Kunjungan File.

  • Jika Anda ingin menemukan tabel yang tidak diperbarui untuk waktu lama dan kemudian membersihkan atau mengoptimalkannya, Anda dapat menggunakan metrik Data Terakhir Diperbarui Pada.

Metrik

Metrik

Deskripsi

Sumber

Ukuran

Ukuran semua data yang disimpan dalam sebuah tabel.

Jika lokasinya di-hosting di DLF, nilai metrik ini berasal dari statistik Object Storage Service (OSS). Jika tidak, nilai metrik ini berasal dari statistik E-MapReduce (EMR).

Total Jumlah Tabel

Jumlah total file yang disimpan dalam sebuah tabel.

Jika lokasinya di-hosting di DLF, nilai metrik ini berasal dari statistik OSS. Jika tidak, nilai metrik ini berasal dari statistik EMR.

Jumlah Partisi

Jumlah total partisi dalam sebuah tabel.

Nilai metrik ini berasal dari metadata.

Pembaruan DDL Terakhir

Waktu ketika tabel terakhir diperbarui menggunakan pernyataan bahasa deskripsi data (DDL).

Jika lokasinya di-hosting di DLF, nilai metrik ini berasal dari statistik OSS.

Data Terakhir Diperbarui

Waktu ketika data terakhir diperbarui.

Jika lokasinya di-hosting di DLF, nilai metrik ini berasal dari statistik OSS.

Kunjungan File dalam Sehari Terakhir

Jumlah kunjungan ke sebuah tabel pada hari terakhir.

Data ini berasal dari berbagai mesin komputasi. Saat ini, data ini hanya berasal dari mesin EMR. Kondisi yang berlaku:

  • Versi EMR harus V3.45.1 atau lebih baru atau V5.11.1 atau lebih baru. Untuk versi EMR lainnya, Anda harus memperbarui komponen EMRHOOK di gateway EMR. Untuk informasi lebih lanjut, lihat Perbarui komponen EMR-HOOK di gateway EMR.

  • Hanya mesin komputasi Spark dan Hive yang didukung.

  • Nilai metrik ini diperbarui pada pukul 00:00 setiap hari. Ada penundaan sekitar 10 menit selama pembaruan.

Kunjungan File dalam Tujuh Hari Terakhir

Jumlah kunjungan ke sebuah tabel dalam tujuh hari terakhir.

Kunjungan File dalam 30 Hari Terakhir

Jumlah kunjungan ke sebuah tabel dalam 30 hari terakhir.

Prosedur

  1. Masuk ke Konsol DLF.

  2. Di panel navigasi di sebelah kiri, pilih Metadata > Metadata.

  3. Klik tab Table, konfigurasikan parameter Catalog List dan Database Name, lalu masukkan nama tabel yang ingin Anda cari.

  4. Klik nama tabel untuk masuk ke halaman detail tabel.

  5. Klik tab Data Overview.