全部产品
Search
文档中心

E-MapReduce:Gunakan JindoTable untuk mengumpulkan statistik frekuensi akses tabel dan partisi

更新时间:Jul 02, 2025

Anda dapat menggunakan JindoTable untuk mengumpulkan statistik frekuensi akses tabel dan partisi, serta memisahkan data dingin dan panas berdasarkan statistik tersebut. Hal ini membantu mengurangi biaya penyimpanan dan meningkatkan efisiensi penggunaan cache.

Kumpulkan catatan akses

JindoTable memungkinkan Anda mengumpulkan catatan akses tabel Hive. Mesin Spark dan Hive mendukung fitur ini. Data yang dikumpulkan disimpan dalam namespace layanan SmartData dari kluster.

Secara default, pengumpulan catatan akses diaktifkan. Untuk menonaktifkan fitur ini, ikuti langkah-langkah yang dijelaskan di Nonaktifkan Pengumpulan Catatan Akses.

Kueri statistik frekuensi akses

JindoTable memungkinkan Anda menjalankan perintah untuk menanyakan statistik frekuensi akses.
  • Sintaks
    jindo table -accessStat <-d [hari]> <-n [topNums]>

    Atur hari dan topNums ke bilangan bulat positif. Jika hari diatur ke 1, semua catatan akses yang dihasilkan dari pukul 00:00 (waktu lokal) pada hari saat ini hingga waktu saat ini akan diperiksa.

  • Deskripsi

    Perintah ini digunakan untuk menanyakan sejumlah catatan akses tabel atau partisi yang paling sering dikunjungi dalam rentang waktu tertentu.

  • Contoh: Kueri 20 catatan akses tabel atau partisi yang paling sering dikunjungi dalam tujuh hari terakhir.
    jindo table -accessStat -d 7 -n 20

Untuk informasi lebih lanjut tentang cara menggunakan JindoTable, lihat Gunakan JindoTable.

Nonaktifkan pengumpulan catatan akses


  1. Di bilah navigasi atas, pilih wilayah tempat kluster Anda berada dan pilih grup sumber daya sesuai dengan kebutuhan bisnis Anda.
  2. Klik tab Cluster Management.
  3. Di halaman Cluster Management, temukan kluster Anda dan klik Details di kolom Actions.
  4. Ubah parameter.
    Penting Anda dapat melakukan operasi berikut untuk menghapus sebagian nilai parameter terkait.
    • Hive:
      1. Di panel navigasi sisi kiri, pilih Cluster Service > Hive.
      2. Klik tab Configure.
      3. Klik tab hive-site di bagian Service Configuration.
      4. Cari parameter hive.exec.post.hooks di bagian Configuration Filter dan hapus com.aliyun.emr.table.hive.HivePostHook dari nilai parameter.hive-site
    • Spark:
      1. Di panel navigasi sisi kiri, pilih Cluster Service > Spark.
      2. Klik tab Configure.
      3. Klik tab spark-defaults di bagian Service Configuration.
      4. Cari parameter spark.sql.queryExecutionListeners di bagian Configuration Filter dan hapus com.aliyun.emr.table.spark.SparkSQLQueryListener dari nilai parameter.spark_default
  5. Simpan konfigurasi.
    1. Di pojok kanan atas bagian Service Configuration, klik Save.
    2. Di kotak dialog Confirm Changes, tentukan Deskripsi dan aktifkan Auto-update Configuration.
    3. Klik OK.
  6. Mulai ulang layanan terkait.
    • Hive:
      1. Di pojok kanan atas halaman, pilih Actions > Restart HiveServer2.
      2. Di kotak dialog Cluster Activities, tentukan parameter terkait.
      3. Klik OK.
      4. Di pesan Confirm, klik OK.
    • Spark:
      1. Di pojok kanan atas halaman, pilih Actions > Restart ThriftServer.
      2. Di kotak dialog Cluster Activities, tentukan parameter terkait.
      3. Klik OK.
      4. Di pesan Confirm, klik OK.