All Products
Search
Document Center

E-MapReduce:Item pemeriksaan dan metrik utama Hive

Last Updated:Mar 26, 2026

Dokumen ini mencakup item pemeriksaan kesehatan dan metrik pemantauan utama untuk HiveServer dan HiveMetaStore di kluster E-MapReduce (EMR).

Tingkat keparahan

LevelMaknaAksi yang diperlukan
P0 (Critical)Layanan Hive tidak tersediaSegera lakukan pemecahan masalah
P1 (High)Layanan Hive tersedia tetapi kinerjanya menurun atau workload meningkatSegera lakukan pemecahan masalah

Item pemeriksaan HiveServer

inspection_hive_server_availability

Memeriksa ketersediaan HiveServer dengan menjalankan serangkaian pernyataan validasi.

Pesan errorPenyebabAksi
hive server availability permission check is failedPengguna tidak memiliki izin untuk menjalankan pernyataan pemeriksaan HiveServer (misalnya, izin tersebut tidak sengaja dicabut)Kembalikan izin yang diperlukan
Hive server availability is failedHiveServer mengalami anomaliPeriksa proses dan log HiveServer

inspection_hive_server_ha

Memeriksa status high availability (HA) seluruh komponen HiveServer.

Pesan hasilStatusTingkat keparahanAksi
Hive server HA status is OKSemua komponen HiveServer normalTidak perlu tindakan
One or more Hive server failedSatu atau lebih komponen HiveServer mengalami anomaliP1Periksa proses dan log HiveServer
All Hive server are failedSemua komponen HiveServer mengalami anomaliP0Periksa proses dan log HiveServer

inspection_hive_server_port

Memeriksa keberadaan port 10000 HiveServer pada host. Jika port tersebut tidak tersedia, proses HiveServer mengalami anomali. Periksa proses dan log HiveServer.

inspection_hive_server_gc

Memeriksa metrik memory.heap.usage pada Java Virtual Machine (JVM) untuk HiveServer.

Penggunaan memori heap JVMTingkat keparahanAksi
≥ 95%P0Segera tingkatkan memori HiveServer. Jika tidak, HiveServer mungkin restart dan job yang sedang berjalan dapat gagal.
≥ 90%P1Segera tingkatkan memori HiveServer. Jika tidak, HiveServer mungkin restart dan job yang sedang berjalan dapat gagal.
< 90%NormalSesuaikan memori berdasarkan kebutuhan bisnis jika diperlukan.

inspection_hive_server_restart

Memantau frekuensi restart HiveServer dalam jendela waktu lima menit.

Perilaku restartTingkat keparahanAksi
Restart berulang dalam lima menitP0Segera periksa proses dan log HiveServer
Satu kali restart dalam lima menitP1Segera periksa proses dan log HiveServer
Tidak ada restartNormalTidak perlu tindakan

Item pemeriksaan HiveMetaStore

inspection_hive_metastore_ha

Memeriksa status high availability (HA) seluruh komponen HiveMetaStore.

Pesan hasilStatusTingkat keparahanTindakan
Hive metastore HA status is OKSemua komponen HiveMetaStore normalTidak perlu tindakan
One or more metastore failedSatu atau lebih komponen HiveMetaStore mengalami anomaliP1Segera periksa proses dan log HiveMetaStore
All Hive metastore are failedSemua komponen HiveMetaStore mengalami anomaliP0Segera periksa proses dan log HiveMetaStore

inspection_hive_metastore_port

Memeriksa keberadaan port 9083 HiveMetaStore pada host. Jika port tersebut tidak tersedia, proses HiveMetaStore mengalami anomali. Segera periksa proses dan log HiveMetaStore.

inspection_hive_metastore_gc

Memeriksa metrik memory.heap.usage pada JVM untuk HiveMetaStore.

Penggunaan memori heap JVMTingkat keparahanAksi
≥ 95%P0Segera tingkatkan memori HiveMetaStore
≥ 90%P1Segera tingkatkan memori HiveMetaStore
< 90%NormalSesuaikan memori berdasarkan kebutuhan bisnis jika diperlukan.

inspection_hive_metastore_restart

Memantau frekuensi restart HiveMetaStore dalam jendela waktu lima menit.

Perilaku restartTingkat keparahanAksi
Restart berulang dalam lima menitP0Segera periksa proses dan log HiveMetaStore
Satu kali restart dalam lima menitP1Segera periksa proses dan log HiveMetaStore
Tidak ada restartNormalTidak perlu tindakan

Metrik utama HiveServer2

Lihat metrik ini pada tab Monitoring kluster Anda di Konsol EMR.

KategoriMetrikYang perlu diperhatikan
SessionOpenSessions, ActiveSessionsLonjakan jumlah session terbuka atau aktif saat terjadi error dapat mengindikasikan tekanan memori. Sesuaikan memori berdasarkan kebutuhan bisnis Anda.
JVMJVM MemHeapMax, metrik garbage collection (GC)Tinjau metrik JVM dalam jendela waktu saat error terjadi untuk menentukan apakah perlu menambah memori.
Tasktask PENDING, ActiveRunTasksCalls, metrik TasksCountJumlah task pending yang besar dapat mengindikasikan memori HiveServer tidak mencukupi, kontensi antrian sumber daya YARN, atau job besar yang mengonsumsi sebagian besar sumber daya yang tersedia. Misalnya, task pending adalah task yang progresnya ditangguhkan.

Metrik utama HiveMetaStore

Lihat metrik ini pada tab Monitoring kluster Anda di Konsol EMR.

KategoriMetrikYang perlu diperhatikan
JVMJVM MemHeapMax, metrik GCTinjau metrik JVM dalam jendela waktu saat error terjadi untuk menentukan apakah perlu menambah memori.
Operasi metadataMetrik terkait GetTable, Waktu CreateTablePeningkatan stabil pada metrik ini atau adanya exception mengindikasikan bottleneck memori pada HiveMetaStore atau masalah kinerja pada database backend. Tingkatkan memori HiveMetaStore berdasarkan ukuran memori saat ini, atau upgrade spesifikasi database backend berdasarkan waktu yang dibutuhkan untuk menjalankan kueri pada database tersebut.