CoreDNS merupakan plug-in default untuk penemuan layanan berbasis DNS di kluster Container Service for Kubernetes (ACK). Topik ini menjelaskan cara melihat dasbor CoreDNS, menginterpretasikan setiap metrik, serta memecahkan masalah DNS umum menggunakan dasbor tersebut.
Prasyarat
Sebelum memulai, pastikan Anda telah:
Mengaktifkan Application Real-Time Monitoring Service (ARMS)
Menginstal komponen ack-arms-prometheus. Untuk informasi selengkapnya, lihat Manage components.
Lihat dasbor CoreDNS
Masuk ke Konsol ACK. Di panel navigasi kiri, klik Clusters.
Pada halaman Clusters, temukan kluster yang diinginkan lalu klik namanya. Di panel kiri, pilih Operations > Prometheus Monitoring.
Pada halaman Prometheus Monitoring, klik tab Network Monitoring, lalu klik tab CoreDNS untuk melihat dasbor.

Metrik dasbor
Dasbor CoreDNS dibangun berdasarkan kueri Prometheus Query Language (PromQL) dan menampilkan throughput permintaan, perilaku respons, serta performa cache. Metrik-metrik tersebut dikelompokkan ke dalam tiga kategori.
Metrik permintaan
| Metric | Unit | Description |
|---|---|---|
| Requests (total) | Requests/s | Total permintaan DNS yang diterima oleh CoreDNS per detik. |
| Requests (success rate) | % | Persentase permintaan yang mengembalikan NOERROR atau NXDOMAIN. Kedua kode respons ini dianggap berhasil. |
| Requests (by zone) | Requests/s | Laju permintaan yang dipecah berdasarkan zona DNS. |
| Requests (by qtype) | Requests/s | Laju permintaan yang dipecah berdasarkan jenis kueri DNS (misalnya, A, AAAA, MX). |
| Requests (DO bit) | Requests/s | Laju permintaan untuk kueri yang menyertakan bit DNSSEC OK (DO). |
| Requests (size, udp) | Bytes | Ukuran setiap paket permintaan UDP yang diterima oleh CoreDNS. |
| Requests (size, tcp) | Bytes | Ukuran setiap paket permintaan TCP yang diterima oleh CoreDNS. |
Metrik respons
| Metric | Unit | Description |
|---|---|---|
| Responses (by rcode) | Requests/s | Laju respons yang dipecah berdasarkan kode respons DNS (misalnya, NOERROR, NXDOMAIN, SERVFAIL). |
| Responses (duration) | Seconds | Latensi respons pada persentil ke-99, ke-90, dan ke-50. |
| Responses (size, udp) | Bytes | Ukuran paket respons UDP pada persentil ke-99 dan ke-50. |
| Responses (size, tcp) | Bytes | Ukuran paket respons TCP pada persentil ke-99 dan ke-50. |
Metrik cache
| Metric | Unit | Description |
|---|---|---|
| Cache (size) | N/A | Jumlah total entri dalam cache CoreDNS. |
| Cache (hitrate) | % | Tingkat hit cache. |
Anomali umum
Tabel berikut menjelaskan anomali CoreDNS umum berdasarkan tingkat keparahan, beserta penyebab yang mungkin terjadi dan tindakan yang direkomendasikan.
| Severity | Anomaly | Where to look | Likely causes | What to do |
|---|---|---|---|---|
| Critical | High SERVFAIL response rate | Responses (by rcode) | Server DNS upstream tidak dapat dijangkau | Periksa log CoreDNS untuk mengidentifikasi nama domain yang memicu respons SERVFAIL, lalu pecahkan masalah konektivitas DNS upstream. Lihat Collect and analyze CoreDNS logs. |
| Critical | High response latency | Responses (duration) | Banyak aplikasi melakukan resolusi nama domain eksternal | Periksa latensi persentil ke-99 pada grafik Responses (duration) untuk mengidentifikasi sumber latensi. |
| Warning | Sharp increase in request rate | Requests (total) | Lonjakan traffic aplikasi; aplikasi salah konfigurasi yang membuat kueri DNS berlebihan | Periksa nama domain yang paling sering diakses dalam log CoreDNS untuk menentukan apakah peningkatan tersebut diharapkan. Jika iya, skala CoreDNS dengan menambahkan lebih banyak Pod — lihat Ensure the high availability of CoreDNS — dan aktifkan NodeLocal DNSCache untuk mengurangi beban traffic DNS. Untuk instruksi analisis log, lihat Collect and analyze CoreDNS logs. |
Metrik untuk Prometheus yang dikelola sendiri
Jika ARMS tidak diaktifkan, pantau CoreDNS menggunakan instans Prometheus yang dikelola sendiri. Tabel berikut mencantumkan metrik CoreDNS yang tersedia di CoreDNS 1.9.3. Untuk daftar lengkapnya, lihat dokumentasi metrik CoreDNS.
| Metric | Data type | Labels | Description |
|---|---|---|---|
requests_total | Counter | server, zone, proto, family, type | Total jumlah kueri DNS. |
request_duration_seconds | Histogram | server, zone | Waktu respons kueri DNS. |
request_size_bytes | Histogram | server, zone, proto | Ukuran paket kueri DNS. Ambang batas bucket histogram (byte): 0, 100, 200, 300, 400, 511, 1023, 2047, 4095, 8291, 16000, 32000, 48000, 64000. |
do_requests_total | Counter | server, zone | Total jumlah kueri DNS untuk kueri yang menyertakan bit DO. |
response_size_bytes | Histogram | server, zone, proto | Ukuran paket respons DNS. Ambang batas bucket histogram (byte): 0, 100, 200, 300, 400, 511, 1023, 2047, 4095, 8291, 16000, 32000, 48000, 64000. |
responses_total | Counter | server, zone, rcode, plugin | Total jumlah respons DNS. |
panics_total | Counter | — | Jumlah total panic CoreDNS. |
plugin_enabled | Gauge | server, zone, name | Apakah suatu plugin diaktifkan. |
https_responses_total | Counter | server, status | Total jumlah kueri DNS-over-HTTPS (DoH). |