Layanan Log Sederhana menyediakan fitur diagnostik untuk mengidentifikasi kesalahan pengumpulan, seperti kegagalan parsing regex, jalur file salah, atau lalu lintas yang melebihi kapasitas shard. Anda juga dapat menggunakan aturan peringatan bawaan untuk memantau collector secara real time dan menerima notifikasi melalui DingTalk atau saluran lainnya.
Prasyarat
-
Collector telah dikonfigurasikan untuk mengumpulkan log. Kumpulkan log teks dari host.
-
Diagnosis masalah waktu proses
Tersedia dua mode diagnostik:
-
Advanced Diagnostics (Direkomendasikan): Menampilkan dasbor exception dengan exception terkait collector dan mendukung kueri dalam rentang waktu lebih panjang.
-
Basic Diagnostics: Menampilkan exception pengumpulan dari satu jam terakhir.
Kasus penggunaan
-
Status collector tidak normal: kegagalan heartbeat, proses aktif tidak berjalan, atau kesalahan sertifikat SSL.
-
Kegagalan pengumpulan log: log tidak terkumpul, latensi tinggi, atau kesalahan parsing seperti ketidaksesuaian regex.
-
Kesalahan konfigurasi: jalur file salah, IP kelompok mesin tidak cocok, atau masalah izin cross-account.
-
Hambatan kinerja: laju pengumpulan mendekati atau melebihi batas default (20 MB/s), menyebabkan log terbuang.
-
Masalah pengumpulan log kontainer: restart Pod yang sering atau rotasi log cepat sehingga pengumpulan tidak lengkap.
-
Masalah plugin dan pengumpulan kustom: kegagalan plugin kustom (misalnya, parsing Grok) atau kesalahan pengumpulan dari sumber data HTTP.
-
Masalah keandalan data: kehilangan log akibat LoongCollector tidak aktif atau rotasi log terlalu cepat.
Prosedur
-
Masuk ke Konsol Simple Log Service. Di daftar proyek, klik proyek tujuan.
-
Klik
Log Storage. Di daftar LogStore, arahkan kursor ke LogStore target dan klik ikon
. -
Klik Advanced Diagnostics atau Basic Diagnostics untuk melihat informasi diagnostik.
-
Lihat hasil diagnostik.
Basic diagnostics
Panel Log Collection Error mencantumkan semua kesalahan pengumpulan LoongCollector untuk LogStore tersebut. Klik kode kesalahan untuk melihat detailnya. Kesalahan pengumpulan data umum.
Advanced diagnostics
Halaman LoongCollector/Logtail Exception Monitoring menampilkan metrik seperti Active Collection Agent Count dan Complete Error Information. Untuk detail dasbor, lihat Lihat laporan data. Untuk kode kesalahan, lihat Kesalahan pengumpulan data umum.
-
Setelah menyelesaikan masalah, periksa apakah ada kesalahan baru. Kesalahan historis tetap terlihat hingga masa berlakunya habis — abaikan kesalahan tersebut dan pastikan tidak ada kesalahan baru yang muncul. LoongCollector melaporkan kesalahan setiap 10 menit.
Untuk melihat log lengkap yang terbuang akibat kegagalan parsing, periksa log waktu proses LoongCollector:
Untuk host: file
/usr/local/ilogtail/loongcollector.LOGdi server.Untuk kontainer: file
/usr/local/ilogtail/loongcollector.LOGdi dalam kontainer.
Pantau status waktu proses
SLS menyediakan kebijakan peringatan bawaan untuk memantau collector secara real time:
-
Pantau heartbeat collector
Kueri LogStore
internal-diagnostic_loguntuk log dengan__topic__:logtail_statusguna menghitung jumlah mesin dengan heartbeat normal. Konfigurasikan aturan peringatan yang dipicu saat jumlah heartbeat turun di bawah nilai yang diharapkan, sehingga mengidentifikasi mesin yang mati atau mengalami masalah jaringan. -
Atur peringatan untuk exception pengumpulan
Jalankan kueri
__topic__: logtail_alarmuntuk menganalisis exception dalam 15 menit terakhir, seperti file tidak dapat dibaca, izin tidak mencukupi, dan kegagalan parsing. Hal ini membantu Anda mengidentifikasi dan memperbaiki masalah konfigurasi guna mencegah kehilangan log. -
Terima peringatan untuk hambatan kinerja
Gunakan dasbor pemantauan exception Logtail untuk melihat jumlah LoongCollector aktif, riwayat restart, dan pesan kesalahan. Pantau status waktu proses dan penggunaan sumber daya (CPU, memori) untuk mengidentifikasi hambatan kinerja atau restart tidak normal.
-
Pantau pengumpulan log terpusat
Gunakan dasbor pemantauan pengumpulan file LoongCollector untuk melacak jumlah file yang dikumpulkan, latensi rata-rata, dan laju kegagalan parsing. Kelola status pengumpulan log secara terpusat dalam skenario multi-akun atau multi-Wilayah.
Prosedur
-
Konfigurasikan kebijakan tindakan untuk menentukan cara pengiriman notifikasi saat status peringatan berubah.
-
Masuk ke Konsol Simple Log Service.
-
Di daftar proyek, klik proyek tempat Anda mengaktifkan log penting.
-
Di panel navigasi sebelah kiri, klik
Alerts. Pada halaman Alert Center, pilih . -
Di daftar kebijakan tindakan, temukan kebijakan tindakan
sls.app.logtail.builtindan klik Modify pada kolom Actions. -
Pada kotak dialog Edit Action Policy, pilih dan konfigurasikan saluran notifikasi sesuai kebutuhan Anda. Saluran notifikasi. Lalu, klik Confirm.
-
-
Buat aturan peringatan yang dipicu saat status waktu proses LoongCollector mencapai ambang batas tertentu.
-
Pada halaman Alert Center, klik tab Alert Rules, lalu klik ikon
di samping Create Alert. -
Klik Create from Template. Di panel Create from Template, klik Logtail Fault Monitor di bawah All Templates, lalu klik kartu target.
-
Di panel Create Alert, tinjau konfigurasinya. Aturan peringatan bawaan mencakup parameter yang telah ditetapkan. Klik OK. Buat aturan peringatan.
-