All Products
Search
Document Center

Simple Log Service:Diagnosis dan pantau status waktu proses LoongCollector

Last Updated:Jun 03, 2026

Layanan Log Sederhana menyediakan fitur diagnostik untuk mengidentifikasi kesalahan pengumpulan, seperti kegagalan parsing regex, jalur file salah, atau lalu lintas yang melebihi kapasitas shard. Anda juga dapat menggunakan aturan peringatan bawaan untuk memantau collector secara real time dan menerima notifikasi melalui DingTalk atau saluran lainnya.

Prasyarat

  • Collector telah dikonfigurasikan untuk mengumpulkan log. Kumpulkan log teks dari host.

  • Aktifkan log penting untuk proyek tujuan

    Aktifkan log layanan yang diperlukan. Aktifkan log layanan.

    1. Masuk ke Konsol Simple Log Service. Di daftar proyek, klik proyek tujuan. Pada halaman detail proyek, klik tab Service Log, lalu klik Enable Service Logs.

    2. Pada panel Enable Detailed Logs, pilih Important Logs dan Job Operational Logs, lalu klik OK.

      • Proyek bernama log-service-{user-id}-{region} dibuat secara otomatis di Wilayah tujuan.

      • Ingesti, penyimpanan, kueri, dan analisis log penting serta log operasional pekerjaan tidak dikenai biaya. Transformasi data dan pengiriman data ditagih berdasarkan skema pay-as-you-go.

Diagnosis masalah waktu proses

Tersedia dua mode diagnostik:

  • Advanced Diagnostics (Direkomendasikan): Menampilkan dasbor exception dengan exception terkait collector dan mendukung kueri dalam rentang waktu lebih panjang.

  • Basic Diagnostics: Menampilkan exception pengumpulan dari satu jam terakhir.

Kasus penggunaan

  • Status collector tidak normal: kegagalan heartbeat, proses aktif tidak berjalan, atau kesalahan sertifikat SSL.

  • Kegagalan pengumpulan log: log tidak terkumpul, latensi tinggi, atau kesalahan parsing seperti ketidaksesuaian regex.

  • Kesalahan konfigurasi: jalur file salah, IP kelompok mesin tidak cocok, atau masalah izin cross-account.

  • Hambatan kinerja: laju pengumpulan mendekati atau melebihi batas default (20 MB/s), menyebabkan log terbuang.

  • Masalah pengumpulan log kontainer: restart Pod yang sering atau rotasi log cepat sehingga pengumpulan tidak lengkap.

  • Masalah plugin dan pengumpulan kustom: kegagalan plugin kustom (misalnya, parsing Grok) atau kesalahan pengumpulan dari sumber data HTTP.

  • Masalah keandalan data: kehilangan log akibat LoongCollector tidak aktif atau rotasi log terlalu cepat.

Prosedur

  1. Masuk ke Konsol Simple Log Service. Di daftar proyek, klik proyek tujuan.

  2. Klik imageLog Storage. Di daftar LogStore, arahkan kursor ke LogStore target dan klik ikon Logtail configuration management.

  3. Klik Advanced Diagnostics atau Basic Diagnostics untuk melihat informasi diagnostik.

  4. Lihat hasil diagnostik.

    Basic diagnostics

    Panel Log Collection Error mencantumkan semua kesalahan pengumpulan LoongCollector untuk LogStore tersebut. Klik kode kesalahan untuk melihat detailnya. Kesalahan pengumpulan data umum.

    Advanced diagnostics

    Halaman LoongCollector/Logtail Exception Monitoring menampilkan metrik seperti Active Collection Agent Count dan Complete Error Information. Untuk detail dasbor, lihat Lihat laporan data. Untuk kode kesalahan, lihat Kesalahan pengumpulan data umum.

  5. Setelah menyelesaikan masalah, periksa apakah ada kesalahan baru. Kesalahan historis tetap terlihat hingga masa berlakunya habis — abaikan kesalahan tersebut dan pastikan tidak ada kesalahan baru yang muncul. LoongCollector melaporkan kesalahan setiap 10 menit.

    Untuk melihat log lengkap yang terbuang akibat kegagalan parsing, periksa log waktu proses LoongCollector:
    Untuk host: file /usr/local/ilogtail/loongcollector.LOG di server.
    Untuk kontainer: file /usr/local/ilogtail/loongcollector.LOG di dalam kontainer.

Pantau status waktu proses

SLS menyediakan kebijakan peringatan bawaan untuk memantau collector secara real time:

  • Pantau heartbeat collector

    Kueri LogStore internal-diagnostic_log untuk log dengan __topic__:logtail_status guna menghitung jumlah mesin dengan heartbeat normal. Konfigurasikan aturan peringatan yang dipicu saat jumlah heartbeat turun di bawah nilai yang diharapkan, sehingga mengidentifikasi mesin yang mati atau mengalami masalah jaringan.

  • Atur peringatan untuk exception pengumpulan

    Jalankan kueri __topic__: logtail_alarm untuk menganalisis exception dalam 15 menit terakhir, seperti file tidak dapat dibaca, izin tidak mencukupi, dan kegagalan parsing. Hal ini membantu Anda mengidentifikasi dan memperbaiki masalah konfigurasi guna mencegah kehilangan log.

  • Terima peringatan untuk hambatan kinerja

    Gunakan dasbor pemantauan exception Logtail untuk melihat jumlah LoongCollector aktif, riwayat restart, dan pesan kesalahan. Pantau status waktu proses dan penggunaan sumber daya (CPU, memori) untuk mengidentifikasi hambatan kinerja atau restart tidak normal.

  • Pantau pengumpulan log terpusat

    Gunakan dasbor pemantauan pengumpulan file LoongCollector untuk melacak jumlah file yang dikumpulkan, latensi rata-rata, dan laju kegagalan parsing. Kelola status pengumpulan log secara terpusat dalam skenario multi-akun atau multi-Wilayah.

Prosedur

  1. Konfigurasikan kebijakan tindakan untuk menentukan cara pengiriman notifikasi saat status peringatan berubah.

    1. Masuk ke Konsol Simple Log Service.

    2. Di daftar proyek, klik proyek tempat Anda mengaktifkan log penting.

    3. Di panel navigasi sebelah kiri, klik imageAlerts. Pada halaman Alert Center, pilih Notification Management > Action Policy.

    4. Di daftar kebijakan tindakan, temukan kebijakan tindakan sls.app.logtail.builtin dan klik Modify pada kolom Actions.

    5. Pada kotak dialog Edit Action Policy, pilih dan konfigurasikan saluran notifikasi sesuai kebutuhan Anda. Saluran notifikasi. Lalu, klik Confirm.

  2. Buat aturan peringatan yang dipicu saat status waktu proses LoongCollector mencapai ambang batas tertentu.

    1. Pada halaman Alert Center, klik tab Alert Rules, lalu klik ikon image di samping Create Alert.

    2. Klik Create from Template. Di panel Create from Template, klik Logtail Fault Monitor di bawah All Templates, lalu klik kartu target.

    3. Di panel Create Alert, tinjau konfigurasinya. Aturan peringatan bawaan mencakup parameter yang telah ditetapkan. Klik OK. Buat aturan peringatan.