全部产品
Search
文档中心

Simple Log Service:Memecahkan masalah kesalahan pengumpulan log kontainer

更新时间:Sep 16, 2025

Jika Logtail gagal mengumpulkan log dari kontainer standar atau Kubernetes Anda, ikuti petunjuk dalam topik ini untuk memecahkan masalah dan memeriksa status operasi.

Periksa kesalahan denyut nadi kelompok mesin

Periksa status denyut nadi kelompok mesin untuk menentukan apakah Logtail diinstal dengan benar di lingkungan kontainer Anda.

  1. Periksa status denyut nadi kelompok mesin.

    1. Masuk ke Konsol Simple Log Service.

    2. Pada bagian Proyek, klik yang Anda inginkan.

      image

    3. Di panel navigasi, pilih Resources > Machine Groups.

    4. Dalam daftar kelompok mesin, klik kelompok mesin tujuan.

    5. Pada halaman Machine Group Settings, lihat status kelompok mesin dan catat jumlah node yang status denyut nadinya adalah OK.

  2. Periksa jumlah node pekerja dalam kluster kontainer.

    1. Hubungkan ke kluster.

    2. Jalankan perintah berikut untuk melihat jumlah node pekerja dalam kluster.

      kubectl get node | grep -v master

      Hasil serupa dengan berikut akan dikembalikan.

      NAME                                 STATUS    ROLES     AGE       VERSION
      cn-hangzhou.i-bp17enxc2us3624wexh2   Ready     <none>    238d      v1.10.4
      cn-hangzhou.i-bp1ad2b02jtqd1shi2ut   Ready     <none>    220d      v1.10.4
  3. Bandingkan jumlah node yang status denyut nadinya OK dengan jumlah node pekerja dalam kluster kontainer. Pecahkan masalah berdasarkan hasil perbandingan.

    • Status denyut nadi semua node dalam kelompok mesin adalah Failed.

    • Jumlah node yang status denyut nadinya OK kurang dari jumlah node pekerja dalam kluster.

      • Periksa apakah DaemonSet diterapkan secara manual menggunakan File YAML.

        1. Jalankan perintah berikut. Jika hasilnya dikembalikan, itu berarti bahwa DaemonSet diterapkan secara manual menggunakan File YAML.

          kubectl get po -n kube-system -l k8s-app=logtail
        2. Unduh versi terbaru dari templat DaemonSet.

        3. Konfigurasikan parameter seperti ${your_region_name}, ${your_aliyun_user_id}, dan ${your_machine_group_name} dengan nilai sebenarnya Anda.

        4. Jalankan perintah berikut untuk memperbarui file.

          kubectl apply -f ./logtail-daemonset.yaml
      • Untuk kasus lainnya, ajukan tiket.

Periksa kesalahan pengumpulan log kontainer

Jika Anda tidak dapat menemukan log pada halaman Preview atau halaman kueri Logstore di Konsol Simple Log Service, ini menunjukkan bahwa Simple Log Service belum mengumpulkan log kontainer Anda. Dalam hal ini, periksa status kontainer lalu lakukan pemeriksaan berikut.

Penting
  • Catat hal berikut saat Anda mengumpulkan log dari file kontainer.

    • Logtail hanya mengumpulkan log tambahan. Jika file log tidak diperbarui setelah konfigurasi Logtail diterapkan, Logtail tidak mengumpulkan log dari file tersebut. Untuk informasi lebih lanjut, lihat Membaca file log.

    • Logtail hanya dapat mengumpulkan log dari file yang menggunakan penyimpanan kontainer default atau dipasang ke jalur lokal. Metode penyimpanan lainnya tidak didukung.

  • Setelah log dikumpulkan, Anda harus membuat indeks untuk menanyakan dan menganalisis log dalam Logstore. Untuk informasi lebih lanjut, lihat Buat indeks.

  1. Periksa kesalahan denyut nadi kelompok mesin. Untuk informasi lebih lanjut, lihat Periksa kesalahan denyut nadi kelompok mesin.

  2. Periksa apakah konfigurasi Logtail sudah benar.

    Periksa apakah IncludeLabel, ExcludeLabel, IncludeEnv, ExcludeEnv, dan pengaturan lainnya dalam konfigurasi Logtail memenuhi persyaratan Anda.

    Catatan
    • Label adalah label kontainer, yaitu label dalam output Docker inspect, bukan label Kubernetes.

    • Anda dapat sementara menghapus pengaturan IncludeLabel, ExcludeLabel, IncludeEnv, dan ExcludeEnv untuk memeriksa apakah log dapat dikumpulkan. Jika log dapat dikumpulkan, ini menunjukkan bahwa pengaturan parameter ini salah.

Operasi O&M lainnya

Masuk ke kontainer Logtail

  • Docker Standar

    1. Di host, jalankan perintah berikut untuk menemukan kontainer Logtail.

      docker ps | grep logtail

      Hasil serupa dengan berikut akan dikembalikan.

      223****6e        registry.cn-hangzhou.aliyuncs.com/log-service/logtail                             "/usr/local/ilogta..."   8 hari yang lalu          Up 8 hari                               logtail-iba
    2. Jalankan perintah berikut untuk memulai shell bash di kontainer Logtail.

      docker exec -it 223****6e  bash

      Dalam perintah, 223****6e adalah ID kontainer. Ganti dengan ID sebenarnya.

  • Kubernetes

    1. Jalankan perintah berikut untuk menemukan pod Logtail.

      kubectl get po -n kube-system | grep logtail

      Hasil serupa dengan berikut akan dikembalikan.

      logtail-ds-****d                                             1/1       Berjalan    0          8d
      logtail-ds-****8                                             1/1       Berjalan    0          8d
    2. Jalankan perintah berikut untuk masuk ke pod.

      kubectl exec -it -n kube-system logtail-ds-****d -- bash

      Dalam perintah, logtail-ds-****d adalah ID pod. Ganti dengan ID sebenarnya.

Lihat log operasi Logtail

Log Logtail disimpan di direktori /usr/local/ilogtail/ dari kontainer Logtail. File log bernama ilogtail.LOG dan logtail_plugin.LOG.

  1. Masuk ke kontainer Logtail. Untuk informasi lebih lanjut, lihat Masuk ke kontainer Logtail.

  2. Pergi ke direktori /usr/local/ilogtail/.

    cd /usr/local/ilogtail
  3. Lihat file ilogtail.LOG dan logtail_plugin.LOG.

    cat ilogtail.LOG
    cat logtail_plugin.LOG

Deskripsi output standar (stdout) kontainer Logtail

Output standar kontainer Logtail tidak memberikan informasi bermakna untuk pemecahan masalah. Anda dapat mengabaikan konten berikut.

start umount useless mount points, /shm$|/merged$|/mqueue$
umount: /logtail_host/var/lib/docker/overlay2/3fd0043af174cb0273c3c7869500fbe2bdb95d13b1e110172ef57fe840c82155/merged: must be superuser to unmount
umount: /logtail_host/var/lib/docker/overlay2/d5b10aa19399992755de1f85d25009528daa749c1bf8c16edff44beab6e69718/merged: must be superuser to unmount
umount: /logtail_host/var/lib/docker/overlay2/5c3125daddacedec29df72ad0c52fac800cd56c6e880dc4e8a640b1e16c22dbe/merged: must be superuser to unmount
......
xargs: umount: exited with status 255; aborting
umount done
start logtail
ilogtail is running
logtail status:
ilogtail is running

Lihat status komponen Simple Log Service dalam kluster Kubernetes

Jalankan perintah berikut untuk melihat status dan informasi penerapan Simple Log Service.

kubectl get deploy -n kube-system | grep -E 'alibaba-log-controller|loongcollector-operator'

Hasil berikut dikembalikan:

NAME                     READY   UP-TO-DATE   AVAILABLE   AGE
alibaba-log-controller   1/1     1            1           11d

Jalankan perintah berikut untuk melihat informasi status sumber daya DaemonSet.

kubectl get ds  -n kube-system | grep -E 'logtail-ds|loongcollector-ds'

Hasil berikut dikembalikan:

NAME         DESIRED   CURRENT   READY   UP-TO-DATE   AVAILABLE   NODE SELECTOR  AGE
logtail-ds   2         2         2       2            2           **ux           11d

Lihat nomor versi, alamat IP, dan waktu mulai Logtail

  1. Di host, jalankan perintah berikut untuk melihat nomor versi, alamat IP, dan waktu mulai Logtail.

    Informasi disimpan dalam file /usr/local/ilogtail/app_info.json dari kontainer Logtail.

    kubectl exec logtail-ds-****k -n kube-system cat /usr/local/ilogtail/app_info.json

    Hasil serupa dengan berikut akan dikembalikan.

    {
       "UUID" : "",
       "hostname" : "logtail-****k",
       "instance_id" : "0EB****_172.20.4.2_1517810940",
       "ip" : "172.20.4.2",
       "logtail_version" : "0.16.2",
       "os" : "Linux; 3.10.0-693.2.2.el7.x86_64; #1 SMP Tue Sep 12 22:26:13 UTC 2017; x86_64",
       "update_time" : "2018-02-05 06:09:01"
    }

Tangani penghapusan tidak sengaja Logstore yang dibuat oleh CRD

Jika Anda menghapus Logstore yang dibuat secara otomatis oleh Custom Resource Definition (CRD), data yang dikumpulkan tidak dapat dipulihkan. Selain itu, konfigurasi CRD untuk Logstore ini menjadi tidak valid. Untuk mencegah kesalahan pengumpulan log, gunakan salah satu solusi berikut.

  • Gunakan Logstore lain dalam konfigurasi CRD. Jangan gunakan Logstore yang dihapus tidak sengaja.

  • Mulai ulang pod alibaba-log-controller.

    Anda dapat menjalankan perintah berikut untuk menemukan pod.

    kubectl get po -n kube-system | grep alibaba-log-controller