Detak jantung kelompok mesin mencerminkan status komunikasi antara server dan Simple Log Service (SLS). Jika detak jantung abnormal, data tidak dapat dikirim ke SLS. Topik ini menjelaskan penyebab detak jantung abnormal serta memberikan solusi untuk kasus penggunaan umum.
Penyebab detak jantung abnormal
LoongCollector pada server menggunakan item konfigurasi berikut untuk mengidentifikasi proyek tujuan dan melaporkan detak jantung. Memecahkan masalah detak jantung abnormal melibatkan pemeriksaan item konfigurasi dan verifikasi konektivitas jaringan.
Akun Alibaba Cloud dengan Proyek SLS: Akun ini harus memiliki izin untuk mengakses server dan mengumpulkan log-nya.
Wilayah dan Jenis Jaringan Proyek: Titik akhir SLS dibuat secara dinamis berdasarkan wilayah dan jenis jaringan. Pastikan server dapat terhubung ke titik akhir. Untuk informasi lebih lanjut, lihat Jenis Jaringan dan Titik Akhir.
Pengenal kustom atau alamat IP: Detak jantung dibentuk dengan mengaitkan server dengan kelompok mesin menggunakan alamat IP-nya atau pengenal kustom.
Prosedur pembentukan heartbeat
LoongCollector membaca konfigurasinya untuk mendapatkan ID Akun Alibaba Cloud, titik akhir, serta alamat IP server atau pengenal kustom.
LoongCollector melaporkan detak jantung dengan informasi ini ke proyek di wilayah yang ditentukan.
Backend SLS membandingkan alamat IP atau pengenal kustom yang dilaporkan oleh LoongCollector dengan konfigurasi dalam kelompok mesin Anda.
Jika informasinya cocok, detak jantung berhasil dibentuk dengan satu atau lebih proyek yang sesuai. Status detak jantung kelompok mesin berubah menjadi OK.
Kasus penggunaan umum detak jantung abnormal
Heartbeat server baru GAGAL
Ketika status detak jantung adalah FAIL, mungkin diperlukan waktu untuk membentuk detak jantung awal. Tunggu sekitar dua menit lalu segarkan status detak jantung. Jika status masih FAIL, lakukan langkah-langkah berikut:
Verifikasi bahwa Anda memilih metode instalasi yang benar untuk LoongCollector. Jika metode tersebut benar, lanjutkan ke langkah berikutnya. Jika tidak, uninstall lalu instal ulang LoongCollector.
Metode instalasi
Kasus penggunaan
Metode ini hanya berlaku jika server adalah Instance ECS Alibaba Cloud, dan baik Instance ECS maupun proyek milik akun Alibaba Cloud yang sama dan berada di wilayah yang sama wilayah.
Metode ini berlaku jika server adalah Instance ECS Alibaba Cloud, dan baik Instance ECS maupun proyek milik akun Alibaba Cloud yang sama tetapi berada di wilayah yang berbeda wilayah.
Metode ini berlaku jika server adalah Instance ECS Alibaba Cloud, dan baik Instance ECS maupun proyek berada di wilayah yang sama wilayah tetapi milik akun Alibaba Cloud yang berbeda.
Metode ini berlaku jika server bukan Instance ECS Alibaba Cloud, seperti server on-premises atau server dari penyedia cloud lain.
Metode ini berlaku jika server adalah Instance ECS Alibaba Cloud, tetapi Instance ECS dan proyek milik akun Alibaba Cloud yang berbeda dan berada di wilayah yang berbeda wilayah. Dalam kasus ini, server dapat diperlakukan sebagai server on-premises.
Di server, jalankan perintah
sudo /etc/init.d/loongcollectord statusuntuk memeriksa status LoongCollector. Jika `loongcollector is running` dikembalikan, LoongCollector telah dimulai. Jika tidak, jalankan perintah berikut untuk memulai LoongCollector:Jika Anda menggunakan kolektor Logtail, jalankan
sudo /etc/init.d/ilogtaild statusuntuk memeriksa statusnya dansudo /etc/init.d/ilogtaild startuntuk memulainya.sudo /etc/init.d/loongcollectord startJika Anda berada dalam kasus penggunaan lintas akun di mana proyek dan server milik Akun Alibaba Cloud yang berbeda, Anda harus secara manual mengonfigurasi file ID pengguna untuk memberikan izin kepada akun proyek untuk mengakses server dan mengumpulkan log-nya.
Konfirmasikan bahwa wilayah dan jenis jaringan sudah benar dan Anda dapat terhubung ke titik akhir. Periksa apakah file
/usr/local/ilogtail/ilogtail_config.jsondi server berisi informasiregionyang benar dan sesuai dengan ID Wilayah proyek SLS. Jika sesuai, lanjutkan ke langkah berikutnya. Jika tidak, ubahlah:Periksa nilai pengenal kustom atau alamat IP:
Masuk ke Konsol Simple Log Service. Di bagian Proyek, klik proyek target.
Di panel navigasi di sebelah kiri, pilih Sumber Daya > Kelompok Mesin. Di halaman Kelompok Mesin, klik kelompok mesin target.
Di halaman Machine Group Settings, lihat Machine Group Identifier dan lakukan operasi yang sesuai:
Pengenal kustom
Pastikan file
/etc/ilogtail/user_defined_idada di server. Jika tidak, buatlah.Tulis string kustom ke file sebagai pengenal kustom. Contoh ini menggunakan
user-defined-test-1.# Tulis string kustom ke file yang ditentukan. echo "user-defined-test-1" > /etc/ilogtail/user_defined_idAtur Custom Identifier ke string kustom. Dalam contoh ini, nilainya adalah
user-defined-test-1.
Alamat IP
Tambahkan nilai bidang
ipdari/usr/local/ilogtail/app_info.jsondi server ke bidang IP Address.Aturan nilai IP: Jika Anda telah menyetel pemetaan hostname ke alamat IP di file /etc/hosts di server, alamat IP yang dipetakan akan otomatis diambil. Jika tidak ada pemetaan hostname yang disetel, alamat IP dari kartu antarmuka jaringan pertama (NIC) akan otomatis diambil. Jika parameter working_ip disetel di /usr/local/ilogtail/ilogtail_config.json, nilainya digunakan sebagai alamat IP server. Pastikan alamat IP dapat diambil setidaknya dengan salah satu cara ini. Jika tidak, bidang ip kosong dan detak jantung tidak dapat dibentuk.
Detak jantung sebelumnya berhasil tetapi sekarang FAIL
Detak jantung yang sebelumnya berhasil menunjukkan bahwa item konfigurasi sudah benar. Jika kelompok mesin menggunakan pengenal kustom, konfigurasinya bersifat statis. Masalahnya kemungkinan besar terkait jaringan. Verifikasi konektivitas jaringan ke titik akhir SLS. Jika kelompok mesin menggunakan alamat IP, status GAGAL kemungkinan besar disebabkan oleh konflik alamat IP atau perubahan alamat IP. Lakukan langkah-langkah berikut untuk menyelesaikan masalah:
Di server, mulai ulang LoongCollector untuk mendapatkan informasi alamat IP terbaru.
Jika Anda menggunakan kolektor Logtail, jalankan
sudo /etc/init.d/ilogtaild restartsudo /etc/init.d/loongcollectord restartDi server, lihat informasi di bidang
ipdari file/usr/local/ilogtail/app_info.json.Aturan nilai IP: Jika Anda telah menyetel pemetaan hostname ke alamat IP di file /etc/hosts di server, alamat IP yang dipetakan akan otomatis diambil. Jika tidak ada pemetaan hostname yang disetel, alamat IP dari NIC pertama akan otomatis diambil. Jika parameter working_ip disetel di /usr/local/ilogtail/ilogtail_config.json, nilainya digunakan sebagai alamat IP server.
Masuk ke Konsol Simple Log Service. Di bagian Proyek, klik proyek target.
Di panel navigasi di sebelah kiri, pilih Sumber Daya > Kelompok Mesin. Di halaman Kelompok Mesin, klik kelompok mesin target.
Di halaman Machine Group Settings, periksa apakah bidang IP Address berisi nilai bidang
ipdari/usr/local/ilogtail/app_info.json. Jika tidak, tambahkan nilai bidangipke bidang IP Address.Jika alamat IP cocok tetapi detak jantung tetap GAGAL, ini mungkin menunjukkan bahwa alamat IP server tidak stabil atau bertentangan. Pertimbangkan beralih ke pengenal kustom untuk identifikasi yang lebih andal.
Detak jantung adalah FAIL setelah mengganti tipe pengenal kelompok mesin
Ketika terjadi konflik atau perubahan alamat IP, kelompok mesin berbasis IP tidak lagi cocok. Anda perlu beralih ke kelompok mesin yang menggunakan pengenal kustom. Mengganti tipe kelompok mesin tidak memengaruhi konektivitas jaringan, informasi akun Alibaba Cloud, atau pengaturan wilayah dan jenis jaringan. Oleh karena itu, Anda hanya perlu memastikan bahwa nilai pengenal kustom benar.
Pastikan file
/etc/ilogtail/user_defined_idada. Jika tidak, buatlah.Tulis string kustom ke file sebagai pengenal kustom. Contoh ini menggunakan
user-defined-test-1.# Tulis string kustom ke file yang ditentukan. echo "user-defined-test-1" > /etc/ilogtail/user_defined_idMasuk ke Konsol Simple Log Service. Di bagian Proyek, klik proyek target.
Di panel navigasi di sebelah kiri, pilih Sumber Daya > Kelompok Mesin. Di halaman Kelompok Mesin, klik kelompok mesin target.
Di halaman Machine Group Settings, konfirmasi nilai dari dua parameter berikut. Jika salah, klik Modify di pojok kanan atas, buat perubahan yang diperlukan, lalu simpan.
Machine Group Identifier: Pengidentifikasi kustom.
Pengenal Kustom: String kustom. Dalam contoh ini, nilainya adalah
user-defined-test-1.
FAQ
Mengapa status detak jantung GAGAL meskipun semua konfigurasi sudah benar?
Jika Anda yakin bahwa konfigurasi sudah benar dan jaringan normal, status detak jantung mungkin GAGAL karena dua alasan berikut:
Kolektor mengurangi frekuensi detak jantung karena tidak ada konfigurasi koleksi yang diterapkan di wilayah tersebut untuk waktu yang lama.
Untuk mengurangi beban server, kolektor mengurangi frekuensi permintaan konfigurasi dari wilayah jika tidak ada konfigurasi yang dikembalikan. Interval permintaan dapat meningkat hingga maksimum 12 menit. Jika interval ini melebihi ambang batas FAIL detak jantung wilayah, status detak jantung berubah menjadi FAIL.
Solusi: Abaikan status detak jantung GAGAL. Terapkan konfigurasi koleksi ke kelompok mesin yang berisi server. Detak jantung akan pulih selama permintaan berikutnya ke wilayah. Untuk memulihkan detak jantung segera, mulai ulang kolektor.
Konfigurasi aktif tidak sesuai dengan file
ilogtail_config.json.Contoh: Kolektor dimulai dengan konfigurasi non-default. Kemudian, file
ilogtail_config.jsondimodifikasi, tetapi kolektor tidak dimulai ulang.Cara memeriksa:
Metode paling langsung adalah memulai ulang kolektor untuk secara otomatis memuat konfigurasi terbaru.
Jika Anda khawatir tentang dampak pada pengumpulan log, lihat file
/usr/local/ilogtail/ilogtail.LOG. Dari awal file, cari kata kunciload logtail config file. Entri log pada baris itu berisi konfigurasi yang sedang digunakan. Periksa apakah itu sesuai dengan file lokal.
di sebelah kanan nama proyek untuk pergi ke halaman gambaran proyek.