Layanan Log Sederhana mendukung pemantauan terkait dan peringatan tanpa data. Topik ini menjelaskan cara mengonfigurasi pemantauan terkait dan peringatan tanpa data.
Ketepatan waktu pemantauan
Alur Kerja Pemantauan
Sistem mengeksekusi pernyataan kueri berdasarkan rentang waktu dan nilai parameter Check Frequency yang Anda tentukan dalam aturan peringatan. Setelah hasil kueri dan analisis dikembalikan, sistem mengevaluasi hasil tersebut berdasarkan kondisi pemicu dari aturan peringatan. Jika kondisi pemicu terpenuhi, sistem akan menghasilkan peringatan.
Analisis Masalah
Latensi Pengindeksan Data: Anda hanya dapat meminta data yang telah ditulis ke Layanan Log Sederhana setelah ada latensi singkat. Akibatnya, beberapa data mungkin gagal diperoleh meskipun latensinya singkat.
Sebagai contoh, Layanan Log Sederhana memulai pengecekan pada 12:03:30 berdasarkan aturan peringatan di mana pernyataan kueri menggunakan rentang waktu 1 Menit(Relatif) dan parameter Check Frequency disetel ke Interval Tetap 1 Menit. Dalam kasus ini, pernyataan tersebut meminta data dalam rentang waktu [12:02:30,12:03:30). Namun, jika data ditulis ke Layanan Log Sederhana pada 12:03:29, pernyataan tersebut mungkin gagal memperoleh data tersebut.
Ketidakakuratan Kueri: Jika log dihasilkan pada titik waktu yang berbeda tetapi ditulis ke Layanan Log Sederhana pada menit yang sama, log-log tersebut memiliki indeks yang sama. Akibatnya, log yang dihasilkan pada titik waktu yang lebih lambat bisa memiliki indeks yang lebih awal.
Sebagai contoh, Layanan Log Sederhana memulai pengecekan pada 12:03:30 berdasarkan aturan peringatan di mana pernyataan kueri menggunakan rentang waktu 1 Menit(Relatif). Dalam kasus ini, pernyataan tersebut meminta data dalam rentang waktu [12:02:30,12:03:30). Jika dua log dihasilkan pada 12:02:20 dan 12:02:50 tetapi ditulis ke Layanan Log Sederhana pada 12:02:50, log-log tersebut dapat diindeks menggunakan 12:02:20, dan pernyataan tidak dapat memperoleh log-log tersebut berdasarkan rentang waktu [12:02:30,12:03:30).
Saran Optimasi
Jika Anda memerlukan akurasi tinggi untuk peringatan, lihat saran berikut untuk menghilangkan peringatan berulang dan negatif palsu:
Saran tentang Latensi Pengindeksan Data: Saat mengonfigurasi parameter Time Range dalam kotak dialog Query Statistics, klik Custom di bawah Relative dan tentukan nilai sebelum waktu saat ini untuk bidang Start At dan End Time. Sebagai contoh, setel parameter Time Range ke 70Detik Lalu~10Detik Lalu(Relatif). Waktu buffer 10 detik membantu mencegah masalah bahwa beberapa data tidak diperoleh karena kecepatan pengindeksan rendah.
Saran tentang Ketidakakuratan Kueri: Saat mengonfigurasi parameter Time Range dalam kotak dialog Query Statistics, pilih jangka waktu. Sebagai contoh, setel parameter Time Range ke 1 Menit(Jangka Waktu), 5 Menit(Jangka Waktu), atau 1 Jam(Jangka Waktu). Kemudian, setel parameter Frekuensi Pengecekan ke nilai yang sama dengan jangka waktu yang dipilih. Sebagai contoh, setel parameter Check Frequency ke Interval Tetap 1 Menit, Interval Tetap 5 Menit, atau Interval Tetap 1 Jam.
Jika Anda memerlukan ketepatan waktu tinggi untuk peringatan, lihat saran berikut untuk menerima peringatan sesegera mungkin. Namun, peringatan duplikat mungkin dihasilkan dalam kasus ini.
Saran tentang Latensi Pengindeksan Data: Saat mengonfigurasi parameter Time Range dalam kotak dialog Query Statistics, klik Custom di bawah Relative dan tentukan nilai yang lebih awal dari waktu saat ini untuk bidang Start At. Sebagai contoh, tentukan 70 Detik Lalu untuk bidang Start At.
Saran tentang Ketidakakuratan Kueri: Saat mengonfigurasi parameter Time Range dalam kotak dialog Query Statistics, sertakan menit sebelumnya dalam rentang waktu. Sebagai contoh, setel parameter Time Range ke 90Detik(Relatif). Kemudian, setel parameter Frekuensi Pengecekan ke Interval Tetap 1 Menit.
Mengaitkan hasil dari beberapa operasi kueri dan analisis
Dalam sistem peringatan Layanan Log Sederhana, hasil dari operasi kueri dan analisis disebut sebagai set. Anda dapat menggunakan beberapa set untuk pemantauan terkait.

Layanan Log Sederhana mendukung pemantauan terkait hingga tiga set.
Secara default, hanya 1.000 baris pertama data dalam hasil operasi kueri dan analisis yang digunakan untuk operasi set. Jika Anda menentukan tiga operasi kueri dan analisis dan menyetel parameter Set Operations ke nilai selain No Merge, hanya 100 baris pertama data dalam hasil setiap operasi kueri dan analisis yang digunakan.
Jika tiga set dihasilkan, sistem melakukan operasi set pada dua set pertama, lalu melakukan operasi set pada hasil operasi set pertama dan set ketiga. Contoh:
Set A LEFT JOIN Set B LEFT JOIN Set C: Sistem melakukan operasi LEFT JOIN pada Set A dan Set B. Setelah hasil diperoleh, sistem melakukan operasi LEFT JOIN pada hasil dan Set C.
Set A JOIN Set B INNER JOIN Set C: Sistem melakukan operasi JOIN pada Set A dan Set B. Setelah hasil diperoleh, sistem melakukan operasi INNER JOIN pada hasil dan Set C.
Set A LEFT EXCLUDE JOIN Set B No Merge Set C: Sistem melakukan operasi LEFT EXCLUDE JOIN pada Set A dan Set B. Sistem mengabaikan Set C saat memperoleh hasil akhir kueri dan analisis.
Tabel berikut menjelaskan jenis-jenis operasi set yang didukung oleh Layanan Log Sederhana.
Operasi set | Ilustrasi | Deskripsi |
| Kedua set tidak terkait. Set A digunakan sebagai hasil kueri dan analisis. Set B digunakan sebagai sumber referensi untuk variabel template peringatan. | |
Tidak ada | Data arbitrer dari Set A digabungkan dengan data arbitrer dari Set B. Dalam banyak kasus, operasi set ini digunakan untuk menyaring data untuk evaluasi lebih lanjut. | |
| Data di Set B ditambahkan ke Set A dan disejajarkan berdasarkan field. | |
| Hanya data yang ada di Set B yang dipertahankan di Set A. Set B adalah daftar putih dari Set A. | |
| Sebagian data dari Set B dilengkapi ke Set A. Set B adalah tabel dimensi dari Set A. | |
| Sebagian data dari Set A dilengkapi ke Set B. Set A adalah tabel dimensi dari Set B. | |
| Set A dan Set B saling melengkapi. | |
| Data yang ada di Set B dihapus dari Set A. Set B adalah daftar hitam dari Set A. | |
| Data yang ada di Set A dihapus dari Set B. Set A adalah daftar hitam dari Set B. |
No Merge
Persyaratan
Log akses NGINX dipantau. Jika jumlah kesalahan dengan kode status 5XX dalam periode 15 menit melebihi 500, peringatan dipicu dan notifikasi peringatan dikirim. Notifikasi peringatan mencakup informasi tentang host tempat peringatan dipicu.
Konfigurasi

Hasil
Hasil Pernyataan Kueri 0
Pernyataan tersebut meminta jumlah kesalahan dengan kode status 5XX dalam periode 15 menit.
cnt
1234
Hasil Pernyataan Kueri 1
Pernyataan tersebut meminta 5 host teratas dengan jumlah kesalahan terbesar dengan kode status 5XX dalam periode 15 menit dan jumlah kesalahan untuk setiap host.
host
pv
host1
60
host2
55
host3
47
host4
45
host5
30
Hasil Operasi Set
Dalam contoh ini, parameter Set Operations disetel ke No Merge. Hasil operasi set adalah hasil dari Pernyataan Kueri 0.
CROSS JOIN
Contoh 1
Persyaratan
Log akses Object Storage Service (OSS) dan Server Load Balancer (SLB) dipantau. Jumlah kesalahan dengan kode status 4XX di OSS dan jumlah kesalahan dengan kode status 5XX di SLB diperiksa setiap interval 15 menit. Jika total jumlah kesalahan mencapai 1.000, peringatan dipicu.
Konfigurasi

Hasil
Hasil Pernyataan Kueri 0
Pernyataan tersebut meminta jumlah kesalahan dengan kode status 4XX di OSS dalam periode 15 menit.
pv
890
Hasil Pernyataan Kueri 1
Pernyataan tersebut meminta jumlah kesalahan dengan kode status 5XX di SLB dalam periode 15 menit.
pv
567
Hasil Operasi Set
Dalam contoh ini, parameter Set Operations disetel ke CROSS JOIN. Tabel berikut menjelaskan hasil operasi set.
$0.pv
$1.pv
890
567
Contoh Tambahan
Hasil Pernyataan Kueri 0
a
b
a1
b1
a2
b2
a5
b5
Hasil Pernyataan Kueri 1
a
c
a1
c1
a3
c3
Hasil Operasi Set
Dalam contoh ini, parameter Set Operations disetel ke CROSS JOIN. Tabel berikut menjelaskan hasil operasi set.
$0.a
b
$1.a
c
a1
b1
a1
c1
a1
b1
a3
c3
a2
b2
a1
c1
a2
b2
a3
c3
a5
b5
a1
c1
a5
b5
a3
c3
JOIN
Contoh 1
Persyaratan
Dua logstore digunakan untuk menyimpan log akses NGINX. Satu logstore berada di wilayah China (Beijing), dan logstore lainnya berada di wilayah China (Shanghai). Jumlah host dengan lebih dari 30 kesalahan dengan kode status 5XX diperiksa setiap interval 15 menit. Jika jumlah host yang memenuhi kondisi tertentu di kedua logstore melebihi 10, peringatan dipicu.
Konfigurasi

Hasil
Hasil Pernyataan Kueri 0
Pernyataan tersebut meminta jumlah host dengan lebih dari 30 kesalahan dengan kode status 5XX dalam periode 15 menit dan jumlah kesalahan untuk setiap host.
host
pv
host1
60
host2
55
host3
47
host4
45
host5
31
Hasil Pernyataan Kueri 1
Pernyataan tersebut meminta jumlah host dengan lebih dari 30 kesalahan dengan kode status 5XX dalam periode 15 menit dan jumlah kesalahan untuk setiap host.
host
pv
hosta
70
hostb
45
hostc
44
hostd
42
Hasil Operasi Set
Dalam contoh ini, parameter Set Operations disetel ke JOIN. Tabel berikut menjelaskan hasil operasi set.
host
pv
host1
60
host2
55
host3
47
host4
45
hosg5
31
hosta
70
hostb
45
hostc
44
hostd
42
Contoh Tambahan
Jika field dalam dua hasil kueri dan analisis tidak sepenuhnya cocok, field yang tidak cocok dibiarkan kosong setelah operasi JOIN dilakukan.
Hasil Pernyataan Kueri 0
a
b
a1
b1
a2
b2
Hasil Pernyataan Kueri 1
b
c
b1
c1
b2
c2
Hasil Operasi Set
a
b
c
a1
b1
Tidak ada
a2
b2
Tidak ada
Tidak ada
b1
c1
Tidak ada
b2
c2
Set A JOIN Set B INNER JOIN Set C: Jika Anda menentukan tiga pernyataan kueri, sistem melakukan operasi set pada hasil dari dua pernyataan pertama. Setelah hasil operasi set pertama diperoleh, sistem melakukan operasi set pada hasil operasi set pertama dan hasil dari pernyataan ketiga.
Hasil Pernyataan Kueri 0
a
b
a1
b1
a2
b2
Hasil Pernyataan Kueri 1
a
b
a1
b11
a2
b22
a3
b33
Hasil Operasi Set pada Hasil Pernyataan Kueri 0 dan Pernyataan Kueri 1
Dalam contoh ini, parameter Set Operations disetel ke INNER JOIN dan $0.a == $1.a ditentukan. Tabel berikut menjelaskan hasil operasi set.
a
$0.b
$1.b
a1
b1
b11
a2
b2
b22
Hasil Pernyataan Kueri 2
a
b
a3
b333
a4
b444
Hasil Operasi Set
Dalam contoh ini, parameter Set Operations disetel ke JOIN. Tabel berikut menjelaskan hasil operasi set.
CatatanField b dalam hasil Pernyataan Kueri 2 disejajarkan dengan field $0.b.
a
$0.b
$1.b
a1
b1
b11
a2
b2
b22
a3
b333
Tidak ada
a4
b444
Tidak ada
INNER JOIN
Contoh 1
Persyaratan
Jumlah kesalahan dengan kode status 5XX di bucket tertentu dipantau. Jika jumlah kesalahan dengan kode status 5XX dalam periode 15 menit melebihi 1.000, peringatan dipicu. Untuk memenuhi persyaratan ini, Anda harus menambahkan data sumber daya untuk mempertahankan daftar putih bucket.
Konfigurasi

Hasil
Hasil Pernyataan Kueri 0
Pernyataan tersebut meminta bucket dengan lebih dari 1.000 kesalahan dengan kode status 5XX dalam periode 15 menit.
bucket
pv
bucket_01
1.600
bucket_02
1.550
bucket_03
1.470
bucket_04
1.450
Hasil Pernyataan Kueri 1
Tabel berikut menggambarkan data sumber daya bucket.
bucket
desc
bucket_03
untuk tim dev
bucket_04
untuk tim test
bucket_05
untuk tim layanan
bucket_06
untuk tim dukungan
Hasil Operasi Set
Dalam contoh ini, parameter Set Operations disetel ke INNER JOIN dan $0.bucket == $1.bucket ditentukan. Tabel berikut menjelaskan hasil operasi set.
bucket
pv
desc
bucket_03
1.470
untuk tim dev
bucket_04
1.450
untuk tim test
Contoh 2
Persyaratan
Dua logstore digunakan untuk menyimpan log akses NGINX. Satu logstore berada di wilayah Tiongkok (Beijing), dan logstore lainnya berada di wilayah Tiongkok (Shanghai). Klien dengan lebih dari 30 kesalahan yang kode statusnya adalah 5XX diperiksa setiap interval 15 menit. Jika kedua logstore memiliki kesalahan dengan kode status 5XX dan jumlah kesalahan untuk logstore di wilayah Tiongkok (Beijing) lebih besar daripada jumlah kesalahan untuk logstore di wilayah Tiongkok (Shanghai), maka peringatan akan dipicu.
Konfigurasi

Hasil
Hasil Pernyataan Kueri 0
Pernyataan ini memeriksa klien dengan lebih dari 30 kesalahan yang kode statusnya adalah 5XX dalam logstore di wilayah Tiongkok (Beijing) dalam periode 15 menit dan jumlah kesalahan untuk setiap klien.
client_ip
pv
192.0.2.4
60
192.0.2.5
55
192.0.2.6
47
192.0.2.7
45
192.0.2.8
31
Hasil Pernyataan Kueri 1
Pernyataan ini memeriksa klien dengan lebih dari 30 kesalahan yang kode statusnya adalah 5XX dalam logstore di wilayah Tiongkok (Shanghai) dalam periode 15 menit dan jumlah kesalahan untuk setiap klien.
client_ip
pv
192.0.2.5
70
192.0.2.6
45
192.0.2.7
44
192.0.2.8
42
192.0.2.9
42
Hasil Operasi Set
Dalam contoh ini, parameter Set Operations disetel ke INNER JOIN, dan $0.client_ip == $1.client_ip serta $0.pv > $1.pv ditentukan. Tabel berikut menjelaskan hasil dari operasi set.
client_ip
pv
192.0.2.6
47
192.0.2.7
45
Contoh Tambahan
Sebuah kolom di hasil Query Statement 0 dan sebuah kolom di hasil Query Statement 1 tidak terkait tetapi memiliki nama yang sama. Dua kolom tersebut di hasil operasi set yang ditentukan secara otomatis diberi awalan $0 dan $1.
Hasil dari Query Statement 0
a
b
c
d
a1
b1
c1
d1
a2
b2
c2
d2
a3
b3
c3
d3
Hasil dari Query Statement 1
a
b
c
a1
b11
c11
a2
b22
c22
Hasil dari Operasi Set
Dalam contoh ini, parameter Set Operations diatur ke INNER JOIN dan $0.a == $1.a telah ditentukan. Tabel berikut menjelaskan hasil dari operasi set.
a
$0.b
$0.c
d
$1.b
$1.c
a1
b1
c1
d1
b11
c11
a2
b2
c2
d2
b22
c22
LEFT JOIN
Hasil Pernyataan Kueri 0
a
b
a1
b1
a2
b2
a3
b3
Hasil Pernyataan Kueri 1
a
b
c
a1
b11
c1
a2
b22
c2
Hasil Operasi Set
Dalam contoh ini, parameter Set Operations disetel ke LEFT JOIN dan $0.a == $1.a ditentukan. Tabel berikut menjelaskan hasil operasi set.
a
$0.b
$1.b
c
a1
b1
b11
c1
a2
b2
b22
c2
a3
b3
Tidak ada
Tidak ada
RIGHT JOIN
Hasil Pernyataan Kueri 0
a
b
c
a1
b11
c1
a2
b22
c2
Hasil Pernyataan Kueri 1
a
b
a1
b1
a2
b2
a3
b3
Hasil Operasi Set
Dalam contoh ini, parameter Set Operations disetel ke RIGHT JOIN dan $0.a == $1.a ditentukan. Tabel berikut menjelaskan hasil operasi set.
a
$0.b
c
$1.b
a1
b11
c1
b1
a2
b22
c2
b2
a3
Tidak ada
Tidak ada
b3
FULL JOIN
Hasil Pernyataan Kueri 0
a
b
c
a1
b1
c1
a2
b2
c2
a5
b5
c3
Hasil Pernyataan Kueri 1
a
b
d
a1
b11
d1
a2
b22
d2
a3
b33
d3
Hasil Operasi Set
Dalam contoh ini, parameter Set Operations disetel ke FULL JOIN dan $0.a == $1.a ditentukan. Tabel berikut menjelaskan hasil operasi set.
a
$0.b
c
$1.b
d
a1
b1
c1
b11
d1
a2
b2
c2
b22
d2
a5
b5
c3
Tidak ada
Tidak ada
a3
Tidak ada
Tidak ada
b33
d3
LEFT EXCLUDE JOIN
Persyaratan
Jumlah kesalahan dengan kode status 5XX di bucket yang tidak ditentukan dipantau. Jika jumlah kesalahan dengan kode status 5XX dalam periode 15 menit melebihi 1.000, peringatan dipicu. Untuk memenuhi persyaratan ini, Anda harus menambahkan data sumber daya untuk mempertahankan daftar hitam bucket.
Konfigurasi

Hasil
Hasil Pernyataan Kueri 0
Pernyataan tersebut meminta bucket dengan lebih dari 1.000 kesalahan dengan kode status 5XX dalam periode 15 menit.
bucket
pv
bucket_01
60
bucket_02
55
bucket_03
47
bucket_04
45
Hasil Pernyataan Kueri 1
Tabel berikut menggambarkan data sumber daya bucket.
bucket
desc
bucket_03
untuk tim dev
bucket_04
untuk tim test
Hasil Operasi Set
Dalam contoh ini, parameter Set Operations disetel ke LEFT EXCLUDE JOIN dan $0.bucket == $1.bucket ditentukan. Tabel berikut menjelaskan hasil operasi set.
bucket
pv
bucket_01
60
bucket_02
55
RIGHT EXCLUDE JOIN
Persyaratan
Jumlah kesalahan dengan kode status 5XX di bucket yang tidak ditentukan dipantau. Jika jumlah kesalahan dengan kode status 5XX dalam periode 15 menit melebihi 1.000, peringatan dipicu. Untuk memenuhi persyaratan ini, Anda harus menambahkan data sumber daya untuk mempertahankan daftar hitam bucket.
Konfigurasi

Hasil
Hasil Pernyataan Kueri 0
Tabel berikut menggambarkan data sumber daya bucket.
bucket
desc
bucket_03
untuk tim dev
bucket_04
untuk tim test
Hasil Pernyataan Kueri 1
Pernyataan kueri tersebut meminta bucket dengan lebih dari 1.000 kesalahan dengan kode status 5XX dalam periode 15 menit.
bucket
pv
bucket_01
60
bucket_02
55
bucket_03
47
bucket_04
45
Hasil Operasi Set
Dalam contoh ini, parameter Set Operations disetel ke RIGHT EXCLUDE JOIN dan $0.bucket == $1.bucket ditentukan. Tabel berikut menjelaskan hasil operasi set.
bucket
pv
bucket_01
60
bucket_02
55
Peringatan tanpa data
Jika terjadi kehilangan data selama proses pengumpulan, Layanan Log Sederhana tidak menerima data, dan masalah ini mungkin tidak terdeteksi. Oleh karena itu, Layanan Log Sederhana menyediakan fitur peringatan tanpa data untuk mengirim notifikasi peringatan untuk jenis masalah ini. Sebagai contoh, konfigurasikan aturan peringatan untuk memantau metrik CPU untuk setiap host. Jika kondisi berikut terpenuhi, peringatan dipicu dan notifikasi peringatan dikirim:
Pemanfaatan CPU sebuah host melebihi 95%.
Tidak ada data yang dikembalikan untuk operasi kueri dan analisis.
Konfigurasikan aturan peringatan berdasarkan deskripsi berikut:
Query Statistics: Tentukan pernyataan berikut untuk meminta pemanfaatan CPU host.
* | select promql_query_range('cpu_util') from metrics limit 1000Trigger Condition: Pilih data matches the expression, masukkan value>95, lalu pilih Severity: Medium.
Jika field value dalam hasil kueri dan analisis lebih besar dari 95, peringatan tingkat sedang dipicu.
Threshold of Continuous Triggers: Jika jumlah kali berturut-turut kondisi pemicu tertentu terpenuhi mencapai nilai parameter ini, peringatan dipicu.
No Data Alert: Nyalakan No Data Alert. Kemudian, konfigurasikan parameter Tingkat Keparahan dan Tambah Anotasi.
Jika Anda menyalakan Peringatan Tanpa Data, peringatan dipicu ketika jumlah kali berturut-turut tidak ada data yang dikembalikan melebihi nilai parameter Ambang Batas Pemicu Berkelanjutan.
Jika Anda menyalakan Peringatan Tanpa Data, tentukan tingkat keparahan dan anotasi independen untuk fitur tersebut.
Gambar berikut menunjukkan konfigurasi.








