Siapkan peringatan untuk kluster terdaftar ACK One guna mendeteksi aktivitas anomali dan anomali metrik di Container Service for Kubernetes (ACK) secara tepat waktu.
Prasyarat
Kluster terdaftar ACK One telah dibuat dan kluster Kubernetes eksternal yang diterapkan di pusat data lokal telah terhubung ke kluster terdaftar ACK One.
Konfigurasikan komponen Cloud Monitor di kluster terdaftar
Langkah 1: Berikan izin RAM kepada komponen Cloud Monitor
Menggunakan onectl
Instal onectl di mesin lokal Anda. Untuk informasi selengkapnya, lihat Gunakan onectl untuk mengelola kluster terdaftar.
Berikan izin Resource Access Management (RAM) kepada komponen Cloud Monitor.
onectl ram-user grant --addon alicloud-monitor-controllerKeluaran yang diharapkan:
Ram policy ack-one-registered-cluster-policy-alicloud-monitor-controller granted to ram user ack-one-user-ce313528c3 successfully.
Menggunakan konsol
Sebelum menginstal komponen di kluster terdaftar, Anda harus memperoleh pasangan AccessKey untuk mengakses layanan Alibaba Cloud. Untuk membuat pasangan AccessKey, Anda harus terlebih dahulu membuat pengguna RAM dan memberikan izin yang diperlukan kepada pengguna RAM tersebut agar dapat mengakses sumber daya cloud.
Buat kebijakan kustom. Kode berikut merupakan contohnya:
{ "Action": [ "log:*", "arms:*", "cms:*", "cs:UpdateContactGroup" ], "Resource": [ "*" ], "Effect": "Allow" }Buat pasangan AccessKey untuk pengguna RAM.
PeringatanKami menyarankan Anda mengonfigurasi kebijakan berbasis pasangan AccessKey untuk kontrol akses jaringan, dengan membatasi sumber pemanggilan AccessKey hanya pada lingkungan jaringan tepercaya guna meningkatkan keamanan AccessKey.
Gunakan pasangan AccessKey untuk membuat Secret bernama alibaba-addon-secret di kluster terdaftar.
Saat Anda menginstal komponen Cloud Monitor, sistem akan secara otomatis menggunakan pasangan AccessKey ini untuk mengakses sumber daya cloud yang diperlukan.
kubectl -n kube-system create secret generic alibaba-addon-secret --from-literal='access-key-id=<your access key id>' --from-literal='access-key-secret=<your access key secret>'CatatanGanti
<your access key id>dan<your access key secret>dengan pasangan AccessKey yang telah Anda peroleh.
Langkah 2: Instal dan tingkatkan komponen Cloud Monitor
Menggunakan onectl
Instal komponen Cloud Monitor.
onectl addon install alicloud-monitor-controllerKeluaran yang diharapkan:
Addon alicloud-monitor-controller, version **** installed.Menggunakan konsol
Konsol secara otomatis memeriksa apakah konfigurasi peringatan memenuhi persyaratan, lalu memandu Anda untuk mengaktifkan, menginstal, atau meningkatkan komponen tersebut.
Masuk ke Konsol ACK. Di panel navigasi sebelah kiri, klik Clusters.
Pada halaman Clusters, temukan kluster yang diinginkan lalu klik namanya. Di panel sebelah kiri, pilih .
Pada halaman Alerting, ikuti petunjuk di layar untuk menginstal atau meningkatkan komponen.
Setelah instalasi atau peningkatan selesai, buka halaman Alerting untuk mengonfigurasi informasi peringatan.
Tab
Deskripsi
Alert Rule Management
Status: Aktifkan atau nonaktifkan set aturan peringatan target.
Edit Notification Object: Tetapkan grup kontak untuk pemberitahuan peringatan.
Sebelum mengonfigurasi ini, buat kontak dan grup, lalu tambahkan kontak ke dalam grup. Anda hanya dapat memilih grup kontak sebagai objek notifikasi. Untuk memberi tahu satu orang, buat grup yang hanya berisi kontak tersebut dan pilih grup itu.
Alert History
Anda dapat melihat 100 catatan peringatan terbaru dari 24 jam terakhir.
Klik tautan di kolom Alert Rule untuk membuka sistem pemantauan terkait dan melihat konfigurasi aturan secara detail.
Klik Troubleshoot untuk menemukan sumber daya tempat anomali terjadi (event anomali atau metrik).
Klik Intelligent Analysis untuk menggunakan asisten AI guna menganalisis masalah dan memberikan panduan pemecahan masalah.
Contact Management
Kelola kontak. Anda dapat membuat, mengedit, atau menghapus kontak.
Metode Kontak:
Telepon/Pesan Teks: Setelah Anda menetapkan nomor ponsel untuk kontak, kontak tersebut dapat menerima pemberitahuan peringatan melalui telepon dan pesan teks.
Hanya nomor ponsel yang telah diverifikasi yang dapat digunakan untuk menerima notifikasi panggilan telepon. Untuk informasi selengkapnya tentang cara memverifikasi nomor ponsel, lihat Verifikasi nomor ponsel.
Email: Setelah Anda menetapkan alamat email untuk kontak, kontak tersebut dapat menerima pemberitahuan peringatan melalui email.
Robot: DingTalk Robot, WeCom Robot, dan Lark Robot.
Untuk robot DingTalk, Anda harus menambahkan kata kunci keamanan: Alerting, Dispatch.
Sebelum mengonfigurasi notifikasi email dan robot, verifikasi terlebih dahulu di Konsol CloudMonitor. Pilih untuk memastikan Anda dapat menerima informasi peringatan.
Contact Group Management
Kelola grup kontak. Anda dapat membuat, mengedit, atau menghapus grup kontak. Anda hanya dapat memilih grup kontak saat Edit Notification Object.
Jika tidak ada grup kontak yang tersedia, konsol akan membuat grup kontak default berdasarkan informasi Akun Alibaba Cloud Anda.
Menyiapkan peringatan
Langkah 1: Aktifkan aturan peringatan default
Masuk ke Konsol ACK. Di panel navigasi sebelah kiri, klik Clusters.
Pada halaman Clusters, temukan kluster yang diinginkan lalu klik namanya. Di panel sebelah kiri, pilih .
Pada tab Alert Rules, aktifkan set aturan peringatan.

Langkah 2: Konfigurasi manual aturan peringatan
Masuk ke Konsol ACK. Di panel navigasi sebelah kiri, klik Clusters.
Pada halaman Clusters, temukan kluster yang diinginkan lalu klik namanya. Di panel sebelah kiri, pilih .
Pada tab Alert Rule Management, klik Edit Notification Objects untuk mengasosiasikan objek notifikasi. Lalu, aktifkan sakelar Enabled untuk mengaktifkan set aturan peringatan.
Fitur
Deskripsi
Alert Rules
Fitur peringatan ACK secara otomatis menghasilkan templat peringatan untuk skenario kontainer. Templat tersebut mencakup peringatan untuk event anomali dan anomali metrik.
Aturan peringatan diklasifikasikan ke dalam set aturan peringatan. Anda dapat mengasosiasikan beberapa grup kontak dengan satu set aturan peringatan serta mengaktifkan atau menonaktifkan set tersebut.
Satu set aturan peringatan berisi beberapa aturan peringatan. Setiap aturan peringatan berkorespondensi dengan satu item pemeriksaan untuk satu jenis anomali. Anda dapat mengonfigurasi beberapa set aturan peringatan di kluster terkait menggunakan sumber daya YAML. Jika Anda memodifikasi file YAML, aturan peringatan akan disinkronkan.
Untuk informasi selengkapnya tentang konfigurasi YAML aturan peringatan, lihat Konfigurasi aturan peringatan menggunakan CRD.
Untuk informasi selengkapnya tentang templat aturan peringatan default, lihat Manajemen Peringatan Container Service.
Alert History
Anda dapat melihat 100 catatan peringatan terakhir. Klik tautan di kolom Alert Rule Type untuk membuka sistem pemantauan terkait guna melihat konfigurasi aturan secara detail. Klik tautan di kolom Details untuk membuka halaman sumber daya tempat peringatan dipicu. Sumber daya tersebut dapat berupa event anomali atau sumber daya dengan anomali metrik.

Contact Management
Buat, edit, atau hapus kontak.
Alert Contact Groups
Buat, edit, atau hapus grup kontak. Jika tidak ada grup kontak yang tersedia, konsol akan membuat grup kontak default berdasarkan informasi Akun Alibaba Cloud Anda.
Cara mengonfigurasi aturan peringatan menggunakan CRD
Saat fitur peringatan diaktifkan, sumber daya AckAlertRule yang berisi templat aturan peringatan default dibuat di namespace kube-system. Anda dapat menggunakan sumber daya ini untuk mengonfigurasi set aturan peringatan untuk ACK di kluster.
Konsol
Masuk ke Konsol ACK. Di panel navigasi sebelah kiri, klik Clusters.
Pada halaman Clusters, temukan kluster yang diinginkan lalu klik namanya. Di panel sebelah kiri, pilih .
Pada tab Alert Rule Management, klik Edit Alert Configuration di pojok kanan atas. Lalu, klik YAML di kolom Actions aturan target untuk melihat konfigurasi sumber daya AckAlertRule untuk kluster saat ini.
Modifikasi file YAML sesuai kebutuhan. Untuk informasi selengkapnya, lihat Templat aturan peringatan default.
Kode berikut menunjukkan contoh konfigurasi YAML untuk aturan peringatan:
Anda dapat menggunakan
rules.thresholdsuntuk menyesuaikan ambang batas peringatan. Untuk informasi selengkapnya tentang parameter, lihat tabel berikut. Sebagai contoh, konfigurasi di atas memicu notifikasi peringatan jika utilisasi CPU node kluster melebihi 85% selama tiga pemeriksaan berturut-turut dan peringatan sebelumnya dipicu lebih dari 900 detik yang lalu.Parameter
Wajib
Deskripsi
Nilai Default
CMS_ESCALATIONS_CRITICAL_ThresholdWajib
Ambang batas peringatan. Jika parameter ini tidak dikonfigurasi, aturan gagal disinkronkan dan dinonaktifkan.
unit: Satuan. Anda dapat mengatur nilai ini menjadi percent, count, atau qps.value: Ambang batas.
Bergantung pada konfigurasi templat peringatan default.
CMS_ESCALATIONS_CRITICAL_TimesOpsi
Jumlah percobaan ulang untuk aturan CloudMonitor. Jika tidak dikonfigurasi, nilai default digunakan.
3
CMS_RULE_SILENCE_SECOpsi
Periode tenang dalam detik setelah peringatan pertama dilaporkan ketika CloudMonitor terus-menerus memicu aturan karena anomali. Hal ini mencegah kelelahan peringatan. Jika tidak dikonfigurasi, nilai default digunakan.
900
kubectl
Jalankan perintah berikut untuk mengedit file YAML aturan peringatan.
kubectl edit ackalertrules default -n kube-systemModifikasi file YAML sesuai kebutuhan, lalu simpan dan keluar. Untuk informasi selengkapnya, lihat Templat aturan peringatan default.
Anda dapat menggunakan
rules.thresholdsuntuk menyesuaikan ambang batas peringatan. Sebagai contoh, konfigurasi di atas memicu notifikasi peringatan jika utilisasi CPU node kluster melebihi 85% selama tiga pemeriksaan berturut-turut dan peringatan sebelumnya dipicu lebih dari 900 detik yang lalu.Parameter
Wajib
Deskripsi
Nilai Default
CMS_ESCALATIONS_CRITICAL_ThresholdWajib
Ambang batas peringatan. Jika parameter ini tidak dikonfigurasi, aturan gagal disinkronkan dan dinonaktifkan.
unit: Satuan. Anda dapat mengatur nilai ini menjadi percent, count, atau qps.value: Ambang batas.
Bergantung pada konfigurasi templat peringatan default.
CMS_ESCALATIONS_CRITICAL_TimesOpsi
Jumlah percobaan ulang untuk aturan CloudMonitor. Jika tidak dikonfigurasi, nilai default digunakan.
3
CMS_RULE_SILENCE_SECOpsi
Periode tenang dalam detik setelah peringatan pertama dilaporkan ketika CloudMonitor terus-menerus memicu aturan karena anomali. Hal ini mencegah kelelahan peringatan. Jika tidak dikonfigurasi, nilai default digunakan.
900
Templat aturan peringatan default
Aturan peringatan default dibuat di kluster terdaftar dalam situasi berikut:
Fitur aturan peringatan default diaktifkan.
Anda mengakses halaman aturan peringatan untuk pertama kalinya saat fitur aturan peringatan default dinonaktifkan.
Tabel berikut menjelaskan aturan peringatan default yang dibuat.
Item Peringatan | Deskripsi Aturan | Sumber Peringatan | Rule_Type | ACK_CR_Rule_Name | SLS_Event_ID |
Pemeriksaan kluster menemukan anomali | Mekanisme pemeriksaan otomatis menangkap potensi anomali. Anda perlu menganalisis masalah spesifik dan kebijakan pemeliharaan harian. | Simple Log Service | event | cis-sched-failed | sls.app.ack.cis.schedule_task_failed |