阿里云Elasticsearch支持对实例进行监控,并支持自定义报警阈值以及通过短信接收报警。为避免出现集群状态不正常、节点磁盘使用率过高等问题影响Elasticsearch服务,强烈建议您配置监控报警,实时监控集群状态、节点磁盘使用率等信息,及时查收报警短信,提前做好防御措施。本文介绍如何为Elasticsearch实例配置云监控报警。
背景信息
监控项 | 说明 |
---|---|
集群状态 | 必选。主要监控集群状态为正常(绿色)还是非正常(黄色或红色)。 |
节点磁盘使用率(%) | 必选。报警阈值控制在75%以下,不要超过80%。 |
节点HeapMemory使用率(%) | 必选。报警阈值控制在85%以下,不要超过90%。 |
节点CPU使用率(%) | 可选。报警阈值控制在95%以下,不要超过95%。 |
节点load_1m | 可选。以CPU核数的80%为参考值。 |
集群查询QPS(Count/Second) | 可选。以实际测试结果作为参考。 |
集群写入QPS(Count/Second) | 可选。以实际测试结果作为参考。 |
说明 Elasticsearch实例的监控报警默认为开启状态,因此您可以在实例的监控报警页面查看历史监控数据,目前只保留一个月内的监控信息。