阿里云Logstash支持对实例进行监控,并支持设置自定义报警规则以及通知方式。为避免出现集群状态异常、节点磁盘使用率过高等问题而影响Logstash服务,建议您进行监控报警配置,实时监控集群状态、节点磁盘使用率等信息,及时查收报警短信,提前做好防御措施。本文介绍如何为Logstash实例配置自定义报警策略。

背景信息

目前Logstash只支持在云监控中配置以下四种监控项。如果您在配置项中观察到其他项,请忽略。
监控项 说明
Logstash实例节点磁盘使用率 必选。报警阈值控制在75%以下。
节点内存使用量 必选。报警阈值控制在85%以下。
Logstash实例节点CPU使用率 可选。报警阈值控制在95%以下。
节点1分钟负载 可选。以CPU核数的80%为参考值。

操作步骤

  1. 进入云监控控制台。
    1. 登录阿里云Elasticsearch控制台
    2. 在顶部菜单栏处,选择地域。
    3. 在左侧导航栏,单击Logstash实例,然后在Logstash实例中单击目标实例ID。
    4. 在左侧导航栏,单击集群监控
    5. 监控报警配置页面,单击前往云监控配置,进入云监控控制台的创建报警规则页面。
      进入云监控入口
  2. 配置关联资源。
    配置关联资源
    参数 说明
    产品 选择阿里云LogstashService
    资源范围 按需选择,取值含义如下:
    • 全部资源:选择全部资源,则产品下任何实例满足报警规则描述时,都会发送报警通知。
    • 实例:选择指定的实例,则选中的实例满足报警规则描述时,才会发送报警通知。

    本文以选择实例为例。

    地域 选择实例所在地域。
    实例 选择待监控的实例。
  3. 设置报警规则。
    设置报警规则
    通道沉默时间指报警发生后如果未恢复正常,再次发送一次报警通知的间隔时间。
    说明 其他参数说明,请参见 创建阈值报警规则
  4. 配置报警通知方式,选择云账号报警联系人
    如果您还没有报警联系组,请单击 快速创建联系人组,进行创建。 快速创建联系人组
    说明 您可以在 报警回调中填写可通过公网访问的URL,云监控会将报警信息通过POST请求推送到该地址,目前仅支持HTTP协议。
  5. 单击确认
  6. 查看Logstash监控大屏。
    配置完成后,Logstash实例的监控信息将在实例正常运行后开始采集。当指标值超过您设置的报警阈值时,系统会为您发送报警通知。您可以通过以下方式查看Logstash监控大屏:
    1. 在云监控首页的左侧导航栏,选择Dashboard > 云产品监控大盘
    2. 选择阿里云LogstashService产品,并选择地域。
    3. 选择实例和监控时间段,即可查看该段时间内的监控大屏。
      Logstash监控大屏