进程监控默认为您采集阿里云主机最近一段时间内活跃进程的CPU使用率、内存使用率和文件打开数。如果您添加了进程关键字,还可以采集包含关键字的进程个数。

前提条件

请确保您已为阿里云主机安装云监控插件。具体操作,请参见安装和卸载C++版本插件

背景信息

云监控每分钟统计一次CPU消耗Top5的进程,记录这些进程的CPU使用率、内存使用率和打开文件数。
  • 进程的CPU使用率与内存使用率。

    您可以参考Linux中的top命令理解这两个监控项的含义。

  • 进程的打开文件数。

    您可以参考Linux中的lsof命令理解这个监控项的含义。

云监控采集CPU消耗Top5进程的CPU使用率,可能存在以下问题:

  • 如果您的进程占用多个CPU,则会出现CPU使用率超过100%的情况,因为采集结果为多核CPU的总使用率。
  • 如果您查询的时间范围内,CPU消耗Top5的进程不固定,进程列表会显示该时间范围内全部进入过Top5的进程,列表中的时间表示该进程最后一次进入Top5的时间。
  • 云监控只采集CPU消耗Top5进程的CPU使用率、内存使用率和打开文件数。如果进程在查询的时间范围内未持续进入Top5,则监控图表中会出现数据点不连续的情况,数据点的密集程度表明了该进程在主机上的活跃程度。示例如下:
    • Wrapper进程未持续进入主机CPU消耗Top5,监控图表中的数据点稀疏,且不连续,表示有数据点的时间该进程进入Top5。wrapper
    • Java进程在监控图表中的数据点非常密集,且连续,表示该进程已持续进入CPU消耗Top5。JAVA

添加进程监控

您可以通过监控主机的进程数,采集关键进程的数量,及时获取关键进程的存活状态。

假设您的主机运行了如下进程:
  • /usr/bin/java -Xmx2300m -Xms2300m org.apache.catalina.startup.Bootstrap
  • /usr/bin/ruby
  • nginx -c /etc/nginx/nginx.conf
您添加了6个进程关键字,采集结果如下:
  • 进程关键字为ruby,采集进程数为1,命中进程名称。
  • 进程关键字为nginx,采集进程数为1,命中进程名称与参数。
  • 进程关键字为/usr/bin,采集进程数为2,命中路径(2个进程包含该路径)。
  • 进程关键字为apache.catalina,采集进程数为1,命中部分参数。
  • 进程关键字为nginx.conf,采集进程数为1,命中部分参数。
  • 进程关键字为-c,采集进程数为1,命中部分参数。
  1. 登录云监控控制台
  2. 在左侧导航栏,单击主机监控
  3. 主机监控页面,单击目标主机的实例名称链接,或单击目标主机对应操作列的监控图表
  4. 单击进程监控页签。
  5. 进程数区域,单击右上角的添加进程监控
  6. 添加进程监控面板,输入进程名称,单击增加
  7. 单击右上角的关闭图标。

删除进程监控

  1. 登录云监控控制台
  2. 在左侧导航栏,单击主机监控
  3. 主机监控页面,单击目标主机的实例名称链接,或单击目标主机对应操作列的监控图表
  4. 单击进程监控页签。
  5. 进程数区域,单击右上角的添加进程监控
  6. 添加进程监控面板,单击目标进程对应操作列的删除
  7. 删除确认对话框,单击确定
  8. 单击右上角的关闭图标。

为进程监控设置报警规则

您添加进程监控后,可以为该进程设置报警规则。当进程数发生变化时,您可以收到报警通知。

  1. 登录云监控控制台
  2. 在左侧导航栏,单击主机监控
  3. 主机监控页面,单击右上角的创建报警规则
  4. 创建报警规则面板,监控指标选择进程中的(Agent)process.count_processname,根据所需设置报警规则的其他参数。
    如果主机上设置了多个进程,且每个进程数不同,可以单击添加规则,为多个进程设置报警规则。关于如何设置报警规则中的相关参数,请参见创建报警规则
  5. 单击确定