全部产品
Search
文档中心

配额中心:创建配额告警

更新时间:Jul 15, 2024

当您需要监控各云产品配额项的使用情况时,可以为目标配额项创建告警。当配额项的监控指标达到告警条件时,您会收到告警通知,提前申请提升配额。

前提条件

API速率配额的配额告警集成云监控的告警能力,目前处于邀测阶段,请您提交工单申请。

背景信息

配额中心仅支持为通用配额和API速率配额创建告警,具体差异如下:

  • 通用配额

    配额中心默认通过短信和邮件给当前阿里云账号发送告警通知。您还可以设置告警回调的URL地址,实现自动化提升目标云服务配额的目的。

    告警回调是配额中心提供的一个告警订阅功能。您的运维系统可以根据告警回调内容发起配额提升流程,实现自动化提升配额。

  • API速率配额

    API速率配额的配额告警集成了云监控的告警能力后,AliyunQuotasReadOnlyAccess和AliyunQuotasFullAccess权限策略自动更新。更多信息,请参见产品系统策略

    您可以通过以下方式为API速率配额创建配额告警:

    • 通过配额中心控制台创建

      通过配额中心只能为目标云产品中的某个API速率创建配额告警(即单独配额项告警)。具体操作,请参见为API速率配额创建配额告警

    • 通过云监控控制台创建

      通过云监控可以为目标云产品中的某个API速率创建配额告警(即单独配额项告警),也可以为目标云产品中的全部API速率创建配额告警(即全局配额项告警)。配额告警创建成功后,您还可以在配额中心的配额告警页面的API速率配额页签中看到新创建的告警规则。具体操作,请参见配额中心监控

    创建配额告警后,当告警指标达到阈值时,告警联系人组中的告警联系人会收到电话、短信、邮件和告警回调方式的告警通知。创建的配额告警将消耗云监控的费用额度,不同告警方式的计费如下:

    • 电话:无免费额度,您需要开通按量计费或购买资源包。更多信息,请参见按量计费资源包

    • 短信:免费额度为1000条/月,如果超过免费额度,则请您开通按量计费或购买资源包。更多信息,请参见免费额度按量计费资源包

    • 邮件和告警回调:均免费。

为通用配额创建配额告警

本文以为云服务器ECS的安全组总数量上限创建配额告警为例进行介绍,其中告警条件为:当配额项(安全组总数量上限)的使用率达到80%时,通过短信和邮件给当前阿里云账号发送告警通知。

  1. 登录配额中心控制台

  2. 在左侧导航栏,选择产品列表 > 通用配额

  3. 通用配额列表页面的弹性计算区域,单击云服务器ECS

  4. 单击安全组总数量上限对应操作列的创建告警

  5. 告警规则创建页面,设置告警规则的相关参数。

    • 基本信息:输入告警规则名称。

    • 告警条件告警指标选择使用率(%)配额告警阈值80%,其他参数保持默认值。

    • 通知方式:无需设置。

      表 1. 为通用配额创建配额告警的相关参数说明

      参数

      说明

      规则名称

      配额告警的规则名称。

      告警指标

      配额告警的指标。包括:用量使用率(%)剩余可用量剩余可用率(%)

      配额告警阈值

      配额告警的阈值。您需要根据告警指标设置配额告警的阈值。

      • 告警指标选择用量时,如果配额的使用量大于等于阈值,当前阿里云账号会收到告警通知。

      • 告警指标选择使用率(%)时,如果配额的使用率大于等于阈值,当前阿里云账号会收到告警通知。取值范围:[50%, 100%]。

      • 告警指标选择剩余可用量时,如果配额的剩余可用量小于等于阈值,当前阿里云账号会收到告警通知。

      • 告警指标选择剩余可用率(%)时,如果配额的剩余可用率小于等于阈值,当前阿里云账号会收到告警通知。取值范围:(0%, 50%]。

      告警回调

      配额中心将告警信息通过HTTP协议的POST请求发送到您指定的公网URL地址。

      告警回调的请求示例和参数说明,请参见告警回调的请求内容是什么?

      说明
      • 配额中心的告警精度默认为15分钟,表示配额中心会在配额达到告警阈值后的大约15分钟后发送告警通知。

      • 当您的告警回调采用与钉钉机器人的Webhook方式集成时,必须先设置钉钉机器人的自定义关键字告警,再复制Webhook地址作为告警回调的URL地址。

  6. 单击确认

    告警历史页签,您可以查看配额的告警历史。

    您还可以在左侧导航栏单击告警历史,查看已发生告警的告警规则。

    说明

    通用配额取实时配额值,使用率和剩余可用率根据配额用量和配额计算产生。

为API速率配额创建配额告警

本文以为云服务器ECS的API CreateSecurityGroup(配额为每60秒200次)创建配额告警为例进行介绍,其中告警条件为:当阈值大于等于180时,通过短信和邮件给告警联系人组内的告警联系人发送告警通知。

  1. (可选)为RAM用户授予通过云监控创建和删除配额告警的权限。

    说明

    仅RAM用户需要执行本操作。

    为RAM用户授予以下自定义策略的具体操作,请参见为RAM用户授权

    {
      "Statement": [
        {
          "Effect": "Allow",
          "Action": [
            "cms:PutMetricRuleTargets",
            "cms:PutResourceMetricRules",
            "cms:DeleteMetricRules",
            "cms:DeleteMetricRuleTargets"
          ],
          "Resource": "*"
        }
      ],
      "Version": "1"
    }
  2. 登录配额中心控制台

  3. 在左侧导航栏,选择产品列表 > API速率配额

  4. API速率配额产品列表页面的弹性计算区域,单击云服务器ECS

  5. 地域默认为华东1(杭州),先输入关键字CreateSecurityGroup进行搜索,再单击CreateSecurityGroup对应操作列的创建告警

  6. 告警规则创建页面,设置告警规则的相关参数。

    • 基本信息:输入告警规则名称。

    • 告警条件告警指标选择配额阈值为大于等于180告警级别警告(Warn),告警级别对应的通知方式默认为邮件+告警回调,其他参数保持默认值。

    • 通知方式:单击告警联系人组对应的新建联系人,您可以在云监控控制台创建告警联系人或告警联系人组,其他参数均保持默认值。

      说明

      当您不设置告警回调地址时,不会通过此方式进行告警通知。

      表 2. 为API速率配额创建配额告警的相关参数说明

      参数

      说明

      规则名称

      告警规则名称。

      告警指标

      配额告警的指标。包括:配额用量使用率(%)剩余可用率(%)

      阈值及报警级别

      告警级别和该级别对应的阈值。

      告警级别对应的告警通知方式如下:

      • 紧急(Critical):邮件+告警回调。

      • 警告(Warn):邮件+告警回调。

      • 普通(Info):邮件+告警回调。

      您还需要选择发送告警通知需要监控指标达到告警阈值的次数。取值:连续1个周期、连续3个周期、连续5个周期、连续10个周期、连续15个周期、连续30个周期、连续60个周期、连续70个周期、连续90个周期、连续120个周期和连续180个周期。

      您可以设置多级告警,当阈值处于不同区间时,对应不同告警级别,云监控通过不同渠道给您发送告警通知。

      通道沉默周期

      告警发生后未恢复正常,间隔多久重复发送一次告警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。

      某监控指标达到告警阈值时发送告警,如果监控指标在通道沉默周期内持续超过告警阈值,在通道沉默周期内不会重复发送告警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送告警通知。

      例如:当通道沉默周期选择24小时时,如果告警未恢复正常,则间隔24小时后,云监控会再次发送告警通知。

      生效时间

      告警规则的生效时间。告警规则仅在指定周期(星期一至星期日)的生效期内才会发送告警通知。

      告警联系人组

      发送告警的联系人组。

      应用分组的告警通知会发送给该告警联系人组中的告警联系人。告警联系人组是一组告警联系人,可以包含一个或多个告警联系人。

      关于如何创建告警联系人和告警联系人组,请参见创建告警联系人或告警联系人组

      告警回调

      公网可访问的URL,用于接收云监控通过POST请求推送的告警信息。目前仅支持HTTP协议。

      当您需要测试告警回调地址的连通性时,可以执行以下操作。

      1. 单击回调地址正后方的测试

        WebHook测试结果页面,您可以通过Webhook返回的状态码和测试结果详情对告警回调地址的连通性进行判断和排查。

        说明

        您还可以设置Webhook的语言,再次单击测试,获取对应的测试结果详情。

      2. 单击关闭

      标签

      告警规则的标签。包括标签名称和标签值。

      说明
      • 您最多可设置6组标签。

      • 单击高级设置,可设置该参数。

      投递渠道

      告警信息的投递渠道。取值:

      • 日志服务

        如果您打开日志服务开关,当告警发生时,会将告警信息发送至日志服务的日志库。您需要设置日志服务的地域ProjectNameLogstore

        关于如何创建Project和Logstore,请参见快速入门

      • 消息服务MNS-Topic

        如果您打开消息服务MNS-Topic开关,当告警发生时,会将告警信息发送至消息服务的主题。您需要设置消息服务的地域和主题。

        关于如何创建主题,请参见创建主题

      • 函数计算

        如果您打开函数计算开关,当告警发生时,会将告警通知发送至函数计算进行格式处理。您需要设置函数计算的地域、服务和函数。

        关于如何创建服务和函数,请参见快速创建函数

      说明

      单击高级设置,可设置该参数。

      恢复通知

      是否在告警恢复时发送相应的恢复通知。默认打开开关。

      说明

      单击高级设置,可设置该参数。

      无数据处理方法

      无监控数据时告警的处理方式。取值:

      • 不做任何处理(默认值)

      • 发送无数据告警

      • 视为恢复

      说明

      单击高级设置,可设置该参数。

  7. 单击确认

    • 配额监控页签,您可以查看配额的监控图表。

      您还可以单击目标告警规则对应操作列的监控详情,查看配额相关指标的监控图表。

      说明

      API速率配额以60秒为时间周期聚合数据,具体如下:

      • 如果API速率配额是QPS粒度(例如:5/1(s),表示每秒可查询5次),则取60秒内访问量最大的某秒的QPS为配额用量。

      • 如果API速率配额是QPM粒度(例如:300/60(s),表示每60秒可查询300次),则取60秒内总访问量为配额用量。

    • 告警历史页签,您可以查看配额的告警历史。

      您还可以在左侧导航栏单击告警历史,查看已发生告警的告警规则。

相关文档