ASM支持采集控制平面日志和日志告警,例如采集ASM控制平面向数据平面Sidecar推送配置的相关日志。本文介绍如何启用控制平面日志采集和日志告警。
背景信息
ASM控制面组件的主要功能之一是推送网格的规则配置到数据面的Sidecar代理或者网关中。如果用户配置的网格规则内容存在一些冲突导致推送失败,代理或者网关就接收不到最新的配置内容。虽然代理或网关在不重启的情况下,可以使用已经接收到的配置继续运行,但是一旦这些Pod重启,很有可能导致Sidecar代理或网关启动失败。在很多实际场景中,经常出现用户误配置引发的网关或代理不可用的问题,因此启用控制面的日志告警,及时发现并解决问题十分必要。
启用控制平面日志采集
启用控制平面日志告警
重要 启用控制平面日志告警之前必须先启用控制平面日志采集,否则将无法使用该功能。
当控制平面发往数据平面的xDS请求被数据平面拒绝时,数据平面同步失败告警将被触发。此时您的数据平面的Sidecar代理或ASM网关将无法得到最新的配置信息,存在以下两种情况:
- 如果数据平面Sidecar在此之前收到过成功的配置推送,则该Sidecar将保持最后一次收到的成功推送的配置。
- 如果数据平面Sidecar在此之前尚未收到过成功的配置推送,则该Sidecar将没有任何配置信息,这意味着该节点可能没有任何监听,也无法处理任何请求和路由规则。
配置告警通知人
告警管理中心是SLS服务下基于业务的统一智能告警运维平台,您可以配置SLS服务网关内置行动策略,设置告警通知接收人,通知模板等。
- 登录日志服务控制台。
- 在日志应用区域的智能运维页签中,单击告警管理中心。
- 在告警管理中心页面,单击右上角的全局配置。
- 在告警管理中心左侧导航栏,单击 。
- 在用户组管理页面,单击SLS服务网格内置用户组右侧操作列下的修改。
- 在修改用户组对话框,在待添加成员区域选中目标成员,单击
图标,将目标成员添加到已添加成员区域,然后单击确认。
触发告警通知示例
告警处理的参考方案
以下表格列出了常见的数据面同步失败错误信息和处理建议,如果您没有找到对应的错误信息,请提交工单。
错误信息 | 处理建议 |
---|---|
Internal:Error adding/updating listener(s) 0.0.0.0_443: Failed to load certificate chain from <inline>, only P-256 ECDSA certificates are supported | 该告警信息表示数据面集群不支持您为数据面配置的证书,当前仅支持P-256 ECDSA证书。您需要重新配置证书,具体操作,请参见通过ASM网关启用HTTPS安全服务。 |
Internal:Error adding/updating listener(s) 0.0.0.0_443: Invalid path: **** | 该告警信息表示您为数据面配置的证书路径有误或证书不存在,您需要检查证书挂载路径是否与Gateway中配置的路径相符。具体操作,请参见通过ASM网关启用HTTPS安全服务。 |
Internal:Error adding/updating listener(s) 0.0.0.0_xx: duplicate listener 0.0.0.0_xx found | 该告警信息表示您为网关配置的监听端口重复,请检查您的Gateway,删除重复的端口。 |
Internal:Error adding/updating listener(s) 192.168.33.189_15021: Didn't find a registered implementation for name: '***' | 该告警信息表示在Sidecar和Ingressgateway中无法找到您通过EnvoyFilter针对15021这个Listener patch的配置中引用的***,您需要删除该引用。 |
Internal:Error adding/updating listener(s) 0.0.0.0_80: V2 (and AUTO) xDS transport protocol versions are deprecated in grpc_service *** | 该告警信息表示即将弃用您数据面的XDS V2协议,这通常是因为您的数据面Sidecar的版本与控制平面不符。升级数据平面的Sidecar可以解决该问题,您需要删除Pod,该Pod自动重新创建后会自动注入最新版本的Sidecar。 |