爬虫风险管理(Anti-Bot Service,简称Anti-Bot)的日志服务功能详细记录网站域名的访问、攻防日志。日志中包含数十个字段,您可以根据不同需要选取特定的日志字段进行查询分析。
字段 | 说明 | 示例值 |
---|---|---|
__topic__ | 日志主题(Topic),该字段值固定为antibot_access_log。 | antibot_access_log |
antibot | 触发的爬虫风险管理防护策略类型,包括:
|
ratelimit |
antibot_action | 爬虫风险管理防护策略执行的操作,包括:
|
drop |
antibot_rule | 所触发的爬虫风险管理的规则ID。 | 5472 |
antibot_verify | 爬虫风险管理采用的校验手段的验证结果。
说明 当antibot_action字段的值为challenge和captcha时将记录该值。
|
challenge_fail |
block_action | 触发防爬拦截的防护类型。该值固定为antibot。 | antibot |
body_bytes_sent | 发送给客户端的HTTP Body的字节数。 | 2 |
content_type | 访问请求内容类型。 | application/x-www-form-urlencoded |
host | 源网站。 | api.aliyun.com |
http_cookie | 访问请求头部中带有的访问来源客户端Cookie信息。 | k1=v1;k2=v2 |
http_referer | 访问请求头部中带有的访问请求的来源URL信息。若无来源URL信息,则显示- 。
|
http://xyz.com |
http_user_agent | 访问请求头部中的User Agent字段,一般包含来源客户端浏览器标识、操作系统标识等信息。 | Dalvik/2.1.0 (Linux; U; Android 7.0; EDI-AL10 Build/HUAWEIEDISON-AL10) |
http_x_forwarded_for | 访问请求头部中带有的XFF头信息,用于识别通过HTTP代理或负载均衡方式连接到Web服务器的客户端最原始的IP地址。 | - |
https | 访问请求是否为HTTPS请求,其中:
|
true |
matched_host | 匹配到的已接入Anti-Bot防护配置的域名,可能是泛域名。若无法匹配到相关域名配置,则显示- 。
|
*.aliyun.com |
real_client_ip | 访问的客户端的真实IP。若无法获取到,则显示- 。
|
1.2.3.4 |
region | Anti-Bot实例地域信息。 | cn |
remote_addr | 访问请求的客户端IP。 | 1.2.3.4 |
remote_port | 访问请求的客户端端口。 | 23713 |
request_length | 访问请求长度,单位字节。 | 123 |
request_method | 访问请求的HTTP请求方法。 | GET |
request_path | 请求的相对路径(不包含查询字符串)。 | /news/search.php |
request_time_msec | 访问请求时间,单位为毫秒。 | 44 |
request_traceid | 访问请求唯一ID标识。 | 7837b11715410386943437009ea1f0 |
server_protocol | 源站服务器响应的协议及版本号。 | HTTP/1.1 |
status | 爬虫风险管理返回给客户端的HTTP响应状态信息。 | 200 |
time | 访问请求的发生时间。 | 2018-05-02T16:03:59+08:00 |
ua_browser | 访问请求来源的浏览器信息。 | ie9 |
ua_browser_family | 访问请求来源所属浏览器系列。 | internet explorer |
ua_browser_type | 访问请求来源的浏览器类型。 | web_browser |
ua_browser_version | 访问请求来源的浏览器版本。 | 9.0 |
ua_device_type | 访问请求来源客户端的设备类型。 | computer |
ua_os | 访问请求来源客户端的操作系统信息。 | windows_7 |
ua_os_family | 访问请求来源客户端所属操作系统系列。 | windows |
upstream_addr | Anti-Bot使用的回源地址列表,格式为IP:Port ,多个地址用逗号分隔。
|
1.2.3.4:443 |
upstream_ip | 访问请求所对应的源站IP。例如,Anti-Bot回源到ECS的情况,该参数即返回源站ECS的IP。 | 1.2.3.4 |
upstream_response_time | 源站响应Anti-Bot请求的时间,单位秒。如果返回“-”,代表响应超时。 | 0.044 |
upstream_status | 源站返回给Anti-Bot的响应状态。如果返回“-”,表示没有响应(例如该请求被Anti-Bot拦截或源站响应超时)。 | 200 |
user_id | 阿里云账号AliUID。 | 12345678 |
wxbb_action | 当爬虫风险管理防护类型为APP端增强防护时,执行的操作:
说明 如果未接入SDK防护,该字段值为-。
|
close |
wxbb_invalid_wua | APP端增强防护策略类型。
说明 其他的字段值对应一些具体的风险标签。由于该防护策略存在一定的误报率,如果没有出现大规模绕过的情况,一般不建议启用该防护策略。如果您需要针对特定类型进行拦截,请联系我们开启相应风险标签的拦截功能。
|
valid wua |