全部产品
Search
文档中心

CDN:下载离线日志

更新时间:Jun 17, 2024

阿里云CDN按小时颗粒度记录了域名的全网访问日志。您可以根据需求将指定域名在30天内某一天的日志下载到本地路径进行保存,并进行分析。

注意事项

  • 通过CDN/DCDN控制台(或者OpenAPI)的监控查询、用量查询(实际计费流量)功能查到的加速域名使用的流量数据与通过日志统计的流量数据有差异。通常来说,通过监控查询、用量查询功能查到的加速域名使用的流量数据是通过日志统计的流量数据的1.1倍,详细请参见为什么监控查询流量、用量查询流量与日志统计流量有差异

  • 少数ISP在特定区域可能会分配私有IP地址给用户端,导致CDN节点接收到的是用户的私有IP地址。

    说明

    私有IP地址范围有以下三个:

    • A类私有IP地址:10.0.0.0~10.255.255.255,子网掩码:10.0.0.0/8

    • B类私有IP地址:172.16.0.0~172.31.255.255,子网掩码:172.16.0.0/12

    • C类私有IP地址:192.168.0.0~192.168.255.255,子网掩码:192.168.0.0/16

日志下载使用说明

  • 日志文件延迟时间:通常情况下延迟在24小时之内,也有可能超过24小时。

  • 日志下载默认支持下载30天内的日志数据。如果您需要存储更长时间的日志,可以使用离线日志转存服务,将日志转存到您名下的OSS进行长期存储。具体操作请参见通过函数计算转存离线日志

  • 日志命名规则:加速域名_年_月_日_开始时间_结束时间[扩展字段].gz,扩展字段以下划线(_)开头。例如aliyundoc.com_2018_10_30_000000_010000_xx.gz

    说明

    扩展字段可能不存在,例如aliyundoc.com_2018_10_30_000000_010000.gz

日志的字段格式说明

  • 日志示例

    [9/Jun/2015:01:58:09 +0800] 10.10.10.10 - 1542 "-" "GET http://www.aliyun.com/index.html" 200 191 2830 MISS "Mozilla/5.0 (compatible; AhrefsBot/5.0; +http://example.com/robot/)" "text/html"
  • 字段含义

    字段

    描述

    [9/Jun/2015:01:58:09 +0800]

    用户访问请求的结束时间。

    10.10.10.10

    从用户请求携带的请求头X-Forwarded-For中提取左边第一个IP地址(即client_ip,客户端IP,如果客户端与CDN节点之间没有经过代理的话,等同于客户端与CDN节点建联使用的IP)。

    说明
    • 请求头 X-Forwarded-For 的格式为X-Forwarded-For: <client_ip>, <proxy_ip>

    • 在客户端与CDN节点之间没有经过代理的场景下(即x-forwarded-for里面只有<client_ip>),可能会出现日志中<client_ip>的值为私网IP地址的情况,其原因通常为客户端所在的运营商为其分配了私网IP地址(目的是减少公网IP地址的使用,以降低成本)。

    • 在客户端与CDN节点之间有经过代理的场景下(即x-forwarded-for里面既有<client_ip>,也有<proxy_ip>),也可能会出现日志中<client_ip>的值为私网IP地址的情况,其原因通常为运营商为客户端分配的公网IP地址被配置到了代理上面,而此时客户端上配置的是私网IP地址。

    -

    从用户请求携带的请求头X-Forwarded-For中提取左边第二个IP地址(即proxy_ip,代理IP,如果客户端与CDN节点之间没有经过代理的话,提取到的空值用-表示)。

    1542

    请求响应时间,单位为毫秒。

    "-"

    HTTP请求头中的Referer。

    GET

    请求方法。

    http://www.aliyun.com/index.html

    用户请求的URL链接。

    200

    HTTP状态码。

    191

    请求大小,单位为字节。

    2830

    请求返回大小,单位为字节。

    MISS

    命中信息。

    • HIT:用户请求命中了CDN边缘节点上的资源(不需要回源)。

    • MISS:用户请求的内容没有在CDN边缘节点上缓存,需要向上游获取资源(上游可能是CDN L2节点,也可能是源站)。

    说明

    阿里云CDN目前仅提供了CDN边缘节点的日志信息,不包含CDN L2节点的回源相关信息,因此当该字段为MISS时,无法获取回源信息,因此无法直观地从日志里面看到用户请求是否回源。

    Mozilla/5.0(compatible; AhrefsBot/5.0; +http://example.com/robot/)

    User-Agent请求头信息。

    text/html

    文件类型。

    说明

    开启全球资源计划的域名日志,不包含该字段。

操作步骤

  1. 登录CDN控制台

  2. 在左侧导航栏,单击日志管理 > 离线日志

  3. 日志下载页签,选择域名查询时间,单击查询

  4. 根据查询结果,单击操作列下的下载,即可下载日志至本地。

相关API

DescribeCdnDomainLogs:查询域名的离线日志下载地址。