物联网(IoT)是一个基于互联网、传统电信网等的信息承载体,它让所有能够被独立寻址的普通物理对象形成互相连通的网络。本文将为您介绍IoT数据自动化同步至云端的解决方案。
背景信息
物联网(The Internet of Things,简称IoT)是指通过信息传感器等各种装置和技术,实时采集任何需要的信息。通过各类网络的接入,实现物与物、物与人的连接,实现对物品和过程的智能化感知、识别和管理。
物联网、大数据和云计算作为当前第三次信息化浪潮的代表技术,将在未来形成广泛的影响。物联网专注于物物相连,大数据专注于数据的价值化,云计算则为大数据和物联网提供计算资源等服务支持。
大数据是物联网体系的重要组成部分。物联网的体系结构包括设备、网络、平台、分析、应用和安全,其中分析部分的主要内容为大数据分析。大数据分析是大数据完成数据价值化的重要手段之一,而进行大数据分析的第一步是让数据成功上云。
解决方案
IoT数据自动化同步至云端解决方案主要包括存储原始数据和同步数据至分析系统两部分。
IoT设备大量的数据通常以半结构化的形式存储。例如,使用OSS存储原始信息为CSV文件。

- 新建离线同步节点,详情请参见通过向导模式配置任务。
- 选择数据来源OSS进行读取,详情请参见配置OSS Reader。
- 选择数据去向进行写入,本文以写入MaxCompute为例,您也可以写入其它类型的数据源中。
配置自动化流程
使用OSS读取CSV文件时,需要配置读取的文件名(Object前缀)。通常IoT会不停生成数据并存储为CSV文件,如果您手动配置同步任务以读取IoT数据至云端,会较为复杂且不易实现。下文将为您介绍每5分钟生成一份CSV文件的情况下,如何自动同步数据至云端(MaxCompute)。
- OSS上的文件需要按时周期性生成。
DataWorks具备按照定时时间进行周期调度的特点,您可以设置DataWorks同步任务的调度周期为OSS生成文件的周期。例如,OSS上的文件每15分钟生成一份,设置DataWorks同步任务的调度周期为每15分钟调度一次。
- 生成的文件名需要使用时间戳来命名。
OSS同步任务在读取文件时,需要使用时间戳对文件进行命名。DataWorks通过参数变量来动态生成文件名称,以确保和OSS上的文件名称保持一致。说明 推荐您使用yyyymmddhhmm等时间戳作为文件名的一部分,例如iot_log_201911062315.csv。