表格存储(Tablestore)面向海量结构化数据提供Serverless表存储服务,同时针对物联网场景深度优化提供一站式的IoTstore解决方案。适用于海量账单、IM消息、物联网、车联网、风控、推荐等场景中的结构化数据存储,提供海量数据低成本存储、毫秒级的在线数据查询和检索以及灵活的数据分析能力。

基本概念

在使用表格存储前,您需要了解以下基本概念。

术语说明
地域地域(Region)物理的数据中心,表格存储服务会部署在多个阿里云地域中,您可以根据自身的业务需求选择不同地域的表格存储服务。更多信息,请参见表格存储已经开通的Region
读写吞吐量读吞吐量和写吞吐量的单位为读服务能力单元和写服务能力单元,服务能力单元(Capacity Unit,简称CU)是数据读写操作的最小计费单位。更多信息,请参见读写吞吐量
实例实例(Instance)是使用和管理表格存储服务的实体,每个实例相当于一个数据库。表格存储对应用程序的访问控制和资源计量都在实例级别完成。更多信息,请参见实例
服务地址每个实例对应一个服务地址(EndPoint),应用程序在进行表和数据操作时需要指定服务地址。更多信息,请参见服务地址
数据生命周期数据生命周期(Time To Live,简称TTL)是数据表的一个属性,即数据的存活时间,单位为秒。表格存储会在后台对超过存活时间的数据进行清理,以减少您的数据存储空间,降低存储成本。更多信息,请参见数据版本和生命周期

数据存储模型

表格存储提供了宽表(WideColumn)模型、时序(TimeSeries)模型和消息(Timeline)模型三种数据存储模型,请根据使用场景选择合适的模型。不同数据存储模型支持的功能特性请参见功能特性

模型描述
宽表模型类Bigtable/HBase模型,可应用于元数据、大数据等多种场景,支持数据版本、生命周期、主键列自增、条件更新、局部事务、原子计数器、过滤器等功能。更多信息,请参见宽表模型
时序模型针对时间序列数据的特点进行设计的模型,可应用于物联网设备监控、设备采集数据、机器监控数据等场景,支持自动构建时序元数据索引、丰富的时序查询能力等功能。更多信息,请参见时序模型
消息模型针对消息数据场景设计的模型,可应用于IM、Feed流等消息场景。能满足消息场景对消息保序、海量消息存储、实时同步的需求,同时支持全文检索与多维度组合查询。更多信息,请参见消息模型

使用方式

您可以通过如下方式使用表格存储产品。

使用方式描述
控制台阿里云提供的Web服务页面,方便您便捷的操作表格存储。更多信息,请参见表格存储控制台
SDK支持主流开发语言Java、Go、Python、Node.js.、.Net和PHP。更多信息,请参见SDK概览
命令行工具支持通过简单的命令操作表格存储。更多信息,请参见命令行工具

快速入门

通过控制台或者命令行工具,您可以快速体验宽表模型中数据表或者时序模型中时序表的操作。更多信息,请参见快速入门

计算与分析

表格存储支持通过MaxCompute、Spark、Hive或者HadoopMR、函数计算、Flink以及表格存储SQL查询进行计算与分析,请根据实际场景选择相应分析工具。

分析工具操作描述
MaxCompute使用MaxCompute通过MaxCompute客户端为表格存储的数据表创建外部表,即可访问表格存储中的数据。
Spark使用Spark计算引擎使用Spark计算引擎时,支持通过E-MapReduce SQL或者DataFrame编程方式访问表格存储。
Hive或者HadoopMR使用Hive或者HadoopMR使用Hive或者HadoopMR访问表格存储中的数据。
函数计算使用函数计算通过函数计算访问表格存储,对表格存储增量数据进行实时计算。
Flink使用Flink通过实时计算Flink访问表格存储中的源表、维表或者结果表,实现大数据实时计算与分析。
表格存储SQL查询使用SQL查询SQL查询为多数据引擎提供统一的访问接口。通过SQL查询功能,您可以对表格存储中数据进行复杂的查询和高效的分析。

迁移同步

您可以将异构数据平滑迁移同步到表格存储,还可以将数据同步到对象存储OSS(Object Storage Service)等服务中。

分类数据同步描述
数据导入同步Kafka数据基于Tablestore Sink Connector将Apache Kafka中的数据批量导入到表格存储的数据表或者时序表中。
同步表格存储数据使用通道服务、DataWorks或者DataX将表格存储数据表中数据同步到另一个数据表中。
数据导出同步到MaxCompute使用DataWorks将表格存储中的全量数据或者增量数据导出到MaxCompute。
同步到OSS使用DataWorks将表格存储中的全量数据或者增量数据导出到OSS。
同步到本地文件使用命令行工具或者DataX工具直接下载数据到本地文件。您也可以使用DataWorks工具将数据同步到OSS后再在OSS侧下载数据到本地文件。