表格存储是阿里云自研的多模型结构化数据存储,提供海量结构化数据存储以及快速的查询和分析服务。表格存储的分布式存储和强大的索引引擎能够提供PB级存储、千万TPS以及毫秒级延迟的服务能力。
基础概念
使用表格存储前,请了解如下基础概念。
基础概念 | 描述 |
---|---|
实例 | 实例是使用和管理表格存储服务的实体,表格存储对应用程序的访问控制和资源计量都在实例级别完成。 |
读写吞吐量 | 读吞吐量和写吞吐量的单位为读服务能力单元和写服务能力单元,服务能力单元(简称CU)是数据读写操作的最小计费单位。 |
地域 | 地域是指阿里云物理数据中心所在的位置。 |
服务地址 | 每个表格存储实例对应一个服务地址,应用程序在进行表和数据操作时需要指定服务地址。 |
模型
表格存储提供多种模型,您可以根据业务需求选择对应的模型进行应用。表格存储提供如下几种模型。
模型 | 描述 |
---|---|
Wide column模型 | 可应用于元数据、大数据等多种场景。支持数据版本、生命周期、主键列自增、条件更新、原子计数器、过滤器等功能。 |
Timeline模型 | 针对消息数据场景设计的模型,可应用于IM、Feed流等消息场景。能满足消息场景对消息保序、海量消息存储、实时同步的需求,同时支持全文检索与多维度组合查询。 |
功能
表格存储提供如下功能。
功能 | 描述 |
---|---|
主键列自增 | 设置非分区键的一列主键为自增列后,在写入一行数据时,此列主键无需填值,表格存储会自动生成该主键列的值,该值在分区键上保证唯一且严格递增。 |
条件更新 | 只有满足条件时,才能对数据表中的数据进行更新;当不满足条件时,更新失败。 |
原子计数器 | 将列作为一个原子计数器使用,便于为某些在线应用提供实时统计功能,例如统计帖子的PV(实时浏览量)等。 |
过滤器 | 在服务端对读取的结果再进行一次过滤,根据过滤器中的条件决定返回哪些行。由于只返回符合条件的数据行,所以在大部分场景下,可以有效降低网络传输的数据量,减少响应时间。 |
多元索引 | 基于倒排索引和列式存储,解决大数据的复杂查询难题。 |
全局二级索引 | 支持在属性列创建索引。 |
通道服务 | 提供了增量、全量、增量加全量三种类型的分布式数据实时消费通道。可以实现对表中历史存量和新增数据的消费处理。 |
HBase支持 | 开源HBase API的Java应用可以通过Tablestore HBase Client直接访问表格存储服务。 |