Tablestore(Tablestore)面向海量結構化資料提供Serverless表格儲存體服務,同時針對物聯網情境深度最佳化提供一站式的IoTstore解決方案。適用于海量賬單、IM訊息、物聯網、車連網、風控、推薦等情境中的結構化資料存放區,提供海量資料低成本儲存、毫秒級的線上資料查詢和檢索以及靈活的資料分析能力。

基本概念

在使用Tablestore前,您需要瞭解以下基本概念。

術語說明
地區地區(Region)物理的資料中心,Tablestore服務會部署在多個阿里雲地區中,您可以根據自身的業務需求選擇不同地區的Tablestore服務。更多資訊,請參見Tablestore已經開通的Region
讀寫輸送量讀輸送量和寫輸送量的單位為讀服務能力單元和寫服務能力單元,服務能力單元(Capacity Unit,簡稱CU)是資料讀寫操作的最小計費單位。更多資訊,請參見讀寫輸送量
執行個體執行個體(Instance)是使用和管理Tablestore服務的實體,每個執行個體相當於一個資料庫。Tablestore對應用程式的存取控制和資源計量都在執行個體層級完成。更多資訊,請參見執行個體
服務地址每個執行個體對應一個服務地址(EndPoint),應用程式在進行表和資料操作時需要指定服務地址。更多資訊,請參見服務地址
資料生命週期資料生命週期(Time To Live,簡稱TTL)是資料表的一個屬性,即資料的存活時間,單位為秒。Tablestore會在後台對超過存活時間的資料進行清理,以減少您的資料存放區空間,降低儲存成本。更多資訊,請參見資料版本和生命週期

資料存放區模型

Tablestore提供了寬表(WideColumn)模型、時序(TimeSeries)模型和訊息(Timeline)模型三種資料存放區模型,請根據使用情境選擇合適的模型。不同資料存放區模型支援的功能特性請參見功能特性

模型描述
寬表模型類Bigtable/HBase模型,可應用於中繼資料、巨量資料等多種情境,支援資料版本、生命週期、主鍵列自增、條件更新、局部事務、原子計數器、過濾器等功能。更多資訊,請參見寬表模型
時序模型針對時間序列資料的特點進行設計的模型,可應用於物聯網裝置監控、裝置採集資料、機器監控資料等情境,支援自動構建時序中繼資料索引、豐富的時序查詢能力等功能。更多資訊,請參見時序模型
訊息模型針對訊息資料情境設計的模型,可應用於IM、Feed流等訊息情境。能滿足訊息情境對訊息保序、海量訊息儲存、即時同步的需求,同時支援全文檢索索引與多維度組合查詢。更多資訊,請參見訊息模型

使用方式

您可以通過如下方式使用Tablestore產品。

使用方式描述
控制台阿里雲提供的Web服務頁面,方便您便捷的動作表格儲存。更多資訊,請參見Tablestore控制台
SDK支援主流開發語言Java、Go、Python、Node.js.、.Net和PHP。更多資訊,請參見SDK概覽
命令列工具支援通過簡單的命令動作表格儲存。更多資訊,請參見命令列工具

快速入門

通過控制台或者命令列工具,您可以快速體驗寬表模型中資料表或者時序模型中時序表的操作。更多資訊,請參見快速入門

計算與分析

Tablestore支援通過MaxCompute、Spark、Data Lake Analytics(簡稱DLA)、Hive或者HadoopMR、Function Compute、Flink以及TablestoreSQL查詢進行計算與分析,請根據實際情境選擇相應分析工具。

分析工具操作描述
MaxCompute使用MaxCompute通過MaxCompute用戶端為Tablestore的資料表建立外部表格,即可訪問Tablestore中的資料。
Spark使用Spark計算引擎使用Spark計算引擎時,支援通過E-MapReduce SQL或者DataFrame編程方式訪問Tablestore。
Hive或者Hadoop MR使用Hive或者HadoopMR使用Hive或者HadoopMR訪問Tablestore中的資料。
Function Compute使用Function Compute通過Function Compute訪問Tablestore,對錶格儲存增量資料進行Realtime Compute。
Flink使用Flink通過Realtime ComputeFlink訪問Tablestore中的源表、維表或者結果表,實現巨量資料Realtime Compute與分析。
TablestoreSQL查詢使用SQL查詢SQL查詢為多資料引擎提供統一的提供者。通過SQL查詢功能,您可以對錶格儲存中資料進行複雜的查詢和高效的分析。

遷移同步

您可以將異構資料平滑遷移同步到Tablestore,還可以將資料同步到Object Storage Service(Object Storage Service)等服務中。

分類資料同步貓叔
資料匯入同步Kafka資料基於Tablestore Sink Connector將Apache Kafka中的資料大量匯入到Tablestore的資料表或者時序表中。
同步Tablestore資料使用通道服務、DataWorks或者DataX將Tablestore資料表中資料同步到另一個資料表中。
資料匯出同步到MaxCompute使用DataWorks將Tablestore中的全量資料或者增量資料匯出到MaxCompute。
同步到OSS使用DataWorks將Tablestore中的全量資料或者增量資料匯出到OSS。
同步到本地檔案使用命令列工具或者DataX工具直接下載資料到本地檔案。您也可以使用DataWorks工具將資料同步到OSS後再在OSS側下載資料到本地檔案。