云数据库 SelectDB 版

基于 Apache Doris 的云原生实时数据仓库,致力于提供极致性能、简单易用的数据分析服务。

概述

云数据库 SelectDB 版是基于 Apache Doris 研发的新一代云原生实时数仓服务,具有云原生存算分离、实时极速、融合统一、简单易用、开源开放等核心优势,提供万级 QPS 的实时报表查询、亚秒级的即席多维分析体验、近10倍性价比的日志分析方案、最高降本80%的湖仓一体分析平台。

产品优势

  • 云原生架构:解决成本和扩展性问题

    云原生的存算分离架构,可独立、按需地伸缩计算和存储资源。全量数据存储于廉价稳定的对象存储 OSS 中,存储单价降低约 90%。支持多计算集群共享同一份数据,避免存储冗余,同时提供强大的物理和逻辑隔离能力。总拥有成本(TCO)低于自建数仓 50%。

  • #
    实时极速:解决性能问题

    SelectDB 在宽表聚合、多表关联分析、高并发点查场景下,均具有极致的查询性能。登顶全球分析型数据库榜单 ClickBench,多项指标世界第一。支持实时高并发的导入和更新能力,数据从产生到可分析仅需秒级。

  • #
    极简易用:解决易用性问题

    支持丰富易用的数据导入方式,可快速完成数据接入。兼容 MySQL 连接协议和语法,无缝对接数十款数据库和大数据生态产品,降低用户学习成本。提供可视化开发工具,简化数据开发过程。

产品功能

实时弹性

支持多计算集群,集群可按需扩缩容,分钟级完成、无需停服。

数据湖分析

支持丰富的数据湖类型,如Hive、Iceberg、Hudi等,支持湖数据的查询与回写。

半结构化数据分析

提供简单极速的半结构化数据分析能力,支持任意类型Variant、倒排索引等。

应用场景

传统解决方案面临的挑战包括:数据从产生到可见的延时高(小时级),查询响应速度慢并发低(仅支持数十并发),同时易发生数据丢失或重复,服务可用性差等问题。使用云数据库 SelectDB 版处理在线高并发报表查询,可以获得实时、快速、稳定、高可用的服务。

方案优势

  • 实时数据写入

    支持每秒百万级的实时写入,也支持与数据库生态(如MySQL、PostgreSQL、Oracle等)、大数据生态(如Flink、Kafka、Dataworks等)的集成对接,简化数据写入过程。

  • 亚秒级查询响应

    通过全新的查询优化器、高性能的Pipeline执行引擎、丰富的索引类型等,实现数量级的查询加速。强一致的聚合物化视图,支持查询自动改写命中,满足亚秒级聚合统计查询。

  • 万级高并发

    支持分区分桶级裁剪、跳数索引(Zonemap、Bloomfilter)、点查索引(主键、倒排),减少读取的数据量,提升并发查询能力。结合行列混存、定制查询优化器,单机可支撑上万 QPS 的高并发点查。

传统解决方案通常存在以下问题:计算分析过程复杂,难以快速响应查询;表结构不灵活,不适应灵活的业务变化;数据发生变化时,原有数据无法实时更新。基于云数据库 SelectDB 版建设多维数据分析平台,可实现个性化、精细化的运营(如用户画像与行为分析),以更加精准的方式触达用户、驱动业务发展。

方案优势

  • 高性能更新处理

    提供高并发的数据更新能力,支持整行或部分列更新,无需离线周期性的重算大量历史数据,始终保障秒级的数据时效性。提供简单高效的内置 ETL 能力,可通过 SQL 轻松进行数据处理转换。

  • 轻量级表结构变更

    支持轻量的表结构变更,可秒级在线完成表结构变更。提供丰富的半结构化类型(如Map、Array、Json等)、高性能的宽表处理能力(高达数千列),充分满足业务的灵活多样性。

  • 秒级交互式分析

    提供丰富的即席分析函数(如留存分析函数、画像分析函数等)、正交位图处理等能力,大幅简化即席多维分析的开发过程,同时实现秒级交互式的数据分析体验。

面对庞大的日志数量,日志场景需同时实现高吞吐写入和实时可见性,降低资源成本成为巨大的挑战。此外,日志场景还需快速的文本检索能力,以满足故障排查、全文检索等需求。云数据库 SelectDB 版利用存算分离、列式存储、倒排索引等能力,可实现海量日志的实时查询、低成本存储、高效处理,提供 10+ 倍性价比的 ES 替代方案。

方案优势

  • 海量数据实时写入

    为日志场景优化的高性能倒排索引,写入速度是 ES 倒排索引的 4 倍。服务端 Group Commit 机制,保证秒级实时可见前提下写入吞吐到 GB/s。

  • 高性价比数据存储

    采用列式存储、精简倒排索引、高压缩比压缩,存储空间占用仅需 ES 的 1/5。采用存算分离架构,单位存储空间成本仅需 ES 的1/3,整体成本为 ES 的 1/15。

  • 高效处理查询请求

    通过分区分桶、时间段筛选,大幅度缩小查询的数据范围。通过倒排索引,按检索词快速定位到匹配的日志行,避免大批量扫描,达到秒级响应。

传统的大数据平台解决方案通过组合多套数据湖查询引擎和数据仓库系统,来满足复杂多样的大数据分析需求,面临人力及资源成本高、数据开发使用复杂、数据分析实时性差等问题。基于云数据库 SelectDB 版构建湖仓一体的分析系统,通过一套系统,即可低成本、高效、极速地满足复杂多样的数据分析需求。

方案优势

  • 指数级降低成本

    云数据库 SelectDB 版在一套系统中即可完美支持多种分析需求,大幅降低冗余系统建设,从而降低大数据平台的人力维护成本、资源冗余开销,综合成本降低可达 80%。

  • 简化统一开发体验

    基于云数据库 SelectDB 版的湖仓互通、轻量级 ELT 能力,无缝完成数据源到数仓的数据同步、清洗过程,无需依赖 Spark 和 Flink。使用云数据库 SelectDB 版作为统一查询网关,无需进行多系统切换及 SQL 方言兼容处理。

  • 极速数据分析

    基于云数据库 SelectDB 版领先的查询分析引擎,结合数据缓存、统计信息收集等,云数据库 SelectDB 版分析性能可达 Presto/Trino 的 3 ~ 5 倍。可利用弹性计算资源、内表加速视图等,进一步提升性能。

phone 联系我们
AI 助理 由 Qwen 驱动