全部产品
Search
文档中心

云原生数据库 PolarDB:ROLLUP的并行加速

更新时间:Jan 19, 2024

您可以使用ROLLUP语法实现只借助一条查询语句,就计算出数据在不同维度上划分组之后得到的统计结果以及所有数据的总体值。本文将介绍如何使用ROLLUP语法。

前提条件

PolarDB集群版本需为PolarDB MySQL版 8.0且Revision version为8.0.1.1.0或以上,您可以参见查询版本号确认集群版本。

语法

ROLLUP语法可以看作是GROUP BY语法的拓展,您只需要在原本的GROUP BY列之后加上WITH ROLLUP即可,例如:

SELECT year, country, product, SUM(profit) AS profit
       FROM sales
       GROUP BY year, country, product WITH ROLLUP;

除了产生按照GROUP BY所指定的列聚合产生的结果外,ROLLUP还会从右至左依次计算更高层次的聚合结果,直至所有数据的聚合。例如上述语句就会先按照GROUP BY year, country, product计算总收益,再按照GROUP BY year, country以及GROUP BY year计算总收益,最后按照不带任何GROUP BY条件计算整个sales表的总收益。

使用ROLLUP语法主要有如下优势:

  • 方便对数据进行多维度的统计分析,简化原本对不同维度各自进行SQL查询的编程复杂度。

  • 实现更快更高效的查询处理。

  • ROLLUP可以将所有的聚合工作转移到服务端,只用读一次数据就能够完成原本多次查询才能完成的统计工作,减轻了客户端的处理负载和网络流量。

并行查询ROLLUP增强性能测试

PolarDB还实现了针对ROLLUP语法的并行查询(Parallel Query)增强,支持多个线程并发计算聚合结果并输出汇总后的结果,大大提升语句执行效率。

使用TPCH进行测试,以Q1为例,在原始的语句上加入ROLLUP语法:

说明 本文的TPC-H的实现基于TPC-H的基准测试,并不能与已发布的TPC-H基准测试结果相比较,本文中的测试并不符合TPC-H基准测试的所有要求。
select
    l_returnflag,
    l_linestatus,
    sum(l_quantity) as sum_qty,
    sum(l_extendedprice) as sum_base_price,
    sum(l_extendedprice * (1 - l_discount)) as sum_disc_price,
    sum(l_extendedprice * (1 - l_discount) * (1 + l_tax)) as sum_charge,
    avg(l_quantity) as avg_qty,
    avg(l_extendedprice) as avg_price,
    avg(l_discount) as avg_disc,
    count(*) as count_order
from
    lineitem
where
    l_shipdate <= date_sub('1998-12-01', interval ':1' day)
group by
    l_returnflag,
    l_linestatus
with rollup
order by
    l_returnflag,
    l_linestatus;
  • 不开启并行查询时,耗时318.73秒。1

  • 开启并行查询后,耗时22.30秒,语句执行效率提升14倍以上。2