全部产品
Search
文档中心

云原生大数据计算服务 MaxCompute:HISTOGRAM

更新时间:Jun 15, 2023

返回一个Map,Map的Key是输入input值,Map的Value是input值出现的次数。NULL值将被忽略。

注意事项

升级到MaxCompute 2.0后,产品扩展了部分函数。如果您用到的函数涉及新数据类型(TINYINT、SMALLINT、INT、FLOAT、VARCHAR、TIMESTAMP或BINARY),在使用扩展函数时,需要执行如下语句开启新数据类型开关:

  • Session级别:如果使用新数据类型,您需要在SQL语句前加上语句set odps.sql.type.system.odps2=true;,并与SQL语句一起提交执行。

  • Project级别:Project Owner可根据需要对Project进行设置,等待10~15分钟后才会生效。命令如下。

    setproject odps.sql.type.system.odps2=true;

    setproject的详细说明请参见项目空间操作。关于开启Project级别数据类型的注意事项,请参见数据类型版本说明

在同一条SQL语句中同时使用多个聚合函数时,如果项目资源不足,会出现内存溢出问题,请您根据实际业务情况优化SQL或购买计算资源。

命令格式

map<K, bigint> histogram(K input);

参数说明

input:输入字段,将作为Map的Key。

返回值说明

返回构造的Map,描述每个input值出现的次数。

示例

select histogram(a) from values
    ('hi'), (null), ('apple'), ('pie'), ('apple') t(a);

返回结果如下。

+----------------------------+
| _c0                        |
+----------------------------+
| {"pie":1,"hi":1,"apple":2} |
+----------------------------+

相关函数

HISTOGRAM函数属于聚合函数,更多将多条输入记录进行求平均值、参数聚合的相关函数请参见聚合函数