本文記錄 Dynamic Table 增量重新整理支援的函數,包括函數支援一覽表及 hg_id_encoding、min_by/max_by 等函數的使用說明與樣本。
函數支援一覽表
Dynamic Table 增量重新整理支援基本的彙總函式:COUNT、SUM、MIN/MAX、COUNT DISTINCT,更多複雜函數的支援記錄如下表所示。
|
函數名 |
函數說明 |
dynamic table使用樣本 |
支援的版本 |
|
將txet類型的UID欄位對應成int/bigint類型,每次調用函數時,會自動對應資料寫入與更新user mapping表,通常使用在計算長UV情境中,使用者UID為text欄位,映射成int類型,方便進行rb計算。 |
|
||
|
min/max_by用於比較expr2列的最大/最小值,給出對應的expr1列的值
|
|
||
|
RB_BUILD_AGG |
說明:column的參數類型支援int32和int64,詳細使用見文檔RoaringBitmap函數 |
|
|
|
string_agg |
說明:
|
|
|
|
array_agg |
說明:
|
|
|
|
any_value |
在包含group by的彙總查詢中,從每個彙總分組中隨機播放某行的結果返回,結果不確定 |
|
|
hg_id_encoding_int32 / hg_id_encoding_int64
從 Hologres V4.1 版本開始支援 hg_id_encoding_int32 / hg_id_encoding_int64,可將 text 類型的 uid 欄位對應成 int32/int64,自動將資料寫入 user_mapping 表,與 Dynamic Table 增量重新整理及 RoaringBitmap 結合可實現長周期 UV 計算。詳情可參考使用者行為分析最佳實務文檔。
文法
hg_id_encoding_int4(<user_id>, '<mapping_tablename>')
hg_id_encoding_int8(<user_id>, '<mapping_tablename>')
參數說明:
-
第一個參數:text 類型的 uid 列。
-
第二個參數:user_mapping 的表名,需提前建立 user mapping 表,將 text 類型的 uid 映射成 int 類型。
使用限制
-
user_mapping 必須有主鍵,且主鍵之外只有一個 Serial 欄位;目前僅支援主鍵為 text 類型且為單列主鍵。
-
第一個參數僅支援 text 類型的 uid 欄位,不支援 NULL 值,否則函數執行報錯。
-
調用函數時會自動將 mapping 資料寫入 user_mapping 表;若 uid 已存在則忽略,新資料則新增。
-
僅 Hologres V4.1 及以上版本支援。
使用樣本
CREATE TABLE base_table(user_id text);
INSERT INTO base_table VALUES('a');
-- 建立 user_mapping 表
CREATE TABLE uid_mapping(user_id text PRIMARY KEY, id serial);
-- 將 base 表的 uid 經 hg_id_encoding_int4 映射後自動寫入 mapping 表
SELECT user_id, hg_id_encoding_int4(user_id, 'uid_mapping') AS res FROM base_table;
-- 查詢 mapping 表
-- user_id | id
-- --------+----
-- a | 1
min_by / max_by
min_by / max_by 用於按 expr2 列取最小/最大值,返回對應的 expr1 列的值。
min_by(expr1, expr2)
max_by(expr1, expr2)
參數說明:expr2 為用於比較大小的列,expr1 為要展示的對應列。傳回值:expr2 最小/最大行對應的 expr1 的值。使用限制:僅 Hologres V4.0 及以上版本支援。
Dynamic Table 使用樣本
DROP TABLE IF EXISTS detail;
CREATE TABLE detail (
userid text,
event_id text,
create_time timestamptz
);
INSERT INTO detail(userid, event_id, create_time) VALUES
('user_1', 'e1', '2024-12-20 10:00:00+08'),
('user_1', 'e2', '2024-12-20 11:30:00+08'),
('user_1', 'e3', '2024-12-21 09:15:00+08'),
('user_2', 'e4', '2024-12-20 08:05:00+08'),
('user_2', 'e5', '2024-12-22 14:20:00+08'),
('user_3', 'e6', '2024-12-21 16:45:00+08');
DROP TABLE IF EXISTS detail_user_first_last_event;
CREATE DYNAMIC TABLE detail_user_first_last_event
WITH (
auto_refresh_mode = 'incremental',
computing_resource = 'local',
freshness = '3 minutes'
)
AS
SELECT
userid,
min_by(event_id, create_time) AS first_event_id,
max_by(event_id, create_time) AS last_event_id,
date_trunc('day', max(create_time))::date AS dt
FROM detail
GROUP BY userid;