HLL_COUNT_MERGE函數用於接收一個或多個HLL++資料結構(sketch)輸入,將儲存類型相同的HLL++ sketch合并為一個新的sketch,並返回合并後sketch的基數估算值。
注意事項
HLL_COUNT_EXTRACT/HLL_COUNT_MERGE/HLL_COUNT_MERGE_PARTIAL函數使用的BINARY資料需要來源於HLL_COUNT_INIT函數, 不能來源於其他系統或者其他方式。
命令格式
BIGINT HLL_COUNT_MERGE(BINARY <sketch>)參數說明
sketch:必填,BINARY類型。HLL++ sketch,由HLL_COUNT_INIT函數產生。
如果sketch為NULL,則被忽略。
每個sketch必須在相同類型上初始化,嘗試合并不同類型的sketches會導致錯誤。例如,無法將從BIGINT資料產生的sketches與從STRING資料產生的sketches合并。
傳回值說明
返回BIGINT類型的基數估計值。若合并之後新產生的sketch為NULL,函數將返回0。
使用樣本
統計所有國家中至少有一張發票的自然人數量。
SELECT HLL_COUNT_MERGE(hll_sketch) AS distinct_customers_with_open_invoice
FROM
(
SELECT country, HLL_COUNT_INIT(customer_id) AS hll_sketch
FROM values
('UA', 'customer_id_1', 'invoice_id_11'),
('BR', 'customer_id_3', 'invoice_id_31'),
('CZ', 'customer_id_2', 'invoice_id_22'),
('CZ', 'customer_id_2', 'invoice_id_23'),
('BR', 'customer_id_3', 'invoice_id_31'),
('UA', 'customer_id_2', 'invoice_id_24')
t(country, customer_id, invoice_id)
GROUP BY country
);返回結果:
+--------------------------------------+
| distinct_customers_with_open_invoice |
+--------------------------------------+
| 3 |
+--------------------------------------+相關函數
HLL_COUNT_MERGE函數屬於HyperLogLog++函數,MaxCompute支援一系列近似彙總的HyperLogLog++函數,更多相關函數請參見HyperLogLog++函數。