本文介紹數組函數和運算子的基礎文法及樣本。
Log Service支援如下數組函數和運算子。
|
函數名稱 |
文法 |
說明 |
支援SQL |
支援SPL |
|
[x] |
返回數組中的第x個元素。等同於element_at函數。 |
√ |
× |
|
|
array_agg(x) |
以數組形式返回x中的所有值。 |
√ |
× |
|
|
array_distinct(x) |
刪除數組中重複的元素。 |
√ |
√ |
|
|
array_except(x, y) |
計算兩個數組的差集。 |
√ |
√ |
|
|
array_intersect(x, y) |
計算兩個數組的交集。 |
√ |
√ |
|
|
array_join(x, delimiter) |
使用指定的串連符將數組中的元素拼接為一個字串。如果數組中包含null元素,則null元素將被忽略。 重要
使用array_join函數時,返回結果大小最大為1 KB,超出1 KB的資料會被截斷。 |
√ |
√ |
|
|
array_join(x, delimiter, null_replacement) |
使用指定的串連符將數組中的元素拼接為一個字串。如果數組中包含null元素,則null元素將被替換為null_replacement。 重要
使用array_join函數時,返回結果大小最大為1 KB,超出1 KB的資料會被截斷。 |
√ |
√ |
|
|
array_max(x) |
擷取數組中的最大值。 |
√ |
√ |
|
|
array_min(x) |
擷取數組中的最小值。 |
√ |
√ |
|
|
array_position(x, element) |
擷取指定元素的下標,下標從1開始。如果指定元素不存在,則返回0。 |
√ |
√ |
|
|
array_remove(x, element) |
刪除數組中指定的元素。 |
√ |
√ |
|
|
array_sort(x) |
對數組元素進行升序排序。如果有null元素,則null元素排在最後。 |
√ |
√ |
|
|
array_transpose(x) |
對矩陣進行轉置,即提取二維數組中索引相同的元素組成一個新的二維數組。 |
√ |
× |
|
|
array_union(x, y) |
計算兩個數組的並集。 |
√ |
× |
|
|
cardinality(x) |
計算數組中元素的個數。 |
√ |
√ |
|
|
concat(x, y…) |
將多個數組拼接為一個數組。 |
√ |
× |
|
|
contains(x, element) |
判斷數組中是否包含指定元素。如果包含,則返回true。 |
√ |
× |
|
|
element_at(x, y) |
返回數組中的第y個元素。 |
√ |
× |
|
|
filter(x, lambda_expression) |
結合Lambda運算式,用於過濾數組中的元素。只返回滿足Lambda運算式的元素。 |
√ |
√ |
|
|
flatten(x) |
將二維數群組轉換為一維數組。 |
√ |
× |
|
|
reduce(x, lambda_expression) |
根據Lambda運算式中的定義,對數組中的各個元素進行相加計算,然後返回計算結果。 |
√ |
√ |
|
|
reverse(x) |
對數組中的元素進行反向排列。 |
√ |
√ |
|
|
sequence(x, y) |
通過指定的起始值返回一個數組,其元素為起始值範圍內一組連續且遞增的值。遞增間隔為預設值1。 |
√ |
√ |
|
|
sequence(x, y, step) |
通過指定的起始值返回一個數組,其元素為起始值範圍內一組連續且遞增的值,並自訂遞增間隔。 |
√ |
√ |
|
|
shuffle(x) |
對數組元素進行隨機排列。 |
√ |
√ |
|
|
slice(x, start, length) |
擷取數組的子集。 |
√ |
√ |
|
|
transform(x, lambda_expression) |
將Lambda運算式應用到數組的每個元素中。 |
√ |
√ |
|
|
zip(x, y...) |
將多個數組合并為一個二維數組,且各個數組中下標相同的元素組成一個新的數組。 |
√ |
√ |
|
|
zip_with(x, y, lambda_expression) |
根據Lambda運算式中的定義將兩個數組合并為一個數組。 |
√ |
× |
下標運算子
下標運算子用於返回數組中的第x個元素。等同於element_at函數。
文法
[x]
參數說明
|
參數 |
說明 |
|
x |
數組下標,從1開始。參數值為bigint類型。 |
傳回值類型
返回指定元素的資料類型。
樣本
返回number欄位值中的第1個元素。
-
欄位範例
number:[49,50,45,47,50] -
查詢和分析語句
* | SELECT cast(json_parse(number) as array(bigint)) [1] -
查詢和分析結果返回
49。
array_agg函數
array_agg函數會以數組形式返回x中的所有值。
文法
array_agg (x)
參數說明
|
參數 |
說明 |
|
x |
參數值為任意資料類型。 |
傳回值類型
array類型。
樣本
以數組形式返回status欄位的值。
-
查詢和分析語句
* | SELECT array_agg(status) AS array -
查詢和分析結果:返回結果中,array 欄位的值為一個包含大量 HTTP 狀態代碼(如 200、202、204、303、304、401、402、501 等)的數組。
array_distinct函數
array_distinct函數用於刪除數組中重複的元素。
文法
array_distinct(x)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
傳回值類型
array類型。
樣本
刪除number欄位值中重複的元素。
-
欄位範例
number:[49,50,45,47,50] -
查詢和分析語句
*| SELECT array_distinct(cast(json_parse(number) as array(bigint))) -
查詢和分析結果為
[49,50,45,47],即去除了原始數組中的重複元素50後的結果。
array_except函數
array_except函數用於計算兩個數組的差集。
文法
array_except(x, y)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
|
y |
參數值為array類型。 |
傳回值類型
array類型。
樣本
計算數組[1,2,3,4,5]和[1,3,5,7]的差集。
-
查詢和分析語句
* | SELECT array_except(array[1,2,3,4,5],array[1,3,5,7]) -
查詢和分析結果為
[2,4]。
array_intersect函數
array_intersect函數用於計算兩個數組的交集。
文法
array_intersect(x, y)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
|
y |
參數值為array類型。 |
傳回值類型
array類型。
樣本
計算數組[1,2,3,4,5]和[1,3,5,7]的交集。
-
查詢和分析語句
* | SELECT array_intersect(array[1,2,3,4,5],array[1,3,5,7]) -
查詢和分析結果為
[1,3,5],即兩個數組的交集。
array_join函數
array_join函數使用指定的串連符將數組中的元素拼接為一個字串。
文法
-
使用指定的串連符將數組中的元素拼接為一個字串。如果數組中包含null元素,則null元素將被忽略。
array_join(x, delimiter) -
使用指定的串連符將數組中的元素拼接為一個字串。如果數組中包含null元素,則null元素將被替換為null_replacement。
array_join(x, delimiter,null_replacement)
參數說明
|
參數 |
說明 |
|
x |
參數值為任意array類型。 |
|
delimiter |
串連符,可以為字串。 |
|
null_replacement |
用於替換null元素的字串。 |
傳回值類型
varchar類型。
樣本
使用空格將數組[null, 'Log','Service']中的元素拼接為一個字串,其中null元素替換為Alicloud。
-
查詢和分析語句
* | SELECT array_join(array[null,'Log','Service'],' ','Alicloud') -
查詢和分析結果:_col0 列的值為
Alicloud Log Service。
array_max函數
array_max函數用於擷取數組中的最大值。
文法
array_max(x)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 重要
如果數組中包含null,則返回結果為null。 |
傳回值類型
與參數值中元素的資料類型一致。
樣本
擷取數組中的最大值。
-
欄位範例
number:[49,50,45,47,50] -
查詢和分析語句
*| SELECT array_max(try_cast(json_parse(number) as array(bigint))) AS max_number -
查詢和分析結果:返回 max_number 值為 50。
array_min函數
array_min函數用於擷取數組中的最小值。
文法
array_min(x)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 重要
如果數組中包含null,則返回結果為null。 |
傳回值類型
與參數值中元素的資料類型一致。
樣本
擷取數組中的最小值。
-
欄位範例
number:[49,50,45,47,50] -
查詢和分析語句
*| SELECT array_min(try_cast(json_parse(number) as array(bigint))) AS min_number -
查詢和分析結果為45。
array_position函數
array_position函數用於擷取指定元素的下標,下標從1開始。如果指定元素不存在,則返回0。
文法
array_position(x, element)
參數說明
|
參數 |
說明 |
|
x |
參數值為數群組類型。 |
|
element |
數組中的一個元素。 說明
如果待擷取下標的元素為null ,則返回結果也為null 。 |
傳回值類型
bigint類型。
樣本
返回數組[49,45,47]中45的下標。
-
查詢和分析語句
* | SELECT array_position(array[49,45,47],45) -
查詢和分析結果返回結果為
2,表示元素45在數組中的位置為第2位。
array_remove函數
array_remove函數用於刪除數組中指定的元素。
文法
array_remove(x, element)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
|
element |
數組中的一個元素。 說明
如果待刪除的元素為null ,則返回結果也為null。 |
傳回值類型
array類型。
樣本
刪除數組[49,45,47]中45。
-
查詢和分析語句
* | SELECT array_remove(array[49,45,47],45) -
查詢和分析結果返回結果為
[49,47]。
array_sort函數
array_sort函數用於對數組元素進行升序排序。如果有null元素,則null元素排在最後。
文法
array_sort(x)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
傳回值類型
array類型。
樣本
對數組['b', 'd', null, 'c', 'a']進行升序排序。
-
查詢和分析語句
* | SELECT array_sort(array['b','d',null,'c','a']) -
查詢和分析結果為
["a","b","c","d",null],數組元素按字母升序排列,null 值排在末尾。
array_transpose函數
array_transpose函數用於對矩陣進行轉置,即提取二維數組中索引相同的元素組成一個新的二維數組。
文法
array_transpose(x)
參數說明
|
參數 |
說明 |
|
x |
參數值為array(double)類型。 |
傳回值類型
array(double)類型。
樣本
提取二維數組中索引相同的元素組成一個新的二維數組,例如數組[0,1,2,3]、[10,19,18,17]、[9,8,7]中的0、10、9的索引都為1,則組成數組[0.0,10.0,9.0]。
-
查詢和分析語句
* | SELECT array_transpose(array[array[0,1,2,3],array[10,19,18,17],array[9,8,7]]) -
查詢和分析結果:_col0列的值為
[[0.0,10.0,9.0],[1.0,19.0,8.0],[2.0,18.0,7.0],[3.0,17.0]]。
array_union函數
array_union函數用於計算兩個數組的並集。
文法
array_union(x, y)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
|
y |
參數值為array類型。 |
傳回值類型
array類型。
樣本
計算數組[1,2,3,4,5]和[1,3,5,7]的並集。
-
查詢和分析語句
* | SELECT array_union(array[1,2,3,4,5],array[1,3,5,7]) -
查詢和分析結果返回結果為
[1,2,3,4,5,7]。
cardinality函數
cardinality函數用於計算數組中元素的個數。
文法
cardinality(x)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
傳回值類型
bigint類型。
樣本
計算number欄位值中元素的個數。
-
欄位範例
number:[49,50,45,47,50] -
查詢和分析語句
*| SELECT cardinality(cast(json_parse(number) as array(bigint))) -
查詢和分析結果返回
5,表示該數組包含 5 個元素。
concat函數
concat函數用於將多個數組拼接為一個數組。
文法
concat(x, y…)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
|
y |
參數值為array類型。 |
傳回值類型
array類型。
樣本
將數組['red','blue']和['yellow','green']拼接為一個數組。
-
查詢和分析語句
* | SELECT concat(array['red','blue'],array['yellow','green']) -
查詢和分析結果返回結果為
["red","blue","yellow","green"]。
contains函數
contains函數用於判斷數組中是否包含指定元素。如果包含,則返回true。
文法
contains(x, element)
參數說明
|
參數 |
說明 |
|
x |
參數值為數群組類型。 |
|
element |
數組中的一個元素。 |
傳回值類型
boolean類型。
樣本
判斷region欄位值中是否包含cn-beijing。
-
欄位範例
region:["cn-hangzhou","cn-shanghai","cn-beijing"] -
查詢和分析語句
*| SELECT contains(cast(json_parse(region) as array(varchar)),'cn-beijing') -
查詢和分析結果返回
_col0列,值為true,表示region數組中包含cn-beijing。
element_at函數
element_at函數用於返回數組中的第y個元素。
文法
element_at(x, y)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
|
y |
數組下標,從1開始。參數值為bigint類型。 |
傳回值類型
任意資料類型。
樣本
返回number欄位值中的第2個元素。
-
欄位範例
number:[49,50,45,47,50] -
查詢和分析語句
* | SELECT element_at(cast(json_parse(number) AS array(varchar)), 2) -
查詢和分析結果返回一列
_col0,值為50。
filter函數
filter函數和Lambda運算式結合,用於過濾數組中的元素。只返回滿足Lambda運算式的元素。
文法
filter(x, lambda_expression)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
|
lambda_expression |
Lambda運算式。更多資訊,請參見Lambda運算式。 |
傳回值類型
array類型。
樣本
返回數組[5,-6,null,7]中大於0的元素,其中x -> x > 0為Lambda運算式。
-
查詢和分析語句
* | SELECT filter(array[5,-6,null,7],x -> x > 0) -
查詢和分析結果返回結果為
[5,7]。
flatten函數
flatten函數用於將二維數群組轉換為一維數組。
文法
flatten(x)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
傳回值類型
array類型。
樣本
將數組array[1,2,3,4]和array[5,2,2,4]轉換為一維數組。
-
查詢和分析語句
* | SELECT flatten(array[array[1,2,3,4],array[5,2,2,4]]) -
查詢和分析結果為:_col0列的值為
[1,2,3,4,5,2,2,4]。
reduce函數
reduce函數將根據Lambda運算式中的定義,對數組中的各個元素進行相加計算,然後返回計算結果。
文法
reduce(x, lambda_expression)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
|
lambda_expression |
第一個參數是初始值,第二個參數是Lambda運算式,第三個參數是對Lambda運算式計算結果的處理。 |
傳回值類型
bigint類型。
樣本
返回數組[5, 20, 50]中各個元素相加的結果。
-
查詢和分析語句
* | SELECT reduce(array[5,20,50],0,(s, x) -> s + x, s -> s) -
查詢和分析結果返回結果為
75。
reverse函數
reverse函數用於對數組中的元素進行反向排列。
文法
reverse(x)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
傳回值類型
array類型。
樣本
將數組[1,2,3,4,5]中的元素反向排序。
-
查詢和分析語句
* | SELECT reverse(array[1,2,3,4,5]) -
查詢和分析結果為
[5,4,3,2,1]。
sequence函數
sequence函數通過指定的起始值返回一個數組,其元素為起始值範圍內一組連續且遞增的值。
文法
-
遞增間隔為預設值1。
sequence(x, y) -
自訂遞增間隔。
sequence(x, y, step)
參數說明
|
參數 |
說明 |
|
x |
參數值為bigint類型、timestamp類型(Unix時間戳記、日期和時間運算式)。 |
|
y |
參數值為bigint類型、timestamp類型(Unix時間戳記、日期和時間運算式)。 |
|
step |
數值間隔。 當參數值為日期和時間運算式時,step格式如下:
|
傳回值類型
array類型。
樣本
-
樣本1:返回0~10之間的偶數。
-
查詢和分析語句
* | SELECT sequence(0,10,2) -
查詢和分析結果返回結果為
[0,2,4,6,8,10]。
-
-
樣本2:返回2017-10-23到2021-08-12之間的日期,間隔為1年。
-
查詢和分析語句
ww* | SELECT sequence(from_unixtime(1508737026),from_unixtime(1628734085),interval '1' year to month ) -
查詢和分析結果
["2017-10-23 13:37:06.000","2018-10-23 13:37:06.000","2019-10-23 13:37:06.000","2020-10-23 13:37:06.000"]
-
-
樣本3:返回1628733298,1628734085之間的Unix時間戳記,間隔為60秒。
-
查詢和分析語句
* | SELECT sequence(1628733298,1628734085,60) -
查詢和分析結果中,
_col0欄位返回時間戳記數組[1628733298,1628733358,1628733418,1628733478,1628733538,1628733598,1628733658,1628733718,1628733778,1628733838,1628733898,1628733958,1628734018,1628734078]。
-
shuffle函數
shuffle函數用於對數組元素進行隨機排列。
文法
shuffle(x)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
傳回值類型
array類型。
樣本
對數組[1,2,3,4,5]中的元素進行隨機排序。
-
查詢和分析語句
*| SELECT shuffle(array[1,2,3,4,5]) -
查詢和分析結果:返回列
_col0,值為[3,1,2,4,5]、[5,1,2,4,3]、[2,5,3,1,4],表明數組元素已被隨機打亂。
slice函數
slice函數用於返回數組的子集。
文法
slice(x, start, length)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
|
start |
指定索引開始的位置。
|
|
length |
指定子集中元素的個數。 |
傳回值類型
array類型。
樣本
返回數組[1,2,4,5,6,7,7]的子集,從第三個元素開始返回,子集元素個數為2。
-
查詢和分析語句
* | SELECT slice(array[1,2,4,5,6,7,7],3,2) -
查詢和分析結果:_col0 列的值為
[4,5]。
transform函數
transform函數用於將Lambda運算式應用到數組的每個元素中。
文法
transform(x, lambda_expression)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
|
lambda_expression |
Lambda運算式。更多資訊,請參見Lambda運算式。 |
傳回值類型
array類型。
樣本
將數組[5,6]中的各個元素加1,然後返回。
-
查詢和分析語句
* | SELECT transform(array[5,6],x -> x + 1) -
查詢和分析結果返回結果為
[6,7]。
zip函數
zip函數用於將多個數組合并為一個二維數組,且各個數組中下標相同的元素組成一個新的數組。
文法
zip(x, y...)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
|
y |
參數值為array類型。 |
傳回值類型
array類型。
樣本
將數組[1,2,3]、['1b',null,'3b']和[1,2,3]合并為一個二維數組。
-
查詢和分析語句
* | SELECT zip(array[1,2,3], array['1b',null,'3b'],array[1,2,3]) -
查詢和分析結果中,_col0 列傳回值為
[[1,"1b",1],[2,null,2],[3,"3b",3]],即 zip 函數將三個數組按索引位置合并為嵌套數組。
zip_with函數
zip_with函數將根據Lambda運算式中的定義將兩個數組合并為一個數組。
文法
zip_with(x, y, lambda_expression)
參數說明
|
參數 |
說明 |
|
x |
參數值為array類型。 |
|
y |
參數值為array類型。 |
|
lambda_expression |
Lambda運算式。更多資訊,請參見Lambda運算式。 |
傳回值類型
array類型。
樣本
使用Lambda運算式(x, y) -> x + y使數組[1,2]和[3,4]中的元素分別相加後,以數群組類型返回相加的結果。
-
查詢和分析語句
SELECT zip_with(array[1,2], array[3,4],(x,y) -> x + y) -
查詢和分析結果:
_col0列的值為[4,6]。