URL請求分類函數會自動將您輸入的URL請求路徑進行歸類打標籤,並提供類別的Regex,協助您更好的歸類URL,查詢結果可供ETL使用。
說明
目前,URL請求分類函數只支援華北2(北京)、華東2(上海)地區。
-
調用方式
select url_classify(url_path varchar); select url_classify(url_path varchar, weight long); -
輸入參數
參數
說明
url_path
URL請求路徑。
weight
URL請求路徑的數量。
-
輸出參數
參數
說明
url_path
URL請求路徑。
api_path
通過函數推匯出URL請求路徑對應的介面。
regex_tpl
通過演算法推匯出的Regex。
-
輸出結果
url_path | api_path | regex_tpl -------------------------------------+------------------------------+------------------------------------- /gl/balance/666398186799140 | /gl/balance/* | \/gl\/balance\/[0-9].+ /gl/glaccount/30579281472076 | /gl/glaccount/* | \/gl\/glaccount\/[0-9].+ /gl/balance/709016207098025 | /gl/balance/* | \/gl\/balance\/[0-9].+ -
樣本
-
查詢分析語句
* | select url_classify(uri, num) from (select uri, COUNT(*) as num from log group by uri limit 1000) -
查詢分析結果。查詢結果返回三列:url_path(原始請求路徑)、api_path(分類後的API路徑模式,變數部分以
*替代)和 regex_tpl(對應的Regex模板)。例如原始路徑/v1/task/20200403_064500_63933_w69w5.2.28/results/17/1被歸類為/v1/task/*/results/17/1,對應正則模板為\/v1\/task\/.*\/results\/17\/1。
-