URL 分類関数は、類似したリクエストパスをグループ化して共通パターンを割り当て、各グループに対応する正規表現を生成することで、URL 分類を簡素化します。その後、クエリ結果を ETL オペレーションに使用できます。
説明
URL 分類関数は、China (Beijing) および China (Shanghai) リージョンでのみ利用できます。
-
構文
select url_classify(url_path varchar); select url_classify(url_path varchar, weight long); -
入力パラメーター
パラメーター
説明
url_path
リクエストパス。
weight
分類の重み。
-
出力パラメーター
パラメーター
説明
url_path
元のリクエストパス。
api_path
一般化された API パスパターン。
regex_tpl
パターンに一致する正規表現テンプレート。
-
出力
url_path | api_path | regex_tpl -------------------------------------+------------------------------+------------------------------------- /gl/balance/666398186799140 | /gl/balance/* | \/gl\/balance\/.* /gl/glaccount/30579281472076 | /gl/glaccount/* | \/gl\/glaccount\/.* /gl/balance/709016207098025 | /gl/balance/* | \/gl\/balance\/.* -
例
-
クエリ文
* | select url_classify(uri, num) from (select uri, COUNT(*) as num from log group by uri limit 1000) -
クエリは、url_path (元のリクエストパス)、api_path (一般化された API パスパターン、アスタリスク (
*) が可変部分を置き換えます)、および regex_tpl (対応する正規表現テンプレート) の 3 つの列を返します。 たとえば、元のパス/v1/task/20200403_064500_63933_w69w5.2.28/results/17/1は/v1/task/*/results/17/1として分類され、その対応する正規表現テンプレートは\/v1\/task\/.*\/results\/17\/1です。
-