差分パターン統計関数は、与えられた複数の属性フィールドの例および条件に基づき、条件に影響を及ぼす差分パターンセットを分析します。 これにより、条件間の差分の原因を迅速に診断できます。
pattern_diff
関数の形式:
select pattern_diff(array_char_value, array_char_name, array_numeric_value, array_numeric_name, condition, supportScore,posSampleRatio,negSampleRatio)
パラメータについて、次の表に説明します。
パラメータ | 説明 | 値 |
---|---|---|
array_char_value | 文字型の値で構成される 入力列 | 配列形式の値 (例:array[clientIP, sourceIP, path, logstore]) |
array_char_name | 文字型の値で構成される入力列に対応する名前 | 配列形式の値 (例:array[‘clientIP’, ‘sourceIP’, ‘path’, ‘logstore’]) |
array_numeric_value | 数値で構成される入力列 | 配列形式の値 (例:array[Inflow, OutFlow]) |
array_numeric_name | 数値で構成される入力列に対応する名前 | 配列形式の値 (例:array[‘Inflow’, ‘OutFlow’]) |
condition | データフィルタリング条件。 "True" は正の例を示し、"False" は負の例を示します。 | 例:レイテンシー ≤ 300 |
supportScore | パターンマイニングのための正例および負例のサポートの度合い | double 型の値。 範囲:(0,1) |
posSampleRatio | デフォルト値 "0.5" の正の例のサンプリング比は、正の例の半分だけが使用されていることを示しています。 | double 型の値。 範囲:(0, 1) |
negSampleRatio | デフォルト値 "0.5" の負の例のサンプリング比は、負の例の半分だけが使用されていることを示しています。 | double 型の値。 範囲:(0, 1) |
例:
-
照会と分析の命令文:
* | select pattern_diff(array[ Category, ClientIP, ProjectName, LogStore, Method, Source, UserAgent ], array[ 'Category', 'ClientIP', 'ProjectName', 'LogStore', 'Method', 'Source', 'UserAgent' ], array[ InFlow, OutFlow ], array[ 'InFlow', 'OutFlow' ], Latency > 300, 0.2, 0.1, 1.0) limit 1000
-
結果:
表示項目について、次の表に説明します。
表示項目 | 説明 |
---|---|
possupport | マイニングされたパターンの正の例のサポートレベル |
posconfidence | マイニングされたパターンの正の例の信頼性 |
negsupport | マイニングされたパターンの負の例のサポートレベル |
diffpattern | マイニングされたパターンのコンテンツ |