差分パターン統計関数は、与えられた複数の属性フィールドの例および条件に基づき、条件に影響を及ぼす差分パターンセットを分析します。 これにより、条件間の差分の原因を迅速に診断できます。

pattern_diff

関数の形式:
select pattern_diff(array_char_value, array_char_name, array_numeric_value, array_numeric_name, condition, supportScore,posSampleRatio,negSampleRatio) 
パラメータについて、次の表に説明します。
パラメータ 説明
array_char_value 文字型の値で構成される 入力列 配列形式の値 (例:array[clientIP, sourceIP, path, logstore])
array_char_name 文字型の値で構成される入力列に対応する名前 配列形式の値 (例:array[‘clientIP’, ‘sourceIP’, ‘path’, ‘logstore’])
array_numeric_value 数値で構成される入力列 配列形式の値 (例:array[Inflow, OutFlow])
array_numeric_name 数値で構成される入力列に対応する名前 配列形式の値 (例:array[‘Inflow’, ‘OutFlow’])
condition データフィルタリング条件。 "True" は正の例を示し、"False" は負の例を示します。 例:レイテンシー ≤ 300
supportScore パターンマイニングのための正例および負例のサポートの度合い double 型の値。 範囲:(0,1)
posSampleRatio デフォルト値 "0.5" の正の例のサンプリング比は、正の例の半分だけが使用されていることを示しています。 double 型の値。 範囲:(0, 1)
negSampleRatio デフォルト値 "0.5" の負の例のサンプリング比は、負の例の半分だけが使用されていることを示しています。 double 型の値。 範囲:(0, 1)
例:
  • 照会と分析の命令文:
    * | select pattern_diff(array[ Category, ClientIP, ProjectName, LogStore, Method, Source, UserAgent ], array[ 'Category', 'ClientIP', 'ProjectName', 'LogStore', 'Method', 'Source', 'UserAgent' ], array[ InFlow, OutFlow ], array[ 'InFlow', 'OutFlow' ], Latency > 300, 0.2, 0.1, 1.0) limit 1000 
  • 結果:

表示項目について、次の表に説明します。
表示項目 説明
possupport マイニングされたパターンの正の例のサポートレベル
posconfidence マイニングされたパターンの正の例の信頼性
negsupport マイニングされたパターンの負の例のサポートレベル
diffpattern マイニングされたパターンのコンテンツ