テキスト、long、double 型のフィールドを分析して、基本的なデータ分布、統計メトリクス、上位 5 件の値の時系列グラフを表示します。
前提条件
分析したいフィールドのインデックス作成機能と統計機能を有効にします。 詳細については、「インデックスの作成」をご参照ください。
たとえば、アクセスログに request_method フィールドと request_time フィールドが含まれている場合、次の図に示す設定を使用できます。
制限
フィールド分析は、現在のクエリページで指定された時間範囲とクエリ条件に一致するすべてのログを対象とします。 ログ数が 1 億未満の場合、完全な分析が実行されます。 1 億を超える場合、サンプリングによってデータセットが約 1 億ログに削減されます。 サンプリングを回避するには、時間範囲を狭めるか、フィルター条件を追加してください。
フィールド分析結果の表示
Log Serviceコンソールにログインします。
[プロジェクト] セクションで、管理するプロジェクトをクリックします。
タブで、管理するログストアをクリックします。
-
フィールド分析結果を表示します。
-
単一フィールドの分析結果の表示
[生ログ] タブの [インデックスフィールド] セクションで、フィールドの横にある [
] アイコンをクリックすると、そのフィールドの分析結果が表示されます。
-
フィールドの説明
テキストフィールドの詳細
基本的なデータ分布
|
パラメーター |
説明 |
|
ログエントリの総数 |
現在のページで時間範囲とクエリ条件に一致するログエントリの総数。 |
|
総行数 |
このフィールドを含み、現在のクエリ条件に一致するログエントリの総数。 |
|
欠損値の総数 |
ログエントリの総数 - 総行数。 |
|
欠損値の割合 |
欠損値の総数 / ログエントリの総数。 |
|
個別値の総数 |
approx_distinct 関数を使用して計算された、列内の個別フィールド値の数。 |
|
個別値の割合 |
個別値の総数 / ログエントリの総数。 |
統計メトリクス
|
パラメーター |
説明 |
|
最大長 |
フィールド値の最大文字長。 |
|
最小長 |
フィールド値の最小文字長。 |
|
平均長 |
フィールド値の平均文字長。 |
上位 5 件の値の時系列グラフ
指定された時間範囲における上位 5 件の値の変化傾向を示します。
[上位 5 値の時系列グラフ] の右側にある
アイコンをクリックして、時系列グラフをダッシュボードに追加します。 詳細については、「ダッシュボードの作成」をご参照ください。
long および double フィールドの詳細
基本的なデータ分布
|
パラメーター |
説明 |
|
ログエントリの総数 |
現在のページで時間範囲とクエリ条件に一致するログエントリの総数。 |
|
総行数 |
このフィールドを含み、現在のクエリ条件に一致するログエントリの総数。 |
|
個別値の総数 |
approx_distinct 関数 を使用して計算された、列内の個別フィールド値の数。 |
|
個別値の割合 |
個別値の総数 / ログエントリの総数。 |
統計メトリクス
|
パラメーター |
説明 |
|
最大値 |
フィールドの最大値。 |
|
最小値 |
フィールドの最小値。 |
|
平均値 |
フィールドの平均値。 |
|
中央値 |
データを昇順に並べ替えた後の中央に位置する値。 |
|
第 1 四分位数 (Q1) |
データを昇順に並べ替えた後の 25 パーセンタイルに位置する値。 |
|
第 3 四分位数 (Q3) |
データを昇順に並べ替えた後の 75 パーセンタイルに位置する値。 |
|
サンプル標準偏差 |
stddev_samp 関数 を使用して計算されたフィールドのサンプル標準偏差。 |
|
母標準偏差 |
stddev_pop 関数 を使用して計算されたフィールドの母標準偏差。 |
|
尖度 |
データ分布の集中度を示す指標。 |
|
歪度 |
データ分布の非対称性の度合いを示す指標。 |
数値分布ヒストグラム
値の分布を 10 個のビンに分割して、近似ヒストグラムを生成します。
[数値分布ヒストグラム] の右にある
アイコンをクリックして、ヒストグラムをダッシュボードに追加します。 詳細については、「ダッシュボードを作成する」をご参照ください。

