集計関数は、複数の入力レコードをグループ化して 1 つの出力レコードを形成します。入力レコードと出力レコードは多対 1 の関係にあります。このトピックでは、データ分析機能でサポートされている集計関数の構文、パラメーター、および例について説明します。
AVG
構文
double avg(double <colname>) decimal avg(decimal <colname>)説明
列の平均値を返します。
パラメーター
値: 必須。このパラメーターの値は、DOUBLE 型または DECIMAL 型です。入力値が STRING 型または BIGINT 型の場合、計算前に暗黙的に DOUBLE 型に変換されます。入力値が他のデータ型の場合、エラーが返されます。値 が NULL の場合、その値は計算に使用されます。BOOLEAN 型の値は計算に使用できません。
戻り値
入力値が DECIMAL 型の場合、DECIMAL 型の値が返されます。入力値が他の有効なデータ型の場合、DOUBLE 型の値が返されます。
例
現在の日の平均気温を計算します。
avg(temperature);
COUNT
構文
bigint count([distinct|all] <value>)説明
指定された条件に一致するレコードの数を返します。
パラメーター
distinct|all: オプション。このパラメーターは、カウント操作中に重複を削除するかどうかを指定します。デフォルト値は all で、すべてのレコードがカウントされることを指定します。このパラメーターを distinct に設定すると、値が異なるレコードのみがカウントされます。
値: 必須。このパラメーターの値は、任意のデータ型にすることができます。指定された列の値が NULL の場合、この値を含む行は計算に含まれません。
戻り値
BIGINT 型の値が返されます。
例
例 1: 現在の日の気温レコードの数を計算します。
count(temperature);例 2: distinct を使用して気温値で気温レコードを重複排除し、気温値の数を計算します。
count(distinct temperature);
MAX
構文
max(<colname>)説明
列の最大値を返します。
パラメーター
値: 必須。列の名前。列は任意のデータ型にすることができます。指定された列の値が NULL の場合、この値を含む行は計算に含まれません。 BOOLEAN 型の値は計算に使用されません。
戻り値
この関数は、値 と同じ型の値を返します。
例
現在の日の気温レコードの中で最大の気温を計算します。
max(temperature);
MIN
構文
min(<value>)説明
列の最小値を返します。
パラメーター
値: 必須。列の名前。列は任意のデータ型にすることができます。指定された列の値が NULL の場合、この値を含む行は計算に含まれません。 BOOLEAN 型の値は計算に使用されません。
戻り値
この関数は、値 と同じ型の値を返します。
例
現在の日の気温レコードの中で最小の気温を計算します。
min(temperature);
SUM
構文
sum(<value>)説明
列の合計を返します。
パラメーター
値: 必須。列の名前。列は DOUBLE、DECIMAL、または BIGINT 型です。入力値が STRING 型の場合、計算前に暗黙的に DOUBLE 型に変換されます。指定された列の値が NULL の場合、この値を含む行は計算に含まれません。 BOOLEAN 型の値は計算に使用されません。
戻り値
入力パラメーターが BIGINT 型の場合、BIGINT 型の値が返されます。入力パラメーターが DOUBLE 型または STRING 型の場合、DOUBLE 型の値が返されます。
例
現在の日のすべての気温値の合計を計算します。
sum(temperature);