STDDEV_SAMP 関数は、サンプルの標準偏差を計算します。
制限事項
ウィンドウ関数を使用する前に、次の制限事項に注意してください。
ウィンドウ関数は
SELECT文でのみサポートされます。ウィンドウ関数には、ネストされたウィンドウ関数またはネストされた集計関数を含めることはできません。
ウィンドウ関数を同じレベルの集計関数と一緒に使用することはできません。
構文
-- サンプルの標準偏差を計算します。
DOUBLE STDDEV_SAMP(DOUBLE <colname>)
DECIMAL STDDEV_SAMP(DECIMAL <colname>)
-- ウィンドウ内の expr のサンプル標準偏差を計算します。
DOUBLE STDDEV_SAMP([DISTINCT] <expr>) OVER([partition_clause] [orderby_clause] [frame_clause])
DECIMAL STDDEV_SAMP([DISTINCT] <expr>) OVER([partition_clause] [orderby_clause] [frame_clause])パラメーター
colname: 必須。列の名前。列は DOUBLE 型または DECIMAL 型にすることができます。入力が STRING 型または BIGINT 型の場合、値は計算のために暗黙的に DOUBLE 型に変換されます。
expr: 必須。サンプルの標準偏差を計算する式。式は DOUBLE または DECIMAL 値に評価される必要があります。
入力値が STRING 型または BIGINT 型の場合、計算のために暗黙的に DOUBLE 型に変換されます。他のデータ型ではエラーが返されます。
値が NULL の場合、対応する行は計算で無視されます。
DISTINCT キーワードを指定した場合、この関数は一意の値のサンプル標準偏差を計算します。
partition_clause、orderby_clause、および frame_clause: 詳細については、「windowing_definition」をご参照ください。
戻り値
colname の値が NULL の場合、その行は計算で無視されます。他のデータ型の場合、戻り値の型は次のように決定されます:
入力タイプ
戻り値の型
TINYINT
DOUBLE
SMALLINT
DOUBLE
INT
DOUBLE
BIGINT
DOUBLE
FLOAT
DOUBLE
DOUBLE
DOUBLE
DECIMAL
DECIMAL
戻り値は expr と同じデータ型です。expr のすべての値が NULL の場合、関数は NULL を返します。ウィンドウに expr の NULL でない値が 1 つしか含まれていない場合、関数は 0 を返します。
説明ウィンドウに expr の NULL でない値が 1 つしか含まれておらず、
SET odps.sql.bigquery.compatible=true;コマンドを実行して BigQuery 互換モードを有効にした場合、関数は NULL を返します。
サンプルデータ
このセクションでは、関数の使用方法を理解するのに役立つサンプルソースデータと例を示します。emp という名前のテーブルを作成し、サンプルデータをテーブルに挿入します。サンプル文:
CREATE TABLE IF NOT EXISTS emp
(empno BIGINT,
ename STRING,
job STRING,
mgr BIGINT,
hiredate DATETIME,
sal BIGINT,
comm BIGINT,
deptno BIGINT);
tunnel upload emp.txt emp; --emp.txt を、データファイルをアップロードする実際のパス (パスと名前) に置き換えますemp.txt ファイルには、次のサンプルデータが含まれています:
7369,SMITH,CLERK,7902,1980-12-17 00:00:00,800,,20
7499,ALLEN,SALESMAN,7698,1981-02-20 00:00:00,1600,300,30
7521,WARD,SALESMAN,7698,1981-02-22 00:00:00,1250,500,30
7566,JONES,MANAGER,7839,1981-04-02 00:00:00,2975,,20
7654,MARTIN,SALESMAN,7698,1981-09-28 00:00:00,1250,1400,30
7698,BLAKE,MANAGER,7839,1981-05-01 00:00:00,2850,,30
7782,CLARK,MANAGER,7839,1981-06-09 00:00:00,2450,,10
7788,SCOTT,ANALYST,7566,1987-04-19 00:00:00,3000,,20
7839,KING,PRESIDENT,,1981-11-17 00:00:00,5000,,10
7844,TURNER,SALESMAN,7698,1981-09-08 00:00:00,1500,0,30
7876,ADAMS,CLERK,7788,1987-05-23 00:00:00,1100,,20
7900,JAMES,CLERK,7698,1981-12-03 00:00:00,950,,30
7902,FORD,ANALYST,7566,1981-12-03 00:00:00,3000,,20
7934,MILLER,CLERK,7782,1982-01-23 00:00:00,1300,,10
7948,JACCKA,CLERK,7782,1981-04-12 00:00:00,5000,,10
7956,WELAN,CLERK,7649,1982-07-20 00:00:00,2450,,10
7956,TEBAGE,CLERK,7748,1982-12-30 00:00:00,1300,,10例
例 1: 各部門 (`deptno`) の給与 (`sal`) のサンプル標準偏差を計算します。ウィンドウは `deptno` によってパーティション分割されます。`ORDER BY` 句が指定されていないため、この関数はパーティション内のすべての行に対して標準偏差を計算し、各行に同じ値を返します。次のコマンドは一例です:
SELECT deptno, sal, STDDEV_SAMP(sal) OVER (PARTITION BY deptno) FROM emp;次の結果が返されます。
+------------+------------+------------+ | deptno | sal | _c2 | +------------+------------+------------+ | 10 | 1300 | 1693.7138680032904 | -- ウィンドウの最初の行。サンプル標準偏差は、パーティション内の 6 行すべてについて計算されます。 | 10 | 2450 | 1693.7138680032904 | -- サンプル標準偏差は、パーティション内の 6 行すべてについて計算されます。 | 10 | 5000 | 1693.7138680032904 | -- サンプル標準偏差は、パーティション内の 6 行すべてについて計算されます。 | 10 | 1300 | 1693.7138680032904 | | 10 | 5000 | 1693.7138680032904 | | 10 | 2450 | 1693.7138680032904 | | 20 | 3000 | 1123.3320969330487 | | 20 | 3000 | 1123.3320969330487 | | 20 | 800 | 1123.3320969330487 | | 20 | 1100 | 1123.3320969330487 | | 20 | 2975 | 1123.3320969330487 | | 30 | 1500 | 668.331255192114 | | 30 | 950 | 668.331255192114 | | 30 | 1600 | 668.331255192114 | | 30 | 1250 | 668.331255192114 | | 30 | 1250 | 668.331255192114 | | 30 | 2850 | 668.331255192114 | +------------+------------+------------+例 2: 各部門 (`deptno`) の給与 (`sal`) の累積サンプル標準偏差を計算します。ウィンドウは `deptno` によってパーティション分割され、`sal` によって順序付けられます。この関数は、パーティションの最初の行から現在の行までの範囲の標準偏差を計算します。次のコマンドは一例です:
SELECT deptno, sal, STDDEV_SAMP(sal) OVER (PARTITION BY deptno ORDER BY sal) FROM emp;次の結果が返されます。
+------------+------------+------------+ | deptno | sal | _c2 | +------------+------------+------------+ | 10 | 1300 | 0.0 | -- ウィンドウの最初の行。 | 10 | 1300 | 0.0 | -- 1 行目から 2 行目までの累積サンプル標準偏差。 | 10 | 2450 | 663.9528095680697 | -- 1 行目から 3 行目までの累積サンプル標準偏差。 | 10 | 2450 | 663.9528095680696 | | 10 | 5000 | 1511.2081259707413 | | 10 | 5000 | 1693.7138680032904 | | 20 | 800 | 0.0 | | 20 | 1100 | 212.13203435596427 | | 20 | 2975 | 1178.7175234126282 | | 20 | 3000 | 1182.7536725793752 | | 20 | 3000 | 1123.3320969330487 | | 30 | 950 | 0.0 | | 30 | 1250 | 212.13203435596427 | | 30 | 1250 | 173.20508075688772 | | 30 | 1500 | 225.0 | | 30 | 1600 | 253.4758371127315 | | 30 | 2850 | 668.331255192114 | +------------+------------+------------+例 3: すべての従業員の給与 (`sal`) のサンプル標準偏差を計算します。次のコマンドは一例です:
SELECT STDDEV_SAMP(sal) FROM emp;次の結果が返されます。
+------------+ | _c0 | +------------+ | 1301.6180541247609 | +------------+例 4: この関数を
GROUP BYと一緒に使用して、従業員を部門 (`deptno`) ごとにグループ化し、各部門の給与 (`sal`) のサンプル標準偏差を計算します。次のコマンドは一例です:SELECT deptno, STDDEV_SAMP(sal) FROM emp GROUP BY deptno;次の結果が返されます。
+------------+------------+ | deptno | _c1 | +------------+------------+ | 10 | 1693.7138680032901 | | 20 | 1123.3320969330487 | | 30 | 668.3312551921141 | +------------+------------+
関連関数
STDDEV_SAMP は集計関数またはウィンドウ関数です。