ピアソン係数は、2 つの変数の間の線形相関を測定する線形相関係数です。Machine Learning Designer では、ピアソン係数コンポーネントを使用して、入力テーブルまたはパーティションの 2 つの数値列のピアソン相関係数を計算します。
コンポーネントを構成する
ピアソン係数コンポーネントを構成するには、次のいずれかの方法を使用できます。
方法 1:パイプラインページでコンポーネントを構成する
Platform for AI(PAI)の Machine Learning Designer のパイプラインページで、ピアソン係数コンポーネントのパラメーターを構成できます。次の表にパラメーターを示します。
タブ | パラメーター | 説明 |
フィールド設定 | 入力列 1 | 相関係数を計算する列の名前。 |
入力列 2 | 相関係数を計算する列の名前。 |
方法 2:PAI コマンドを使用する
PAI コマンドを使用して、コンポーネントパラメーターを構成できます。SQL スクリプトコンポーネントを使用して、PAI コマンドを呼び出すことができます。詳細については、「SQL スクリプト」をご参照ください。
pai -name pearson
-project algo_public
-DinputTableName=wpbc
-Dcol1Name=f1
-Dcol2Name=f2
-DoutputTableName=wpbc_pear;
パラメーター | 説明 | 必須 |
inputTableName | 入力テーブルの名前。 | はい |
inputTablePartitions | 入力テーブルのパーティション。デフォルトでは、すべてのパーティションが選択されます。
| いいえ |
col1Name | 入力列 1 の名前。 | はい |
col2Name | 入力列 2 の名前。 | はい |
outputTableName | 出力テーブルの名前。 | はい |
lifecycle | 出力テーブルのライフサイクル。デフォルトでは、出力テーブルにはライフサイクルがありません。 説明 値は正の整数である必要があります。 | いいえ |
例
入力テーブル
MaxCompute SQL タスクを開発するで pai_pearson_test_input テーブルを作成します。ステートメント例:
create table pai_pearson_test_input as select * from ( select 1.0 as f0,0.11 as f1 union all select 2.0 as f0,0.12 as f1 union all select 3.0 as f0,0.13 as f1 union all select 5.0 as f0,0.15 as f1 union all select 8.0 as f0,0.18 as f1 )tmp;
PAI コマンド
SQL スクリプトを実行して PAI コマンドを実行するか、MaxCompute SQL タスクを開発することで PAI コマンドを実行します。
pai -name pearson -project algo_public -DinputTableName=pai_pearson_test_input -Dcol1Name=f0 -Dcol2Name=f1 -DoutputTableName=pai_pearson_test_output;
出力テーブル
+------------+------------+------------+------------+-------------+-------------+---------------------+ | src_table | src_parts | col1_name | col2_name | count_total | count_valid | pearson_coefficient | +------------+------------+------------+------------+-------------+-------------+---------------------+ | sre_mpi_algo_dev.pai_pearson_test_input | | f0 | f1 | 5 | 5 | 0.9999999999999973 | +------------+------------+------------+------------+-------------+-------------+---------------------+