すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:Pearson Coefficient

最終更新日:Apr 30, 2025

ピアソン係数は、2 つの変数の間の線形相関を測定する線形相関係数です。Machine Learning Designer では、ピアソン係数コンポーネントを使用して、入力テーブルまたはパーティションの 2 つの数値列のピアソン相関係数を計算します。

コンポーネントを構成する

ピアソン係数コンポーネントを構成するには、次のいずれかの方法を使用できます。

方法 1:パイプラインページでコンポーネントを構成する

Platform for AI(PAI)の Machine Learning Designer のパイプラインページで、ピアソン係数コンポーネントのパラメーターを構成できます。次の表にパラメーターを示します。

タブ

パラメーター

説明

フィールド設定

入力列 1

相関係数を計算する列の名前。

入力列 2

相関係数を計算する列の名前。

方法 2:PAI コマンドを使用する

PAI コマンドを使用して、コンポーネントパラメーターを構成できます。SQL スクリプトコンポーネントを使用して、PAI コマンドを呼び出すことができます。詳細については、「SQL スクリプト」をご参照ください。

pai -name pearson
    -project algo_public
    -DinputTableName=wpbc
    -Dcol1Name=f1
    -Dcol2Name=f2
    -DoutputTableName=wpbc_pear;

パラメーター

説明

必須

inputTableName

入力テーブルの名前。

はい

inputTablePartitions

入力テーブルのパーティション。デフォルトでは、すべてのパーティションが選択されます。

  • partition_name=value の形式で単一のパーティションを指定します。

  • name1=value1,name2=value2 の形式で複数のパーティションを指定します。

    説明

    複数のパーティションはカンマ (,) で区切ります。

  • name1=value1/name2=value2 の形式で複数レベルのパーティションを指定します。

いいえ

col1Name

入力列 1 の名前。

はい

col2Name

入力列 2 の名前。

はい

outputTableName

出力テーブルの名前。

はい

lifecycle

出力テーブルのライフサイクル。デフォルトでは、出力テーブルにはライフサイクルがありません。

説明

値は正の整数である必要があります。

いいえ

  • 入力テーブル

    MaxCompute SQL タスクを開発するで pai_pearson_test_input テーブルを作成します。ステートメント例:

    create table pai_pearson_test_input as
    select * from
    (
    select 1.0 as f0,0.11 as f1
    union all
    select 2.0 as f0,0.12 as f1
    union all
    select 3.0 as f0,0.13 as f1
    union all
    select 5.0 as f0,0.15 as f1
    union all
    select 8.0 as f0,0.18 as f1
    )tmp;
  • PAI コマンド

    SQL スクリプトを実行して PAI コマンドを実行するか、MaxCompute SQL タスクを開発することで PAI コマンドを実行します。

    pai -name pearson
        -project algo_public
        -DinputTableName=pai_pearson_test_input
        -Dcol1Name=f0
        -Dcol2Name=f1
        -DoutputTableName=pai_pearson_test_output;
  • 出力テーブル

    +------------+------------+------------+------------+-------------+-------------+---------------------+
    | src_table  | src_parts  | col1_name  | col2_name  | count_total | count_valid | pearson_coefficient |
    +------------+------------+------------+------------+-------------+-------------+---------------------+
    | sre_mpi_algo_dev.pai_pearson_test_input |            | f0         | f1         | 5           | 5           | 0.9999999999999973  |
    +------------+------------+------------+------------+-------------+-------------+---------------------+