全部产品
Search
文档中心

Platform For AI:Koefisien Pearson

更新时间:Jul 02, 2025

Koefisien Pearson adalah koefisien korelasi linier yang mengukur hubungan linier antara dua variabel. Dalam Machine Learning Designer, komponen Koefisien Pearson digunakan untuk menghitung koefisien korelasi Pearson dari dua kolom numerik dalam tabel input atau partisi.

Konfigurasikan komponen

Anda dapat menggunakan salah satu metode berikut untuk mengonfigurasi komponen Koefisien Pearson:

Metode 1: Konfigurasikan komponen pada halaman pipeline

Anda dapat mengonfigurasi parameter komponen Koefisien Pearson di halaman pipeline Machine Learning Designer dari Platform for AI (PAI). Tabel berikut menjelaskan parameter tersebut:

Tab

Parameter

Deskripsi

Pengaturan Kolom

Kolom Input 1

Nama kolom yang akan dihitung koefisien korelasinya.

Kolom Input 2

Nama kolom yang akan dihitung koefisien korelasinya.

Metode 2: Gunakan perintah PAI

Anda dapat mengonfigurasi parameter komponen dengan menggunakan perintah PAI. Anda dapat memanggil perintah PAI melalui komponen SQL Script. Untuk informasi lebih lanjut, lihat SQL Script.

pai -name pearson
    -project algo_public
    -DinputTableName=wpbc
    -Dcol1Name=f1
    -Dcol2Name=f2
    -DoutputTableName=wpbc_pear;

Parameter

Deskripsi

Diperlukan

inputTableName

Nama tabel input.

Ya

inputTablePartitions

Partisi dalam tabel input. Secara default, semua partisi dipilih.

  • Tentukan satu partisi dalam format partition_name=value.

  • Tentukan beberapa partisi dalam format name1=value1,name2=value2.

    Catatan

    Pisahkan beberapa partisi dengan tanda koma (,).

  • Tentukan partisi multi-level dalam format name1=value1/name2=value2.

Tidak

col1Name

Nama Kolom Input 1.

Ya

col2Name

Nama Kolom Input 2.

Ya

outputTableName

Nama tabel output.

Ya

lifecycle

Siklus hidup tabel output. Secara default, tabel output tidak memiliki siklus hidup.

Catatan

Nilainya harus bilangan bulat positif.

Tidak

Contoh

  • Tabel Input

    Kembangkan tugas SQL MaxCompute untuk membuat tabel pai_pearson_test_input. Contoh pernyataan:

    create table pai_pearson_test_input as
    select * from
    (
    select 1.0 as f0,0.11 as f1
    union all
    select 2.0 as f0,0.12 as f1
    union all
    select 3.0 as f0,0.13 as f1
    union all
    select 5.0 as f0,0.15 as f1
    union all
    select 8.0 as f0,0.18 as f1
    )tmp;
  • Perintah PAI

    Jalankan skrip SQL untuk menjalankan perintah PAI atau kembangkan tugas SQL MaxCompute untuk menjalankan perintah PAI.

    pai -name pearson
        -project algo_public
        -DinputTableName=pai_pearson_test_input
        -Dcol1Name=f0
        -Dcol2Name=f1
        -DoutputTableName=pai_pearson_test_output;
  • Tabel Output

    +------------+------------+------------+------------+-------------+-------------+---------------------+
    | src_table  | src_parts  | col1_name  | col2_name  | count_total | count_valid | pearson_coefficient |
    +------------+------------+------------+------------+-------------+-------------+---------------------+
    | sre_mpi_algo_dev.pai_pearson_test_input |            | f0         | f1         | 5           | 5           | 0.9999999999999973  |
    +------------+------------+------------+------------+-------------+-------------+---------------------+