Koefisien Pearson adalah koefisien korelasi linier yang mengukur hubungan linier antara dua variabel. Dalam Machine Learning Designer, komponen Koefisien Pearson digunakan untuk menghitung koefisien korelasi Pearson dari dua kolom numerik dalam tabel input atau partisi.
Konfigurasikan komponen
Anda dapat menggunakan salah satu metode berikut untuk mengonfigurasi komponen Koefisien Pearson:
Metode 1: Konfigurasikan komponen pada halaman pipeline
Anda dapat mengonfigurasi parameter komponen Koefisien Pearson di halaman pipeline Machine Learning Designer dari Platform for AI (PAI). Tabel berikut menjelaskan parameter tersebut:
Tab | Parameter | Deskripsi |
Pengaturan Kolom | Kolom Input 1 | Nama kolom yang akan dihitung koefisien korelasinya. |
Kolom Input 2 | Nama kolom yang akan dihitung koefisien korelasinya. |
Metode 2: Gunakan perintah PAI
Anda dapat mengonfigurasi parameter komponen dengan menggunakan perintah PAI. Anda dapat memanggil perintah PAI melalui komponen SQL Script. Untuk informasi lebih lanjut, lihat SQL Script.
pai -name pearson
-project algo_public
-DinputTableName=wpbc
-Dcol1Name=f1
-Dcol2Name=f2
-DoutputTableName=wpbc_pear;Parameter | Deskripsi | Diperlukan |
inputTableName | Nama tabel input. | Ya |
inputTablePartitions | Partisi dalam tabel input. Secara default, semua partisi dipilih.
| Tidak |
col1Name | Nama Kolom Input 1. | Ya |
col2Name | Nama Kolom Input 2. | Ya |
outputTableName | Nama tabel output. | Ya |
lifecycle | Siklus hidup tabel output. Secara default, tabel output tidak memiliki siklus hidup. Catatan Nilainya harus bilangan bulat positif. | Tidak |
Contoh
Tabel Input
Kembangkan tugas SQL MaxCompute untuk membuat tabel pai_pearson_test_input. Contoh pernyataan:
create table pai_pearson_test_input as select * from ( select 1.0 as f0,0.11 as f1 union all select 2.0 as f0,0.12 as f1 union all select 3.0 as f0,0.13 as f1 union all select 5.0 as f0,0.15 as f1 union all select 8.0 as f0,0.18 as f1 )tmp;Perintah PAI
Jalankan skrip SQL untuk menjalankan perintah PAI atau kembangkan tugas SQL MaxCompute untuk menjalankan perintah PAI.
pai -name pearson -project algo_public -DinputTableName=pai_pearson_test_input -Dcol1Name=f0 -Dcol2Name=f1 -DoutputTableName=pai_pearson_test_output;Tabel Output
+------------+------------+------------+------------+-------------+-------------+---------------------+ | src_table | src_parts | col1_name | col2_name | count_total | count_valid | pearson_coefficient | +------------+------------+------------+------------+-------------+-------------+---------------------+ | sre_mpi_algo_dev.pai_pearson_test_input | | f0 | f1 | 5 | 5 | 0.9999999999999973 | +------------+------------+------------+------------+-------------+-------------+---------------------+