全部产品
Search
文档中心

Platform For AI:Matriks Koefisien Korelasi

更新时间:Jun 22, 2025

Matriks koefisien korelasi adalah alat yang digunakan untuk menghitung dan menampilkan korelasi berpasangan antara beberapa variabel. Setiap elemen dalam matriks tersebut merepresentasikan koefisien korelasi antara variabel terkait. Umumnya, koefisien korelasi Pearson digunakan untuk mengukur hubungan linear. Matriks ini penting dalam pemilihan fitur, analitik data, dan pembuatan model, membantu mengidentifikasi dependensi linear serta masalah multikolinearitas di antara variabel.

Konfigurasikan komponen

Metode 1: Konfigurasikan komponen pada halaman pipeline

Pada halaman detail pipeline di Machine Learning Designer, tambahkan komponen Correlation Coefficient Matrix ke pipeline dan konfigurasikan parameter sesuai tabel berikut.

Tab

Parameter

Deskripsi

Fields Setting

Semua Dipilih Secara Default

Kolom fitur yang digunakan dalam perhitungan matriks. Secara default, semua kolom fitur dipilih untuk analisis korelasi.

Tuning

Cores

Parameter ini harus digunakan bersama dengan parameter Ukuran Memori.

Ukuran Memori

Parameter ini harus digunakan bersama dengan parameter Core.

Metode 2: Gunakan perintah PAI

Konfigurasikan parameter komponen menggunakan perintah PAI. Anda dapat menggunakan komponen SQL Script untuk memanggil perintah PAI. Untuk informasi lebih lanjut, lihat Skenario 4: Jalankan Perintah PAI dalam Komponen Skrip SQL.

PAI -name corrcoef
    -project algo_public
    -DinputTableName=maple_test_corrcoef_basic12x10_input
    -DoutputTableName=maple_test_corrcoef_basic12x10_output
    -DcoreNum=1
    -DmemSizePerCore=110;

Parameter

Diperlukan

Nilai default

Deskripsi

inputTableName

Ya

Tidak ada nilai default

Nama tabel input.

inputTablePartitions

Tidak

Tidak ada nilai default

Partisi yang dipilih dari tabel input untuk pelatihan. Format berikut didukung:

  • partition_name=value

  • name1=value1/name2=value2: partisi multi-level

null

Jika Anda menentukan beberapa partisi, pisahkan mereka dengan tanda koma (,). Contoh: name1=value1,value2.

outputTableName

Ya

Tidak ada nilai default

Nama tabel output.

selectedColNames

Tidak

Semua kolom

Kolom yang dipilih dari tabel input.

lifecycle

Tidak

Tidak ada nilai default

Lifecycle tabel output.

coreNum

Tidak

Ditentukan oleh sistem

Parameter ini harus digunakan bersama dengan parameter memSizePerCore. Nilainya harus berupa bilangan bulat positif. Nilai valid: 1 hingga 9999.

memSizePerCore

Tidak

Ditentukan oleh sistem

Ukuran memori setiap core. Unit: MB. Nilainya harus berupa bilangan bulat positif dalam rentang [1024, 64 × 1024].

Contoh

  1. Hasilkan data uji berikut.

    col0:double

    col1:bigint

    col2:double

    col3:bigint

    col4:double

    col5:bigint

    col6:double

    col7:bigint

    col8:double

    col9:double

    19

    95

    33

    52

    115

    43

    32

    98

    76

    40

    114

    26

    101

    69

    56

    59

    116

    23

    109

    105

    103

    89

    7

    9

    65

    118

    73

    50

    55

    81

    79

    20

    63

    71

    5

    24

    77

    31

    21

    75

    87

    16

    66

    47

    25

    14

    42

    99

    108

    57

    11

    104

    38

    37

    106

    51

    3

    91

    80

    97

    84

    30

    70

    46

    8

    6

    94

    22

    45

    48

    35

    17

    107

    64

    10

    112

    53

    34

    90

    96

    13

    61

    39

    1

    29

    117

    112

    2

    82

    28

    62

    4

    102

    88

    100

    36

    67

    54

    12

    85

    49

    27

    44

    93

    68

    110

    60

    72

    86

    58

    92

    119

    0

    113

    41

    15

    74

    83

    18

    111

  2. Jalankan perintah PAI berikut:

    PAI -name corrcoef
        -project algo_public
        -DinputTableName=maple_test_corrcoef_basic12x10_input
        -DoutputTableName=maple_test_corrcoef_basic12x10_output
        -DcoreNum=1
        -DmemSizePerCore=110;
  3. Lihat hasil yang dikembalikan.

    columnsnames

    col0

    col1

    col2

    col3

    col4

    col5

    col6

    col7

    col8

    col9

    col0

    1

    -0,2115657251820724

    0,0598306259706561

    0,2599903570684693

    -0,3483249188225586

    -0,28716254396809926

    0,47880162127435116

    -0,13646519484213326

    -0,19500158764680092

    0,3897390240949085

    col1

    -0,2115657251820724

    1

    -0,8444477377898585

    -0,17507636221594533

    0,40943384150571377

    0,09135976026101403

    -0,3018506374626574

    0,40733726912808044

    -0,11827739124590071

    0,12433851389455183

    col2

    0,0598306259706561

    -0,8444477377898585

    1

    0,18518346647293102

    -0,20934839228057014

    -0,1896417512389659

    0,1799377498863213

    -0,3858885676469948

    0,20254569203773892

    0,13476160753756655

    col3

    0,2599903570684693

    -0,17507636221594533

    0,18518346647293102

    1

    0,03988018649854009

    -0,43737887418329147

    -0,053818296425267184

    0,2900856441586986

    -0,3607547910075688

    0,4912019074930449

    col4

    -0,3483249188225586

    0,40943384150571377

    -0,20934839228057014

    0,03988018649854009

    1

    0,1465605209246875

    -0,5016030364347955

    0,5496024325711117

    0,013743256115394122

    0,07497231559184887

    col5

    -0,28716254396809926

    0,09135976026101403

    -0,1896417512389659

    -0,43737887418329147

    0,1465605209246875

    1

    0,16729809310873522

    -0,29890655828796964

    0,3618518101014617

    -0,1713960957286885

    col6

    0,47880162127435116

    -0,3018506374626574

    0,1799377498863213

    -0,053818296425267184

    -0,5016030364347955

    0,16729809310873522

    1

    -0,8165019880156462

    -0,11173420918721436

    -0,10363860378347944

    col7

    -0,13646519484213326

    0,40733726912808044

    -0,3858885676469948

    0,2900856441586986

    0,5496024325711117

    -0,29890655828796964

    -0,8165019880156462

    1

    0,07435907471544469

    0,11711976051999162

    col8

    -0,19500158764680092

    -0,11827739124590071

    0,20254569203773892

    -0,3607547910075688

    0,013743256115394122

    0,3618518101014617

    -0,11173420918721436

    0,07435907471544469

    1

    -0,18463012549540175

    col9

    0,3897390240949085

    0,12433851389455183

    0,13476160753756655

    0,4912019074930449

    0,07497231559184887

    -0,1713960957286885

    -0,10363860378347944

    0,11711976051999162

    -0,18463012549540175

    1