全部产品
Search
文档中心

Platform For AI:Linear SVM

更新时间:Jul 06, 2025

Support Vector Machine (SVM) adalah model pembelajaran mesin yang dikembangkan berdasarkan teori pembelajaran statistik. Model ini meminimalkan risiko dan meningkatkan kemampuan generalisasi pembelajaran mesin sehingga risiko empiris dan interval kepercayaan diminimalkan. Topik ini menjelaskan cara mengonfigurasi komponen Linear SVM serta memberikan contoh penggunaannya.

Informasi latar belakang

Komponen Linear SVM tidak diimplementasikan menggunakan fungsi kernel. Untuk informasi lebih lanjut tentang implementasi komponen ini, lihat bagian "Metode Wilayah Kepercayaan untuk L2-SVM" dalam Trust Region Newton Method for Large-Scale Logistic Regression.

Batasan

Komponen Linear SVM hanya dapat digunakan dalam skenario klasifikasi biner.

Konfigurasi komponen

Anda dapat mengonfigurasi komponen Linear SVM dengan salah satu metode berikut:

Metode 1: Konfigurasikan komponen di Machine Learning Designer

  • Port Input

    Komponen Linear SVM hanya mendukung satu port input yang harus terhubung ke komponen Read Table.

  • Parameter Komponen

    Tab

    Parameter

    Diperlukan

    Deskripsi

    Fields Setting

    Feature Columns

    Ya

    Kolom input yang dipilih berdasarkan karakteristik tabel input. Data yang terkandung dalam kolom-kolom tersebut dapat berupa tipe BIGINT atau DOUBLE.

    Label Column

    Ya

    Kolom label yang dipilih berdasarkan karakteristik tabel input. Data yang terkandung dalam kolom tersebut dapat berupa tipe BIGINT, DOUBLE, atau STRING.

    Parameters Setting

    Positive Sample Label

    Tidak

    Nilai referensi objektif. Nilai acak akan dipilih jika Anda tidak menentukan parameter ini. Jika perbedaan antara contoh positif dan negatif besar, kami sarankan Anda menentukan parameter ini.

    Positive Penalty Factor

    Tidak

    Bobot contoh positif. Nilai valid: (0,+∞). Nilai default: 1.0.

    Negative Penalty Factor

    Tidak

    Bobot contoh negatif. Nilai valid: (0,+∞). Nilai default: 1.0.

    Convergence Coefficient

    Tidak

    Deviasi konvergensi. Nilai valid: (0,1). Nilai default: 0.001.

    Tuning

    Cores

    Tidak

    Jumlah inti yang digunakan dalam komputasi. Sistem secara otomatis mengalokasikan inti jika parameter ini tidak ditentukan.

    Memory Size per Core

    Tidak

    Ukuran memori setiap inti. Sistem secara otomatis mengalokasikan memori ke setiap inti jika parameter ini tidak ditentukan. Unit: MB.

  • Port Output

    Komponen Linear SVM mengeluarkan model biner dengan format yang sama seperti model batch ke komponen prediksi hilir melalui port output.

Metode 2: Jalankan perintah Platform Pembelajaran Mesin untuk AI

Konfigurasikan parameter komponen menggunakan perintah Platform Pembelajaran Mesin untuk AI. Anda dapat menggunakan komponen SQL Script untuk menjalankan perintah tersebut. Untuk informasi lebih lanjut, lihat SQL Script.

PAI -name LinearSVM -project algo_public
    -DinputTableName="bank_data"
    -DmodelName="xlab_m_LinearSVM_6143"
    -DfeatureColNames="pdays,emp_var_rate,cons_conf_idx"
    -DlabelColName="y"
    -DpositiveLabel="0"
    -DpositiveCost="1.0"
    -DnegativeCost="1.0"
    -Depsilon="0.001";

Tabel berikut menjelaskan parameter yang digunakan dalam perintah Platform Pembelajaran Mesin untuk AI.

Parameter

Diperlukan

Deskripsi

Nilai default

inputTableName

Ya

Nama tabel input.

Tidak ada

inputTablepartitions

Tidak

Partisi yang dipilih dari tabel input untuk pelatihan. Format berikut didukung:

  • Partition_name=value

  • name1=value1/name2=value2: partisi multi-level

Catatan

Jika Anda menentukan beberapa partisi, pisahkan mereka dengan koma (,).

Semua partisi

modelName

Ya

Nama model output.

Tidak ada

featureColNames

Ya

Kolom fitur yang dipilih dari tabel input untuk pelatihan.

Tidak ada

labelColName

Ya

Nama kolom label dalam tabel input.

Tidak ada

positiveLabel

Tidak

Nilai contoh positif.

Nilai acak yang dipilih dari nilai-nilai label

positiveCost

Tidak

Bobot contoh positif. Ini juga merupakan faktor penalti positif. Nilai valid: (0,+∞).

1.0

negativeCost

Tidak

Bobot contoh negatif. Ini juga merupakan faktor penalti negatif. Nilai valid: (0,+∞).

1.0

epsilon

Tidak

Koefisien konvergensi. Nilai valid: (0,1).

0.001

enableSparse

Tidak

Menentukan apakah data input bersifat jarang. Nilai valid: true dan false.

false

itemDelimiter

Tidak

Pemisah yang digunakan untuk memisahkan pasangan key-value jika data dalam tabel input bersifat jarang.

Koma (,)

kvDelimiter

Tidak

Pemisah yang digunakan untuk memisahkan keys dan values jika data dalam tabel input bersifat jarang.

Titik dua (:)

coreNum

Tidak

Jumlah inti yang digunakan dalam komputasi. Nilai parameter ini harus berupa bilangan bulat positif.

Dialokasikan secara otomatis

memSizePerCore

Tidak

Ukuran memori setiap inti. Nilai valid: 1 hingga 65536. Unit: MB.

Dialokasikan secara otomatis

Contoh

  1. Gunakan data latih berikut sebagai input.

    id

    y

    f0

    f1

    f2

    f3

    f4

    f5

    f6

    f7

    1

    -1

    -0.294118

    0.487437

    0.180328

    -0.292929

    -1

    0.00149028

    -0.53117

    -0.0333333

    2

    +1

    -0.882353

    -0.145729

    0.0819672

    -0.414141

    -1

    -0.207153

    -0.766866

    -0.666667

    3

    -1

    -0.0588235

    0.839196

    0.0491803

    -1

    -1

    -0.305514

    -0.492741

    -0.633333

    4

    +1

    -0.882353

    -0.105528

    0.0819672

    -0.535354

    -0.777778

    -0.162444

    -0.923997

    -1

    5

    -1

    -1

    0.376884

    -0.344262

    -0.292929

    -0.602837

    0.28465

    0.887276

    -0.6

    6

    +1

    -0.411765

    0.165829

    0.213115

    -1

    -1

    -0.23696

    -0.894962

    -0.7

    7

    -1

    -0.647059

    -0.21608

    -0.180328

    -0.353535

    -0.791962

    -0.0760059

    -0.854825

    -0.833333

    8

    +1

    0.176471

    0.155779

    -1

    -1

    -1

    0.052161

    -0.952178

    -0.733333

    9

    -1

    -0.764706

    0.979899

    0.147541

    -0.0909091

    0.283688

    -0.0909091

    -0.931682

    0.0666667

    10

    -1

    -0.0588235

    0.256281

    0.57377

    -1

    -1

    -1

    -0.868488

    0.1

  2. Gunakan data uji berikut sebagai input.

    id

    y

    f0

    f1

    f2

    f3

    f4

    f5

    f6

    f7

    1

    +1

    -0.882353

    0.0854271

    0.442623

    -0.616162

    -1

    -0.19225

    -0.725021

    -0.9

    2

    +1

    -0.294118

    -0.0351759

    -1

    -1

    -1

    -0.293592

    -0.904355

    -0.766667

    3

    +1

    -0.882353

    0.246231

    0.213115

    -0.272727

    -1

    -0.171386

    -0.981213

    -0.7

    4

    -1

    -0.176471

    0.507538

    0.278689

    -0.414141

    -0.702128

    0.0491804

    -0.475662

    0.1

    5

    -1

    -0.529412

    0.839196

    -1

    -1

    -1

    -0.153502

    -0.885568

    -0.5

    6

    +1

    -0.882353

    0.246231

    -0.0163934

    -0.353535

    -1

    0.0670641

    -0.627669

    -1

    7

    -1

    -0.882353

    0.819095

    0.278689

    -0.151515

    -0.307329

    0.19225

    0.00768574

    -0.966667

    8

    +1

    -0.882353

    -0.0753769

    0.0163934

    -0.494949

    -0.903073

    -0.418778

    -0.654996

    -0.866667

    9

    +1

    -1

    0.527638

    0.344262

    -0.212121

    -0.356974

    0.23696

    -0.836038

    -0.8

    10

    +1

    -0.882353

    0.115578

    0.0163934

    -0.737374

    -0.56974

    -0.28465

    -0.948762

    -0.933333

  3. Buat pipeline seperti yang ditunjukkan pada gambar berikut. Untuk informasi lebih lanjut, lihat Pemodelan Algoritma.

    image.png

  4. Konfigurasikan parameter yang tercantum dalam tabel berikut untuk komponen Linear SVM. Pertahankan nilai default dari parameter yang tidak tercantum dalam tabel.

    Tab

    Parameter

    Deskripsi

    Fields Setting

    Feature Columns

    Pilih kolom f0, f1, f2, f3, f4, f5, f6, dan f7.

    Label Column

    Pilih kolom y.

  5. Jalankan pipeline dan lihat hasil prediksi.Prediction results