Support Vector Machine (SVM) adalah model pembelajaran mesin yang dikembangkan berdasarkan teori pembelajaran statistik. Model ini meminimalkan risiko dan meningkatkan kemampuan generalisasi pembelajaran mesin sehingga risiko empiris dan interval kepercayaan diminimalkan. Topik ini menjelaskan cara mengonfigurasi komponen Linear SVM serta memberikan contoh penggunaannya.
Informasi latar belakang
Komponen Linear SVM tidak diimplementasikan menggunakan fungsi kernel. Untuk informasi lebih lanjut tentang implementasi komponen ini, lihat bagian "Metode Wilayah Kepercayaan untuk L2-SVM" dalam Trust Region Newton Method for Large-Scale Logistic Regression.
Batasan
Komponen Linear SVM hanya dapat digunakan dalam skenario klasifikasi biner.
Konfigurasi komponen
Anda dapat mengonfigurasi komponen Linear SVM dengan salah satu metode berikut:
Metode 1: Konfigurasikan komponen di Machine Learning Designer
Port Input
Komponen Linear SVM hanya mendukung satu port input yang harus terhubung ke komponen Read Table.
Parameter Komponen
Tab
Parameter
Diperlukan
Deskripsi
Fields Setting
Feature Columns
Ya
Kolom input yang dipilih berdasarkan karakteristik tabel input. Data yang terkandung dalam kolom-kolom tersebut dapat berupa tipe BIGINT atau DOUBLE.
Label Column
Ya
Kolom label yang dipilih berdasarkan karakteristik tabel input. Data yang terkandung dalam kolom tersebut dapat berupa tipe BIGINT, DOUBLE, atau STRING.
Parameters Setting
Positive Sample Label
Tidak
Nilai referensi objektif. Nilai acak akan dipilih jika Anda tidak menentukan parameter ini. Jika perbedaan antara contoh positif dan negatif besar, kami sarankan Anda menentukan parameter ini.
Positive Penalty Factor
Tidak
Bobot contoh positif. Nilai valid: (0,+∞). Nilai default: 1.0.
Negative Penalty Factor
Tidak
Bobot contoh negatif. Nilai valid: (0,+∞). Nilai default: 1.0.
Convergence Coefficient
Tidak
Deviasi konvergensi. Nilai valid: (0,1). Nilai default: 0.001.
Tuning
Cores
Tidak
Jumlah inti yang digunakan dalam komputasi. Sistem secara otomatis mengalokasikan inti jika parameter ini tidak ditentukan.
Memory Size per Core
Tidak
Ukuran memori setiap inti. Sistem secara otomatis mengalokasikan memori ke setiap inti jika parameter ini tidak ditentukan. Unit: MB.
Port Output
Komponen Linear SVM mengeluarkan model biner dengan format yang sama seperti model batch ke komponen prediksi hilir melalui port output.
Metode 2: Jalankan perintah Platform Pembelajaran Mesin untuk AI
Konfigurasikan parameter komponen menggunakan perintah Platform Pembelajaran Mesin untuk AI. Anda dapat menggunakan komponen SQL Script untuk menjalankan perintah tersebut. Untuk informasi lebih lanjut, lihat SQL Script.
PAI -name LinearSVM -project algo_public
-DinputTableName="bank_data"
-DmodelName="xlab_m_LinearSVM_6143"
-DfeatureColNames="pdays,emp_var_rate,cons_conf_idx"
-DlabelColName="y"
-DpositiveLabel="0"
-DpositiveCost="1.0"
-DnegativeCost="1.0"
-Depsilon="0.001";Tabel berikut menjelaskan parameter yang digunakan dalam perintah Platform Pembelajaran Mesin untuk AI.
Parameter | Diperlukan | Deskripsi | Nilai default |
inputTableName | Ya | Nama tabel input. | Tidak ada |
inputTablepartitions | Tidak | Partisi yang dipilih dari tabel input untuk pelatihan. Format berikut didukung:
Catatan Jika Anda menentukan beberapa partisi, pisahkan mereka dengan koma (,). | Semua partisi |
modelName | Ya | Nama model output. | Tidak ada |
featureColNames | Ya | Kolom fitur yang dipilih dari tabel input untuk pelatihan. | Tidak ada |
labelColName | Ya | Nama kolom label dalam tabel input. | Tidak ada |
positiveLabel | Tidak | Nilai contoh positif. | Nilai acak yang dipilih dari nilai-nilai label |
positiveCost | Tidak | Bobot contoh positif. Ini juga merupakan faktor penalti positif. Nilai valid: (0,+∞). | 1.0 |
negativeCost | Tidak | Bobot contoh negatif. Ini juga merupakan faktor penalti negatif. Nilai valid: (0,+∞). | 1.0 |
epsilon | Tidak | Koefisien konvergensi. Nilai valid: (0,1). | 0.001 |
enableSparse | Tidak | Menentukan apakah data input bersifat jarang. Nilai valid: true dan false. | false |
itemDelimiter | Tidak | Pemisah yang digunakan untuk memisahkan pasangan key-value jika data dalam tabel input bersifat jarang. | Koma (,) |
kvDelimiter | Tidak | Pemisah yang digunakan untuk memisahkan keys dan values jika data dalam tabel input bersifat jarang. | Titik dua (:) |
coreNum | Tidak | Jumlah inti yang digunakan dalam komputasi. Nilai parameter ini harus berupa bilangan bulat positif. | Dialokasikan secara otomatis |
memSizePerCore | Tidak | Ukuran memori setiap inti. Nilai valid: 1 hingga 65536. Unit: MB. | Dialokasikan secara otomatis |
Contoh
Gunakan data latih berikut sebagai input.
id
y
f0
f1
f2
f3
f4
f5
f6
f7
1
-1
-0.294118
0.487437
0.180328
-0.292929
-1
0.00149028
-0.53117
-0.0333333
2
+1
-0.882353
-0.145729
0.0819672
-0.414141
-1
-0.207153
-0.766866
-0.666667
3
-1
-0.0588235
0.839196
0.0491803
-1
-1
-0.305514
-0.492741
-0.633333
4
+1
-0.882353
-0.105528
0.0819672
-0.535354
-0.777778
-0.162444
-0.923997
-1
5
-1
-1
0.376884
-0.344262
-0.292929
-0.602837
0.28465
0.887276
-0.6
6
+1
-0.411765
0.165829
0.213115
-1
-1
-0.23696
-0.894962
-0.7
7
-1
-0.647059
-0.21608
-0.180328
-0.353535
-0.791962
-0.0760059
-0.854825
-0.833333
8
+1
0.176471
0.155779
-1
-1
-1
0.052161
-0.952178
-0.733333
9
-1
-0.764706
0.979899
0.147541
-0.0909091
0.283688
-0.0909091
-0.931682
0.0666667
10
-1
-0.0588235
0.256281
0.57377
-1
-1
-1
-0.868488
0.1
Gunakan data uji berikut sebagai input.
id
y
f0
f1
f2
f3
f4
f5
f6
f7
1
+1
-0.882353
0.0854271
0.442623
-0.616162
-1
-0.19225
-0.725021
-0.9
2
+1
-0.294118
-0.0351759
-1
-1
-1
-0.293592
-0.904355
-0.766667
3
+1
-0.882353
0.246231
0.213115
-0.272727
-1
-0.171386
-0.981213
-0.7
4
-1
-0.176471
0.507538
0.278689
-0.414141
-0.702128
0.0491804
-0.475662
0.1
5
-1
-0.529412
0.839196
-1
-1
-1
-0.153502
-0.885568
-0.5
6
+1
-0.882353
0.246231
-0.0163934
-0.353535
-1
0.0670641
-0.627669
-1
7
-1
-0.882353
0.819095
0.278689
-0.151515
-0.307329
0.19225
0.00768574
-0.966667
8
+1
-0.882353
-0.0753769
0.0163934
-0.494949
-0.903073
-0.418778
-0.654996
-0.866667
9
+1
-1
0.527638
0.344262
-0.212121
-0.356974
0.23696
-0.836038
-0.8
10
+1
-0.882353
0.115578
0.0163934
-0.737374
-0.56974
-0.28465
-0.948762
-0.933333
Buat pipeline seperti yang ditunjukkan pada gambar berikut. Untuk informasi lebih lanjut, lihat Pemodelan Algoritma.

Konfigurasikan parameter yang tercantum dalam tabel berikut untuk komponen Linear SVM. Pertahankan nilai default dari parameter yang tidak tercantum dalam tabel.
Tab
Parameter
Deskripsi
Fields Setting
Feature Columns
Pilih kolom f0, f1, f2, f3, f4, f5, f6, dan f7.
Label Column
Pilih kolom y.
Jalankan pipeline dan lihat hasil prediksi.
