Topik ini menjelaskan algoritma Support Vector Regression (SVR).
Informasi latar belakang
SVR merupakan cabang aplikasi dari Support Vector Machine (SVM). SVR dapat digunakan untuk menemukan bidang regresi di mana semua elemen data dalam satu set memiliki jarak terpendek.
Skenario
SVR adalah model regresi yang utamanya digunakan untuk memprediksi nilai dalam skenario dengan fitur jarang dan jumlah fitur yang kecil.
Sebagai contoh, model SVR dapat digunakan untuk memprediksi suhu sebuah kota. Fitur input mencakup berbagai faktor seperti rata-rata suhu historis kota selama periode tertentu, persentase cakupan vegetasi, jumlah danau di wilayah tersebut, dan tanggal. Output dari model adalah suhu perkiraan kota selama periode tersebut.
Parameter
Nilai parameter yang dijelaskan dalam tabel berikut sesuai dengan parameter model_parameter yang ditentukan dalam pernyataan CREATE MODEL yang digunakan untuk membuat model. Anda dapat mengonfigurasi parameter sesuai kebutuhan bisnis Anda.
Parameter | Deskripsi |
kernel | Fungsi kernel, yang digunakan untuk memetakan data dimensi rendah ke ruang dimensi tinggi. Nilai valid:
|
c | Koefisien penalti dari koefisien relaksasi. Ini adalah bilangan titik mengambang lebih besar dari 0 dan dapat dibiarkan kosong. Nilai default: 1. Catatan Dalam kasus kualitas data rendah, Anda dapat mengurangi nilai parameter ini. |
epsilon | Ambang batas fungsi loss SVR. Ketika selisih antara nilai prediksi dan nilai aktual sama dengan ambang batas, loss sampel dihitung. Nilai default: 0,1. |
max_iter | Jumlah maksimum iterasi. Nilai valid: bilangan bulat positif dan -1. Nilai default: -1. Catatan Jika Anda mengatur nilainya ke -1, tidak ada batasan jumlah iterasi. Iterasi akan berlanjut hingga nilai konvergen dalam |
Contoh
Membuat model SVR.
/*polar4ai*/CREATE MODEL svr1 WITH
( model_class = 'svr', x_cols = 'dx1,dx2', y_cols='y',
model_parameter=(kernel='rbf')) AS (SELECT * FROM db4ai.testdata1);Evaluasi model.
/*polar4ai*/SELECT dx1,dx2 FROM EVALUATE(MODEL svr1,
SELECT * FROM db4ai.testdata1 LIMIT 10) WITH
(x_cols = 'dx1,dx2',y_cols='y',metrics='r2_score');Gunakan model untuk prediksi.
/*polar4ai*/SELECT dx1,dx2 FROM
PREDICT(MODEL svr1, SELECT * FROM db4ai.testdata1 LIMIT 10)
WITH (x_cols = 'dx1,dx2');Tipe data x_cols dan y_cols harus berupa titik mengambang atau bilangan bulat.