Komponen Prediksi Regresi Lasso mendukung format data sparse dan dense serta memprediksi variabel numerik, seperti batas pinjaman dan suhu. Topik ini menjelaskan cara mengonfigurasi komponen tersebut.
Batasan
Engine komputasi yang didukung adalah MaxCompute, Flink, atau DLC.
Prinsip algoritma
Algoritma regresi Lasso membangun model yang lebih ringkas dengan menerapkan fungsi penalti. Fungsi ini mengecilkan beberapa koefisien regresi dengan memaksa jumlah nilai absolutnya agar tidak melebihi nilai tetap tertentu, serta mengatur koefisien regresi lainnya menjadi nol. Pendekatan ini mempertahankan keunggulan subset shrinkage dan memberikan estimasi bias untuk menangani data multikolinear.
Konfigurasi komponen di GUI
-
Port input
Port input (dari kiri ke kanan)
Tipe data
Komponen hulu yang direkomendasikan
Wajib
Prediction input model
None
Yes
Prediction input data
None
Yes
-
Parameter komponen
Tab
Parameter
Deskripsi
Field Settings
Reserved Algorithm Column Names
Pilih nama kolom yang dicadangkan untuk algoritma.
Vector column
Nama kolom vektor.
Parameter Settings
Prediction result column
Nama kolom hasil prediksi.
Number of threads
Jumlah thread untuk komponen ini. Nilai default-nya adalah 1.
Execution Tuning
Number of workers
Digunakan bersama parameter Memory per worker (MB). Nilainya harus berupa bilangan bulat positif antara 1 hingga 9999.
Memory per worker (MB)
Nilainya harus berada di antara 1024 MB hingga 64 × 1024 MB.
Konfigurasi komponen menggunakan kode
Salin kode berikut ke komponen PyAlink Script untuk mencapai fungsionalitas yang sama.
from pyalink.alink import *
def main(sources, sinks, parameter):
model = sources[0]
batchData = sources[1]
predictor = LassoRegPredictBatchOp()\
.setPredictionCol("pred")
result = predictor.linkFrom(model, batchData)
result.link(sinks[0])
BatchOperator.execute()