Komponen Prediksi Regresi Lasso mendukung data yang jarang dan padat. Komponen ini dapat digunakan untuk memperkirakan nilai variabel numerik seperti batas pinjaman dan suhu. Topik ini menjelaskan cara mengonfigurasi komponen Prediksi Regresi Lasso.
Batasan
Komponen Pelatihan Regresi Ridge hanya dapat digunakan dengan salah satu sumber daya komputasi berikut: MaxCompute, Realtime Compute for Apache Flink, atau Deep Learning Containers (DLC) dari Platform for AI (PAI).
Cara kerja LASSO
LASSO membuat fungsi penalti untuk menghasilkan model yang lebih halus. LASSO dapat mengecilkan beberapa koefisien regresi dan menetapkan koefisien tertentu menjadi nol. Jika sebuah koefisien diperkecil, jumlah nilai absolutnya akan kurang dari nilai tetap. Dengan cara ini, LASSO mempertahankan fitur bermanfaat dari penyusutan subset dan menerapkan estimasi bias pada data multikolinearitas.
Mengonfigurasi komponen di konsol PAI
Port Input
Port input (kiri ke kanan)
Tipe
Komponen hulu yang direkomendasikan
Diperlukan
Model input dari prediksi
Tidak ada
Ya
Data input dari prediksi
Tidak ada
Ya
Pengaturan Parameter
Tab
Parameter
Deskripsi
Field Setting
reservedCols
Kolom yang akan disimpan oleh algoritma.
vectorCol
Nama kolom vektor.
Parameter Setting
predictionCol
Nama kolom prediksi.
numThreads
Jumlah utas komponen. Nilai default: 1.
Execution Tuning
Number of Workers
Jumlah pekerja. Parameter ini harus digunakan bersama dengan parameter Memory per worker, unit MB. Nilai parameter ini harus bilangan bulat positif. Nilai valid: [1,9999].
Memory per worker, unit MB
Ukuran memori setiap pekerja. Nilai valid: 1024 hingga 64 × 1024. Unit: MB.
Mengonfigurasi komponen dengan pengkodean
Anda dapat menyalin kode berikut ke editor kode komponen PyAlink Script. Dengan cara ini, komponen PyAlink Script dapat bekerja seperti komponen Prediksi Regresi Lasso.
from pyalink.alink import *
def main(sources, sinks, parameter):
model = sources[0]
batchData = sources[1]
predictor = LassoRegPredictBatchOp()\
.setPredictionCol("pred")
result = predictor.linkFrom(model, batchData)
result.link(sinks[0])
BatchOperator.execute()