Komponen Prediksi Regresi Ridge mendukung data jarang dan padat. Komponen ini dapat digunakan untuk memperkirakan nilai variabel numerik seperti harga rumah, volume penjualan, dan suhu. Topik ini menjelaskan cara mengonfigurasi komponen Prediksi Regresi Ridge.
Batasan
Komponen Pelatihan Regresi Ridge hanya dapat digunakan dengan salah satu sumber daya komputasi berikut: MaxCompute, Realtime Compute for Apache Flink, atau Deep Learning Containers (DLC) dari Platform for AI (PAI).
Cara kerja Regularisasi Tikhonov
Regularisasi Tikhonov adalah metode regresi estimasi bias yang dirancang khusus untuk analisis data kolineritas. Pada dasarnya, ini merupakan versi ditingkatkan dari metode kuadrat terkecil. Dengan mengorbankan ketidakbiasan metode kuadrat terkecil, regularisasi Tikhonov lebih realistis dan andal dalam memperoleh koefisien regresi serta lebih sesuai untuk data kondisi buruk dibandingkan metode kuadrat terkecil. Namun, regularisasi Tikhonov juga menyebabkan hilangnya sebagian informasi dan penurunan akurasi.
Konfigurasikan komponen di konsol PAI
Port Input
Port input (kiri ke kanan)
Tipe data
Komponen hulu yang direkomendasikan
Diperlukan
Model input prediksi
Tidak ada
Ya
Data input prediksi
Tidak ada
Ya
Parameter Komponen
Tab
Parameter
Deskripsi
Field Setting
reservedCols
Kolom yang akan disimpan oleh algoritma.
vectorCol
Nama kolom vektor.
Parameter Setting
predictionCol
Nama kolom prediksi.
numThreads
Jumlah utas komponen. Nilai default: 1.
Execution Tuning
Number of Workers
Jumlah pekerja. Parameter ini harus digunakan bersama dengan parameter Memory per worker, unit MB. Nilai parameter ini harus bilangan bulat positif. Nilai valid: [1,9999].
Memory per worker, unit MB
Ukuran memori setiap pekerja. Nilai valid: 1024 hingga 64 × 1024. Unit: MB.
Konfigurasikan komponen dengan pengkodean
Anda dapat menyalin kode berikut ke editor kode komponen Skrip PyAlink. Ini memungkinkan komponen Skrip PyAlink berfungsi seperti komponen Prediksi Regresi Ridge.
from pyalink.alink import *
def main(sources, sinks, parameter):
model = sources[0]
batchData = sources[1]
predictor = RidgeRegPredictBatchOp()\
.setPredictionCol("pred")
result = predictor.linkFrom(model, batchData)
result.link(sinks[0])
BatchOperator.execute()