Scorecard prediction adalah teknik pembelajaran mesin yang menerapkan model scorecard untuk memberi skor pada data baru dan memprediksi kinerja atau risiko di masa depan. Model ini biasanya dihasilkan oleh komponen pelatihan scorecard. Komponen Scorecard Prediction menggunakan model tersebut untuk mengevaluasi dan memberi skor pada data masukan, sehingga mendukung pengambilan keputusan dan manajemen risiko.
Konfigurasikan komponen
Metode 1: Gunakan UI
Dalam alur kerja Designer, tambahkan komponen Scorecard Prediction, lalu konfigurasikan parameternya di panel sebelah kanan:
|
Jenis Parameter |
Parameter |
Deskripsi |
|
Pengaturan field |
Feature columns |
Pilih kolom fitur asli untuk prediksi. Secara default, semua kolom dipilih. |
|
Write to the sink table without transformation |
Pilih kolom yang akan ditambahkan ke tabel hasil prediksi tanpa pemrosesan apa pun, seperti ID dan kolom target. |
|
|
Output variable score |
Menentukan apakah akan mengeluarkan skor untuk setiap variabel fitur. Skor prediksi total akhir merupakan jumlah dari skor intercept dan semua skor variabel. |
|
|
Penyesuaian eksekusi |
Number of cores |
Jumlah core CPU yang digunakan. Sistem mengalokasikan nilai ini secara otomatis secara default. |
|
Memory per core |
Jumlah memori untuk setiap core CPU. Sistem mengalokasikan nilai ini secara otomatis secara default. |
Metode 2: Gunakan perintah PAI
Anda dapat mengonfigurasi parameter komponen Scorecard Prediction dengan perintah PAI. Gunakan komponen SQL Script untuk memanggil perintah tersebut. Untuk informasi selengkapnya, lihat SQL Script.
pai -name=lm_predict
-project=algo_public
-DinputFeatureTableName=input_data_table
-DinputModelTableName=input_model_table
-DmetaColNames=sample_key,label
-DfeatureColNames=fea1,fea2
-DoutputTableName=output_score_table
|
Parameter |
Wajib |
Nilai default |
Deskripsi |
|
inputFeatureTableName |
Ya |
None |
Tabel data fitur masukan. |
|
inputFeatureTablePartitions |
Tidak |
Seluruh tabel |
Partisi yang dipilih dari tabel fitur masukan. |
|
inputModelTableName |
Ya |
None |
Tabel model masukan. |
|
featureColNames |
Tidak |
Semua kolom |
Kolom fitur yang dipilih dari tabel masukan. |
|
metaColNames |
Tidak |
None |
Kolom data yang tidak ditransformasi. Kolom yang dipilih dikeluarkan apa adanya. Tentukan kolom seperti label dan sample_id di sini. |
|
outputFeatureScore |
Tidak |
false |
Menentukan apakah akan mengeluarkan skor variabel dalam hasil prediksi. Nilai yang valid:
|
|
outputTableName |
Ya |
None |
Tabel hasil prediksi keluaran. |
|
lifecycle |
Tidak |
None |
Siklus hidup tabel keluaran. |
|
coreNum |
Tidak |
Dihitung secara otomatis |
Jumlah core. |
|
memSizePerCore |
Tidak |
Dihitung secara otomatis |
Ukuran memori dalam MB. |
Output komponen
Komponen Scorecard Prediction menghasilkan tabel skor, seperti pada contoh berikut:
Kolom churn ditambahkan ke tabel hasil apa adanya dan tidak terkait dengan hasil prediksi. Tiga kolom lainnya merupakan kolom hasil prediksi, yang dijelaskan dalam tabel berikut.
|
Nama kolom |
Jenis kolom |
Deskripsi kolom |
|
prediction_score |
DOUBLE |
Kolom skor prediksi. Dalam model linear, ini adalah hasil perkalian nilai fitur dengan nilai bobot model, lalu dijumlahkan. Dalam model scorecard, jika model melakukan transformasi skor, kolom ini mengeluarkan skor yang telah ditransformasi. |
|
prediction_prob |
DOUBLE |
Dalam skenario klasifikasi biner, ini adalah nilai probabilitas prediksi untuk contoh positif. Nilai ini diperoleh dengan menerapkan transformasi Sigmoid pada skor asli (sebelum transformasi skor). |
|
prediction_detail |
STRING |
Nilai probabilitas untuk setiap kelas, dalam format JSON. 0 merepresentasikan kelas negatif, dan 1 merepresentasikan kelas positif. Contoh: {“0”:0.1813110520,”1”:0.8186889480}. |