Prediksi scorecard adalah teknik pembelajaran mesin yang melibatkan penerapan model scorecard pada data baru untuk memprediksi kinerja atau risiko masa depannya. Model ini biasanya dihasilkan oleh komponen pelatihan scorecard, sedangkan komponen prediksi scorecard menggunakan model tersebut untuk mengevaluasi dan memberi peringkat data masukan, membantu dalam pengambilan keputusan dan manajemen risiko.
Konfigurasikan komponen
Anda dapat menggunakan salah satu metode berikut untuk mengonfigurasi komponen Prediksi Scorecard:
Metode 1: Konfigurasikan komponen pada halaman pipeline
Anda dapat mengonfigurasi parameter komponen Prediksi Scorecard pada halaman pipeline Machine Learning Designer dari Platform for AI (PAI). Machine Learning Designer sebelumnya dikenal sebagai Machine Learning Studio. Tabel berikut menjelaskan parameter-parameter tersebut.
Tab | Parameter | Deskripsi |
Fields Setting | Feature Columns | Kolom fitur yang digunakan dalam prediksi. Secara default, semua kolom fitur dipilih. |
Reserved Columns | Kolom yang ditambahkan ke tabel hasil prediksi tanpa pemrosesan, seperti kolom ID dan objektif. | |
Output Variable Score | Menentukan apakah akan menghasilkan skor untuk setiap variabel fitur. Total skor prediksi adalah skor opsi intercept ditambah skor setiap variabel. | |
Tuning | Cores | Jumlah core CPU yang dibutuhkan. Secara default, sistem menentukan nilainya. |
Memory Size per Core | Ukuran memori setiap core CPU. Secara default, sistem menentukan nilainya. |
Metode 2: Gunakan perintah PAI
Konfigurasikan parameter komponen dengan menggunakan perintah PAI. Anda dapat menggunakan komponen SQL Script untuk memanggil perintah PAI. Untuk informasi lebih lanjut, lihat SQL Script.
pai -name=lm_predict
-project=algo_public
-DinputFeatureTableName=input_data_table
-DinputModelTableName=input_model_table
-DmetaColNames=sample_key,label
-DfeatureColNames=fea1,fea2
-DoutputTableName=output_score_tableParameter | Deskripsi | Diperlukan | Nilai default |
inputFeatureTableName | Nama tabel fitur masukan. | Ya | Tidak ada nilai default |
inputFeatureTablePartitions | Partisi yang dipilih dari tabel fitur masukan. | Tidak | Tabel lengkap |
inputModelTableName | Nama tabel model masukan. | Ya | Tidak ada nilai default |
featureColNames | Kolom fitur yang dipilih dari tabel masukan. | Tidak | Semua kolom |
metaColNames | Kolom yang tidak perlu dikonversi. Kolom-kolom ini di output sama dengan yang di input. Anda dapat menentukan label dan ID sampel di kolom-kolom ini. | Tidak | Tidak ada nilai default |
outputFeatureScore | Menentukan apakah akan menghasilkan skor variabel dalam hasil prediksi. Nilai valid:
| Tidak | false |
outputTableName | Nama tabel output. | Ya | Tidak ada nilai default |
lifecycle | Lifecycle tabel output. | Tidak | Tidak ada nilai default |
coreNum | Jumlah core. | Tidak | Ditentukan oleh sistem |
memSizePerCore | Ukuran memori setiap core. Satuan: MB. | Tidak | Ditentukan oleh sistem |
Output
Gambar berikut menunjukkan tabel skor yang dihasilkan oleh komponen Prediksi Scorecard.
Kolom churn adalah kolom yang ditambahkan ke tabel hasil dari tabel masukan. Data dalam kolom ini tidak memengaruhi hasil prediksi. Tiga kolom lainnya menampilkan hasil prediksi. Tabel berikut menjelaskan tiga kolom tersebut.
Kolom | Tipe data | Deskripsi |
prediction_score | DOUBLE | Kolom yang berisi skor prediksi. Dalam model linier, nilai fitur dan nilai bobot model dikalikan dan dijumlahkan untuk mendapatkan skor prediksi. Dalam model scorecard, jika transformasi skor dilakukan, skor yang telah ditransformasi dihasilkan di kolom ini. |
prediction_prob | DOUBLE | Kolom yang berisi nilai probabilitas contoh positif dalam klasifikasi biner. Nilai probabilitas ditransformasi dari skor asli (tanpa transformasi skor) dengan menggunakan fungsi sigmoid. |
prediction_detail | STRING | Kolom yang berisi nilai probabilitas contoh positif dan negatif yang dijelaskan dalam string JSON. Nilai 0 mewakili negatif, dan nilai 1 mewakili positif. Contoh: {"0":0.1813110520,"1":0.8186889480}. |