Topik ini menjelaskan Komponen Prediksi yang disediakan oleh Machine Learning Designer. Jika model Anda dilatih menggunakan komponen penambangan data tradisional tanpa komponen prediksi berpasangan dan Anda ingin menggunakannya untuk menghasilkan prediksi, Anda dapat memilih Komponen Prediksi dalam sebagian besar kasus. Komponen ini menggunakan model yang telah dilatih dan data prediksi sebagai input, lalu menghasilkan hasil prediksi.
Konfigurasikan komponen
Anda dapat mengonfigurasi komponen dengan salah satu metode berikut:
Metode 1: Konfigurasikan komponen di Machine Learning Designer
Konfigurasikan komponen pada tab konfigurasi pipeline di Machine Learning Designer melalui konsol Platform for AI.
Tab | Parameter | Deskripsi |
Fields Setting | Feature Columns | Kolom fitur yang dipilih dari tabel input untuk prediksi. Secara default, semua kolom dalam tabel input dipilih. |
Reserved Columns | Kolom yang ingin Anda cadangkan di tabel output. Kami sarankan Anda menambahkan kolom label untuk memudahkan evaluasi. | |
Output Result Column | Kolom hasil di tabel output. | |
Output Score Column | Kolom skor di tabel output. | |
Output Detail Column | Kolom detail di tabel output. | |
Sparse Matrix | Menentukan apakah data input bersifat sparse. Data sparse disajikan menggunakan pasangan key-value. | |
KV Delimiter | Pemisah yang digunakan untuk memisahkan keys dan values. Secara default, tanda titik dua (:) digunakan. | |
KV Pair Delimiter | Pemisah yang digunakan untuk memisahkan pasangan key-value. Secara default, tanda koma (,) digunakan. | |
Tuning | Cores | Jumlah core. Parameter ini harus digunakan bersama dengan parameter Memory Size per Core. Nilai parameter ini harus berupa bilangan bulat positif. |
Memory Size per Core | Ukuran memori setiap core. Parameter ini harus digunakan bersama dengan parameter Cores. Satuan: MB. |
Metode 2: Jalankan perintah Platform for AI
Konfigurasikan parameter komponen menggunakan perintah Platform for AI. Anda dapat menggunakan Komponen SQL Script untuk menjalankan perintah tersebut. Untuk informasi lebih lanjut, lihat SQL Script. Tabel berikut menjelaskan parameter yang digunakan dalam perintah.
pai -name prediction
-DmodelName=nb_model
-DinputTableName=wpbc
-DoutputTableName=wpbc_pred
-DappendColNames=label;Parameter | Diperlukan | Deskripsi | Nilai default |
inputTableName | Ya | Nama tabel input. | Tidak ada |
featureColNames | Tidak | Kolom fitur yang dipilih dari tabel input untuk prediksi. Pisahkan beberapa kolom dengan tanda koma (,). | Semua kolom |
appendColNames | Tidak | Kolom prediksi yang dipilih dari tabel input dan ditambahkan ke tabel output. | Tidak ada |
inputTablePartitions | Tidak | Partisi yang dipilih dari tabel input untuk pelatihan. Format berikut didukung:
Catatan Jika Anda menentukan beberapa partisi, pisahkan mereka dengan tanda koma (,). | Tabel lengkap |
outputTablePartition | Tidak | Partisi yang hasilnya termasuk dalam tabel output. | Tidak ada |
resultColName | Tidak | Kolom di tabel output yang berisi hasil prediksi dengan probabilitas tertinggi di antara semua kemungkinan hasil. | prediction_result |
scoreColName | Tidak | Kolom di tabel output yang berisi probabilitas tertinggi dari hasil prediksi. | prediction_score |
detailColName | Tidak | Kolom detail di tabel output yang berisi semua kemungkinan hasil dan probabilitasnya. | prediction_detail |
enableSparse | Tidak | Menentukan apakah data input bersifat sparse. Nilai valid: true and false. | false |
itemDelimiter | Tidak | Pemisah yang digunakan untuk memisahkan pasangan key-value sparse. | , |
kvDelimiter | Tidak | Pemisah yang digunakan untuk memisahkan keys dan values sparse. | : |
modelName | Ya | Nama model klastering input. | Tidak ada |
outputTableName | Ya | Nama tabel output. | Tidak ada |
lifecycle | Tidak | Lifecycle tabel output. | Tidak ada |
coreNum | Tidak | Jumlah core. | Dialokasikan secara otomatis |
memSizePerCore | Tidak | Ukuran memori setiap core. Satuan: MB. | Dialokasikan secara otomatis |
Contoh
Jalankan pernyataan SQL berikut untuk menghasilkan data uji:
create table pai_rf_test_input as select * from ( select 1 as f0,2 as f1, "good" as class union all select 1 as f0,3 as f1, "good" as class union all select 1 as f0,4 as f1, "bad" as class union all select 0 as f0,3 as f1, "good" as class union all select 0 as f0,4 as f1, "bad" as class )tmp;Jalankan perintah berikut untuk membangun model. Algoritma random forest digunakan dalam contoh ini.
PAI -name randomforests -project algo_public -DinputTableName="pai_rf_test_input" -DmodelName="pai_rf_test_model" -DforceCategorical="f1" -DlabelColName="class" -DfeatureColNames="f0,f1" -DmaxRecordSize="100000" -DminNumPer="0" -DminNumObj="2" -DtreeNum="3";Jalankan perintah berikut untuk mengirimkan parameter yang dikonfigurasi untuk Komponen Prediksi:
PAI -name prediction -project algo_public -DinputTableName=pai_rf_test_input -DmodelName=pai_rf_test_model -DresultColName=prediction_result -DscoreColName=prediction_score -DdetailColName=prediction_detail -DoutputTableName=pai_temp_2283_76333_1Lihat tabel hasil output pai_temp_2283_76333_1, seperti yang ditunjukkan pada gambar berikut.

prediction_result: kolom yang berisi hasil prediksi dengan probabilitas tertinggi di antara semua kemungkinan hasil.
prediction_score: kolom yang berisi probabilitas hasil prediksi.
Dalam contoh ini, hasil prediksi bisa baik atau buruk, tergantung pada probabilitas mana yang lebih tinggi. Kolom prediction_score berisi probabilitas tertinggi.
prediction_detail: kolom yang berisi semua kemungkinan hasil dan probabilitasnya.