All Products
Search
Document Center

Platform For AI:Prediksi

Last Updated:Apr 02, 2026

Komponen Prediction menerapkan model yang telah dilatih ke data baru dan menuliskan hasilnya ke tabel output. Gunakan komponen ini jika model Anda dilatih menggunakan komponen penambangan data tradisional yang tidak memiliki komponen prediksi berpasangan.

Prasyarat

Sebelum memulai, pastikan Anda telah memiliki:

  • Model yang telah dilatih di Machine Learning Designer

  • Tabel input dengan kolom fitur yang sesuai dengan yang diharapkan oleh model

Konfigurasi komponen

Metode 1: Konfigurasi di Machine Learning Designer

Pada kanvas pipeline di Konsol Machine Learning Platform for AI (PAI), pilih komponen Prediction dan konfigurasikan parameter berikut.

Fields Setting tab

ParameterDeskripsi
Feature columnsKolom fitur yang dipilih dari tabel input. Secara default, semua kolom dipilih.
Reserved columnsKolom yang diteruskan ke tabel output. Sertakan kolom label untuk mempermudah evaluasi di tahap selanjutnya.
Output result columnKolom output yang berisi hasil prediksi utama.
Output score columnKolom output yang berisi probabilitas dari hasil prediksi utama.
Output detail columnKolom output yang berisi semua hasil yang mungkin beserta probabilitasnya.
Sparse matrixAktifkan jika data input dalam format sparse (pasangan kunci-nilai).
KV delimiterPembatas antara kunci dan nilai pada data sparse. Default: titik dua (:).
KV pair delimiterPembatas antara pasangan kunci-nilai pada data sparse. Default: koma (,).

Tuning tab

ParameterDeskripsi
CoresJumlah core. Harus berupa bilangan bulat positif. Gunakan bersama dengan Memory size per core.
Memory size per coreMemori per core, dalam MB. Gunakan bersama dengan Cores.

Metode 2: Jalankan perintah PAI

Jalankan perintah berikut menggunakan komponen SQL Script:

pai -name prediction
    -DmodelName=nb_model
    -DinputTableName=wpbc
    -DoutputTableName=wpbc_pred
    -DappendColNames=label;

Parameter

ParameterWajibDeskripsiDefault
inputTableNameYaNama tabel input.
modelNameYaNama model yang telah dilatih.
outputTableNameYaNama tabel output.
featureColNamesTidakKolom fitur dari tabel input, dipisahkan dengan koma.Semua kolom
appendColNamesTidakKolom input yang ditambahkan ke tabel output.Tidak ada
inputTablePartitionsTidakPartisi yang dibaca dari tabel input. Format yang didukung: partition_name=value untuk satu partisi, name1=value1/name2=value2 untuk partisi multi-level. Pisahkan beberapa partisi dengan koma.Seluruh tabel
outputTablePartitionTidakPartisi tempat hasil ditulis di tabel output.Tidak ada
resultColNameTidakKolom output untuk hasil prediksi utama.prediction_result
scoreColNameTidakKolom output untuk probabilitas hasil prediksi utama.prediction_score
detailColNameTidakKolom output untuk semua hasil yang mungkin beserta probabilitasnya.prediction_detail
enableSparseTidakApakah data input berformat sparse. Nilai yang valid: true, false.false
itemDelimiterTidakPembatas antara pasangan kunci-nilai sparse.,
kvDelimiterTidakPembatas antara kunci dan nilai sparse.:
lifecycleTidakSiklus hidup tabel output.Tidak ada
coreNumTidakJumlah core.Dialokasikan secara otomatis
memSizePerCoreTidakMemori per core, dalam MB.Dialokasikan secara otomatis

Contoh

Contoh ini membangun klasifikasi random forest dan menjalankan Prediction pada data yang sama.

  1. Buat tabel input uji coba:

    create table pai_rf_test_input as
    select * from
    (
    select 1 as f0,2 as f1, "good" as class
    union all
    select 1 as f0,3 as f1, "good" as class
    union all
    select 1 as f0,4 as f1, "bad" as class
    union all
    select 0 as f0,3 as f1, "good" as class
    union all
    select 0 as f0,4 as f1, "bad" as class
    )tmp;
  2. Lakukan pelatihan model menggunakan algoritma random forest:

    PAI -name randomforests
       -project algo_public
       -DinputTableName="pai_rf_test_input"
       -DmodelName="pai_rf_test_model"
       -DforceCategorical="f1"
       -DlabelColName="class"
       -DfeatureColNames="f0,f1"
       -DmaxRecordSize="100000"
       -DminNumPer="0"
       -DminNumObj="2"
       -DtreeNum="3";
  3. Jalankan Prediction terhadap model yang telah dilatih:

    PAI -name prediction
        -project algo_public
        -DinputTableName=pai_rf_test_input
        -DmodelName=pai_rf_test_model
        -DresultColName=prediction_result
        -DscoreColName=prediction_score
        -DdetailColName=prediction_detail
        -DoutputTableName=pai_temp_2283_76333_1
  4. Lihat tabel output pai_temp_2283_76333_1:

    Prediction results

    Tabel output berisi tiga kolom:

    • prediction_result: hasil prediksi utama (kelas dengan probabilitas tertinggi). Pada contoh ini, nilainya adalah good atau bad.

    • prediction_score: probabilitas dari hasil prediksi utama. Pada contoh ini, hasil prediksi berupa good atau bad, tergantung pada probabilitas mana yang lebih tinggi; prediction_score berisi probabilitas tertinggi tersebut.

    • prediction_detail: semua hasil yang mungkin beserta probabilitasnya.