全部产品
Search
文档中心

Platform For AI:Prediksi

更新时间:Jul 02, 2025

Topik ini menjelaskan Komponen Prediksi yang disediakan oleh Machine Learning Designer. Jika model Anda dilatih menggunakan komponen penambangan data tradisional tanpa komponen prediksi berpasangan dan Anda ingin menggunakannya untuk menghasilkan prediksi, Anda dapat memilih Komponen Prediksi dalam sebagian besar kasus. Komponen ini menggunakan model yang telah dilatih dan data prediksi sebagai input, lalu menghasilkan hasil prediksi.

Konfigurasikan komponen

Anda dapat mengonfigurasi komponen dengan salah satu metode berikut:

Metode 1: Konfigurasikan komponen di Machine Learning Designer

Konfigurasikan komponen pada tab konfigurasi pipeline di Machine Learning Designer melalui konsol Platform for AI.

Tab

Parameter

Deskripsi

Fields Setting

Feature Columns

Kolom fitur yang dipilih dari tabel input untuk prediksi. Secara default, semua kolom dalam tabel input dipilih.

Reserved Columns

Kolom yang ingin Anda cadangkan di tabel output. Kami sarankan Anda menambahkan kolom label untuk memudahkan evaluasi.

Output Result Column

Kolom hasil di tabel output.

Output Score Column

Kolom skor di tabel output.

Output Detail Column

Kolom detail di tabel output.

Sparse Matrix

Menentukan apakah data input bersifat sparse. Data sparse disajikan menggunakan pasangan key-value.

KV Delimiter

Pemisah yang digunakan untuk memisahkan keys dan values. Secara default, tanda titik dua (:) digunakan.

KV Pair Delimiter

Pemisah yang digunakan untuk memisahkan pasangan key-value. Secara default, tanda koma (,) digunakan.

Tuning

Cores

Jumlah core. Parameter ini harus digunakan bersama dengan parameter Memory Size per Core. Nilai parameter ini harus berupa bilangan bulat positif.

Memory Size per Core

Ukuran memori setiap core. Parameter ini harus digunakan bersama dengan parameter Cores. Satuan: MB.

Metode 2: Jalankan perintah Platform for AI

Konfigurasikan parameter komponen menggunakan perintah Platform for AI. Anda dapat menggunakan Komponen SQL Script untuk menjalankan perintah tersebut. Untuk informasi lebih lanjut, lihat SQL Script. Tabel berikut menjelaskan parameter yang digunakan dalam perintah.

pai -name prediction
    -DmodelName=nb_model
    -DinputTableName=wpbc
    -DoutputTableName=wpbc_pred
    -DappendColNames=label;

Parameter

Diperlukan

Deskripsi

Nilai default

inputTableName

Ya

Nama tabel input.

Tidak ada

featureColNames

Tidak

Kolom fitur yang dipilih dari tabel input untuk prediksi. Pisahkan beberapa kolom dengan tanda koma (,).

Semua kolom

appendColNames

Tidak

Kolom prediksi yang dipilih dari tabel input dan ditambahkan ke tabel output.

Tidak ada

inputTablePartitions

Tidak

Partisi yang dipilih dari tabel input untuk pelatihan. Format berikut didukung:

  • Partition_name=value

  • name1=value1/name2=value2: partisi multi-level

Catatan

Jika Anda menentukan beberapa partisi, pisahkan mereka dengan tanda koma (,).

Tabel lengkap

outputTablePartition

Tidak

Partisi yang hasilnya termasuk dalam tabel output.

Tidak ada

resultColName

Tidak

Kolom di tabel output yang berisi hasil prediksi dengan probabilitas tertinggi di antara semua kemungkinan hasil.

prediction_result

scoreColName

Tidak

Kolom di tabel output yang berisi probabilitas tertinggi dari hasil prediksi.

prediction_score

detailColName

Tidak

Kolom detail di tabel output yang berisi semua kemungkinan hasil dan probabilitasnya.

prediction_detail

enableSparse

Tidak

Menentukan apakah data input bersifat sparse. Nilai valid: true and false.

false

itemDelimiter

Tidak

Pemisah yang digunakan untuk memisahkan pasangan key-value sparse.

,

kvDelimiter

Tidak

Pemisah yang digunakan untuk memisahkan keys dan values sparse.

:

modelName

Ya

Nama model klastering input.

Tidak ada

outputTableName

Ya

Nama tabel output.

Tidak ada

lifecycle

Tidak

Lifecycle tabel output.

Tidak ada

coreNum

Tidak

Jumlah core.

Dialokasikan secara otomatis

memSizePerCore

Tidak

Ukuran memori setiap core. Satuan: MB.

Dialokasikan secara otomatis

Contoh

  1. Jalankan pernyataan SQL berikut untuk menghasilkan data uji:

    create table pai_rf_test_input as
    select * from
    (
    select 1 as f0,2 as f1, "good" as class
    union all
    select 1 as f0,3 as f1, "good" as class
    union all
    select 1 as f0,4 as f1, "bad" as class
    union all
    select 0 as f0,3 as f1, "good" as class
    union all
    select 0 as f0,4 as f1, "bad" as class
    )tmp;
  2. Jalankan perintah berikut untuk membangun model. Algoritma random forest digunakan dalam contoh ini.

    PAI -name randomforests
       -project algo_public
       -DinputTableName="pai_rf_test_input"
       -DmodelName="pai_rf_test_model"
       -DforceCategorical="f1"
       -DlabelColName="class"
       -DfeatureColNames="f0,f1"
       -DmaxRecordSize="100000"
       -DminNumPer="0"
       -DminNumObj="2"
       -DtreeNum="3";
  3. Jalankan perintah berikut untuk mengirimkan parameter yang dikonfigurasi untuk Komponen Prediksi:

    PAI -name prediction
        -project algo_public
        -DinputTableName=pai_rf_test_input
        -DmodelName=pai_rf_test_model
        -DresultColName=prediction_result
        -DscoreColName=prediction_score
        -DdetailColName=prediction_detail
        -DoutputTableName=pai_temp_2283_76333_1
  4. Lihat tabel hasil output pai_temp_2283_76333_1, seperti yang ditunjukkan pada gambar berikut. Prediction results

    • prediction_result: kolom yang berisi hasil prediksi dengan probabilitas tertinggi di antara semua kemungkinan hasil.

    • prediction_score: kolom yang berisi probabilitas hasil prediksi.

      Dalam contoh ini, hasil prediksi bisa baik atau buruk, tergantung pada probabilitas mana yang lebih tinggi. Kolom prediction_score berisi probabilitas tertinggi.

    • prediction_detail: kolom yang berisi semua kemungkinan hasil dan probabilitasnya.