Komponen Conditional Random Field Prediction adalah komponen algoritma yang disediakan oleh Machine Learning Designer (sebelumnya dikenal sebagai Machine Learning Studio) berdasarkan model prediksi online Linear Conditional Random Field (LinearCRF). Komponen ini digunakan untuk menangani tugas penandaan urutan. Topik ini menjelaskan cara mengonfigurasi parameter komponen Conditional Random Field Prediction serta memberikan contoh penggunaannya.
Konfigurasi parameter
Anda dapat mengonfigurasi parameter komponen secara visual di Designer.
|
Parameter |
Deskripsi |
|
Select the ID column |
Sampel disimpan sebagai N-tupel. Kolom ID berisi ID unik untuk setiap sampel. |
|
Select a Feature Column |
Kata yang akan dianotasi beserta fitur-fiturnya. |
|
Select the Target Column |
Pilih kolom target. |
|
Prediction Result Column |
Nama kolom hasil prediksi. Nilai default-nya adalah prediction_result. |
|
Prediction Score Column |
Nama kolom skor prediksi. Nilai default-nya adalah prediction_score. |
|
Prediction Detail Column |
Nama kolom detail prediksi. Biarkan parameter ini kosong jika Anda tidak memerlukan kolom detail prediksi. |
Contoh
Fase prediksi online LinearCRF memerlukan model pelatihan dalam format Model I/O. Tabel data pelatihan menggunakan format berikut.
|
sentence_id |
word |
f1 |
f2 |
label |
|
1 |
Rockwell |
NNP |
POS |
B-NP |
|
1 |
International |
NNP |
NP |
I-NP |
|
1 |
Corp |
NNP |
PO |
I-NP |
|
1 |
's |
POS |
NN |
B-NP |
|
... |
... |
... |
... |
... |
Nama fitur word, f1, dan f2 dalam format input harus sesuai dengan nama kolom fitur pada tabel data pelatihan. Dalam permintaan input prediksi online, fitur-fitur dari kata yang berbeda dipisahkan dengan spasi. Format input untuk model prediksi online LinearCRF adalah sebagai berikut.
{
"inputs":[
{
"word":{
"dataType": 50,
"dataValue":"Rockwell International Corp 's ..."
},
"f1": {
"dataType": 50,
"dataValue":"NNP NNP NNP POS ..."
},
"f2": {
"dataType": 50,
"dataValue":"POS NP PO NN ..."
}
}]
}
Output mengembalikan prediction_result, prediction_score, dan prediction_detail untuk semua kata dalam permintaan input. Hasilnya disajikan dalam format JSON di dalam outputValue. Format output untuk model prediksi online LinearCRF adalah sebagai berikut.
{
"outputs": [
{
"outputLabel": "CRFProcessor_Result",
"outputValue": {
"dataType": 50,
"dataValue": {
"Rockwell NNP POS": {
"prediction_result":"B-NP",
"prediction_score":0.99,
"prediction_detail":{"B-ADJP":0.000145, "B-NP":0.99, ...}
},
"International NNP NP": ...
}
}
}
]
}
Jika format input salah, program akan mengembalikan pesan error seperti yang ditunjukkan di bawah ini.
{
"outputs": [
{
"outputLabel": "CRFProcessor_Result",
"outputValue": {
"dataType":50,
"dataValue": "Failed: The input format is incorrect"
}
}
]
}