評分卡預測是一種機器學習技術,通過應用評分卡模型對新資料進行評分,以預測其未來表現或風險。該模型通常由評分卡訓練組件產生,評分卡預測組件則利用該模型對輸入資料進行評估和打分,從而協助決策制定和風險管理。
配置組件
方式一:可視化方式
在Designer工作流程頁面添加評分卡預測組件,並在介面右側配置相關參數:
參數類型 | 參數 | 描述 |
欄位設定 | 特徵列 | 選擇用於預測的原始特徵列,預設選擇全部。 |
原樣添加到結果表 | 選擇不進行任何處理,直接附加到預測結果表中的列。例如ID列和目標列等。 | |
輸出變數分 | 是否輸出每個特徵變數所對應的分數,最終的預測總得分為截距項的得分加所有的變數分。 | |
執行調優 | 核心數目 | 使用的CPU Core數量,預設系統自動分配。 |
每個核的記憶體大小 | 每個CPU Core所用的記憶體大小,預設系統自動分配。 |
方式二:PAI命令方式
使用PAI命令配置評分卡預測組件參數。您可以使用SQL指令碼組件進行PAI命令調用,詳情請參見SQL指令碼。
pai -name=lm_predict
-project=algo_public
-DinputFeatureTableName=input_data_table
-DinputModelTableName=input_model_table
-DmetaColNames=sample_key,label
-DfeatureColNames=fea1,fea2
-DoutputTableName=output_score_table參數 | 是否必選 | 預設值 | 描述 |
inputFeatureTableName | 是 | 無 | 輸入特徵資料表。 |
inputFeatureTablePartitions | 否 | 全表 | 輸入特徵表選擇的分區。 |
inputModelTableName | 是 | 無 | 輸入的模型表。 |
featureColNames | 否 | 所有列 | 輸入表選擇的特徵列。 |
metaColNames | 否 | 無 | 不進行轉換的資料列,選中的列會原樣輸出。可以在此指定Label和sample_id等。 |
outputFeatureScore | 否 | false | 預測結果中是否輸出變數分,取值包括:
|
outputTableName | 是 | 無 | 輸出預測結果表。 |
lifecycle | 否 | 無 | 輸出表的生命週期。 |
coreNum | 否 | 預設自動計算 | 核心數。 |
memSizePerCore | 否 | 預設自動計算 | 記憶體大小,單位為MB。 |
組件輸出
評分卡預測組件輸出的打分表示例如下:
其中churn列為使用者選擇的原樣添加到結果表中的列,與預測結果無關。其它三列為預測結果列,其含義如下表所示。
列名 | 列類型 | 列描述 |
prediction_score | DOUBLE | 預測分數列。線性模型中特徵值和模型權重值直接相乘相加的結果,對應到評分卡模型中,如果模型進行了分數轉換,則該分數輸出轉換後的得分。 |
prediction_prob | DOUBLE | 二分類情境中預測得到的正例機率值,原始得分(未經分數轉換)經過Sigmoid變換後得到該值。 |
prediction_detail | STRING | 用JSON格式描述的各類別機率值,其中0表示負類,1表示正類。例如{“0”:0.1813110520,”1”:0.8186889480}。 |