评分卡预测是一种机器学习技术,通过应用评分卡模型对新数据进行评分,以预测其未来表现或风险。该模型通常由评分卡训练组件生成,评分卡预测组件则利用该模型对输入数据进行评估和打分,从而帮助决策制定和风险管理。
配置组件
方式一:可视化方式
在Designer工作流页面添加评分卡预测组件,并在界面右侧配置相关参数:
|
参数类型 |
参数 |
描述 |
|
字段设置 |
特征列 |
选择用于预测的原始特征列,默认选择全部。 |
|
原样添加到结果表 |
选择不进行任何处理,直接附加到预测结果表中的列。例如ID列和目标列等。 |
|
|
输出变量分 |
是否输出每个特征变量所对应的分数,最终的预测总得分为截距项的得分加所有的变量分。 |
|
|
执行调优 |
核数目 |
使用的CPU Core数量,默认系统自动分配。 |
|
每个核的内存大小 |
每个CPU Core所用的内存大小,默认系统自动分配。 |
方式二:PAI命令方式
使用PAI命令配置评分卡预测组件参数。您可以使用SQL脚本组件进行PAI命令调用,详情请参见SQL脚本。
pai -name=lm_predict
-project=algo_public
-DinputFeatureTableName=input_data_table
-DinputModelTableName=input_model_table
-DmetaColNames=sample_key,label
-DfeatureColNames=fea1,fea2
-DoutputTableName=output_score_table
|
参数 |
是否必选 |
默认值 |
描述 |
|
inputFeatureTableName |
是 |
无 |
输入特征数据表。 |
|
inputFeatureTablePartitions |
否 |
全表 |
输入特征表选择的分区。 |
|
inputModelTableName |
是 |
无 |
输入的模型表。 |
|
featureColNames |
否 |
所有列 |
输入表选择的特征列。 |
|
metaColNames |
否 |
无 |
不进行转换的数据列,选中的列会原样输出。可以在此指定Label和sample_id等。 |
|
outputFeatureScore |
否 |
false |
预测结果中是否输出变量分,取值包括:
|
|
outputTableName |
是 |
无 |
输出预测结果表。 |
|
lifecycle |
否 |
无 |
输出表的生命周期。 |
|
coreNum |
否 |
默认自动计算 |
核心数。 |
|
memSizePerCore |
否 |
默认自动计算 |
内存大小,单位为MB。 |
组件输出
评分卡预测组件输出的打分表示例如下:执行打分后,输出结果表包含原始标签列 churn(值为0或1)及以下预测输出列。其中churn列为用户选择的原样添加到结果表中的列,与预测结果无关。其它三列为预测结果列,其含义如下表所示。
|
列名 |
列类型 |
列描述 |
|
prediction_score |
DOUBLE |
预测分数列。线性模型中特征值和模型权重值直接相乘相加的结果,对应到评分卡模型中,如果模型进行了分数转换,则该分数输出转换后的得分。 |
|
prediction_prob |
DOUBLE |
二分类场景中预测得到的正例概率值,原始得分(未经分数转换)经过Sigmoid变换后得到该值。 |
|
prediction_detail |
STRING |
用JSON格式描述的各类别概率值,其中0表示负类,1表示正类。例如{“0”:0.1813110520,”1”:0.8186889480}。 |