什么是评分卡预测算法组件 - 人工智能平台 PAI

评分卡预测是一种机器学习技术，通过应用评分卡模型对新数据进行评分，以预测其未来表现或风险。该模型通常由评分卡训练组件生成，评分卡预测组件则利用该模型对输入数据进行评估和打分，从而帮助决策制定和风险管理。

配置组件

方式一：可视化方式

在Designer工作流页面添加评分卡预测组件，并在界面右侧配置相关参数：

参数类型	参数	描述
字段设置	特征列	选择用于预测的原始特征列，默认选择全部。
	原样添加到结果表	选择不进行任何处理，直接附加到预测结果表中的列。例如ID列和目标列等。
	输出变量分	是否输出每个特征变量所对应的分数，最终的预测总得分为截距项的得分加所有的变量分。
执行调优	核数目	使用的CPU Core数量，默认系统自动分配。
执行调优	每个核的内存大小	每个CPU Core所用的内存大小，默认系统自动分配。

方式二：PAI命令方式

使用PAI命令配置评分卡预测组件参数。您可以使用SQL脚本组件进行PAI命令调用，详情请参见SQL脚本。

pai -name=lm_predict
    -project=algo_public
    -DinputFeatureTableName=input_data_table
    -DinputModelTableName=input_model_table
    -DmetaColNames=sample_key,label
    -DfeatureColNames=fea1,fea2
    -DoutputTableName=output_score_table

参数	是否必选	默认值	描述
inputFeatureTableName	是	无	输入特征数据表。
inputFeatureTablePartitions	否	全表	输入特征表选择的分区。
inputModelTableName	是	无	输入的模型表。
featureColNames	否	所有列	输入表选择的特征列。
metaColNames	否	无	不进行转换的数据列，选中的列会原样输出。可以在此指定Label和sample_id等。
outputFeatureScore	否	false	预测结果中是否输出变量分，取值包括： true：输出变量分。 false：不输出变量分。
outputTableName	是	无	输出预测结果表。
lifecycle	否	无	输出表的生命周期。
coreNum	否	默认自动计算	核心数。
memSizePerCore	否	默认自动计算	内存大小，单位为MB。

组件输出

评分卡预测组件输出的打分表示例如下：执行打分后，输出结果表包含原始标签列 churn（值为0或1）及以下预测输出列。其中churn列为用户选择的原样添加到结果表中的列，与预测结果无关。其它三列为预测结果列，其含义如下表所示。

列名	列类型	列描述
prediction_score	DOUBLE	预测分数列。线性模型中特征值和模型权重值直接相乘相加的结果，对应到评分卡模型中，如果模型进行了分数转换，则该分数输出转换后的得分。
prediction_prob	DOUBLE	二分类场景中预测得到的正例概率值，原始得分（未经分数转换）经过Sigmoid变换后得到该值。
prediction_detail	STRING	用JSON格式描述的各类别概率值，其中0表示负类，1表示正类。例如{“0”:0.1813110520,”1”:0.8186889480}。