かんばん予測は、機械学習の手法の一つであり、かんばんモデルを新規データに適用してその将来のパフォーマンスまたはリスクをスコアリング・予測するものです。このモデルは通常、かんばん学習コンポーネントによって生成されます。かんばん予測コンポーネントは、このモデルを用いて入力データを評価・スコアリングし、意思決定およびリスク管理を支援します。
コンポーネントの設定
方法 1:UI を使用する
Designer ワークフローで、[スコアカード予測] コンポーネントを追加し、右側のペインでパラメーターを設定します:
|
パラメーター種別 |
パラメーター |
説明 |
|
フィールド設定 |
特徴量カラム |
予測に使用する元の特徴量カラムを選択します。デフォルトでは、すべてのカラムが選択されています。 |
|
変換なしで結果テーブルに書き込む |
ID や label などのカラムのように、処理を行わず予測結果テーブルに追加するカラムを選択します。 |
|
|
変数スコアの出力 |
各特徴量変数のスコアを出力するかどうかを指定します。最終的な合計予測スコアは、切片のスコアとすべての変数スコアの合計となります。 |
|
|
実行チューニング |
CPU コア数 |
使用する CPU コア数です。デフォルトでは、システムが自動的に割り当てます。 |
|
CPU コアあたりのメモリ量 |
各 CPU コアに割り当てるメモリ量です。デフォルトでは、システムが自動的に割り当てます。 |
方法 2:PAI コマンドを使用する
かんばん予測 コンポーネントのパラメーターを設定するには、PAI コマンドを使用できます。SQL スクリプトコンポーネントから PAI コマンドを呼び出します。詳細については、「SQL スクリプト」をご参照ください。
pai -name=lm_predict
-project=algo_public
-DinputFeatureTableName=input_data_table
-DinputModelTableName=input_model_table
-DmetaColNames=sample_key,label
-DfeatureColNames=fea1,fea2
-DoutputTableName=output_score_table
|
パラメーター |
必須 |
デフォルト値 |
説明 |
|
inputFeatureTableName |
はい |
なし |
入力特徴量データテーブルです。 |
|
inputFeatureTablePartitions |
いいえ |
全テーブル |
入力特徴量テーブルから選択するパーティションです。 |
|
inputModelTableName |
はい |
なし |
入力モデルテーブルです。 |
|
featureColNames |
いいえ |
すべてのカラム |
入力テーブルから選択する特徴量カラムです。 |
|
metaColNames |
いいえ |
なし |
変換されないデータカラムです。選択したカラムはそのまま出力されます。label や sample_id のようなカラムをここに指定します。 |
|
outputFeatureScore |
いいえ |
false |
予測結果に変数スコアを出力するかどうかを指定します。有効な値は以下のとおりです。
|
|
outputTableName |
はい |
なし |
出力予測結果テーブルです。 |
|
lifecycle |
いいえ |
なし |
出力テーブルのライフサイクルです。 |
|
coreNum |
いいえ |
自動計算 |
CPU コア数です。 |
|
memSizePerCore |
いいえ |
自動計算 |
メモリサイズ(MB)です。 |
コンポーネントの出力
かんばん予測コンポーネントは、以下に示す例のようなスコアリングテーブルを出力します。
結果テーブルには、churn カラムがそのまま追加されますが、これは予測結果とは関係ありません。その他の 3 つのカラムは予測結果カラムであり、以下の表で説明します。
|
カラム名 |
カラム型 |
カラムの説明 |
|
prediction_score |
DOUBLE |
予測スコア列。線形モデルでは、これは特徴量の値にモデルの重みの値を乗算し、それらを合計したものです。スコアカードモデルでは、モデルがスコア変換を実行する場合、この列には変換後のスコアが出力されます。 |
|
prediction_prob |
DOUBLE |
バイナリ分類シナリオにおいて、これは正例の予測確率値です。この値は、元のスコア(スコア変換前のスコア)に Sigmoid 変換を適用することで得られます。 |
|
prediction_detail |
STRING |
各クラスの確率値を JSON 形式で記述した文字列です。0 は負例クラス、1 は正例クラスを表します。例:{“0”:0.1813110520,”1”:0.8186889480}。 |