このトピックでは、Platform for AI (PAI) の金融コンポーネントを使用して、クレジットカードの取引記録に基づいた信用スコアリングのためのスコアカードモデルを構築する方法について説明します。
背景情報
スコアカードは、信用リスク評価やインターネット金融における一般的なモデリング手法です。これは単なる特定の機械学習アルゴリズムではなく、汎用的なモデリングフレームワークです。ビニングされた生データに特徴量エンジニアリング変換を適用し、その後線形モデルを使用することで機能します。
スコアカードモデリングは、通常、クレジットカードのリスク評価やローン実行などの信用評価分野で使用されます。他の分野では、スコアカードモデリングは、カスタマーサービスの品質評価やセサミクレジットのような信用スコアリングシステムなど、スコアベースの評価にも使用できます。
前提条件
-
ワークスペースが作成済みであること。詳細については、「ワークスペースの作成と管理」をご参照ください。
-
MaxCompute リソースがワークスペースに関連付けられていること。詳細については、「ワークスペースの作成と管理」をご参照ください。
データセット
このパイプラインでは、海外の組織が提供するオープンソースのデータセット (データセットのダウンロード) を使用します。このデータセットには 30,000 件のレコードが含まれています。データセットには、性別、学歴、婚姻状況、年齢、クレジットカードの取引履歴、請求明細などのユーザー情報が含まれています。
payment_next_month パラメーターはターゲット列であり、ユーザーがクレジットカードの請求を返済したかどうかを示します。各値の意味は次のとおりです:
1:請求が返済済みであることを示します。
0 は未払いの請求書を示します。
スコアカードによる信用スコアリング
-
ビジュアルモデリング (Designer) のページに移動します。
-
PAI コンソールにログインします。
-
左側のナビゲーションウィンドウで、[ワークスペース] をクリックします。[ワークスペース] ページで、管理するワークスペースの名前をクリックします。
-
左側のナビゲーションウィンドウで、 を選択します。
-
パイプラインを構築します。
[プリセットテンプレート] ページで、[スコアカードに基づく信用消費分析] の下にある Create をクリックします。
[パイプライン] タブで、[スコアカードに基づく信用消費分析] をダブルクリックしてパイプラインを開きます。
システムは、以下に示すように、プリセットテンプレートからパイプラインを自動的に構築します。

エリア
説明
①
入力データセットを訓練データセットと予測データセットに分割します。
②
[ビニング] コンポーネントは One-Hot エンコーディングに似ており、データ分布に基づいてデータを高次元の特徴量にマッピングできます。たとえば、age フィールドの場合、[ビニング] コンポーネントは異なる間隔のデータ分布に基づいてビニング操作を実行できます。ワークフローが完了したら、[ビニング-1] コンポーネントを右クリックし、Binning を選択します。[ビニング-1] の設定パネルで、名前 (age) をクリックして詳細を表示します。結果は次の図のようになります。
ワークフローが完了したら、[ビニング-1] コンポーネントを右クリックし、ショートカットメニューから を選択すると、次の図に示すように、各フィールドが複数の間隔にビニングされていることを確認できます。
③
このコンポーネントは、分割とビニングの前後のサンプル安定性を比較し、各特徴量の PSI (集団安定性指標) を返します。パイプラインの実行後、[PSI-1] コンポーネントを右クリックし、 を選択して、次の図に示すように詳細を表示できます。

PSI (集団安定性指標) は、サンプル分布の変化を測定し、その安定性を評価するための主要なメトリックです。特徴量の合計 PSI は、そのすべてのビンの PSI 値の合計です。一般的に、PSI 値が 0.1 未満の場合は軽微な変化を示します。PSI 値が 0.1 から 0.25 の間の場合、中程度の変化を示します。PSI 値が 0.25 を超える場合は、特別な注意が必要な重大な変化を示します。
④
スコアカードトレーニング。パイプラインの実行後、[スコアカードトレーニング-1] コンポーネントを右クリックし、 を選択して、次の図に示すようにトレーニング結果を表示できます。
スコアカードの本質は、複雑なモデルの重みをビジネスフレンドリなスコアで表現することです。結果の主要なパラメーターは次のとおりです:weight:元の重み値を指定します。
Scaled_weight:スコア変化のメトリックです。たとえば、pay_0 特徴量の場合、特徴量の値が (-1,0] の間隔にあればスコアは 29 減少し、(0,1] の間隔にあればスコアは 27 増加します。
contribution:各特徴量が結果に与える影響。値が大きいほど影響が大きいことを示します。
⑤
各ユーザーの信用スコアを予測し、モデルのパフォーマンスを評価します。
パイプラインを実行し、結果を表示します。
キャンバスの上部にある実行アイコン
をクリックします。パイプラインの実行が完了したら、キャンバス上の [スコアカード予測-1] コンポーネントを右クリックし、ショートカットメニューから を選択して、各ユーザーの信用スコアを表示します。

関連ドキュメント
アルゴリズムコンポーネントの詳細については、次のトピックをご参照ください: