Lasso 回帰予測コンポーネントは、スパースおよび密なデータ形式の両方をサポートし、ローン限度額や温度などの数値変数を予測します。本トピックでは、このコンポーネントの設定方法について説明します。
制限事項
対応するコンピューティングエンジンは、MaxCompute、Flink、または DLC です。
アルゴリズムの仕組み
Lasso 回帰アルゴリズムは、ペナルティ関数を導入することでより精緻なモデルを構築します。この関数は、回帰係数の絶対値の和を所定の固定値未満に収めるよう強制し、一部の回帰係数を縮小するとともに、他の係数をゼロに設定します。この手法により、部分集合の縮小(subset shrinkage)の利点を維持しつつ、多重共線性のあるデータを処理するためのバイアス付き推定を提供します。
GUI によるコンポーネントの設定
-
入力ポート
入力ポート(左から右へ)
データ型
推奨される上流コンポーネント
必須
予測入力モデル
なし
はい
予測入力データ
なし
はい
-
コンポーネントパラメーター
タブ
パラメーター
説明
フィールド設定
予約済みアルゴリズム列名
アルゴリズムで予約する列の名前を選択します。
ベクター列
ベクター列の名前です。
パラメーター設定
予測結果列
予測結果を格納する列の名前です。
スレッド数
コンポーネントで使用するスレッド数です。デフォルト値は 1 です。
実行チューニング
ワーカー数
ワーカーあたりのメモリ (MB) パラメーターと併用します。値は 1 ~ 9999 の正の整数である必要があります。
ワーカーあたりのメモリ (MB)
値は 1024 MB ~ 64 × 1024 MB の範囲である必要があります。
コードによるコンポーネントの設定
以下のコードをPyAlink スクリプトコンポーネントにコピーして、同等の機能を実現します。
from pyalink.alink import *
def main(sources, sinks, parameter):
model = sources[0]
batchData = sources[1]
predictor = LassoRegPredictBatchOp()\
.setPredictionCol("pred")
result = predictor.linkFrom(model, batchData)
result.link(sinks[0])
BatchOperator.execute()