Imputer Trainコンポーネントは、不足している値を自動入力するようにモデルをトレーニングします。 以下の帰属ポリシーがサポートされている: MEAN、MIN、MAX、およびVALUE。
制限事項
サポートされている計算エンジンは、MaxComputeとFlinkです。
概要
このImputer Trainコンポーネントは、不足している値を自動入力するようにモデルをトレーニングします。 以下の帰属ポリシーがサポートされている: MEAN、MIN、MAX、およびVALUE。 VALUEインピュテーションポリシーが指定されている場合、fillValueパラメーターは使用可能であり、必須です。
Machine Learning Designerでコンポーネントを構成する
入力ポート
入力ポート (左から右へ) | データ型 | 推奨上流コンポーネント | 必須/任意 |
data | MaxComputeまたはObject Storage Service (OSS) に格納された構造化データ | 可 |
コンポーネントパラメータ
タブ | 項目 | 説明 |
フィールド設定 | selectedCols | 不足している値を設定する数値列の名前。 |
パラメーター設定 | fillValue | システムが不足している値に設定するカスタム値。 このパラメーターは、strategyパラメーターをVALUEに設定した場合にのみ使用でき、必要です。 |
戦略 | 不足している値を設定するために使用されるポリシー。 デフォルト値: MEAN。 有効な値:
| |
実行チューニング | 数の労働者 | 労働者の数。 このパラメーターは、Memory per worker, unit MBパラメーターと一緒に使用する必要があります。 このパラメーターの値は正の整数でなければなりません。 有効な値: [1,9999] 。 |
ワーカあたりのメモリ、単位MB | 各ワーカーのメモリサイズ。 有効な値: 1024〜65536。 単位:MB。 |
出力ポート
出力ポート (左から右へ) | 推奨下流コンポーネント | モデルタイプ |
モデル | Imputerモデル |
例:
次のコードをPyAlink Scriptコンポーネントのコードエディターにコピーできます。 これにより、PyAlinkスクリプトコンポーネントは、Imputer Trainコンポーネントのように機能します。
from pyalink.alink import *
def main(sources, sinks, parameter):
data = sources[0]
selectedColNames = ["col2", "col3"]
trainOp = ImputerTrainBatchOp()\
.setSelectedCols(selectedColNames)
result = trainOp.linkFrom(data)
result.link(sinks[0])
BatchOperator.execute()