すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:インプタートレイン

最終更新日:Jul 22, 2024

Imputer Trainコンポーネントは、不足している値を自動入力するようにモデルをトレーニングします。 以下の帰属ポリシーがサポートされている: MEAN、MIN、MAX、およびVALUE。

制限事項

サポートされている計算エンジンは、MaxComputeとFlinkです。

概要

このImputer Trainコンポーネントは、不足している値を自動入力するようにモデルをトレーニングします。 以下の帰属ポリシーがサポートされている: MEAN、MIN、MAX、およびVALUE。 VALUEインピュテーションポリシーが指定されている場合、fillValueパラメーターは使用可能であり、必須です。

Machine Learning Designerでコンポーネントを構成する

入力ポート

入力ポート (左から右へ)

データ型

推奨上流コンポーネント

必須/任意

data

MaxComputeまたはObject Storage Service (OSS) に格納された構造化データ

読み取りテーブル

ファイルデータの読み取り

コンポーネントパラメータ

タブ

項目

説明

フィールド設定

selectedCols

不足している値を設定する数値列の名前。

パラメーター設定

fillValue

システムが不足している値に設定するカスタム値。 このパラメーターは、strategyパラメーターをVALUEに設定した場合にのみ使用でき、必要です。

戦略

不足している値を設定するために使用されるポリシー。 デフォルト値: MEAN。 有効な値:

  • 平均: システムは、欠落した値に平均値を設定します。

  • MIN: システムは、不足している値に最小値を設定します。

  • MAX: システムは、不足している値に最大値を設定します。

  • 値: 不足している値にカスタム値を設定します。

実行チューニング

数の労働者

労働者の数。 このパラメーターは、Memory per worker, unit MBパラメーターと一緒に使用する必要があります。 このパラメーターの値は正の整数でなければなりません。 有効な値: [1,9999] 。

ワーカあたりのメモリ、単位MB

各ワーカーのメモリサイズ。 有効な値: 1024〜65536。 単位:MB。

出力ポート

出力ポート (左から右へ)

推奨下流コンポーネント

モデルタイプ

モデル

入力予測

Imputerモデル

例:

次のコードをPyAlink Scriptコンポーネントのコードエディターにコピーできます。 これにより、PyAlinkスクリプトコンポーネントは、Imputer Trainコンポーネントのように機能します。

from pyalink.alink import *

def main(sources, sinks, parameter):
    data = sources[0]
    selectedColNames = ["col2", "col3"]
    trainOp = ImputerTrainBatchOp()\
               .setSelectedCols(selectedColNames)
    result = trainOp.linkFrom(data)
    result.link(sinks[0])
		BatchOperator.execute()