Min Max Scaler Batch Predictコンポーネントを使用してデータに正規化バッチ予測を実装する場合、ユーザーはMin Max Scaler Trainコンポーネントを使用してトレーニングしたモデルを指定する必要があります。
制限事項
サポートされているコンピューティングエンジンは、MaxComputeとRealtime compute for Apache Flinkです。
概要
このコンポーネントは、以下の式を使用することによって、値を [minValue, maxValue] の範囲内に入るデータに変換する: (value − min)/(max − min) × (maxValue − minValue) + minValue。 Maxは列データの最大値を示し、minは列データの最小値を示す。
MinValueとmaxValueはカスタマイズできます。 デフォルトでは、minValueは0に、maxValueは1に設定されます。
Min Max Scaler Batch Predictコンポーネントを使用する場合、ユーザーはMin Max Scaler Trainコンポーネントによって生成されるモデルを指定する必要があります。
Machine Learning Designerでコンポーネントを構成する
入力ポート
入力ポート (左から右へ) | データ型 | 推奨上流コンポーネント | 必須/任意 |
予測の入力モデル | None | 可 | |
予測の入力データ | None | 可 |
コンポーネントパラメータ
タブ | 項目 | 説明 |
パラメーター設定 | outputCols | オプションです。 正規化後の新しい列名。 新しい列の数は、トレーニングで使用される古い列の数と同じでなければなりません。 複数入力する場合は、カンマ (,) で区切ります。 |
numThreads | コンポーネントによって使用されるスレッドの数。 デフォルト値は 1 です。 | |
実行チューニング | 数の労働者 | 労働者の数。 このパラメーターは、Memory per worker, unit MBパラメーターと一緒に使用する必要があります。 このパラメーターの値は正の整数でなければなりません。 有効な値: [1,9999] 。 |
ワーカあたりのメモリ、単位MB | 各ワーカーのメモリサイズ。 有効な値: 1024〜65536。 単位:MB。 |
出力ポート
出力ポート (左から右へ) | 保管場所 | 推奨下流コンポーネント | モデルタイプ |
出力結果 | N/A | None | None |
例:
次のコードをPyAlink Scriptコンポーネントのコードエディターにコピーできます。 これにより、PyAlinkスクリプトコンポーネントはMin Max Scaler Batch Predictコンポーネントのように機能します。
from pyalink.alink import *
def main(sources, sinks, parameter):
model = sources[0]
batchData = sources[1]
predictor = MinMaxScalerPredictBatchOp()
result = predictor.linkFrom(model, batchData)
result.link(sinks[0])
BatchOperator.execute()