最小最大スケーラーのバッチ予測 - Platform For AI - Alibaba Cloud ドキュメントセンター

Min Max Scaler Batch Predictコンポーネントを使用してデータに正規化バッチ予測を実装する場合、ユーザーはMin Max Scaler Trainコンポーネントを使用してトレーニングしたモデルを指定する必要があります。

制限事項

サポートされているコンピューティングエンジンは、MaxComputeとRealtime compute for Apache Flinkです。

概要

このコンポーネントは、以下の式を使用することによって、値を [minValue, maxValue] の範囲内に入るデータに変換する: (value − min)/(max − min) × (maxValue − minValue) + minValue。 Maxは列データの最大値を示し、minは列データの最小値を示す。

MinValueとmaxValueはカスタマイズできます。デフォルトでは、minValueは0に、maxValueは1に設定されます。

Min Max Scaler Batch Predictコンポーネントを使用する場合、ユーザーはMin Max Scaler Trainコンポーネントによって生成されるモデルを指定する必要があります。

Machine Learning Designerでコンポーネントを構成する

入力ポート

入力ポート (左から右へ)

データ型

推奨上流コンポーネント

必須/任意

予測の入力モデル

None

最小最大スケーラー列車

可

予測の入力データ

None

読み取りテーブル

CSVファイルの読み取り

可

コンポーネントパラメータ

タブ	項目	説明
パラメーター設定	outputCols	オプションです。正規化後の新しい列名。新しい列の数は、トレーニングで使用される古い列の数と同じでなければなりません。複数入力する場合は、カンマ (,) で区切ります。
パラメーター設定	numThreads	コンポーネントによって使用されるスレッドの数。デフォルト値は 1 です。
実行チューニング	数の労働者	労働者の数。このパラメーターは、Memory per worker, unit MBパラメーターと一緒に使用する必要があります。このパラメーターの値は正の整数でなければなりません。有効な値: [1,9999] 。
実行チューニング	ワーカあたりのメモリ、単位MB	各ワーカーのメモリサイズ。有効な値: 1024〜65536。単位：MB。

出力ポート

出力ポート (左から右へ)	保管場所	推奨下流コンポーネント	モデルタイプ
出力結果	N/A	None	None

例：

次のコードをPyAlink Scriptコンポーネントのコードエディターにコピーできます。これにより、PyAlinkスクリプトコンポーネントはMin Max Scaler Batch Predictコンポーネントのように機能します。

from pyalink.alink import *

def main(sources, sinks, parameter):
    model = sources[0]
    batchData = sources[1]
    predictor = MinMaxScalerPredictBatchOp()
    result = predictor.linkFrom(model, batchData)
    result.link(sinks[0])
    BatchOperator.execute()