すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:最小最大スケーラーのバッチ予測

最終更新日:Jul 22, 2024

Min Max Scaler Batch Predictコンポーネントを使用してデータに正規化バッチ予測を実装する場合、ユーザーはMin Max Scaler Trainコンポーネントを使用してトレーニングしたモデルを指定する必要があります。

制限事項

サポートされているコンピューティングエンジンは、MaxComputeとRealtime compute for Apache Flinkです。

概要

このコンポーネントは、以下の式を使用することによって、値を [minValue, maxValue] の範囲内に入るデータに変換する: (value − min)/(max − min) × (maxValue − minValue) + minValue。 Maxは列データの最大値を示し、minは列データの最小値を示す。

MinValueとmaxValueはカスタマイズできます。 デフォルトでは、minValueは0に、maxValueは1に設定されます。

Min Max Scaler Batch Predictコンポーネントを使用する場合、ユーザーはMin Max Scaler Trainコンポーネントによって生成されるモデルを指定する必要があります。

Machine Learning Designerでコンポーネントを構成する

入力ポート

入力ポート (左から右へ)

データ型

推奨上流コンポーネント

必須/任意

予測の入力モデル

None

最小最大スケーラー列車

予測の入力データ

None

読み取りテーブル

CSVファイルの読み取り

コンポーネントパラメータ

タブ

項目

説明

パラメーター設定

outputCols

オプションです。 正規化後の新しい列名。 新しい列の数は、トレーニングで使用される古い列の数と同じでなければなりません。 複数入力する場合は、カンマ (,) で区切ります。

numThreads

コンポーネントによって使用されるスレッドの数。 デフォルト値は 1 です。

実行チューニング

数の労働者

労働者の数。 このパラメーターは、Memory per worker, unit MBパラメーターと一緒に使用する必要があります。 このパラメーターの値は正の整数でなければなりません。 有効な値: [1,9999] 。

ワーカあたりのメモリ、単位MB

各ワーカーのメモリサイズ。 有効な値: 1024〜65536。 単位:MB。

出力ポート

出力ポート (左から右へ)

保管場所

推奨下流コンポーネント

モデルタイプ

出力結果

N/A

None

None

例:

次のコードをPyAlink Scriptコンポーネントのコードエディターにコピーできます。 これにより、PyAlinkスクリプトコンポーネントはMin Max Scaler Batch Predictコンポーネントのように機能します。

from pyalink.alink import *

def main(sources, sinks, parameter):
    model = sources[0]
    batchData = sources[1]
    predictor = MinMaxScalerPredictBatchOp()
    result = predictor.linkFrom(model, batchData)
    result.link(sinks[0])
    BatchOperator.execute()