テーブルからベクトルへのコンポーネントは、データの複数の列をベクトルデータに変換します。
制限事項
サポートされているコンピューティングエンジンは、MaxComputeとRealtime compute for Apache Flinkです。
概要
この列ベクトルコンポーネントは、複数の数値列データをベクトルデータに変換します。
Machine Learning Designerでコンポーネントを構成する
入力ポート
入力ポート (左から右へ) | データ型 | 推奨上流コンポーネント | 必須/任意 |
data | Integer | 可 |
コンポーネントパラメータ
タブ | 項目 | 説明 |
フィールド設定 | reservedCols | 予約する生成された列の名前。 デフォルトでは、すべての列が予約されています。 |
selectedCols | データをベクトルに変換する数値列の名前。 | |
パラメーター設定 | vectorCol | ベクトルデータを含む生成された列の名前。 |
handleInvalid | 例外を処理するために使用されるポリシー。 デフォルト値: ERROR。 有効な値:
| |
vectorSize | ベクトル内の要素の数。 デフォルト値: -1。 | |
実行チューニング | 数の労働者 | 労働者の数。 このパラメーターは、Memory per worker, unit MBパラメーターと一緒に使用する必要があります。 このパラメーターの値は正の整数でなければなりません。 有効な値: [1,9999] 。 |
ワーカあたりのメモリ、単位MB | 各ワーカーのメモリサイズ。 有効な値: 1024〜65536。 単位:MB。 |
出力ポート
出力ポート (左から右へ) | 保管場所 | 推奨下流コンポーネント | モデルタイプ |
出力結果 | N/A | None | None |
例:
次のコードをPyAlink Scriptコンポーネントのコードエディターにコピーできます。 これにより、PyAlinkスクリプトコンポーネントは、テーブルからベクトルへのコンポーネントのように機能します。
from pyalink.alink import *
def main(sources, sinks, parameter):
data = sources[0]
op = ColumnsToVectorBatchOp()\
.setSelectedCols(["f0", "f1"])\
.setReservedCols(["row"])\
.setVectorCol("vec")\
.linkFrom(data)
result = op.linkFrom(data)
result.link(sinks[0])
BatchOperator.execute()