すべてのプロダクト
Search
ドキュメントセンター

Platform For AI:列からベクトルへ

最終更新日:Jul 22, 2024

テーブルからベクトルへのコンポーネントは、データの複数の列をベクトルデータに変換します。

制限事項

サポートされているコンピューティングエンジンは、MaxComputeとRealtime compute for Apache Flinkです。

概要

この列ベクトルコンポーネントは、複数の数値列データをベクトルデータに変換します。

Machine Learning Designerでコンポーネントを構成する

入力ポート

入力ポート (左から右へ)

データ型

推奨上流コンポーネント

必須/任意

data

Integer

読み取りテーブル

CSVファイルの読み取り

コンポーネントパラメータ

タブ

項目

説明

フィールド設定

reservedCols

予約する生成された列の名前。 デフォルトでは、すべての列が予約されています。

selectedCols

データをベクトルに変換する数値列の名前。

パラメーター設定

vectorCol

ベクトルデータを含む生成された列の名前。

handleInvalid

例外を処理するために使用されるポリシー。 デフォルト値: ERROR。 有効な値:

  • エラー: 例外をスローします。

  • SKIP: 例外をスキップしてNULLを返します。

vectorSize

ベクトル内の要素の数。 デフォルト値: -1。

実行チューニング

数の労働者

労働者の数。 このパラメーターは、Memory per worker, unit MBパラメーターと一緒に使用する必要があります。 このパラメーターの値は正の整数でなければなりません。 有効な値: [1,9999] 。

ワーカあたりのメモリ、単位MB

各ワーカーのメモリサイズ。 有効な値: 1024〜65536。 単位:MB。

出力ポート

出力ポート (左から右へ)

保管場所

推奨下流コンポーネント

モデルタイプ

出力結果

N/A

None

None

例:

次のコードをPyAlink Scriptコンポーネントのコードエディターにコピーできます。 これにより、PyAlinkスクリプトコンポーネントは、テーブルからベクトルへのコンポーネントのように機能します。

from pyalink.alink import *

def main(sources, sinks, parameter):
    data = sources[0]
    op = ColumnsToVectorBatchOp()\
        .setSelectedCols(["f0", "f1"])\
        .setReservedCols(["row"])\
        .setVectorCol("vec")\
        .linkFrom(data)
    result = op.linkFrom(data)
    result.link(sinks[0])
    BatchOperator.execute()