列の結合アルゴリズムコンポーネントは、2 つのテーブルの列を横に並べて結合します。両方の入力テーブルの行数が同じである必要があり、異なる場合はエラーが発生します。2 つのテーブルのうち一方がパーティションテーブルの場合は、そのパーティションテーブルを 2 番目の入力ポートに接続してください。
コンポーネントの設定
列の結合コンポーネントは、次の方法で設定できます。
方法 1:ビジュアル設定
[フィールド設定] タブで、[Customize Output Columns from Left Table] と [Customize Output Columns from Right Table] を使用して、出力テーブルの列を選択します。
方法 2:PAI コマンド
SQL スクリプトコンポーネントで PAI コマンドを使用してコンポーネントを設定します。詳細については「SQL スクリプト」をご参照ください。
PAI -name appendColumns
-project algo_public
-DinputTableNames=maple_test_appendcol_basic_input1,maple_test_appendcol_basic_input2
-DoutputTableName=maple_test_appendcol_setOutCol_output
-DoutputTableColNames=x0,x1,x2,x3,x4,x5,x6,x7,x8,x9;
| パラメーター | 必須 | 説明 | デフォルト |
| inputTableNames | はい | 2 つの入力テーブルの名前。カンマ (,) で区切ります。 | なし |
| outputTableName | はい | 出力テーブルの名前。 | なし |
| selectedColNamesList | いいえ | 入力テーブルに対応する選択された列名のリスト。
説明 両方のテーブルからすべての列を選択する場合は、パラメーター値全体を二重引用符 ("") で囲む必要があります。囲まない場合、システムはセミコロン ( ;) をコマンド終端文字として解釈します。一方のテーブルからすべての列を選択する場合は、そのテーブルの列名を省略できますが、セミコロン (;) は記述する必要があります。 |
なし |
| inputPartitionsInfoList | いいえ | 入力テーブルに対応する選択されたパーティションのリスト。
説明 すべてのパーティションを選択する場合は、パラメーター値全体を二重引用符 ("") で囲む必要があります。囲まない場合、システムはセミコロン ( ;) をコマンド終端文字として解釈します。テーブルがパーティション分割されていない場合は、パーティション名を省略できますが、セミコロン (;) は記述する必要があります。 |
なし |
| autoRenameCol | いいえ | 出力テーブルの列を自動的に名前変更するかどうかを指定します。 | false |
| outputTableColNames | いいえ | 出力テーブルの列の新しい名前。このパラメーターを指定しない場合、元の列名が使用されます。 重要 autoRenameCol が true に設定されている場合、このパラメーターは無効です。 |
なし |
| lifecycle | いいえ | 出力テーブルのライフサイクル (日数)。正の整数である必要があります。 | なし |
| coreNum | いいえ | ジョブのコア数。このパラメーターは memSizePerCore と組み合わせて使用します。値は [1, 9999] の範囲の正の整数である必要があります。 |
システムによって決定 |
| memSizePerCore | いいえ | コアあたりのメモリサイズ (MB)。値は [1024, 65536] の範囲の正の整数である必要があります。 | システムによって決定 |
例
この例では、次の 2 つのソーステーブルを結合します。
- ソーステーブル 1
表 1. maple_test_appendcol_basic_input1 col0:bigint col1:double col2:string col3:Datetime col4:Boolean 10 0.0 aaaa 2015-10-01 00:00:00 TRUE 11 1.0 aaaa 2015-10-01 00:00:00 FALSE 12 2.0 aaaa 2015-10-01 00:00:00 TRUE 13 3.0 aaaa 2015-10-01 00:00:00 TRUE 14 4.0 aaaa 2015-10-01 00:00:00 TRUE - ソーステーブル 2
表 2. maple_test_appendcol_basic_input2 col10:bigint col11:double col12:string col13:Datetime col14:Boolean 110 10.0 2aaaa 2015-10-01 00:00:00 TRUE 111 11.0 2aaaa 2015-10-01 00:00:00 FALSE 112 12.0 2aaaa 2015-10-01 00:00:00 TRUE 113 13.0 2aaaa 2015-10-01 00:00:00 TRUE 114 14.0 2aaaa 2015-10-01 00:00:00 FALSE
PAI -name appendColumns
-project algo_public
-DinputTableNames=maple_test_appendcol_basic_input1,maple_test_appendcol_basic_input2
-DoutputTableName=maple_test_appendcol_setOutCol_output
-DoutputTableColNames=x0,x1,x2,x3,x4,x5,x6,x7,x8,x9;このコマンドは、次の出力テーブルを生成します。| x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 |
| 10 | 0 | aaaa | 2015-10-01 00:00:00 | true | 110 | 10 | 2aaaa | 2015-10-01 00:00:00 | true |
| 11 | 1 | aaaa | 2015-10-01 00:00:00 | false | 111 | 11 | 2aaaa | 2015-10-01 00:00:00 | false |
| 12 | 2 | aaaa | 2015-10-01 00:00:00 | true | 112 | 12 | 2aaaa | 2015-10-01 00:00:00 | true |
| 13 | 3 | aaaa | 2015-10-01 00:00:00 | true | 113 | 13 | 2aaaa | 2015-10-01 00:00:00 | true |
| 14 | 4 | aaaa | 2015-10-01 00:00:00 | true | 114 | 14 | 2aaaa | 2015-10-01 00:00:00 | false |