All Products
Search
Document Center

Platform For AI:Gabung kolom

Last Updated:Apr 02, 2026

Komponen Merge Columns menggabungkan dua tabel secara berdampingan dengan menambahkan seluruh kolom dari tabel kedua ke sebelah kanan tabel pertama. Jumlah baris tetap sama—kolom digabung secara horizontal, bukan ditumpuk.

Prasyarat

Sebelum memulai, pastikan bahwa:

  • Kedua tabel memiliki jumlah baris yang sama. Jika jumlah baris berbeda, komponen akan mengembalikan error.

  • Jika salah satu tabel memiliki partisi, hubungkan tabel partisi ke port input kedua. Menghubungkannya ke port pertama menyebabkan operasi gagal.

Konfigurasikan komponen

Gunakan salah satu metode berikut.

Metode 1: Konfigurasikan komponen pada halaman pipeline

Setelah Anda memilih kolom yang akan digabung dari tabel kiri, hasilnya disimpan ke kolom yang ditentukan pada tabel kanan.

Component configurations

Metode 2: Gunakan perintah PAI

Kirimkan konfigurasi melalui perintah PAI appendColumns. Untuk memanggil perintah PAI dalam pipeline, gunakan komponen SQL Script.

PAI -name appendColumns
    -project algo_public
    -DinputTableNames=maple_test_appendcol_basic_input1,maple_test_appendcol_basic_input2
    -DoutputTableName=maple_test_appendcol_setOutCol_output
    -DoutputTableColNames=x0,x1,x2,x3,x4,x5,x6,x7,x8,x9;

Parameter

ParameterWajibBawaanDeskripsi
inputTableNamesYaNama dua tabel input, dipisahkan dengan koma (,).
outputTableNameYaNama tabel output.
selectedColNamesListTidakKolom yang dipilih dari masing-masing tabel input. Pisahkan kolom dalam satu tabel dengan koma (,); pisahkan kedua tabel dengan titik koma (;). Jika Anda memilih semua kolom dari kedua tabel, bungkus nilainya dengan tanda kutip ganda (") — jika tidak, titik koma akan dianggap sebagai pengakhiran perintah. Jika Anda memilih semua kolom dari satu tabel, Anda dapat menghilangkan nama kolomnya tetapi harus tetap menyertakan titik koma.
inputPartitionsInfoListTidakPartisi yang dibaca dari masing-masing tabel input. Pisahkan partisi dalam satu tabel dengan garis miring (/); pisahkan kedua tabel dengan titik koma (;). Jika Anda memilih semua partisi, bungkus nilainya dengan tanda kutip ganda ("). Jika tabel tidak dipartisi, hilangkan nama partisinya tetapi tetap sertakan titik koma.
autoRenameColTidakfalseMenentukan apakah nama kolom pada tabel output akan diubah secara otomatis. Saat diatur ke true, parameter outputTableColNames diabaikan.
outputTableColNamesTidakNama kolom baru untuk tabel output, diterapkan secara berurutan. Jika tidak ditentukan, nama kolom asli dari kedua tabel akan digunakan. Diabaikan saat autoRenameCol bernilai true.
lifecycleTidakSiklus hidup tabel output. Harus berupa bilangan bulat positif.
coreNumTidakBawaan sistemJumlah core yang dialokasikan. Harus berupa bilangan bulat positif dalam rentang [1, 9999]. Harus diatur bersama dengan memSizePerCore.
memSizePerCoreTidakBawaan sistemMemori yang dialokasikan per core, dalam satuan MB. Harus berupa bilangan bulat positif dalam rentang [1024, 65536]. Harus diatur bersama dengan coreNum.

Penanganan konflik nama kolom

Jika kedua tabel input memiliki nama kolom yang sama, tabel output akan berisi nama kolom duplikat kecuali konflik tersebut diselesaikan. Dua opsi tersedia:

  • Penggantian nama otomatis: Atur autoRenameCol=true. PAI akan memberikan nama unik secara otomatis. Gunakan opsi ini jika Anda tidak perlu mengontrol nama kolom output.

  • Pemberian nama manual: Atur outputTableColNames menjadi daftar nama baru yang dipisahkan koma dan mencakup semua kolom output. Gunakan opsi ini jika langkah selanjutnya bergantung pada nama kolom tertentu.

Jika autoRenameCol=true, nilai apa pun yang ditetapkan untuk outputTableColNames akan diabaikan.

Contoh

Contoh ini menggabungkan dua tabel berikut.

Tabel sumber 1: `maple_test_appendcol_basic_input1` (5 kolom, 5 baris)

col0:bigintcol1:doublecol2:stringcol3:Datetimecol4:Boolean
100.0aaaa2015-10-01 00:00:00TRUE
111.0aaaa2015-10-01 00:00:00FALSE
122.0aaaa2015-10-01 00:00:00TRUE
133.0aaaa2015-10-01 00:00:00TRUE
144.0aaaa2015-10-01 00:00:00TRUE

Tabel sumber 2: `maple_test_appendcol_basic_input2` (5 kolom, 5 baris)

col10:bigintcol11:doublecol12:stringcol13:Datetimecol14:Boolean
11010.02aaaa2015-10-01 00:00:00TRUE
11111.02aaaa2015-10-01 00:00:00FALSE
11212.02aaaa2015-10-01 00:00:00TRUE
11313.02aaaa2015-10-01 00:00:00TRUE
11414.02aaaa2015-10-01 00:00:00FALSE

Jalankan perintah berikut untuk menggabungkan kedua tabel dan mengganti nama semua kolom output:

PAI -name appendColumns
    -project algo_public
    -DinputTableNames=maple_test_appendcol_basic_input1,maple_test_appendcol_basic_input2
    -DoutputTableName=maple_test_appendcol_setOutCol_output
    -DoutputTableColNames=x0,x1,x2,x3,x4,x5,x6,x7,x8,x9;

Tabel output maple_test_appendcol_setOutCol_output berisi semua 10 kolom (x0–x4 dari tabel sumber 1, x5–x9 dari tabel sumber 2) dan 5 baris yang sama:

x0x1x2x3x4x5x6x7x8x9
100aaaa2015-10-01 00:00:00true110102aaaa2015-10-01 00:00:00true
111aaaa2015-10-01 00:00:00false111112aaaa2015-10-01 00:00:00false
122aaaa2015-10-01 00:00:00true112122aaaa2015-10-01 00:00:00true
133aaaa2015-10-01 00:00:00true113132aaaa2015-10-01 00:00:00true
144aaaa2015-10-01 00:00:00true114142aaaa2015-10-01 00:00:00false