Algoritma JOIN sering digunakan dalam tahap pra-pemrosesan data untuk mengkonsolidasikan informasi relevan dari berbagai sumber ke dalam satu tabel dengan mencocokkan catatan pada satu atau lebih bidang. Operasi ini mirip dengan pernyataan JOIN dalam SQL dan bertujuan untuk memastikan integritas serta konsistensi data, memberikan fondasi yang andal untuk pelatihan dan analisis selanjutnya.
Konfigurasikan komponen
Anda dapat mengonfigurasi komponen JOIN di halaman pipeline Machine Learning Designer. Tabel berikut menjelaskan parameter yang tersedia.
Parameter | Deskripsi |
Join Type | Jenis join. Nilai yang valid: Left Join, Inner Join, Right Join, dan Full Join. |
MapJoin Optimization | Menentukan apakah data di tabel kecil dimuat ke dalam memori untuk mempercepat eksekusi operasi JOIN. Nilai yang valid:
|
Join Condition | Kondisi join dalam format persamaan. Anda dapat menambahkan atau menghapus kondisi secara manual. |
Select Output Columns from the Left Table | Kolom output dari tabel kiri. |
Select Output Columns from the Right Table | Kolom output dari tabel kanan. |