Topik ini menjelaskan komponen Tambah Kolom ID yang disediakan oleh Machine Learning Studio. Komponen ini memungkinkan Anda menambahkan kolom ID ke kolom pertama tabel.
Informasi latar belakang
Komponen Tambah Kolom ID dapat digunakan untuk tabel dengan maksimum 1.000.000.000 x 1.023 baris.
Konfigurasi komponen
Anda dapat menggunakan salah satu metode berikut untuk mengonfigurasi komponen Tambah Kolom ID.
Metode 1: Konfigurasikan komponen pada halaman pipeline
Konfigurasikan parameter komponen pada halaman pipeline dari Machine Learning Designer.
| Tab | Parameter | Deskripsi |
| Parameters Setting | All Selected by Default | Secara default, semua kolom dalam tabel input dipilih. Kolom tertentu mungkin tidak digunakan untuk pelatihan. Kolom-kolom ini tidak mempengaruhi hasil prediksi. |
| ID Column | Nilai default parameter ini adalah append_id. | |
| Tuning | Cores | Jumlah core. |
| Memory Size per Core | Ukuran memori setiap core. Unit: MB. Nilai valid: (1,65536). |
Metode 2: Gunakan perintah PAI
Konfigurasikan parameter komponen dengan menggunakan perintah PAI. Anda dapat menggunakan komponen SQL Script untuk memanggil perintah PAI. Untuk informasi lebih lanjut, lihat SQL Script.
PAI -name AppendId
-project algo_public
-DinputTableName=maple_test_appendid_basic_input
-DoutputTableName=maple_test_appendid_basic_output;| Parameter | Diperlukan | Deskripsi | Nilai default |
| inputTableName | Ya | Nama tabel input. | Tidak ada nilai default |
| selectedColNames | Tidak | Kolom yang dipilih dari tabel input untuk pelatihan. Nama kolom harus dipisahkan dengan koma (,). Kolom tipe INT dan DOUBLE didukung. Jika data input dalam format jarang, kolom tipe STRING didukung. | Semua kolom |
| inputTablePartitions | Tidak | Partisi yang dipilih dari tabel input untuk pelatihan. Format berikut didukung:
Catatan Jika Anda menentukan beberapa partisi, pisahkan mereka dengan koma (,). | Semua partisi |
| outputTableName | Ya | Nama tabel output. | Tidak ada nilai default |
| IDColName | Tidak | Nama kolom ID yang ditambahkan. | append_id |
| lifecycle | Tidak | Siklus hidup tabel output. | Tidak ada nilai default |
| coreNum | Tidak | Jumlah core. | Ditentukan oleh sistem |
| memSizePerCore | Tidak | Ukuran memori setiap core. Unit: MB. Nilai valid: (1,65536). | Ditentukan oleh sistem |
Contoh
PAI -name AppendId
-project algo_public
-DinputTableName=maple_test_appendid_basic_input
-DoutputTableName=maple_test_appendid_basic_output;- Data Input
col0 col1 col2 col3 col4 10 0.0 aaaa Thu Oct 01 00:00:00 CST 2015 true 11 1.0 aaaa Thu Oct 01 00:00:00 CST 2015 false 12 2.0 aaaa Thu Oct 01 00:00:00 CST 2015 true 13 3.0 aaaa Thu Oct 01 00:00:00 CST 2015 true 14 4.0 aaaa Thu Oct 01 00:00:00 CST 2015 true - Tabel Output
append_id col0 col1 col2 col3 col4 0 10 0.0 aaaa Thu Oct 01 00:00:00 CST 2015 true 1 11 1.0 aaaa Thu Oct 01 00:00:00 CST 2015 false 2 12 2.0 aaaa Thu Oct 01 00:00:00 CST 2015 true 3 13 3.0 aaaa Thu Oct 01 00:00:00 CST 2015 true 4 14 4.0 aaaa Thu Oct 01 00:00:00 CST 2015 true