Topik ini menjelaskan komponen Diagram Kotak yang disediakan oleh Machine Learning Designer.
Grafik diagram kotak menunjukkan distribusi dari satu set data. Grafik ini menggambarkan fitur distribusi dari data mentah dan dapat digunakan untuk membandingkan fitur distribusi antara beberapa set data.
Batasan
Laporan visual dari komponen ini hanya tersedia di Machine Learning Studio.
Konfigurasikan komponen
Anda dapat mengonfigurasi komponen dengan menggunakan salah satu metode berikut:
Metode 1: Menggunakan konsol Platform for AI Machine Learning
Konfigurasikan parameter komponen pada halaman konfigurasi pipeline Machine Learning Designer.
| Tab | Parameter | Deskripsi |
| Field Setting | Continuous Features | Kolom yang mewakili fitur kontinu. |
| Enumeration Feature | Kolom yang mewakili fitur enumerasi. Catatan Machine Learning Studio hanya memungkinkan Anda memilih satu bidang, sedangkan Machine Learning Designer memungkinkan Anda memilih beberapa bidang. | |
| Stratified Samples | Jumlah sampel bertingkat yang diadopsi. |
Metode 2: Menggunakan perintah Platform for AI (PAI)
Konfigurasikan parameter komponen dengan menggunakan perintah PAI. Anda dapat menggunakan komponen SQL Script untuk menjalankan perintah PAI. Untuk informasi lebih lanjut, lihat SQL Script. Tabel berikut menjelaskan parameter dari perintah PAI.
PAI -name box_plot -project algo_public
-DinputTable="boxplot"
-DcontinueCols="age"
-DcategoryCol="y"
-DoutputTable="pai_temp_6075_97181_1"
-DsampleSize="1000"
-Dlifecycle="7";| Parameter | Diperlukan | Deskripsi | Nilai default |
| inputTable | Ya | Nama tabel input. | Tidak tersedia |
| inputTablePartitions | Tidak | Partisi yang dipilih dari tabel input untuk pelatihan. Format berikut didukung:
Catatan Jika Anda menentukan beberapa partisi, pisahkan mereka dengan koma (,). | Tidak tersedia |
| outputTable | Ya | Nama tabel output yang menyimpan grafik diagram kotak dan sampel. | Tidak tersedia |
| continueCols | Ya | Kolom yang mewakili fitur kontinu. | Tidak tersedia |
| categoryCol | Ya | Kolom yang mewakili fitur enumerasi. | Tidak tersedia |
| sampleSize | Tidak | Jumlah sampel berdasarkan kondisi gangguan setiap fitur yang digambarkan. | 1000 |
| lifecycle | Tidak | Siklus hidup tabel output. Unit: hari. | 28 |
| coreNum | Tidak | Jumlah core yang digunakan dalam komputasi. Nilai parameter ini harus bilangan bulat positif. | Dialokasikan secara otomatis |
| memSizePerCore | Tidak | Ukuran memori setiap core. Nilai valid: 1 hingga 65536. Unit: MB. | Dialokasikan secara otomatis |
Contoh
- Data Masukan
create table boxplot as select age, y from bank_data limit 100;age y 50 0 53 0 28 1 39 0 55 1 30 0 37 0 39 0 36 1 27 0 34 0 41 0 55 1 33 0 26 0 52 0 35 1 27 1 28 0 26 0 41 0 35 0 40 0 32 0 41 0 34 0 49 0 37 0 35 0 38 0 47 0 46 0 27 0 29 1 32 0 36 0 29 0 47 0 44 0 54 0 36 0 42 0 44 0 72 1 48 0 36 0 35 0 43 0 56 0 42 0 31 0 32 0 33 0 31 0 39 0 30 1 24 0 24 0 38 0 26 0 41 0 34 0 30 0 37 0 68 0 31 0 48 0 33 0 59 0 44 0 28 0 50 0 33 0 45 0 40 0 45 0 43 0 54 0 53 0 35 0 30 0 25 0 35 0 54 1 30 0 38 0 35 0 47 0 32 0 27 0 40 1 31 0 42 0 40 0 31 0 57 0 38 1 39 0 37 0 44 0 - Pengaturan Parameter
Tetapkan kolom age sebagai kolom fitur kontinu, dan kolom y sebagai kolom fitur enumerasi. Pertahankan nilai default parameter lainnya.
- Keluaran
- Deskripsi KeluaranKlik kanan Box Plot dan pilih untuk melihat keluaran. Parameter:
- percent_points: Menunjukkan persentil yang dihitung.
- percent_count: Menunjukkan jumlah entri data dalam setiap interval. Interval dibagi berdasarkan persentil.
- sample_list: Sampel dipilih dari setiap strata berdasarkan laju pengambilan sampel. Laju pengambilan sampel dihitung menggunakan rumus berikut: Laju pengambilan sampel = Jumlah sampel bertingkat / Total jumlah entri data. Jika laju pengambilan sampel terlalu rendah dan nilai jumlah sampel di setiap strata dikalikan dengan laju pengambilan sampel kurang dari 10, laju pengambilan sampel baru akan dihitung ulang.
- Gambar berikut menunjukkan grafik diagram kotak.

- Gambar berikut menunjukkan distribusi titik gangguan.

- Deskripsi Keluaran