Konfigurasi komponen Histogram (Multiple Columns) - Platform For AI

Pemodelan Visual (Designer) dari Platform for AI (PAI) menyediakan komponen histogram. Histogram, yang juga dikenal sebagai profil distribusi massa, adalah bagan laporan statistik berupa serangkaian garis vertikal atau segmen dengan ketinggian berbeda untuk menunjukkan distribusi data. Sumbu horizontal mewakili jenis data, sedangkan sumbu vertikal mewakili distribusi data.

Konfigurasikan komponen

Anda dapat menggunakan salah satu metode berikut untuk mengonfigurasi komponen Histogram (Beberapa Kolom).

Metode 1: Konfigurasikan komponen di halaman pipeline

Di halaman Pipeline Designer, cari Histogram (Multiple Columns) di panel sebelah kiri. Seret ke dalam kanvas, hubungkan dengan node upstream, lalu klik komponen tersebut untuk mengonfigurasi parameter.

Tab	Parameter	Deskripsi
Pengaturan Bidang	Pilih Kolom	Pilih kolom yang akan dianalisis. Hanya tipe DOUBLE dan BIGINT yang didukung. Maksimal 1.024 kolom didukung.
Pengaturan Parameter	Interval	Jumlah interval ke dalam mana data dibagi.
Tuning	Cores	Jumlah core yang digunakan dalam komputasi. Nilainya harus bilangan bulat positif. Secara default, nilai dipilih secara otomatis.
Tuning	Ukuran Memori per Core	Ukuran memori setiap core. Nilai valid: 1 hingga 65536. Unit: MB. Secara default, nilai dipilih secara otomatis.

Setelah node dijalankan, klik kanan node dan pilih Visual Analysis atau View Data untuk melihat outputnya.

Metode 2: Gunakan perintah PAI

Konfigurasikan parameter komponen dengan menggunakan komponen SQL Script untuk memanggil perintah PAI. Untuk informasi lebih lanjut, lihat SQL Script.

PAI -name histogram
      -project algo_public
      -DinputTableName=maple_histogram_1to20_input
      -DoutputTableName=maple_histogram_1to20_output
      -DselectedColNames=col0,col1 -DintervalNum=20;

Parameter	Diperlukan	Deskripsi	Nilai default
inputTableName	Ya	Nama tabel input.	Tidak ada nilai default
inputTablePartitions	Tidak	Partisi yang dipilih dari tabel input untuk pelatihan. Format berikut didukung: Partition_name=value name1=value1/name2=value2: partisi multi-level null Jika Anda menentukan beberapa partisi, pisahkan mereka dengan koma (,).	Tidak ada nilai default
outputTableName	Ya	Nama tabel output.	Tidak ada nilai default
selectedColNames	Ya	Nama kolom yang dipilih dari tabel input untuk pelatihan. Pisahkan nama kolom ganda dengan koma (,). Tipe INT dan DOUBLE didukung. Maksimal 1.024 kolom didukung.	Tidak ada nilai default
intervalNum	Tidak	Jumlah interval ke dalam mana data dibagi.	100
lifecycle	Tidak	Siklus hidup tabel.	Tidak ada nilai default
coreNum	Tidak	Jumlah core yang digunakan dalam komputasi. Nilainya harus bilangan bulat positif. Nilai valid: [1,9999].	Dipilih secara otomatis oleh sistem
memSizePerCore	Tidak	Ukuran memori setiap core. Nilai valid: 1 hingga 65536. Unit: MB.	Dipilih secara otomatis oleh sistem

Contoh

Contoh untuk Metode 2: Gunakan Perintah PAI.

Cari SQL Script di panel sebelah kiri dan seret ke dalam kanvas.
Sambungkan ke node upstream untuk mendapatkan data. Contoh data:
Contoh data
col0 (BIGINT)
col1 (DOUBLE)
1
1.0
2
2.0
3
3.0
4
4.0
5
5.0
6
6.0
7
7.0
8
8.0
9
9.0
10
10.0
11
11.0
12
12.0
13
13.0
14
14.0
15
15.0
16
16.0
17
17.0
18
18.0
19
19.0
20
20.0

Konfigurasikan perintah PAI berikut untuk node skrip SQL.

PAI -name histogram -project algo_public  --Parameter default. Anda tidak perlu mengubahnya     
    -DinputTableName=maple_histogram_1to20_input  --Nama tabel input
    -DoutputTableName=maple_histogram_1to20_output  --Nama tabel output
    -DselectedColNames=col0,col1  --Kolom yang dipilih
    -DintervalNum=20;  --Jumlah interval

Klik kanan node skrip SQL dan pilih Run Current Node.
Jika node upstream belum dijalankan, jalankan mereka terlebih dahulu untuk membaca data.

Lihat hasil dari tabel output. Contoh output:

colname	histogram
col0	[1, 1.95):1;[1.95, 2.9):1;[2.9, 3.85):1;[3.85, 4.8):1;[4.8, 5.75):1;[5.75, 6.7):1;[6.7, 7.65):1;[7.65, 8.6):1;[8.6, 9.55):1;[9.55, 10.5):1;[10.5, 11.45):1;[11.45, 12.4):1;[12.4, 13.35):1;[13.35, 14.3):1;[14.3, 15.25):1;[15.25, 16.2):1;[16.2, 17.15):1;[17.15, 18.1):1;[18.1, 19.05):1;[19.05, 20]:1
col1	[1, 1.95):1;[1.95, 2.9):1;[2.9, 3.85):1;[3.85, 4.8):1;[4.8, 5.75):1;[5.75, 6.7):1;[6.7, 7.65):1;[7.65, 8.6):1;[8.6, 9.55):1;[9.55, 10.5):1;[10.5, 11.45):1;[11.45, 12.4):1;[12.4, 13.35):1;[13.35, 14.3):1;[14.3, 15.25):1;[15.25, 16.2):1;[16.2, 17.15):1;[17.15, 18.1):1;[18.1, 19.05):1;[19.05, 20]:1

col0 (BIGINT)	col1 (DOUBLE)
1	1.0
2	2.0
3	3.0
4	4.0
5	5.0
6	6.0
7	7.0
8	8.0
9	9.0
10	10.0
11	11.0
12	12.0
13	13.0
14	14.0
15	15.0
16	16.0
17	17.0
18	18.0
19	19.0
20	20.0