Pemodelan Visual (Designer) dari Platform for AI (PAI) menyediakan komponen histogram. Histogram, yang juga dikenal sebagai profil distribusi massa, adalah bagan laporan statistik berupa serangkaian garis vertikal atau segmen dengan ketinggian berbeda untuk menunjukkan distribusi data. Sumbu horizontal mewakili jenis data, sedangkan sumbu vertikal mewakili distribusi data.
Konfigurasikan komponen
Anda dapat menggunakan salah satu metode berikut untuk mengonfigurasi komponen Histogram (Beberapa Kolom).
Metode 1: Konfigurasikan komponen di halaman pipeline
Di halaman Pipeline Designer, cari Histogram (Multiple Columns) di panel sebelah kiri. Seret ke dalam kanvas, hubungkan dengan node upstream, lalu klik komponen tersebut untuk mengonfigurasi parameter.
Tab | Parameter | Deskripsi |
Pengaturan Bidang | Pilih Kolom | Pilih kolom yang akan dianalisis. Hanya tipe DOUBLE dan BIGINT yang didukung. Maksimal 1.024 kolom didukung. |
Pengaturan Parameter | Interval | Jumlah interval ke dalam mana data dibagi. |
Tuning | Cores | Jumlah core yang digunakan dalam komputasi. Nilainya harus bilangan bulat positif. Secara default, nilai dipilih secara otomatis. |
Ukuran Memori per Core | Ukuran memori setiap core. Nilai valid: 1 hingga 65536. Unit: MB. Secara default, nilai dipilih secara otomatis. |
Setelah node dijalankan, klik kanan node dan pilih Visual Analysis atau View Data untuk melihat outputnya.
Metode 2: Gunakan perintah PAI
Konfigurasikan parameter komponen dengan menggunakan komponen SQL Script untuk memanggil perintah PAI. Untuk informasi lebih lanjut, lihat SQL Script.
PAI -name histogram
-project algo_public
-DinputTableName=maple_histogram_1to20_input
-DoutputTableName=maple_histogram_1to20_output
-DselectedColNames=col0,col1 -DintervalNum=20;Parameter | Diperlukan | Deskripsi | Nilai default |
inputTableName | Ya | Nama tabel input. | Tidak ada nilai default |
inputTablePartitions | Tidak | Partisi yang dipilih dari tabel input untuk pelatihan. Format berikut didukung:
null Jika Anda menentukan beberapa partisi, pisahkan mereka dengan koma (,). | Tidak ada nilai default |
outputTableName | Ya | Nama tabel output. | Tidak ada nilai default |
selectedColNames | Ya | Nama kolom yang dipilih dari tabel input untuk pelatihan. Pisahkan nama kolom ganda dengan koma (,). Tipe INT dan DOUBLE didukung. Maksimal 1.024 kolom didukung. | Tidak ada nilai default |
intervalNum | Tidak | Jumlah interval ke dalam mana data dibagi. | 100 |
lifecycle | Tidak | Siklus hidup tabel. | Tidak ada nilai default |
coreNum | Tidak | Jumlah core yang digunakan dalam komputasi. Nilainya harus bilangan bulat positif. Nilai valid: [1,9999]. | Dipilih secara otomatis oleh sistem |
memSizePerCore | Tidak | Ukuran memori setiap core. Nilai valid: 1 hingga 65536. Unit: MB. | Dipilih secara otomatis oleh sistem |
Contoh
Contoh untuk Metode 2: Gunakan Perintah PAI.
Cari SQL Script di panel sebelah kiri dan seret ke dalam kanvas.
Sambungkan ke node upstream untuk mendapatkan data. Contoh data:
Konfigurasikan perintah PAI berikut untuk node skrip SQL.
PAI -name histogram -project algo_public --Parameter default. Anda tidak perlu mengubahnya -DinputTableName=maple_histogram_1to20_input --Nama tabel input -DoutputTableName=maple_histogram_1to20_output --Nama tabel output -DselectedColNames=col0,col1 --Kolom yang dipilih -DintervalNum=20; --Jumlah intervalKlik kanan node skrip SQL dan pilih Run Current Node.
Jika node upstream belum dijalankan, jalankan mereka terlebih dahulu untuk membaca data.
Lihat hasil dari tabel output. Contoh output:
colname
histogram
col0
[1, 1.95):1;[1.95, 2.9):1;[2.9, 3.85):1;[3.85, 4.8):1;[4.8, 5.75):1;[5.75, 6.7):1;[6.7, 7.65):1;[7.65, 8.6):1;[8.6, 9.55):1;[9.55, 10.5):1;[10.5, 11.45):1;[11.45, 12.4):1;[12.4, 13.35):1;[13.35, 14.3):1;[14.3, 15.25):1;[15.25, 16.2):1;[16.2, 17.15):1;[17.15, 18.1):1;[18.1, 19.05):1;[19.05, 20]:1
col1
[1, 1.95):1;[1.95, 2.9):1;[2.9, 3.85):1;[3.85, 4.8):1;[4.8, 5.75):1;[5.75, 6.7):1;[6.7, 7.65):1;[7.65, 8.6):1;[8.6, 9.55):1;[9.55, 10.5):1;[10.5, 11.45):1;[11.45, 12.4):1;[12.4, 13.35):1;[13.35, 14.3):1;[14.3, 15.25):1;[15.25, 16.2):1;[16.2, 17.15):1;[17.15, 18.1):1;[18.1, 19.05):1;[19.05, 20]:1