全部产品
Search
文档中心

Platform For AI:Histogram (Beberapa Kolom)

更新时间:Jun 22, 2025

Pemodelan Visual (Designer) dari Platform for AI (PAI) menyediakan komponen histogram. Histogram, yang juga dikenal sebagai profil distribusi massa, adalah bagan laporan statistik berupa serangkaian garis vertikal atau segmen dengan ketinggian berbeda untuk menunjukkan distribusi data. Sumbu horizontal mewakili jenis data, sedangkan sumbu vertikal mewakili distribusi data.

Konfigurasikan komponen

Anda dapat menggunakan salah satu metode berikut untuk mengonfigurasi komponen Histogram (Beberapa Kolom).

Metode 1: Konfigurasikan komponen di halaman pipeline

Di halaman Pipeline Designer, cari Histogram (Multiple Columns) di panel sebelah kiri. Seret ke dalam kanvas, hubungkan dengan node upstream, lalu klik komponen tersebut untuk mengonfigurasi parameter.

Tab

Parameter

Deskripsi

Pengaturan Bidang

Pilih Kolom

Pilih kolom yang akan dianalisis. Hanya tipe DOUBLE dan BIGINT yang didukung. Maksimal 1.024 kolom didukung.

Pengaturan Parameter

Interval

Jumlah interval ke dalam mana data dibagi.

Tuning

Cores

Jumlah core yang digunakan dalam komputasi. Nilainya harus bilangan bulat positif. Secara default, nilai dipilih secara otomatis.

Ukuran Memori per Core

Ukuran memori setiap core. Nilai valid: 1 hingga 65536. Unit: MB. Secara default, nilai dipilih secara otomatis.

Setelah node dijalankan, klik kanan node dan pilih Visual Analysis atau View Data untuk melihat outputnya.

Metode 2: Gunakan perintah PAI

Konfigurasikan parameter komponen dengan menggunakan komponen SQL Script untuk memanggil perintah PAI. Untuk informasi lebih lanjut, lihat SQL Script.

PAI -name histogram
      -project algo_public
      -DinputTableName=maple_histogram_1to20_input
      -DoutputTableName=maple_histogram_1to20_output
      -DselectedColNames=col0,col1 -DintervalNum=20;

Parameter

Diperlukan

Deskripsi

Nilai default

inputTableName

Ya

Nama tabel input.

Tidak ada nilai default

inputTablePartitions

Tidak

Partisi yang dipilih dari tabel input untuk pelatihan. Format berikut didukung:

  • Partition_name=value

  • name1=value1/name2=value2: partisi multi-level

null

Jika Anda menentukan beberapa partisi, pisahkan mereka dengan koma (,).

Tidak ada nilai default

outputTableName

Ya

Nama tabel output.

Tidak ada nilai default

selectedColNames

Ya

Nama kolom yang dipilih dari tabel input untuk pelatihan. Pisahkan nama kolom ganda dengan koma (,). Tipe INT dan DOUBLE didukung.

Maksimal 1.024 kolom didukung.

Tidak ada nilai default

intervalNum

Tidak

Jumlah interval ke dalam mana data dibagi.

100

lifecycle

Tidak

Siklus hidup tabel.

Tidak ada nilai default

coreNum

Tidak

Jumlah core yang digunakan dalam komputasi. Nilainya harus bilangan bulat positif. Nilai valid: [1,9999].

Dipilih secara otomatis oleh sistem

memSizePerCore

Tidak

Ukuran memori setiap core. Nilai valid: 1 hingga 65536. Unit: MB.

Dipilih secara otomatis oleh sistem

Contoh

Contoh untuk Metode 2: Gunakan Perintah PAI.

  1. Cari SQL Script di panel sebelah kiri dan seret ke dalam kanvas.

  2. Sambungkan ke node upstream untuk mendapatkan data. Contoh data:

    Contoh data

    col0 (BIGINT)

    col1 (DOUBLE)

    1

    1.0

    2

    2.0

    3

    3.0

    4

    4.0

    5

    5.0

    6

    6.0

    7

    7.0

    8

    8.0

    9

    9.0

    10

    10.0

    11

    11.0

    12

    12.0

    13

    13.0

    14

    14.0

    15

    15.0

    16

    16.0

    17

    17.0

    18

    18.0

    19

    19.0

    20

    20.0

  3. Konfigurasikan perintah PAI berikut untuk node skrip SQL.

    PAI -name histogram -project algo_public  --Parameter default. Anda tidak perlu mengubahnya     
        -DinputTableName=maple_histogram_1to20_input  --Nama tabel input
        -DoutputTableName=maple_histogram_1to20_output  --Nama tabel output
        -DselectedColNames=col0,col1  --Kolom yang dipilih
        -DintervalNum=20;  --Jumlah interval
  4. Klik kanan node skrip SQL dan pilih Run Current Node.

    Jika node upstream belum dijalankan, jalankan mereka terlebih dahulu untuk membaca data.

  5. Lihat hasil dari tabel output. Contoh output:

    colname

    histogram

    col0

    [1, 1.95):1;[1.95, 2.9):1;[2.9, 3.85):1;[3.85, 4.8):1;[4.8, 5.75):1;[5.75, 6.7):1;[6.7, 7.65):1;[7.65, 8.6):1;[8.6, 9.55):1;[9.55, 10.5):1;[10.5, 11.45):1;[11.45, 12.4):1;[12.4, 13.35):1;[13.35, 14.3):1;[14.3, 15.25):1;[15.25, 16.2):1;[16.2, 17.15):1;[17.15, 18.1):1;[18.1, 19.05):1;[19.05, 20]:1

    col1

    [1, 1.95):1;[1.95, 2.9):1;[2.9, 3.85):1;[3.85, 4.8):1;[4.8, 5.75):1;[5.75, 6.7):1;[6.7, 7.65):1;[7.65, 8.6):1;[8.6, 9.55):1;[9.55, 10.5):1;[10.5, 11.45):1;[11.45, 12.4):1;[12.4, 13.35):1;[13.35, 14.3):1;[14.3, 15.25):1;[15.25, 16.2):1;[16.2, 17.15):1;[17.15, 18.1):1;[18.1, 19.05):1;[19.05, 20]:1