全部产品
Search
文档中心

Platform For AI:Indeks Stabilitas Populasi

更新时间:Jul 02, 2025

Indeks Stabilitas Populasi (PSI) adalah metrik statistik yang digunakan untuk menilai perbedaan antara dua distribusi sampel. Metrik ini umumnya digunakan untuk memantau stabilitas kinerja model di berbagai waktu atau lingkungan. Dengan mengukur perbedaan distribusi antara dua sampel, PSI dapat membantu mengidentifikasi potensi pergeseran atau deviasi data, memberikan dasar untuk pemeliharaan dan pembaruan model.

Informasi latar belakang

PSI adalah metrik umum yang digunakan untuk mengukur stabilitas sampel. Sebagai contoh, Anda dapat menggunakannya untuk mengevaluasi apakah perubahan dalam populasi selama dua bulan stabil. Nilai PSI kurang dari 0,1 menunjukkan perubahan tidak signifikan. Nilai PSI antara 0,1 hingga 0,25 menunjukkan perubahan kecil. Nilai PSI lebih dari 0,25 menunjukkan perubahan besar.

Jika perubahan dalam populasi dari waktu ke waktu tidak stabil, Anda dapat menggunakan grafik untuk mengidentifikasi perubahan tersebut. Lakukan pengelompokan pada variabel, hitung jumlah dan proporsi sampel dalam setiap kelompok, lalu sajikan statistik dalam diagram kolom. Gambar berikut menunjukkan contoh grafik. Column chartMetode ini dapat menunjukkan secara langsung apakah suatu variabel dalam dua sampel berubah secara signifikan. Namun, pergeseran dalam perubahan tersebut tidak dapat diukur dengan metode ini, sehingga stabilitas populasi tidak dapat dipantau secara otomatis. Untuk mengatasi masalah ini, gunakan komponen Indeks Stabilitas Populasi. Gambar berikut menunjukkan rumus untuk menghitung nilai PSI. PSI calculation formula

Konfigurasikan komponen

Anda dapat menggunakan salah satu metode berikut untuk mengonfigurasi komponen Indeks Stabilitas Populasi.

Metode 1: Konfigurasikan komponen pada halaman pipeline

Anda dapat mengonfigurasi parameter komponen Indeks Stabilitas Populasi pada halaman pipeline Machine Learning Designer dari Platform for AI (PAI). Machine Learning Designer sebelumnya dikenal sebagai Machine Learning Studio. Tabel berikut menjelaskan parameter-parameter tersebut.

Tab

Parameter

Deskripsi

Fields Setting

Features for PSI Calculation

Kolom fitur yang diperlukan untuk perhitungan nilai PSI.

Tuning

Cores

Jumlah core CPU yang diperlukan. Secara default, sistem menentukan nilainya.

Memory Size

Ukuran memori untuk setiap core CPU. Secara default, sistem menentukan nilainya.

Metode 2: Gunakan perintah PAI

Konfigurasikan parameter komponen menggunakan perintah PAI. Anda dapat menggunakan komponen SQL Script untuk memanggil perintah PAI. Untuk informasi lebih lanjut, lihat SQL Script.

PAI -name psi
-project algo_public
-DinputBaseTableName=psi_base_table
-DinputTestTableName=psi_test_table
-DoutputTableName=psi_bin_table
-DinputBinTableName=pai_index_table
-DfeatureColNames=fea1,fea2,fea3
-Dlifecycle=7

Parameter

Deskripsi

Diperlukan

Nilai default

inputBaseTableName

Nama tabel dasar. Pergeseran populasi dihitung berdasarkan sampel dalam tabel dasar dan tabel uji.

Ya

Tidak ada nilai default

inputBaseTablePartitions

Partisi yang dipilih dari tabel dasar.

Tidak

Tabel lengkap

inputTestTableName

Nama tabel uji. Pergeseran populasi dihitung berdasarkan sampel dalam tabel dasar dan tabel uji.

Ya

Tidak ada nilai default

inputTestTablePartitions

Partisi yang dipilih dari tabel uji.

Tidak

Tabel lengkap

inputBinTableName

Nama tabel hasil pengelompokan.

Ya

Tidak ada nilai default

featureColNames

Kolom fitur yang diperlukan untuk perhitungan nilai PSI.

Tidak

Tabel lengkap

outputTableName

Nama tabel output.

Ya

Tidak ada nilai default

lifecycle

Siklus hidup tabel output.

Tidak

Tidak ada nilai default

coreNum

Jumlah core CPU yang diperlukan.

Tidak

Ditentukan oleh sistem

memSizePerCore

Ukuran memori untuk setiap core CPU. Satuan: MB.

Tidak

Ditentukan oleh sistem

Contoh

Gunakan komponen Pengelompokan untuk melakukan pengelompokan pada fitur. Kemudian, hubungkan komponen Indeks Stabilitas Populasi ke dua dataset sampel yang ingin dibandingkan dan komponen Pengelompokan, seperti yang ditunjukkan pada gambar berikut. Tentukan parameter Features for PSI Calculation.

image

Gambar berikut menunjukkan hasil perhitungan komponen Indeks Stabilitas Populasi. Calculation results