Indeks Stabilitas Populasi (PSI) adalah metrik statistik yang digunakan untuk menilai perbedaan antara dua distribusi sampel. Metrik ini umumnya digunakan untuk memantau stabilitas kinerja model di berbagai waktu atau lingkungan. Dengan mengukur perbedaan distribusi antara dua sampel, PSI dapat membantu mengidentifikasi potensi pergeseran atau deviasi data, memberikan dasar untuk pemeliharaan dan pembaruan model.
Informasi latar belakang
PSI adalah metrik umum yang digunakan untuk mengukur stabilitas sampel. Sebagai contoh, Anda dapat menggunakannya untuk mengevaluasi apakah perubahan dalam populasi selama dua bulan stabil. Nilai PSI kurang dari 0,1 menunjukkan perubahan tidak signifikan. Nilai PSI antara 0,1 hingga 0,25 menunjukkan perubahan kecil. Nilai PSI lebih dari 0,25 menunjukkan perubahan besar.
Jika perubahan dalam populasi dari waktu ke waktu tidak stabil, Anda dapat menggunakan grafik untuk mengidentifikasi perubahan tersebut. Lakukan pengelompokan pada variabel, hitung jumlah dan proporsi sampel dalam setiap kelompok, lalu sajikan statistik dalam diagram kolom. Gambar berikut menunjukkan contoh grafik.
Metode ini dapat menunjukkan secara langsung apakah suatu variabel dalam dua sampel berubah secara signifikan. Namun, pergeseran dalam perubahan tersebut tidak dapat diukur dengan metode ini, sehingga stabilitas populasi tidak dapat dipantau secara otomatis. Untuk mengatasi masalah ini, gunakan komponen Indeks Stabilitas Populasi. Gambar berikut menunjukkan rumus untuk menghitung nilai PSI. 
Konfigurasikan komponen
Anda dapat menggunakan salah satu metode berikut untuk mengonfigurasi komponen Indeks Stabilitas Populasi.
Metode 1: Konfigurasikan komponen pada halaman pipeline
Anda dapat mengonfigurasi parameter komponen Indeks Stabilitas Populasi pada halaman pipeline Machine Learning Designer dari Platform for AI (PAI). Machine Learning Designer sebelumnya dikenal sebagai Machine Learning Studio. Tabel berikut menjelaskan parameter-parameter tersebut.
Tab | Parameter | Deskripsi |
Fields Setting | Features for PSI Calculation | Kolom fitur yang diperlukan untuk perhitungan nilai PSI. |
Tuning | Cores | Jumlah core CPU yang diperlukan. Secara default, sistem menentukan nilainya. |
Memory Size | Ukuran memori untuk setiap core CPU. Secara default, sistem menentukan nilainya. |
Metode 2: Gunakan perintah PAI
Konfigurasikan parameter komponen menggunakan perintah PAI. Anda dapat menggunakan komponen SQL Script untuk memanggil perintah PAI. Untuk informasi lebih lanjut, lihat SQL Script.
PAI -name psi
-project algo_public
-DinputBaseTableName=psi_base_table
-DinputTestTableName=psi_test_table
-DoutputTableName=psi_bin_table
-DinputBinTableName=pai_index_table
-DfeatureColNames=fea1,fea2,fea3
-Dlifecycle=7Parameter | Deskripsi | Diperlukan | Nilai default |
inputBaseTableName | Nama tabel dasar. Pergeseran populasi dihitung berdasarkan sampel dalam tabel dasar dan tabel uji. | Ya | Tidak ada nilai default |
inputBaseTablePartitions | Partisi yang dipilih dari tabel dasar. | Tidak | Tabel lengkap |
inputTestTableName | Nama tabel uji. Pergeseran populasi dihitung berdasarkan sampel dalam tabel dasar dan tabel uji. | Ya | Tidak ada nilai default |
inputTestTablePartitions | Partisi yang dipilih dari tabel uji. | Tidak | Tabel lengkap |
inputBinTableName | Nama tabel hasil pengelompokan. | Ya | Tidak ada nilai default |
featureColNames | Kolom fitur yang diperlukan untuk perhitungan nilai PSI. | Tidak | Tabel lengkap |
outputTableName | Nama tabel output. | Ya | Tidak ada nilai default |
lifecycle | Siklus hidup tabel output. | Tidak | Tidak ada nilai default |
coreNum | Jumlah core CPU yang diperlukan. | Tidak | Ditentukan oleh sistem |
memSizePerCore | Ukuran memori untuk setiap core CPU. Satuan: MB. | Tidak | Ditentukan oleh sistem |
Contoh
Gunakan komponen Pengelompokan untuk melakukan pengelompokan pada fitur. Kemudian, hubungkan komponen Indeks Stabilitas Populasi ke dua dataset sampel yang ingin dibandingkan dan komponen Pengelompokan, seperti yang ditunjukkan pada gambar berikut. Tentukan parameter Features for PSI Calculation.

Gambar berikut menunjukkan hasil perhitungan komponen Indeks Stabilitas Populasi. 