全部产品
Search
文档中心

Platform For AI:Deteksi Anomali

更新时间:Jun 22, 2025

Deteksi Anomali digunakan untuk mengidentifikasi titik data atau pola dalam kumpulan data yang menyimpang secara signifikan dari normal. Metode ini cocok untuk mendeteksi data dengan fitur kontinu atau enumerasi. Deteksi Anomali membantu pengguna mengidentifikasi potensi kesalahan, penipuan, atau pengecualian guna meningkatkan akurasi dan keandalan analisis data.

Konfigurasikan komponen

Metode 1: Konfigurasikan komponen pada halaman pipeline

Pada halaman detail pipeline di Machine Learning Designer, tambahkan komponen Deteksi Anomali ke pipeline dan konfigurasikan parameter sesuai tabel berikut.

Parameter

Deskripsi

Kolom Fitur

Tentukan kolom fitur yang ingin Anda lakukan deteksi anomali.

Metode Deteksi Anomali

Metode yang digunakan untuk mendeteksi data anomali. Nilai valid:

  • Box Plot digunakan untuk mendeteksi data dengan fitur kontinu.

  • Attribute Value Frequency (AVF) digunakan untuk mendeteksi data dengan fitur enumerasi.

Metode 2: Gunakan perintah PAI

Konfigurasikan parameter komponen menggunakan perintah Platform for AI (PAI). Anda dapat menggunakan komponen SQL Script untuk memanggil perintah PAI. Untuk informasi lebih lanjut, lihat Skenario 4: Jalankan Perintah PAI dalam Komponen Skrip SQL.

PAI -name fe_detect_runner -project algo_public
     -DselectedCols="emp_var_rate,cons_price_rate,cons_conf_idx,euribor3m,nr_employed" \
     -Dlifecycle="28"
     -DdetectStrategy="boxPlot"
     -DmodelTable="pai_temp_2458_23565_2"
     -DinputTable="pai_bank_data"
     -DoutputTable="pai_temp_2458_23565_1";

Parameter

Diperlukan

Deskripsi

inputTable

Ya

Nama tabel input.

inputTablePartitions

Tidak

Partisi dalam tabel input. Secara default, semua partisi dipilih.

  • Tentukan satu partisi dalam format partition_name=value.

  • Tentukan beberapa partisi dalam format name1=value1,name2=value2.

    null

    Pisahkan beberapa partisi dengan koma (,).

  • Tentukan partisi multi-level dalam format name1=value1/name2=value2.

selectedCols

Ya

Fitur input. Tipe data fitur tidak dibatasi.

detectStrategy

Ya

Metode deteksi. Box Plot dan AVF didukung. Box Plot digunakan untuk mendeteksi data dengan fitur kontinu. AVF digunakan untuk mendeteksi data dengan fitur enumerasi.

outputTable

Ya

Tabel output yang berisi data dengan fitur anomali.

modelTable

Ya

Model deteksi anomali.

lifecycle

Tidak

Lifecycle tabel output. Nilai default: 7.

coreNum

Tidak

Jumlah core. Parameter ini harus digunakan bersama dengan parameter memSizePerCore.

null

Nilai parameter ini harus bilangan bulat positif. Nilai valid: 1 hingga 9999.

memSizePerCore

Tidak

Ukuran memori setiap core. Unit: MB. Nilai valid: [2048,64 × 1024].