All Products
Search
Document Center

Platform For AI:Linear model feature importance

Last Updated:Apr 01, 2026

Komponen Linear Model Feature Importance menghitung skor pentingnya fitur untuk model linier, termasuk regresi linier dan regresi logistik untuk klasifikasi biner. Komponen ini mendukung format data masukan sparse maupun dense.

Gunakan komponen ini untuk mengidentifikasi fitur yang paling berkontribusi terhadap prediksi model—langkah kunci dalam debugging model, pemilihan fitur, dan membangun kepercayaan terhadap perilaku model.

Batasan

Komponen ini hanya dapat dijalankan pada sumber daya komputasi MaxCompute.

Prasyarat

Sebelum memulai, pastikan Anda telah memiliki:

  • Model linier yang telah dilatih (regresi linier atau regresi logistik untuk klasifikasi biner)

  • Tabel input di MaxCompute yang berisi kolom fitur dan kolom label

Konfigurasi komponen

Konfigurasikan komponen menggunakan salah satu metode berikut.

Metode 1: Konsol PAI (Machine Learning Designer)

Atur parameter pada tab Fields Setting dan tab Tuning di Machine Learning Designer.

Fields Setting

ParameterWajibDeskripsiBawaan
Feature columnsTidakKolom fitur untuk pelatihan dari tabel inputSemua kolom kecuali kolom label
Target columnYaKolom label. Klik Select fields, cari kolom berdasarkan kata kunci, pilih kolom tersebut, lalu klik OK.
Input sparse format dataTidakMenentukan apakah data input dalam format sparse

Tuning tab

ParameterWajibDeskripsiBawaan
CoresTidakJumlah core untuk komputasiDitentukan oleh sistem
Memory size per coreTidakMemori yang dialokasikan untuk setiap core, dalam MBDitentukan oleh sistem

Metode 2: Perintah PAI

Jalankan komponen menggunakan perintah PAI. Gunakan komponen SQL Script untuk memanggil perintah PAI. Untuk informasi selengkapnya, lihat SQL Script.

PAI -name regression_feature_importance -project algo_public
    -DmodelName=xlab_m_logisticregressi_20317_v0
    -DoutputTableName=pai_temp_2252_20321_1
    -DlabelColName=y
    -DfeatureColNames=pdays,previous,emp_var_rate,cons_price_idx,cons_conf_idx,euribor3m,nr_employed,age,campaign
    -DenableSparse=false -DinputTableName=pai_dense_10_9;
ParameterWajibDeskripsiBawaan
inputTableNameYaNama tabel inputTidak ada
outputTableNameYaNama tabel outputTidak ada
labelColNameYaKolom label dari tabel inputTidak ada
modelNameYaNama model inputTidak ada
featureColNamesTidakKolom fitur dari tabel inputSemua kolom kecuali kolom label
inputTablePartitionsTidakPartisi yang akan dibaca dari tabel inputSeluruh tabel
enableSparseTidakMenentukan apakah data input dalam format sparsefalse
itemDelimiterTidakPembatas antar pasangan kunci-nilai dalam data sparseSpasi
kvDelimiterTidakPembatas antara kunci dan nilai dalam data sparseTitik dua (:)
lifecycleTidakSiklus hidup tabel outputTidak ditentukan
coreNumTidakJumlah coreDitentukan oleh sistem
memSizePerCoreTidakUkuran memori per coreDitentukan oleh sistem

Contoh

Contoh ini menggunakan set data bank_data untuk melatih model regresi logistik, lalu menghitung skor pentingnya fitur.

  1. Buat tabel bernama bank_data dan impor data. Untuk informasi selengkapnya, lihat Buat tabel dan Impor data ke tabel.

  2. Jalankan Pernyataan SQL berikut untuk menghasilkan data pelatihan:

    CREATE TABLE IF NOT EXISTS pai_dense_10_9 AS
    SELECT
        age, campaign, pdays, previous, emp_var_rate,
        cons_price_idx, cons_conf_idx, euribor3m, nr_employed, fixed_deposit
    FROM bank_data LIMIT 10;
  3. Buat dan jalankan pipeline di Machine Learning Designer. Untuk informasi selengkapnya tentang pembuatan pipeline, lihat Pemodelan algoritma.image

    1. Pada daftar komponen, cari dan seret tiga komponen berikut ke kanvas: Read Table, Logistic Regression for Multiclass Classification, dan Linear Model Feature Importance.

    2. Sambungkan komponen sesuai urutan yang ditunjukkan pada gambar di atas.

    3. Konfigurasikan setiap komponen:

      • Klik Read Table-1. Pada tab Select table, atur Table name menjadi bank_data.

      • Klik Logistic Regression for Multiclass Classification-1. Pada tab Fields Setting, atur Training feature columns menjadi age, campaign, pdays, previous, emp_var_rate, cons_price_idx, cons_conf_idx, euribor3m, dan nr_installed. Atur Target column menjadi fixed_deposit.

      • Klik Linear Model Feature Importance-1. Pada tab Fields Setting, atur Target column menjadi fixed_deposit.

    4. Klik image untuk menjalankan pipeline.

  4. Setelah pipeline selesai, klik kanan Linear Model Feature Importance-1 dan pilih View data > Model importance table.image Tabel output berisi dua kolom:

    KolomRumusApa yang diukur
    weightabs(w_)Nilai absolut koefisien fitur
    importanceabs(w_j) × STD(f_i)Koefisien yang diskalakan berdasarkan deviasi standar fitur (deviasi standar dari data pelatihan)
  5. Klik kanan Linear Model Feature Importance-1 dan pilih View analytics report untuk melihat peringkat pentingnya fitur dalam bentuk visualisasi.image

Langkah berikutnya

Referensi