全部产品
Search
文档中心

Platform For AI:Linear Model Feature Importance

更新时间:Jul 06, 2025

Komponen Linear Model Feature Importance digunakan untuk menghitung pentingnya fitur pada model linier, seperti regresi linier dan regresi logistik untuk klasifikasi biner. Format data jarang dan padat didukung. Topik ini menjelaskan cara mengonfigurasi komponen Linear Model Feature Importance.

Batasan

Komponen Linear Model Feature Importance hanya dapat digunakan berdasarkan sumber daya komputasi MaxCompute.

Konfigurasikan komponen

Anda dapat mengonfigurasi komponen dengan salah satu metode berikut:

Metode 1: Konfigurasikan komponen di konsol Platform for AI (PAI)

Konfigurasikan parameter komponen di Machine Learning Designer. Tabel berikut menjelaskan parameter tersebut.

Tab

Parameter

Deskripsi

Fields Setting

Feature Columns

Pilih kolom fitur untuk pelatihan dari tabel input. Opsional. Secara default, semua kolom kecuali kolom label dipilih.

Target Column

Wajib. Kolom label. Klik Select Fields. Di kotak dialog Pilih Kolom, masukkan kata kunci kolom yang ingin Anda cari. Pilih kolom dan klik OK.

Input Sparse Format Data

Opsional. Menentukan apakah data dalam tabel input bersifat jarang.

Tuning

Cores

Opsional. Jumlah inti yang digunakan dalam komputasi.

Memory Size per Core

Opsional. Ukuran memori setiap inti. Unit: MB.

Metode 2: Gunakan perintah PAI

Konfigurasikan parameter komponen menggunakan perintah PAI. Bagian berikut menjelaskan parameter tersebut. Anda dapat menggunakan komponen SQL Script untuk memanggil perintah PAI. Untuk informasi lebih lanjut, lihat SQL Script.

PAI -name regression_feature_importance -project algo_public
    -DmodelName=xlab_m_logisticregressi_20317_v0
    -DoutputTableName=pai_temp_2252_20321_1
    -DlabelColName=y
    -DfeatureColNames=pdays,previous,emp_var_rate,cons_price_idx,cons_conf_idx,euribor3m,nr_employed,age,campaign
    -DenableSparse=false -DinputTableName=pai_dense_10_9;

Parameter

Wajib

Deskripsi

Nilai Default

inputTableName

Ya

Nama tabel input.

Tidak ada

outputTableName

Ya

Nama tabel output.

Tidak ada

labelColName

Ya

Kolom label yang dipilih dari tabel input.

Tidak ada

modelName

Ya

Nama model input.

Tidak ada

featureColNames

Tidak

Kolom fitur yang dipilih dari tabel input.

Semua kolom selain kolom label

inputTablePartitions

Tidak

Partisi yang dipilih dari tabel input.

Tabel lengkap

enableSparse

Tidak

Menentukan apakah data dalam tabel input bersifat jarang.

false

itemDelimiter

Tidak

Pemisah yang digunakan untuk memisahkan pasangan nilai-kunci ketika data dalam tabel input bersifat jarang.

Spasi

kvDelimiter

Tidak

Pemisah yang digunakan untuk memisahkan kunci dan nilai ketika data dalam tabel input bersifat jarang.

Titik dua (:)

lifecycle

Tidak

Daur hidup tabel output.

Tidak ditentukan

coreNum

Tidak

Jumlah inti.

Ditentukan oleh sistem

memSizePerCore

Tidak

Ukuran memori setiap inti.

Ditentukan oleh sistem

Contoh

  1. Buat tabel bernama bank_data dan impor data ke dalam tabel tersebut. Untuk informasi lebih lanjut, lihat Buat Tabel dan Impor Data ke Tabel.

  2. Eksekusi pernyataan SQL berikut untuk menghasilkan data pelatihan:

    create table if not exists pai_dense_10_9 as
    select
        age,campaign,pdays, previous, emp_var_rate, cons_price_idx, cons_conf_idx, euribor3m, nr_employed, fixed_deposit
    from  bank_data limit 10;
  3. Buat pipeline seperti yang ditunjukkan pada gambar berikut dan jalankan komponen. Untuk informasi lebih lanjut, lihat Pemodelan Algoritma.image

    1. Di daftar komponen di sebelah kiri Machine Learning Designer, cari secara terpisah komponen Read Table, Logistic Regression for Multiclass Classification, dan Linear Model Feature Importance, lalu seret komponen-komponen tersebut ke kanvas di sebelah kanan.

    2. Hubungkan node dengan menggambar garis untuk mengatur node menjadi pipeline yang mencakup hubungan hulu dan hilir sesuai gambar sebelumnya.

    3. Konfigurasikan parameter komponen.

      • Di kanvas, klik komponen Read Table-1. Di tab Select Table di panel kanan, atur Table Name menjadi bank_data.

      • Di kanvas, klik komponen Logistic Regression for Multiclass Classification-1. Di tab Fields Setting, pilih age, campaign, pdays, previous, emp_var_rate, cons_price_idx, cons_conf_idx, euribor3m, dan nr_installed sebagai parameter Training Feature Columns. Atur parameter Target Columns menjadi fixed_deposit. Pertahankan nilai default untuk parameter lainnya.

      • Di kanvas, klik komponen Linear Model Feature Importance-1. Di tab Fields Setting, atur parameter Target Column menjadi fixed_deposit. Pertahankan nilai default untuk parameter lainnya.

    4. Setelah konfigurasi parameter selesai, klik tombol image untuk menjalankan pipeline.

  4. Setelah pipeline dijalankan, klik kanan komponen Linear Model Feature Importance-1 dan pilih View Data > Model Importance Table.image

    Tabel berikut menjelaskan rumus perhitungan untuk metrik.

    Nama kolom

    Rumus

    weight

    abs(w_)

    importance

    abs(w_j) * STD(f_i)

    Catatan

    abs(w_j) menunjukkan nilai absolut koefisien fitur. STD(f_i) menunjukkan deviasi standar data pelatihan.

  5. Klik kanan komponen Linear Model Feature Importance-1 dan pilih View Analytics Report untuk melihat laporan analisis data visual.image

Referensi

  • Untuk informasi lebih lanjut tentang komponen yang disediakan oleh Machine Learning Designer, lihat Ikhtisar Machine Learning Designer.

  • Machine Learning Designer menyediakan berbagai komponen algoritma preset. Anda dapat menggunakan komponen tersebut untuk memproses data sesuai kebutuhan bisnis Anda. Untuk informasi lebih lanjut, lihat Ikhtisar Komponen Designer.