Komponen Linear Model Feature Importance digunakan untuk menghitung pentingnya fitur pada model linier, seperti regresi linier dan regresi logistik untuk klasifikasi biner. Format data jarang dan padat didukung. Topik ini menjelaskan cara mengonfigurasi komponen Linear Model Feature Importance.
Batasan
Komponen Linear Model Feature Importance hanya dapat digunakan berdasarkan sumber daya komputasi MaxCompute.
Konfigurasikan komponen
Anda dapat mengonfigurasi komponen dengan salah satu metode berikut:
Metode 1: Konfigurasikan komponen di konsol Platform for AI (PAI)
Konfigurasikan parameter komponen di Machine Learning Designer. Tabel berikut menjelaskan parameter tersebut.
Tab | Parameter | Deskripsi |
Fields Setting | Feature Columns | Pilih kolom fitur untuk pelatihan dari tabel input. Opsional. Secara default, semua kolom kecuali kolom label dipilih. |
Target Column | Wajib. Kolom label. Klik Select Fields. Di kotak dialog Pilih Kolom, masukkan kata kunci kolom yang ingin Anda cari. Pilih kolom dan klik OK. | |
Input Sparse Format Data | Opsional. Menentukan apakah data dalam tabel input bersifat jarang. | |
Tuning | Cores | Opsional. Jumlah inti yang digunakan dalam komputasi. |
Memory Size per Core | Opsional. Ukuran memori setiap inti. Unit: MB. |
Metode 2: Gunakan perintah PAI
Konfigurasikan parameter komponen menggunakan perintah PAI. Bagian berikut menjelaskan parameter tersebut. Anda dapat menggunakan komponen SQL Script untuk memanggil perintah PAI. Untuk informasi lebih lanjut, lihat SQL Script.
PAI -name regression_feature_importance -project algo_public
-DmodelName=xlab_m_logisticregressi_20317_v0
-DoutputTableName=pai_temp_2252_20321_1
-DlabelColName=y
-DfeatureColNames=pdays,previous,emp_var_rate,cons_price_idx,cons_conf_idx,euribor3m,nr_employed,age,campaign
-DenableSparse=false -DinputTableName=pai_dense_10_9;Parameter | Wajib | Deskripsi | Nilai Default |
inputTableName | Ya | Nama tabel input. | Tidak ada |
outputTableName | Ya | Nama tabel output. | Tidak ada |
labelColName | Ya | Kolom label yang dipilih dari tabel input. | Tidak ada |
modelName | Ya | Nama model input. | Tidak ada |
featureColNames | Tidak | Kolom fitur yang dipilih dari tabel input. | Semua kolom selain kolom label |
inputTablePartitions | Tidak | Partisi yang dipilih dari tabel input. | Tabel lengkap |
enableSparse | Tidak | Menentukan apakah data dalam tabel input bersifat jarang. | false |
itemDelimiter | Tidak | Pemisah yang digunakan untuk memisahkan pasangan nilai-kunci ketika data dalam tabel input bersifat jarang. | Spasi |
kvDelimiter | Tidak | Pemisah yang digunakan untuk memisahkan kunci dan nilai ketika data dalam tabel input bersifat jarang. | Titik dua (:) |
lifecycle | Tidak | Daur hidup tabel output. | Tidak ditentukan |
coreNum | Tidak | Jumlah inti. | Ditentukan oleh sistem |
memSizePerCore | Tidak | Ukuran memori setiap inti. | Ditentukan oleh sistem |
Contoh
Buat tabel bernama bank_data dan impor data ke dalam tabel tersebut. Untuk informasi lebih lanjut, lihat Buat Tabel dan Impor Data ke Tabel.
Eksekusi pernyataan SQL berikut untuk menghasilkan data pelatihan:
create table if not exists pai_dense_10_9 as select age,campaign,pdays, previous, emp_var_rate, cons_price_idx, cons_conf_idx, euribor3m, nr_employed, fixed_deposit from bank_data limit 10;Buat pipeline seperti yang ditunjukkan pada gambar berikut dan jalankan komponen. Untuk informasi lebih lanjut, lihat Pemodelan Algoritma.

Di daftar komponen di sebelah kiri Machine Learning Designer, cari secara terpisah komponen Read Table, Logistic Regression for Multiclass Classification, dan Linear Model Feature Importance, lalu seret komponen-komponen tersebut ke kanvas di sebelah kanan.
Hubungkan node dengan menggambar garis untuk mengatur node menjadi pipeline yang mencakup hubungan hulu dan hilir sesuai gambar sebelumnya.
Konfigurasikan parameter komponen.
Di kanvas, klik komponen Read Table-1. Di tab Select Table di panel kanan, atur Table Name menjadi bank_data.
Di kanvas, klik komponen Logistic Regression for Multiclass Classification-1. Di tab Fields Setting, pilih age, campaign, pdays, previous, emp_var_rate, cons_price_idx, cons_conf_idx, euribor3m, dan nr_installed sebagai parameter Training Feature Columns. Atur parameter Target Columns menjadi fixed_deposit. Pertahankan nilai default untuk parameter lainnya.
Di kanvas, klik komponen Linear Model Feature Importance-1. Di tab Fields Setting, atur parameter Target Column menjadi fixed_deposit. Pertahankan nilai default untuk parameter lainnya.
Setelah konfigurasi parameter selesai, klik tombol
untuk menjalankan pipeline.
Setelah pipeline dijalankan, klik kanan komponen Linear Model Feature Importance-1 dan pilih .

Tabel berikut menjelaskan rumus perhitungan untuk metrik.
Nama kolom
Rumus
weight
abs(w_)
importance
abs(w_j) * STD(f_i)
Catatanabs(w_j) menunjukkan nilai absolut koefisien fitur. STD(f_i) menunjukkan deviasi standar data pelatihan.
Klik kanan komponen Linear Model Feature Importance-1 dan pilih View Analytics Report untuk melihat laporan analisis data visual.

Referensi
Untuk informasi lebih lanjut tentang komponen yang disediakan oleh Machine Learning Designer, lihat Ikhtisar Machine Learning Designer.
Machine Learning Designer menyediakan berbagai komponen algoritma preset. Anda dapat menggunakan komponen tersebut untuk memproses data sesuai kebutuhan bisnis Anda. Untuk informasi lebih lanjut, lihat Ikhtisar Komponen Designer.