全部产品
Search
文档中心

PolarDB:Algoritma LR

更新时间:Nov 09, 2025

Topik ini menjelaskan algoritma regresi linier (LR).

Informasi latar belakang

LR adalah analisis regresi yang menggunakan fungsi kuadrat minimum dari persamaan regresi linier untuk memodelkan hubungan antara satu atau lebih variabel independen dan variabel dependen.

Skenario

LR adalah model regresi yang terutama digunakan untuk menyesuaikan nilai. Model ini sederhana tetapi sangat mudah diinterpretasikan.

LR cocok untuk menyesuaikan garis tren. Garis tren mewakili tren jangka panjang dari data deret waktu, menunjukkan apakah satu set data (seperti harga saham, GMV, dan volume penjualan) telah meningkat atau menurun selama periode waktu tertentu. Meskipun garis tren dapat digambar secara visual dengan memeriksa titik-titik data dalam sistem koordinat, penggunaan LR lebih tepat untuk menghitung posisi dan gradien garis tren.

Parameter

Nilai parameter yang dijelaskan dalam tabel berikut sama dengan parameter model_parameter yang ditentukan dalam pernyataan CREATE MODEL yang digunakan untuk membuat model. Anda dapat mengonfigurasi parameter sesuai dengan kebutuhan bisnis Anda.

Parameter

Deskripsi

epoch

Jumlah iterasi. Parameter ini biasanya merupakan bilangan bulat positif. Nilai default: -1.

Catatan

Jika parameter ini diatur ke -1, iterasi akan berlanjut hingga konvergen.

normalize

Menentukan apakah normalisasi diperlukan. Nilai valid:

  • False (default): menormalkan data sebelum pembuatan model.

  • True: tidak menormalkan data sebelum pembuatan model.

Contoh

Buat model LR.

/*polar4ai*/CREATE MODEL linearreg1 WITH
( model_class = 'linearreg', x_cols = 'dx1,dx2', y_cols='y',
 model_parameter=(epoch=3)) AS (SELECT * FROM db4ai.testdata1);

Evaluasi model.

/*polar4ai*/SELECT dx1,dx2 FROM EVALUATE(MODEL linearreg1, 
SELECT * FROM db4ai.testdata1 LIMIT 10) WITH 
(x_cols = 'dx1,dx2',y_cols='y',metrics='r2_score');

Gunakan model untuk prediksi.

/*polar4ai*/SELECT dx1,dx2 FROM
PREDICT(MODEL linearreg1, SELECT * FROM db4ai.testdata1 LIMIT 10)
WITH (x_cols = 'dx1,dx2');
Catatan

Tipe data dari x_cols dan y_cols harus berupa bilangan titik mengambang atau bilangan bulat.