全部产品
Search
文档中心

:Normalisasi

更新时间:Jun 26, 2025

Fungsi fitur

Bidang yang direferensikan dalam parameter fungsi fitur harus dikonfigurasi sebagai bidang indeks atau atribut, sesuai dengan deskripsi setiap fungsi.

Bidang yang direferensikan dalam parameter fungsi fitur harus dikonfigurasi sebagai bidang indeks atau atribut sesuai dengan deskripsi setiap fungsi.

normalisasi: menormalkan skor dalam rentang nilai yang berbeda menjadi nilai numerik dalam rentang [0,1]

1. Ikhtisar skenario

Relevansi dokumen dihitung dari berbagai dimensi. Skor yang dihitung dari dimensi yang berbeda mungkin memiliki rentang nilai yang berbeda. Misalnya, sebuah halaman web bisa memiliki jutaan klik, sementara skor relevansi teks halaman tersebut adalah nilai antara 0 hingga 1. Nilai-nilai ini tidak dapat dibandingkan karena berada dalam rentang yang berbeda. Fungsi normalisasi digunakan untuk menormalkan skor dalam rentang nilai yang berbeda ke skor dalam rentang nilai yang sama, sehingga memungkinkan penggunaan skor yang dinormalisasi untuk perhitungan lebih lanjut. Fungsi normalisasi mendukung tiga metode: normalisasi linier, logaritmik, dan arctangent. Metode yang dipilih bergantung pada parameter input. Jika hanya parameter value yang disetel, fungsi normalisasi menggunakan metode arctangent. Jika parameter value dan max disetel, fungsi normalisasi menggunakan metode logaritmik. Jika semua parameter value, max, dan min disetel, fungsi normalisasi menggunakan metode linier.

2. Sintaksis

normalize(value, max, min)

3. Parameter

  • value: Bidang dalam dokumen atau ekspresi yang ingin dinormalisasi nilainya atau nilai pengembaliannya. Tipe data harus DOUBLE.

  • max: Nilai maksimum dari rentang nilai setelah normalisasi. Parameter ini opsional. Tipe data harus DOUBLE.

  • min: Nilai minimum dari rentang nilai setelah normalisasi. Parameter ini opsional. Tipe data harus DOUBLE.

4. Nilai pengembalian

Nilai pengembalian bertipe DOUBLE dengan rentang valid [0,1].

5. Skenario

Skenario 1: Anda ingin menormalkan nilai bidang harga tetapi tidak mengetahui rentang nilai bidang tersebut. Dalam hal ini, gunakan fungsi normalisasi dalam format berikut: normalize(price).

Skenario 2: Anda ingin menormalkan nilai bidang harga dan hanya mengetahui nilai maksimum dalam rentang nilai bidang tersebut. Dalam hal ini, gunakan fungsi normalisasi dalam format berikut: normalize(price, 100).

Skenario 3: Anda ingin menormalkan nilai bidang harga dengan nilai maksimum dan minimum sebesar 100 dan 1. Dalam hal ini, gunakan fungsi normalisasi dalam format berikut: normalize(price, 100, 1).

Skenario 4: Anda ingin menormalkan nilai pengembalian fungsi distance menjadi nilai dalam rentang 0 hingga 1. Dalam hal ini, gunakan fungsi normalisasi dalam format berikut: normalize(distance(longitude_in_doc, latitude_in_doc, longtitude_in_query, latitude_in_query)).

6. Catatan penggunaan:

  • Bidang yang direferensikan dalam fungsi harus disetel sebagai bidang atribut.

  • Jika fungsi arctangent digunakan untuk normalisasi dan nilai bidang atau nilai pengembalian ekspresi yang ditentukan kurang dari 0, nilai pengembalian fungsi normalisasi adalah 0.

  • Jika fungsi logaritmik digunakan untuk normalisasi, nilai parameter max harus lebih besar dari 1.

  • Jika fungsi linier digunakan untuk normalisasi, nilai parameter max harus lebih besar dari nilai parameter min.