Manfaat mengunggah data perilaku ke OpenSearch
Anda dapat menggunakan data perilaku untuk memahami reaksi pengguna terhadap hasil pencarian, seperti melihat, mengklik, berdiam, menyukai, membagikan, menambahkan ke favorit, dan membeli. Hal ini memberikan panduan untuk mengoptimalkan efek pencarian.
Fitur statistik laporan OpenSearch memungkinkan Anda melihat berbagai laporan pencarian untuk aplikasi, seperti laporan jumlah tampilan halaman (PV), jumlah tampilan halaman item (IPV), dan tingkat klik (CTR). Laporan tersebut dapat membantu meningkatkan operasi bisnis Anda.
OpenSearch menyediakan platform algoritma yang memungkinkan Anda menggunakan data umpan balik perilaku pencarian untuk melatih model algoritma pencarian dan pengurutan. Ini membantu meningkatkan efektivitas pencarian.
Catatan Penggunaan
Fitur pengumpulan data diaktifkan secara otomatis setelah aplikasi dibuat.
Data merujuk pada umpan balik dari reaksi pengguna terhadap hasil pencarian.
Pengumpulan merujuk pada proses mengunggah data perilaku pencarian ke OpenSearch dengan menggunakan SDK OpenSearch. Pada versi terbaru, OpenSearch hanya mendukung pengumpulan data perilaku pencarian melalui SDK server. Fitur pengumpulan data perilaku pencarian melalui SDK seluler atau web sedang dalam pengembangan.
Dibandingkan dengan fitur pengumpulan data sebelumnya, fitur pengumpulan data V2.0 memungkinkan Anda mengoper parameter dan menggunakan SDK dengan lebih mudah. Jika Anda baru mengenal OpenSearch, Anda dapat menggunakan SDK OpenSearch untuk mengunggah data perilaku sesuai dengan bidang-bidang yang dijelaskan dalam topik ini. Catatan: SDK untuk Java 3.4.0 dan SDK untuk PHP 3.2.0 mendukung pengumpulan data V2.0.
Unggah data perilaku
Catatan: Setelah mengaktifkan fitur pengumpulan data perilaku di konsol OpenSearch, disarankan untuk mengunggah data perilaku menggunakan SDK. Bagian berikut menjelaskan bidang-bidang yang digunakan untuk mengunggah data perilaku. Deskripsi:
Untuk mengunggah data perilaku menggunakan SDK, Anda harus menentukan bidang-bidang berikut: imei atau user_id, biz_id, trace_id, rn, bhv_type, bhv_time, item_id, dan item_type.
Untuk mengunggah data perilaku dengan memanggil Operasi API, Anda juga harus menentukan bidang reach_time selain bidang-bidang sebelumnya.
Untuk informasi lebih lanjut tentang demo untuk mengunggah data perilaku menggunakan SDK atau memanggil Operasi API, lihat SDK untuk Pengumpulan Data V2.0.
Deskripsi Bidang Data Perilaku
ID | Bidang | Tipe | Deskripsi | Nilai | Wajib |
1 | app_version | STRING | Nomor versi situs web atau aplikasi seluler yang mengumpulkan data perilaku. | Tidak | |
2 | sdk_type | STRING | Jenis SDK yang digunakan untuk mengunggah data perilaku. OpenSearch menggunakan bidang ini untuk membedakan apakah data perilaku diunggah atau dikumpulkan dengan menggunakan SDK server atau SDK seluler. | Tidak. Jika Anda mengunggah data perilaku dengan menggunakan SDK OpenSearch, bidang ini diatur ke opensearch_sdk secara default. | |
3 | sdk_version | STRING | Nomor versi SDK yang digunakan untuk mengunggah data perilaku. | Tidak. Jika Anda mengunggah data perilaku dengan menggunakan SDK OpenSearch, bidang ini ditentukan secara default. | |
4 | login | STRING | Menentukan apakah pengguna telah masuk ke situs web atau aplikasi seluler yang mengumpulkan data perilaku. | Nilai valid: 0 dan 1. 0: menunjukkan bahwa pengguna belum masuk. 1: menunjukkan bahwa pengguna telah masuk. | Tidak |
5 | user_id | STRING | ID yang digunakan untuk mengidentifikasi pengguna secara unik. | Tidak. Namun, Anda harus menentukan bidang imei atau bidang user_id. | |
6 | imei | STRING | ID perangkat pengguna. Nilai valid: imei, device_id, dan idfa. | Tidak. Namun, Anda harus menentukan bidang imei atau bidang user_id. | |
7 | biz_id | STRING | ID numerik yang digunakan untuk membedakan antara layanan pencarian yang berbeda. Secara umum, bidang biz_id mewakili aplikasi OpenSearch. Anda dapat menentukan beberapa bidang biz_id untuk mewakili aplikasi web, iOS, dan Android. Bidang-bidang ini dapat digunakan untuk membagi lalu lintas dan menjalankan tes di langkah-langkah berikutnya. | Jika Anda tidak membedakan layanan pencarian, kami sarankan Anda mengatur bidang ini ke default. Jika Anda membedakan layanan pencarian, Anda dapat mengatur bidang ini ke pc, ios, atau android berdasarkan kebutuhan bisnis Anda. | Ya |
8 | trace_id | STRING | Penyedia layanan pencarian dari mana dokumen dicari dan dikumpulkan. | Jika dokumen dicari dan dikumpulkan dari OpenSearch, atur bidang ini ke Alibaba. Jika dokumen dicari dan dikumpulkan dari penyedia layanan lain, tentukan bidang ini berdasarkan kebutuhan bisnis Anda. | Ya |
9 | trace_info | STRING | Nilai bidang ini adalah nilai parameter ops_request_misc yang dikembalikan oleh OpenSearch dalam hasil pencarian. Masukkan nilai parameter ops_request_misc apa adanya. | Tidak Catatan: Anda harus memasukkan bidang ini jika bidang trace_id diatur ke Alibaba. Bidang ini digunakan untuk memeriksa apakah hasil pencarian disediakan dari OpenSearch. | |
10 | rn | STRING | Bidang ini digunakan untuk mengidentifikasi PV. Nilai bidang ini adalah nilai parameter request_id yang dikembalikan oleh OpenSearch dalam hasil pencarian. Masukkan nilai parameter request_id apa adanya. | Ya | |
11 | item_id | STRING | Nilai kunci utama dokumen. Nilai bidang ini adalah nilai kunci utama tabel utama dalam aplikasi OpenSearch. | Ya | |
12 | item_type | STRING | Jenis bisnis dokumen. | Untuk informasi lebih lanjut tentang nilai valid bidang ini, lihat bagian Deskripsi bidang item_type dari topik ini. | Ya |
13 | bhv_type | STRING | Jenis perilaku, seperti expose, dwell, browse, add to favorites, dan download. | Untuk informasi lebih lanjut tentang nilai valid bidang ini, lihat bagian Jenis perilaku umum dari topik ini. | Ya |
14 | bhv_value | STRING | Nilai yang digunakan untuk mengukur perilaku, seperti waktu berdiam dan jumlah item yang dibeli. | Untuk informasi lebih lanjut tentang nilai valid bidang ini, lihat bagian Jenis perilaku umum dari topik ini. | Tidak |
15 | bhv_time | STRING | Waktu terjadinya perilaku. Nilainya adalah timestamp UNIX yang akurat hingga detik. | Ya | |
16 | bhv_detail | STRING | Deskripsi rinci perilaku. | Format bidang ini adalah key=value{,key=value}. Nilainya dapat berisi satu atau lebih pasangan key=value. | Tidak |
17 | ip | STRING | Alamat IP ponsel atau perangkat terminal tempat perilaku terjadi. | Tidak. Namun, kami sarankan Anda menentukan bidang ini. | |
18 | longitude | STRING | Garis bujur lokasi tempat perilaku terjadi. | Tidak. Namun, kami sarankan Anda menentukan bidang ini. | |
19 | latitude | STRING | Garis lintang lokasi tempat perilaku terjadi. | Tidak. Namun, kami sarankan Anda menentukan bidang ini. | |
20 | session_id | STRING | ID sesi pengguna. | Tidak. Namun, kami sarankan Anda menentukan bidang ini. | |
21 | spm | STRING | Bidang ini digunakan untuk melacak modul halaman tempat perilaku terjadi. | Format pengkodean bidang ini adalah a.b.c.d, yang menunjukkan ID situs, ID halaman, ID modul, dan ID lokasi. | Tidak |
22 | report_src | STRING | Bidang ini digunakan untuk mengidentifikasi metode yang digunakan untuk mengunggah data perilaku. | Nilai valid: 1, 2, 3, dan patch_data.
| Tidak |
23 | mac | STRING | Alamat media access control (MAC) ponsel atau perangkat terminal yang mengumpulkan data perilaku. | Tidak | |
24 | brand | STRING | Merek ponsel atau perangkat terminal yang mengumpulkan data perilaku. | Tidak. Namun, kami sarankan Anda menentukan bidang ini. | |
25 | device_model | STRING | Model ponsel atau perangkat terminal yang mengumpulkan data perilaku. | Tidak | |
26 | resolution | STRING | Resolusi layar ponsel atau perangkat terminal yang mengumpulkan data perilaku. | Tidak | |
27 | carrier | STRING | Penyedia jaringan ponsel atau perangkat terminal yang mengumpulkan data perilaku. | Tidak | |
28 | access | STRING | Jaringan yang terhubung ke ponsel atau perangkat terminal yang mengumpulkan data perilaku. | Tidak | |
29 | access_subtype | STRING | Jenis jaringan yang terhubung ke ponsel atau perangkat terminal yang mengumpulkan data perilaku. | Tidak | |
30 | os | STRING | Sistem operasi ponsel atau perangkat terminal yang mengumpulkan data perilaku. | Tidak | |
31 | os_version | STRING | Versi sistem operasi ponsel atau perangkat terminal yang mengumpulkan data perilaku. | Tidak | |
32 | language | STRING | Bahasa yang dikonfigurasi untuk ponsel atau perangkat terminal yang mengumpulkan data perilaku. | Tidak | |
33 | phone_md5 | STRING | Nilai hash MD5 dari nomor ponsel. | Tidak | |
34 | reserve1 | STRING | Bidang cadangan. | Tidak | |
35 | reserve2 | STRING | Bidang cadangan. Jika bidang report_src diatur ke patch_data, Anda harus menyetel bidang reserve2 ke nilai bidang raw_query. | Tidak | |
36 | reach_time | BIGINT | Waktu ketika data diterima oleh server. Nilainya adalah timestamp UNIX yang akurat hingga detik. | Ya. Jika Anda mengunggah data perilaku dengan menggunakan SDK OpenSearch, bidang ini dikonfigurasi secara otomatis oleh SDK. Jika Anda mengunggah data perilaku dengan memanggil Operasi API OpenSearch, Anda harus menentukan bidang ini. |
Deskripsi Bidang Item_Type
ID | item_type | Deskripsi |
1 | goods | Barang dan komoditas |
2 | article | Artikel, blog, dan fiksi |
3 | ask | Tanya & Jawab |
4 | bbs | Posting forum |
5 | download | Unduhan item |
6 | image | Gambar |
7 | media | Multimedia seperti film, drama TV, dan musik |
8 | recipe | Makanan dan resep |
9 | news | Berita dan informasi |
10 | institution | Organisasi |
11 | other | Lainnya |
Jenis Perilaku Umum
ID | bhv_type | Deskripsi | bhv_value | bhv_detail |
1 | expose | Perilaku untuk menampilkan item. | Kosong. | Kosong |
2 | stay | Perilaku untuk berdiam di halaman. | Durasi berdiam. Satuan: detik. | Kosong |
3 | click | Perilaku untuk mengklik item. | Jumlah klik. Nilai default: 1. | Kosong |
4 | cart | Perilaku untuk menambahkan item ke keranjang belanja, rak buku, atau daftar putar. | Kosong. | Kosong |
5 | buy | Perilaku untuk membeli item. | Jumlah item yang dibeli. Nilai default: 1. | Contoh: buy_price=12,price_unit=CNY |
6 | collect | Perilaku untuk menambahkan item ke favorit. | Kosong. | Kosong |
7 | like | Perilaku untuk menyukai item. | Jumlah suka. Nilai default: 1. | Kosong |
8 | dislike | Perilaku untuk tidak menyukai item. | Jumlah tidak suka. Nilai default: 1. | Kosong |
9 | comment | Perilaku untuk memberikan komentar pada item. | Jumlah komentar. Nilai default: 1. | Kosong |
10 | share | Perilaku untuk membagikan atau meneruskan item. | Jumlah bagikan atau teruskan. Nilai default: 1. | Kosong |
11 | subscribe | Perilaku untuk mengikuti atau berlangganan item. | Kosong. | Kosong |
12 | gift | Perilaku untuk mengirim hadiah. | Kosong. | Kosong |
13 | download | Perilaku untuk mengunduh item. | Kosong. | Kosong |
14 | read | Perilaku untuk membaca item. | Kosong. | Kosong |
15 | tip | Perilaku untuk memberi hadiah pada item. | Kosong. | Kosong |
16 | complain | Perilaku untuk mengeluh tentang item. | Kosong. | Kosong |
Lihat laporan data
Setelah mengaktifkan fitur pengumpulan data dan mengunggah sejumlah data perilaku tertentu, Anda dapat melihat status dan kualitas data di halaman pengumpulan data.

Status Data
Data dapat berada dalam keadaan Normal (Tersedia) atau Abnormal (Tidak Tersedia). Normal (Tersedia) menunjukkan bahwa tidak ada masalah kualitas pada data perilaku dan data telah diverifikasi. Abnormal (Tidak Tersedia) menunjukkan adanya masalah kualitas pada data perilaku.
Jika data berada dalam keadaan Abnormal (Tidak Tersedia), pembuatan dan pelatihan model popularitas serta prediksi kategori mungkin terpengaruh.
Data Abnormal

Data Normal

Kualitas Data
Jika pemeriksaan kualitas pada data perilaku gagal, pesan kesalahan akan muncul di halaman Verifikasi Data di konsol OpenSearch. Jika pemeriksaan berhasil, tidak ada pesan kesalahan yang muncul di halaman tersebut.
Catatan: Data sampel yang diperiksa pada gambar di atas adalah data perilaku yang disinkronkan ke OpenSearch dalam satu jam sebelum pemeriksaan kualitas dilakukan di awal setiap jam.