全部产品
Search
文档中心

OpenSearch:Pengumpulan Data V2.0

更新时间:Jun 26, 2025

Manfaat mengunggah data perilaku ke OpenSearch

  • Anda dapat menggunakan data perilaku untuk memahami reaksi pengguna terhadap hasil pencarian, seperti melihat, mengklik, berdiam, menyukai, membagikan, menambahkan ke favorit, dan membeli. Hal ini memberikan panduan untuk mengoptimalkan efek pencarian.

  • Fitur statistik laporan OpenSearch memungkinkan Anda melihat berbagai laporan pencarian untuk aplikasi, seperti laporan jumlah tampilan halaman (PV), jumlah tampilan halaman item (IPV), dan tingkat klik (CTR). Laporan tersebut dapat membantu meningkatkan operasi bisnis Anda.

  • OpenSearch menyediakan platform algoritma yang memungkinkan Anda menggunakan data umpan balik perilaku pencarian untuk melatih model algoritma pencarian dan pengurutan. Ini membantu meningkatkan efektivitas pencarian.

Catatan Penggunaan

  • Fitur pengumpulan data diaktifkan secara otomatis setelah aplikasi dibuat.

  • Data merujuk pada umpan balik dari reaksi pengguna terhadap hasil pencarian.

  • Pengumpulan merujuk pada proses mengunggah data perilaku pencarian ke OpenSearch dengan menggunakan SDK OpenSearch. Pada versi terbaru, OpenSearch hanya mendukung pengumpulan data perilaku pencarian melalui SDK server. Fitur pengumpulan data perilaku pencarian melalui SDK seluler atau web sedang dalam pengembangan.

  • Dibandingkan dengan fitur pengumpulan data sebelumnya, fitur pengumpulan data V2.0 memungkinkan Anda mengoper parameter dan menggunakan SDK dengan lebih mudah. Jika Anda baru mengenal OpenSearch, Anda dapat menggunakan SDK OpenSearch untuk mengunggah data perilaku sesuai dengan bidang-bidang yang dijelaskan dalam topik ini. Catatan: SDK untuk Java 3.4.0 dan SDK untuk PHP 3.2.0 mendukung pengumpulan data V2.0.

Unggah data perilaku

Catatan: Setelah mengaktifkan fitur pengumpulan data perilaku di konsol OpenSearch, disarankan untuk mengunggah data perilaku menggunakan SDK. Bagian berikut menjelaskan bidang-bidang yang digunakan untuk mengunggah data perilaku. Deskripsi:

  1. Untuk mengunggah data perilaku menggunakan SDK, Anda harus menentukan bidang-bidang berikut: imei atau user_id, biz_id, trace_id, rn, bhv_type, bhv_time, item_id, dan item_type.

  2. Untuk mengunggah data perilaku dengan memanggil Operasi API, Anda juga harus menentukan bidang reach_time selain bidang-bidang sebelumnya.

  3. Untuk informasi lebih lanjut tentang demo untuk mengunggah data perilaku menggunakan SDK atau memanggil Operasi API, lihat SDK untuk Pengumpulan Data V2.0.

Deskripsi Bidang Data Perilaku

ID

Bidang

Tipe

Deskripsi

Nilai

Wajib

1

app_version

STRING

Nomor versi situs web atau aplikasi seluler yang mengumpulkan data perilaku.

Tidak

2

sdk_type

STRING

Jenis SDK yang digunakan untuk mengunggah data perilaku. OpenSearch menggunakan bidang ini untuk membedakan apakah data perilaku diunggah atau dikumpulkan dengan menggunakan SDK server atau SDK seluler.

Tidak. Jika Anda mengunggah data perilaku dengan menggunakan SDK OpenSearch, bidang ini diatur ke opensearch_sdk secara default.

3

sdk_version

STRING

Nomor versi SDK yang digunakan untuk mengunggah data perilaku.

Tidak. Jika Anda mengunggah data perilaku dengan menggunakan SDK OpenSearch, bidang ini ditentukan secara default.

4

login

STRING

Menentukan apakah pengguna telah masuk ke situs web atau aplikasi seluler yang mengumpulkan data perilaku.

Nilai valid: 0 dan 1. 0: menunjukkan bahwa pengguna belum masuk. 1: menunjukkan bahwa pengguna telah masuk.

Tidak

5

user_id

STRING

ID yang digunakan untuk mengidentifikasi pengguna secara unik.

Tidak. Namun, Anda harus menentukan bidang imei atau bidang user_id.

6

imei

STRING

ID perangkat pengguna. Nilai valid: imei, device_id, dan idfa.

Tidak. Namun, Anda harus menentukan bidang imei atau bidang user_id.

7

biz_id

STRING

ID numerik yang digunakan untuk membedakan antara layanan pencarian yang berbeda. Secara umum, bidang biz_id mewakili aplikasi OpenSearch. Anda dapat menentukan beberapa bidang biz_id untuk mewakili aplikasi web, iOS, dan Android. Bidang-bidang ini dapat digunakan untuk membagi lalu lintas dan menjalankan tes di langkah-langkah berikutnya.

Jika Anda tidak membedakan layanan pencarian, kami sarankan Anda mengatur bidang ini ke default. Jika Anda membedakan layanan pencarian, Anda dapat mengatur bidang ini ke pc, ios, atau android berdasarkan kebutuhan bisnis Anda.

Ya

8

trace_id

STRING

Penyedia layanan pencarian dari mana dokumen dicari dan dikumpulkan.

Jika dokumen dicari dan dikumpulkan dari OpenSearch, atur bidang ini ke Alibaba. Jika dokumen dicari dan dikumpulkan dari penyedia layanan lain, tentukan bidang ini berdasarkan kebutuhan bisnis Anda.

Ya

9

trace_info

STRING

Nilai bidang ini adalah nilai parameter ops_request_misc yang dikembalikan oleh OpenSearch dalam hasil pencarian. Masukkan nilai parameter ops_request_misc apa adanya.

Tidak

Catatan: Anda harus memasukkan bidang ini jika bidang trace_id diatur ke Alibaba. Bidang ini digunakan untuk memeriksa apakah hasil pencarian disediakan dari OpenSearch.

10

rn

STRING

Bidang ini digunakan untuk mengidentifikasi PV. Nilai bidang ini adalah nilai parameter request_id yang dikembalikan oleh OpenSearch dalam hasil pencarian. Masukkan nilai parameter request_id apa adanya.

Ya

11

item_id

STRING

Nilai kunci utama dokumen. Nilai bidang ini adalah nilai kunci utama tabel utama dalam aplikasi OpenSearch.

Ya

12

item_type

STRING

Jenis bisnis dokumen.

Untuk informasi lebih lanjut tentang nilai valid bidang ini, lihat bagian Deskripsi bidang item_type dari topik ini.

Ya

13

bhv_type

STRING

Jenis perilaku, seperti expose, dwell, browse, add to favorites, dan download.

Untuk informasi lebih lanjut tentang nilai valid bidang ini, lihat bagian Jenis perilaku umum dari topik ini.

Ya

14

bhv_value

STRING

Nilai yang digunakan untuk mengukur perilaku, seperti waktu berdiam dan jumlah item yang dibeli.

Untuk informasi lebih lanjut tentang nilai valid bidang ini, lihat bagian Jenis perilaku umum dari topik ini.

Tidak

15

bhv_time

STRING

Waktu terjadinya perilaku. Nilainya adalah timestamp UNIX yang akurat hingga detik.

Ya

16

bhv_detail

STRING

Deskripsi rinci perilaku.

Format bidang ini adalah key=value{,key=value}. Nilainya dapat berisi satu atau lebih pasangan key=value.

Tidak

17

ip

STRING

Alamat IP ponsel atau perangkat terminal tempat perilaku terjadi.

Tidak. Namun, kami sarankan Anda menentukan bidang ini.

18

longitude

STRING

Garis bujur lokasi tempat perilaku terjadi.

Tidak. Namun, kami sarankan Anda menentukan bidang ini.

19

latitude

STRING

Garis lintang lokasi tempat perilaku terjadi.

Tidak. Namun, kami sarankan Anda menentukan bidang ini.

20

session_id

STRING

ID sesi pengguna.

Tidak. Namun, kami sarankan Anda menentukan bidang ini.

21

spm

STRING

Bidang ini digunakan untuk melacak modul halaman tempat perilaku terjadi.

Format pengkodean bidang ini adalah a.b.c.d, yang menunjukkan ID situs, ID halaman, ID modul, dan ID lokasi.

Tidak

22

report_src

STRING

Bidang ini digunakan untuk mengidentifikasi metode yang digunakan untuk mengunggah data perilaku.

Nilai valid: 1, 2, 3, dan patch_data.

  • 1: menunjukkan bahwa data perilaku diunggah dengan memanggil SDK OpenSearch.

  • 2: menunjukkan bahwa data perilaku dikumpulkan dengan memanggil SDK seluler.

  • 3: menunjukkan bahwa data perilaku diunggah dengan memanggil Operasi API OpenSearch.

  • patch_data: menunjukkan bahwa data perilaku diunggah bersama dengan data historis atau data sumber lainnya.

Tidak

23

mac

STRING

Alamat media access control (MAC) ponsel atau perangkat terminal yang mengumpulkan data perilaku.

Tidak

24

brand

STRING

Merek ponsel atau perangkat terminal yang mengumpulkan data perilaku.

Tidak. Namun, kami sarankan Anda menentukan bidang ini.

25

device_model

STRING

Model ponsel atau perangkat terminal yang mengumpulkan data perilaku.

Tidak

26

resolution

STRING

Resolusi layar ponsel atau perangkat terminal yang mengumpulkan data perilaku.

Tidak

27

carrier

STRING

Penyedia jaringan ponsel atau perangkat terminal yang mengumpulkan data perilaku.

Tidak

28

access

STRING

Jaringan yang terhubung ke ponsel atau perangkat terminal yang mengumpulkan data perilaku.

Tidak

29

access_subtype

STRING

Jenis jaringan yang terhubung ke ponsel atau perangkat terminal yang mengumpulkan data perilaku.

Tidak

30

os

STRING

Sistem operasi ponsel atau perangkat terminal yang mengumpulkan data perilaku.

Tidak

31

os_version

STRING

Versi sistem operasi ponsel atau perangkat terminal yang mengumpulkan data perilaku.

Tidak

32

language

STRING

Bahasa yang dikonfigurasi untuk ponsel atau perangkat terminal yang mengumpulkan data perilaku.

Tidak

33

phone_md5

STRING

Nilai hash MD5 dari nomor ponsel.

Tidak

34

reserve1

STRING

Bidang cadangan.

Tidak

35

reserve2

STRING

Bidang cadangan. Jika bidang report_src diatur ke patch_data, Anda harus menyetel bidang reserve2 ke nilai bidang raw_query.

Tidak

36

reach_time

BIGINT

Waktu ketika data diterima oleh server. Nilainya adalah timestamp UNIX yang akurat hingga detik.

Ya. Jika Anda mengunggah data perilaku dengan menggunakan SDK OpenSearch, bidang ini dikonfigurasi secara otomatis oleh SDK. Jika Anda mengunggah data perilaku dengan memanggil Operasi API OpenSearch, Anda harus menentukan bidang ini.

Deskripsi Bidang Item_Type

ID

item_type

Deskripsi

1

goods

Barang dan komoditas

2

article

Artikel, blog, dan fiksi

3

ask

Tanya & Jawab

4

bbs

Posting forum

5

download

Unduhan item

6

image

Gambar

7

media

Multimedia seperti film, drama TV, dan musik

8

recipe

Makanan dan resep

9

news

Berita dan informasi

10

institution

Organisasi

11

other

Lainnya

Jenis Perilaku Umum

ID

bhv_type

Deskripsi

bhv_value

bhv_detail

1

expose

Perilaku untuk menampilkan item.

Kosong.

Kosong

2

stay

Perilaku untuk berdiam di halaman.

Durasi berdiam. Satuan: detik.

Kosong

3

click

Perilaku untuk mengklik item.

Jumlah klik. Nilai default: 1.

Kosong

4

cart

Perilaku untuk menambahkan item ke keranjang belanja, rak buku, atau daftar putar.

Kosong.

Kosong

5

buy

Perilaku untuk membeli item.

Jumlah item yang dibeli. Nilai default: 1.

Contoh: buy_price=12,price_unit=CNY

  • Nilai bidang buy_price menunjukkan harga item saat pesanan dibuat.

  • Secara default, bidang price_unit diatur ke CNY.

6

collect

Perilaku untuk menambahkan item ke favorit.

Kosong.

Kosong

7

like

Perilaku untuk menyukai item.

Jumlah suka. Nilai default: 1.

Kosong

8

dislike

Perilaku untuk tidak menyukai item.

Jumlah tidak suka. Nilai default: 1.

Kosong

9

comment

Perilaku untuk memberikan komentar pada item.

Jumlah komentar. Nilai default: 1.

Kosong

10

share

Perilaku untuk membagikan atau meneruskan item.

Jumlah bagikan atau teruskan. Nilai default: 1.

Kosong

11

subscribe

Perilaku untuk mengikuti atau berlangganan item.

Kosong.

Kosong

12

gift

Perilaku untuk mengirim hadiah.

Kosong.

Kosong

13

download

Perilaku untuk mengunduh item.

Kosong.

Kosong

14

read

Perilaku untuk membaca item.

Kosong.

Kosong

15

tip

Perilaku untuk memberi hadiah pada item.

Kosong.

Kosong

16

complain

Perilaku untuk mengeluh tentang item.

Kosong.

Kosong

Lihat laporan data

Setelah mengaktifkan fitur pengumpulan data dan mengunggah sejumlah data perilaku tertentu, Anda dapat melihat status dan kualitas data di halaman pengumpulan data.

验证报告

Status Data

Data dapat berada dalam keadaan Normal (Tersedia) atau Abnormal (Tidak Tersedia). Normal (Tersedia) menunjukkan bahwa tidak ada masalah kualitas pada data perilaku dan data telah diverifikasi. Abnormal (Tidak Tersedia) menunjukkan adanya masalah kualitas pada data perilaku.

Jika data berada dalam keadaan Abnormal (Tidak Tersedia), pembuatan dan pelatihan model popularitas serta prediksi kategori mungkin terpengaruh.

Data Abnormal

5

Data Normal

6

Kualitas Data

Jika pemeriksaan kualitas pada data perilaku gagal, pesan kesalahan akan muncul di halaman Verifikasi Data di konsol OpenSearch. Jika pemeriksaan berhasil, tidak ada pesan kesalahan yang muncul di halaman tersebut.7Catatan: Data sampel yang diperiksa pada gambar di atas adalah data perilaku yang disinkronkan ke OpenSearch dalam satu jam sebelum pemeriksaan kualitas dilakukan di awal setiap jam.