全部產品
Search
文件中心

OpenSearch:InterventionDictionaryEntry

更新時間:Mar 26, 2025

本文將為您詳細介紹幹預詞典中的詞條內容。

樣本

{
    "cmd": "add",
    "word": "過兒",
    "created": 1536661485,
    "updated": 1537320187,
    "status": "ACTIVE",
    "relevance": {
        "100": "0",
        "200": "2"
    }
}

結構

各幹預詞典的詞條結構各有不同,區分為共有欄位 + 特有欄位,詳情如下 :

共有欄位

欄位

類型

描述

cmd

String

操作命令:

  • add 新增

  • delete 刪除

word

String

詞條。

status

String

狀態:

  • ACTIVE 已生效

created

Integer

建立時間戳記。

updated

Integer

更新時間戳記。

特有欄位

stopword 停用詞

欄位

類型

描述

stopword

Boolean

幹預類型:

  • true 添加

  • false 屏蔽

synonym 同義字

欄位

類型

描述

alias

Array

添加的同義字。

antiAlias

Array

屏蔽的同義字。

correction 拼字錯誤修正

欄位

類型

描述

correction

String

糾正詞。

enabled

Boolean

幹預類型:

  • true 添加

  • false 屏蔽

category_prediction 類目預測

欄位

類型

描述

relevance

Object

幹預內容鍵為類目預測ID,值為相關度(0:不相關;1:略相關;2:相關)例:{“2”:1,”100”:0}。

term_weighting 詞權重

欄位

類型

描述

tokens[]

Object

詞權重內容。

tokens[].token

String

term

tokens[].weight

int

term權重,有7(權重高)、4(權重中)、1(權重低)。

樣本

{
  "word": "譚浩強c語言程式設計",
  "tokens": [
    {
      "token": "譚浩強",
      "weight": 7
    },
    {
      "token": "c語言",
      "weight": 7
    },
    {
      "token": "程式",
      "weight": 1
    },
    {
      "token": "設計",
      "weight": 1
    }
  ]
}

ner 實體識別

欄位

類型

描述

tokens[]

Object

幹預內容。

tokens[].tag

String

  • 識別結果的英文名

  • brand 品牌

  • category 品類

  • material 材質

  • element 款式元素

  • style 風格

  • color 顏色

  • function 功能功效

  • scenario 情境

  • people 人群

  • season 時間季節

  • model 型號

  • region 地點地區

  • name 人名

  • adjective 修飾

  • category-modifier 品類修飾詞

  • size 尺寸規格

  • quality 品質成色

  • suit 套裝

  • new-release 新品

  • series 系列

  • marketing 營銷服務

  • entertainment 文娛書文曲

  • organization 機構實體

  • movie 影視名稱

  • game 遊戲名稱

  • number 數字

  • unit 單位

  • common 普通詞

  • new-word 新詞

  • proper-noun 專有名詞

  • symbol 符號

  • prefix 首碼

  • suffix 尾碼

  • gift 贈送

  • negative 否定

  • agent 代理

tokens[].tagLabel

String

識別結果的中文名,同上,注意:傳參時不需要此欄位

tokens[].token

String

實體詞

tokens[].order

Integer

序號。

matchType

Integer

匹配類型,0 表示全query匹配時幹預生效,1 表示query中有部分匹配幹預也生效預設:0。

樣本

{
    "cmd": "add",
    "word": "豆本豆豆奶",
    "created": 1593429234,
    "updated": 1593429242,
    "status": "ACTIVE",
    "tokens": [{
            "tag": "category",
            "tagLabel": "品類",
            "token": "豆",
            "order": 1
        },
        {
            "tag": "category",
            "tagLabel": "品類",
            "token": "本",
            "order": 2
        },
        {
            "tag": "common",
            "tagLabel": "普通詞",
            "token": "豆豆",
            "order": 3
        },
        {
            "tag": "category",
            "tagLabel": "品類",
            "token": "奶",
            "order": 4
        }
    ]
}

suggest_allowlist 下拉提示白名單

欄位

類型

描述

score

Float

分數。

matchType

Integer

匹配類型:

  • 0

  • 1

  • 2

重要

score和matchType兩個欄位目前唯讀,不支援傳參。

suggest_denylist下拉提示黑名單

欄位

類型

描述

matchType

Integer

匹配類型:

  • 0

  • 1

  • 2

重要

matchType欄位目前唯讀,不支援傳參。

hot_allowlist  熱搜白名單

欄位

類型

描述

rank

Integer

位置,取值範圍:[1-10]。

expirationTime

Integer

到期時間戳記(秒)。

hot_denylist  熱搜黑名單

欄位

類型

描述

matchType

Integer

匹配類型:

  • 0

  • 1

  • 2

重要

matchType欄位目前唯讀,不支援傳參。

hint_allowlist  底紋白名單

欄位

類型

描述

expirationTime

Integer

到期時間戳記(秒)。

hint_denylist  底紋黑名單

欄位

類型

描述

matchType

Integer

匹配類型:

  • 0

  • 1

  • 2

重要

matchType欄位目前唯讀,不支援傳參。

若有收穫,就點個贊吧