功能介绍
根据系统内置的停用词典过滤查询中无意义的词(一般是使用频度过高的但不影响查询结果的词,比如标点符号、语气助词等)。例如:查询词“奔跑吧!兄弟”,经过停用词处理后标点符号“!”不参与召回;或者“你吃饭了吗”,经过停用词处理后语气助词“吗”不参与召回。
功能使用流程
1.开放搜索控制台选择左侧导航栏中的“召回配置”下方对应的“查询分析配置”,选择对应的应用名和应用类型(线上/线下)点击创建。
2.输入“规则名称”,选择“索引范围”,选择“行业类型”,功能选择选中“停用词”,点击“确定”。
注:如果未设置干预词典,则以默认词典为准。如果实际使用场景中出现badcase ,可以参考下文配置干预词典。
3.规则创建完毕后,可以点击“搜索测试”进行搜索效果测试:
测试效果:在搜索测试页面中,选择对应应用和线上应用类型,在查询框中输入 default:'河北省',并在参数区域将 qp 设置为已创建的查询分析规则(如 test_ting)。单击搜索后,页面信息栏显示实际查询词为 (default:'河北'),说明停用词"省"已被成功过滤,返回 1 条匹配结果。
查看查询分析过程:查询分析过程显示,原始查询词河北省经过归一化后仍为河北省,分词结果为河北/省,停用词过滤后移除了省,最终Query改写结果为(default:'河北')。
4.调试无误后,在查询分析界面,切换到“索引视角”,将对应的自定义查询分析设置为默认查询分析,即在索引视角中单击对应规则的设为默认按钮。
5.设置默认自定义查询分析后的界面效果:
设置完成后,对应查询分析名称前将显示 [默认] 标识,表示该条目已被设为默认查询分析。
停用词干预词典
业务场景不一样,停用词也会有所差异,会存在系统内置词典缺少停用词或者提供了错误的停用词。因此,提供了干预功能,供用户自定义停用词。通过创建停用词干预词典,并在查询分析中停用词配置相应的干预词典,就可以干预停用词功能。具体停用词干预词典配置,请点击此处。