一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种提供搜索联想词的方法和装置与流程

2021-11-26 22:50:00 来源:中国专利 TAG:

技术特征:
1.一种提供搜索联想词的方法,其特征在于,包括:获取用户输入的搜索关键词,使用所述搜索关键词在设定的语料库中进行检索,得到用于联想所述搜索关键词的候选文本集;其中,所述语料库包括语料文本和为所述语料文本统计出的多个评价参数的参数值;根据所述参数值,为所述候选文本集的候选文本计算所述多个评价参数的基准评价值,将多个所述基准评价值加权求和,得到所述候选文本的综合评价值;将所述候选文本按照所述综合评价值进行排序,根据排序结果选取目标候选文本作为所述搜索关键词的联想词。2.根据权利要求1所述的方法,其特征在于,所述评价参数为下列任意多个的组合:文本出现频次、文本生成时间、物品品类、供应方标识、搜索入口;所述方法还包括:根据历史搜索记录,计算所述语料文本的文本出现频次;根据所述历史搜索记录,确定所述语料文本的文本生成时间、所述语料文本所对应物品的物品品类和供应方标识、以及搜索入口。3.根据权利要求2所述的方法,其特征在于,根据所述参数值,为所述候选文本集的候选文本计算所述文本出现频次的基准评价值,包括:根据所述候选文本集中候选文本的文本出现频次,确定最大文本出现频次;根据所述最大文本出现频次,对所述候选文本的文本出现频次进行归一化处理,得到所述候选文本的文本出现频次的基准评价值。4.根据权利要求2所述的方法,其特征在于,根据所述参数值,为所述候选文本集的候选文本计算所述文本生成时间的基准评价值,包括:根据所述候选文本集中候选文本的文本生成时间,确定最大文本生成时间和最小文本生成时间;根据所述最大文本生成时间和所述最小文本生成时间,对所述候选文本的文本生成时间进行归一化处理,得到所述候选文本的文本生成时间的基准评价值。5.根据权利要求2所述的方法,其特征在于,所述物品品类包括多级分类;根据所述参数值,为所述候选文本集的候选文本计算所述物品品类的基准评价值,包括:将所述搜索关键词所对应物品的物品品类与所述候选文本集中候选文本对应的物品品类进行比较,得到隶属相同分类的分类级别;将为所述分类级别设定的评分参考值作为所述候选文本的物品品类的基准评价值;其中,所述分类级别越高,所述评分参考值越大。6.根据权利要求2所述的方法,其特征在于,根据所述参数值,为所述候选文本集的候选文本计算所述供应方标识的基准评价值,包括:将所述搜索关键词所对应物品的供应方标识与所述候选文本集中候选文本对应的供应方标识进行比较;如果供应方标识相同,则所述候选文本的供应方标识的基准评价值为设定的第一数值;如果供应方标识不同,则所述候选文本的供应方标识的基准评价值为设定的第二数值。7.根据权利要求2所述的方法,其特征在于,根据所述参数值,为所述候选文本集的候选文本计算所述搜索入口的基准评价值,包括:将用户输入所述搜索关键词的搜索入口与所述候选文本集中候选文本对应的搜索入
口进行比较;如果搜索入口相同,则所述候选文本的搜索入口的基准评价值为设定的第一数值;如果搜索入口不同,则所述候选文本的搜索入口的基准评价值为设定的第二数值。8.一种提供搜索联想词的装置,其特征在于,包括:获取检索模块,用于获取用户输入的搜索关键词,使用所述搜索关键词在设定的语料库中进行检索,得到用于联想所述搜索关键词的候选文本集;其中,所述语料库包括语料文本和为所述语料文本统计出的多个评价参数的参数值;计算求和模块,用于根据所述参数值,为所述候选文本集的候选文本计算所述多个评价参数的基准评价值,将多个所述基准评价值加权求和,得到所述候选文本的综合评价值;排序选取模块,用于将所述候选文本按照所述综合评价值进行排序,根据排序结果选取目标候选文本作为所述搜索关键词的联想词。9.根据权利要求8所述的装置,其特征在于,所述评价参数为下列任意多个的组合:文本出现频次、文本生成时间、物品品类、供应方标识、搜索入口;所述装置还包括:语料库构建模块,用于根据历史搜索记录,计算所述语料文本的文本出现频次;以及根据所述历史搜索记录,确定所述语料文本的文本生成时间、所述语料文本所对应物品的物品品类和供应方标识、以及搜索入口。10.一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。11.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。

技术总结
本发明公开了一种提供搜索联想词的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取用户输入的搜索关键词,使用搜索关键词在设定的语料库中进行检索,得到用于联想搜索关键词的候选文本集;其中,语料库包括语料文本和为语料文本统计出的多个评价参数的参数值;根据参数值,为候选文本集的候选文本计算多个评价参数的基准评价值,将多个基准评价值加权求和,得到候选文本的综合评价值;将候选文本按照综合评价值进行排序,根据排序结果选取目标候选文本作为搜索关键词的联想词。该方法使用多个评价参数对候选文本进行综合评价,进而选取综合评价高的候选文本作为联想词,实现了更细粒度的输入联想,使得联想结果更加准确。联想结果更加准确。联想结果更加准确。


技术研发人员:何刚 杨森
受保护的技术使用者:北京京东世纪贸易有限公司
技术研发日:2020.05.21
技术公布日:2021/11/25
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献