一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种关键词筛选方法、设备和存储介质与流程

2023-04-05 06:16:17 来源:中国专利 TAG:

技术特征:
1.一种关键词筛选方法,所述关键词用于反应营业主体的主营业务,所述关键词的筛选范围为从数据源中提取的多个准关键词,所述准关键词与所述营业主体相关,所述数据源中包括所述营业主体的经营信息,所述准关键词与所述经营信息相关,其特征在于,所述关键词筛选方法包括以下步骤:获取每个准关键词的特征信息;对所述每个准关键词的特征信息进行归一化处理;根据归一化处理后的所述特征信息构建模型;通过所述模型从所述多个准关键词中选出至少一个关键词。2.根据权利要求1所述的关键词筛选方法,其特征在于,所述特征信息包括相似信息、连边关系信息以及通用信息中的至少一种。3.根据权利要求2所述的关键词筛选方法,其特征在于,所述相似信息包括准关键词间相似度和相似词频权重中的至少一种。4.根据权利要求2所述的关键词筛选方法,其特征在于,所述连边关系信息包括上下位匹配数、前后缀匹配数、领域词匹配数、模糊匹配字段数、总字段数、字段内准关键词数、字段间准关键词数、全字段准关键词数以及官网互信中的至少一种。5.根据权利要求2所述的关键词筛选方法,其特征在于,所述通用信息包括:完全匹配字段数、黑名单虚词、主营句式词、名称互信、词频数、全局词频以及词来源中的至少一种。6.根据权利要求1-5任意一项所述的关键词筛选方法,其特征在于,所述模型包括二分类模型。7.根据权利要求6所述的关键词筛选方法,其特征在于,所述通过模型从所述多个准关键词中选出至少一个关键词,包括:设置筛选阈值;根据所述模型针对多个准关键词输出的结果和所述筛选阈值选出至少一个关键词。8.根据权利要求6所述的关键词筛选方法,其特征在于,所述二分类模型为机器学习二分类模型。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-8中任一项所述的方法的步骤。10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8中任一项所述的方法的步骤。

技术总结
本申请涉及信息处理技术领域,具体公开了一种关键词筛选方法、设备和存储介质,所述关键词用于反应营业主体的主营业务,所述关键词的筛选范围为从数据源中提取的多个准关键词,所述准关键词与所述营业主体相关,所述数据源中包括所述营业主体的经营信息,所述准关键词与所述经营信息相关,所述关键词筛选方法包括以下步骤:获取每个准关键词的特征信息;对所述每个准关键词的特征信息进行归一化处理;根据归一化处理后的所述特征信息构建模型;通过所述模型从所述多个准关键词中选出至少一个关键词。本申请可以从与营业主体相关的多种信息中提取真实有效的核心主营信息,从而更精确的找到营业主体的同行。的找到营业主体的同行。的找到营业主体的同行。


技术研发人员:周杰 蔡子哲 曾思亮 方美川
受保护的技术使用者:企知道网络技术有限公司
技术研发日:2022.12.09
技术公布日:2023/3/10
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献