一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种多视角新闻信息快速检索方法、系统、存储介质及终端

2022-11-14 00:35:19 来源:中国专利 TAG:

技术特征:
1.一种多视角新闻信息快速检索方法,其特征在于,所述方法包括以下步骤:s1、构建新闻信息库,其中包括每篇新闻文章的新闻编号、新闻题目、新闻时间、新闻内容长度、新闻热点描述信息以及新闻正文内容;s2、依据用户检索的新闻视角描述信息,进行词汇分割,构建新闻视角词汇向量组b;其中,对新闻视角词汇向量组b中的不同新闻视角词汇向量设置不同的权值;s3、从新闻视角词汇向量组b中依次提取每个新闻视角类别构建的新闻视角词汇向量,根据新闻视角词汇向量的词汇在新闻信息库中对每篇新闻文章内容进行检索,并根据检索结果构建新闻视角词汇检索向量组b
'
;其中,根据新闻视角词汇向量的词汇出现在新闻文章内容的不同位置,标识出该词汇在新闻文章内容中的分布权值;s4、利用向量相似度计算模型依次计算新闻视角词汇向量和新闻视角词汇检索向量组b
'
中每个向量的相似度;s5、设定筛选阈值,从s4中计算的相似度中筛选出大于筛选阈值的新闻文章编号;s6、根据s5中筛选出的新闻文章编号,从所述新闻信息库中提取出对应的新闻文章。2.根据权利要求1所述的一种多视角新闻信息快速检索方法,其特征在于,所述对新闻视角词汇向量组b中的不同新闻视角词汇向量设置不同的权值,包括:根据不同新闻视角词汇向量在新闻信息检索过程中的重要程度,设定不同的权值,权值的等级设定规则依据用户的需求进行动态调整。3.根据权利要求1所述的一种多视角新闻信息快速检索方法,其特征在于,所述根据新闻视角词汇向量的词汇出现在新闻文章内容的不同位置,标识出该词汇在新闻文章内容中的分布权值,包括:标记出新闻视角词汇向量的词汇在每篇新闻文章的新闻编号、新闻题目、新闻时间、新闻内容长度、新闻热点描述信息以及新闻正文内容的分布情况。4.根据权利要求1所述的一种多视角新闻信息快速检索方法,其特征在于,所述s4具体包括:新闻视角词汇向量和新闻视角词汇检索向量组b
'
中每个向量的相似度计算模型如下:其中,;;;是检索新闻信息库的第index篇新闻文章内容后构建的新闻视角词汇检索向量,j表示新闻视角描述信息的类别,n表示新
闻视角词汇向量的个数也是基于用户检索需求的新闻视角类别个数,表示新闻视角词汇向量的权值,p为新闻信息库的新闻文章总篇数,表示检索第index篇新闻文章后,该词汇在新闻文章内容中的分布权值,为第j类新闻视角词汇向量和新闻视角词汇检索向量的夹角。5.根据权利要求4所述的一种多视角新闻信息快速检索方法,其特征在于,所述越小,则新闻信息库中第index篇新闻文章内容与用户检索的新闻视角描述信息越吻合。6.根据权利要求4所述的一种多视角新闻信息快速检索方法,其特征在于,所述设定筛选阈值,从s4中计算的相似度中筛选出大于筛选阈值的新闻文章编号,包括:从新闻信息库中筛选出满足条件的的新闻文章编号index,其中为第j类新闻视角描述信息检索结果的筛选阈值。7.根据权利要求1所述的一种多视角新闻信息快速检索方法,其特征在于,所述新闻信息库中的新闻文章多以word格式文件进行存储。8.一种多视角新闻信息快速检索系统,其特征在于,所述系统包括:新闻信息库构建模块,用于构建新闻信息库,其中包括每篇新闻文章的新闻编号、新闻题目、新闻时间、新闻内容长度、新闻热点描述信息以及新闻正文内容;新闻视角词汇向量构建模块,用于依据用户检索的新闻视角描述信息,进行词汇分割,构建新闻视角词汇向量组b;其中,对新闻视角词汇向量组b中的不同新闻视角词汇向量设置不同的权值;新闻视角词汇检索向量构建模块,用于从新闻视角词汇向量组b中依次提取每个新闻视角类别构建的新闻视角词汇向量,根据新闻视角词汇向量的词汇在新闻信息库中对每篇新闻文章内容进行检索,并根据检索结果构建新闻视角词汇检索向量组b
'
;其中,根据新闻视角词汇向量的词汇出现在新闻文章内容的不同位置,标识出该词汇在新闻文章内容中的分布权值;相似度计算模块,用于利用向量相似度计算模型依次计算新闻视角词汇向量和新闻视角词汇检索向量组b
'
中每个向量的相似度;筛选模块,用于设定筛选阈值,从相似度计算模块中筛选出大于筛选阈值的新闻文章编号;新闻文章提取模块,用于根据筛选模块中筛选出的新闻文章编号,从所述新闻信息库中提取出对应的新闻文章。9.一种存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1-7中任意一项所述多视角新闻信息快速检索方法。
10.一种终端,包括存储器和处理器,存储器上存储有可在处理器上运行的计算机指令,其特征在于,处理器运行计算机指令时执行权利要求1-7中任意一项所述多视角新闻信息快速检索方法。

技术总结
本发明公开了一种多视角新闻信息快速检索方法、系统、存储介质及终端,包括:依据用户检索的新闻视角描述信息,进行词汇分割,构建新闻视角词汇向量组B;其中,对新闻视角词汇向量组B中的不同新闻视角词汇向量设置不同的权值;根据新闻视角词汇向量的词汇在新闻信息库中对每篇新闻文章内容进行检索,并根据检索结果构建新闻视角词汇检索向量组B


技术研发人员:张志强 王伟钧
受保护的技术使用者:成都大学
技术研发日:2022.10.17
技术公布日:2022/11/11
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献