一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于人工智能的话题推荐方法、装置、设备及存储介质与流程

2022-02-20 01:04:22 来源:中国专利 TAG:


1.本技术涉及到人工智能技术领域,特别是涉及到一种基于人工智能的话 题推荐方法、装置、设备及存储介质。


背景技术:

2.现有的内容平台只能先采用运营人员手动创建话题,然后创作者在话题 下挂文章,导致话题更新的及时性较差。话题的来源通过运营人员人工思考, 或者网络手动搜索获得,存在话题来源单一的问题,导致话题的智能性和可 选择性都比较低。


技术实现要素:

3.本技术的主要目的为提供一种基于人工智能的话题推荐方法、装置、设 备及存储介质,旨在解决现有技术的内容平台采用运营人员手动创建话题后 创作者在话题下挂文章的方法,导致话题更新的及时性较差,因话题来源单 一,导致话题的智能性和可选择性都比较低的技术问题。
4.为了实现上述发明目的,本技术提出一种基于人工智能的话题推荐方法, 所述方法包括:
5.获取目标文章数据;
6.采用分词词典,对所述目标文章数据进行文章元素提取,得到目标文章 元素集;
7.获取预设话题元素分析模型,根据所述预设话题元素分析模型和所述目 标文章元素集,在获取的热点关联数据词典中进行热点关联数据的匹配,得 到待筛选的热点关联数据集,其中,所述预设话题元素分析模型是基于线性 回归模型训练得到的模型;
8.对所述待筛选的热点关联数据集进行热点关联数据筛选,得到目标热点 关联数据集;
9.采用预设话题模板库,根据所述目标热点关联数据集对应的各个文章元 素进行话题生成,得到待评估的话题集;
10.对所述目标文章数据的正文进行倾向性评分计算,得到文章正文倾向性 评分;
11.根据所述文章正文倾向性评分,对所述待评估的话题集进行话题筛选, 得到待处理的话题集;
12.根据所述待处理的话题集和所述目标文章数据的正文进行话题推荐,得 到话题推荐结果。
13.进一步的,所述根据所述预设话题元素分析模型和所述目标文章元素集, 在获取的热点关联数据词典中进行热点关联数据的匹配,得到待筛选的热点 关联数据集的步骤之前,还包括:
14.获取多个热点关联样本数据;
15.针对每个所述热点关联样本数据进行文章元素提取,得到每个所述热点 关联样本数据对应的文章标题元素样本集和文章正文元素样本集;
16.根据所述文章标题元素样本集和所述文章正文元素样本集进行契合度计 算,得到每个所述热点关联样本数据对应的契合度样本集;
17.采用机器学习方法,将各个所述契合度样本集输入初始模型进行正弦函 数拟合,其中,所述初始模型是基于所述线性回归模型得到的模型;
18.将完成正弦函数拟合的所述初始模型作为所述预设话题元素分析模型。
19.进一步的,所述对所述待筛选的热点关联数据集进行热点关联数据筛选, 得到目标热点关联数据集的步骤,包括:
20.获取所述待筛选的热点关联数据集中的每个热点关联数据对应的热点来 源信息;
21.针对每个所述热点来源信息进行综合评分,得到综合评分结果;
22.根据各个所述综合评分结果,对所述待筛选的热点关联数据集进行排序, 得到排序后的热点关联数据集;
23.采用预设筛选比例和从开头开始筛选的方法,从所述排序后的热点关联 数据集中进行所述热点关联数据的筛选,得到所述目标热点关联数据集。
24.进一步的,所述根据所述文章正文倾向性评分,对所述待评估的话题集 进行话题筛选,得到待处理的话题集的步骤,包括:
25.采用倾向性评分词典,对所述待评估的话题集中的各个话题进行话题倾 向性评分计算,得到初始话题倾向性评分集;
26.从所述初始话题倾向性评分集中选出倾向性方向与所述文章正文倾向性 评分对应的倾向性方向相同的话题倾向性评分,得到待处理的话题倾向性评 分集;
27.对所述待处理的话题倾向性评分集中的每个话题倾向性评分与所述文章 正文倾向性评分进行相减计算,得到待处理的倾向性评分差值集;
28.获取预设倾向性评分阈值范围,从所述待处理的倾向性评分差值集中找 出数值位于所述预设倾向性评分阈值范围内的倾向性评分差值,得到目标倾 向性评分差值集;
29.将所述目标倾向性评分差值集对应的各个话题作为所述待处理的话题集。
30.进一步的,所述根据所述待处理的话题集和所述目标文章数据的正文进 行话题推荐,得到话题推荐结果的步骤,包括:
31.对所述待处理的话题集中的每个话题与所述目标文章数据的正文进行契 合度计算,得到待分析的契合度集;
32.获取预设契合度阈值,从所述待分析的契合度集中找出数值大于所述预 设契合度阈值的契合度,得到目标契合度集;
33.将所述目标契合度集对应的各个话题,作为所述话题推荐结果。
34.进一步的,所述将所述目标契合度集对应的各个话题,作为所述话题推 荐结果的步骤,包括:
35.将所述目标契合度集对应的各个话题,作为待纠正的话题集;
36.获取话题库,将所述待纠正的话题集中的每个话题与所述话题库中的各 个话题进行相似度计算,得到所述待纠正的话题集中的每个所述话题对应的 相似度集合;
37.获取相似度阈值,从所述相似度集合中找出数值大于所述相似度阈值的 相似度,得到目标相似度;
38.采用所述话题库中的与所述目标相似度对应的话题,对在所述待纠正的 话题集中的与所述目标相似度对应的话题进行替换;
39.将所述待纠正的话题集作为所述话题推荐结果。
40.进一步的,所述根据所述待处理的话题集和所述目标文章数据的正文进 行话题推荐,得到话题推荐结果的步骤之后,包括:
41.将所述话题推荐结果发送给与所述目标文章数据对应的客户端;
42.获取所述客户端根据所述话题推荐结果发送的话题选择结果;
43.根据所述话题选择结果和所述目标文章数据更新内容数据库。
44.本技术还提出了一种基于人工智能的话题推荐装置,所述装置包括:
45.目标文章数据获取模块,用于获取目标文章数据;
46.目标文章元素集确定模块,用于采用分词词典,对所述目标文章数据进 行文章元素提取,得到目标文章元素集;
47.待筛选的热点关联数据集确定模块,用于获取预设话题元素分析模型, 根据所述预设话题元素分析模型和所述目标文章元素集,在获取的热点关联 数据词典中进行热点关联数据的匹配,得到待筛选的热点关联数据集,其中, 所述预设话题元素分析模型是基于线性回归模型训练得到的模型;
48.目标热点关联数据集确定模块,用于对所述待筛选的热点关联数据集进 行热点关联数据筛选,得到目标热点关联数据集;
49.待评估的话题集确定模块,用于采用预设话题模板库,根据所述目标热 点关联数据集对应的各个文章元素进行话题生成,得到待评估的话题集;
50.文章正文倾向性评分确定模块,用于对所述目标文章数据的正文进行倾 向性评分计算,得到文章正文倾向性评分;
51.待处理的话题集确定模块,用于根据所述文章正文倾向性评分,对所述 待评估的话题集进行话题筛选,得到待处理的话题集;
52.话题推荐结果确定模块,用于根据所述待处理的话题集和所述目标文章 数据的正文进行话题推荐,得到话题推荐结果。
53.本技术还提出了一种计算机设备,包括存储器和处理器,所述存储器存 储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方 法的步骤。
54.本技术还提出了一种计算机可读存储介质,其上存储有计算机程序,所 述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
55.本技术的基于人工智能的话题推荐方法、装置、设备及存储介质,其中 方法首先通过采用分词词典,对所述目标文章数据进行文章元素提取,得到 目标文章元素集,根据所述预设话题元素分析模型和所述目标文章元素集, 在获取的热点关联数据词典中进行热点关联数据的匹配,得到待筛选的热点 关联数据集,对所述待筛选的热点关联数据集进行热点关联数据筛选,得到 目标热点关联数据集,采用预设话题模板库,根据所述目标热点关联数据集 对应的各个文章元素进行话题生成,得到待评估的话题集,然后对所述目标 文章数据的正文进行倾向性评分计算,得到文章正文倾向性评分,根据所述 文章正文倾向性评分,对所述待评估的话题集进行话题筛选,得到待处理的 话题集,最后根据所述待处理的话题集和所述目标文章数据的正文进行话题 推荐,得到话题推荐结果,实现根据导入
的文章进行自动化的话题推荐,不 需要手动创建话题,提高了话题更新的及时性;而且对目标文章数据分别进 行热点匹配、热点关联数据筛选、话题生成、话题筛选和话题推荐,提高了 话题的智能性和可选择性。
附图说明
56.图1为本技术一实施例的基于人工智能的话题推荐方法的流程示意图;
57.图2为本技术一实施例的基于人工智能的话题推荐装置的结构示意框图;
58.图3为本技术一实施例的计算机设备的结构示意框图。
59.本技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步 说明。
具体实施方式
60.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及 实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例 仅仅用以解释本技术,并不用于限定本技术。
61.参照图1,本技术实施例中提供一种基于人工智能的话题推荐方法,所述 方法包括:
62.s1:获取目标文章数据;
63.s2:采用分词词典,对所述目标文章数据进行文章元素提取,得到目标 文章元素集;
64.s3:获取预设话题元素分析模型,根据所述预设话题元素分析模型和所 述目标文章元素集,在获取的热点关联数据词典中进行热点关联数据的匹配, 得到待筛选的热点关联数据集,其中,所述预设话题元素分析模型是基于线 性回归模型训练得到的模型;
65.s4:对所述待筛选的热点关联数据集进行热点关联数据筛选,得到目标 热点关联数据集;
66.s5:采用预设话题模板库,根据所述目标热点关联数据集对应的各个文 章元素进行话题生成,得到待评估的话题集;
67.s6:对所述目标文章数据的正文进行倾向性评分计算,得到文章正文倾 向性评分;
68.s7:根据所述文章正文倾向性评分,对所述待评估的话题集进行话题筛 选,得到待处理的话题集;
69.s8:根据所述待处理的话题集和所述目标文章数据的正文进行话题推荐, 得到话题推荐结果。
70.本实施例首先通过采用分词词典,对所述目标文章数据进行文章元素提 取,得到目标文章元素集,根据所述预设话题元素分析模型和所述目标文章 元素集,在获取的热点关联数据词典中进行热点关联数据的匹配,得到待筛 选的热点关联数据集,对所述待筛选的热点关联数据集进行热点关联数据筛 选,得到目标热点关联数据集,采用预设话题模板库,根据所述目标热点关 联数据集对应的各个文章元素进行话题生成,得到待评估的话题集,然后对 所述目标文章数据的正文进行倾向性评分计算,得到文章正文倾向性评分, 根据所述文章正文倾向性评分,对所述待评估的话题集进行话题筛选,得到 待处理的话题
集,最后根据所述待处理的话题集和所述目标文章数据的正文 进行话题推荐,得到话题推荐结果,实现根据导入的文章进行自动化的话题 推荐,不需要手动创建话题,提高了话题更新的及时性;而且对目标文章数 据分别进行热点匹配、热点关联数据筛选、话题生成、话题筛选和话题推荐, 提高了话题的智能性和可选择性。
71.对于s1,可以获取用户输入的目标文章数据,也可以获取第三方应用系 统发送的目标文章数据。
72.目标文章数据,也就是需要进行话题推荐的文章数据。目标文章数据包 括:目标文章标题和目标文章正文。
73.目标文章标题,也就是需要进行话题推荐的文章数据的文章标题。文章 标题,可以使读者了解到文章的主要内容和主旨。
74.目标文章正文,也就是需要进行话题推荐的文章数据的文章正文。文章 正文,是文章的本文,是除了标题、前言、目录、后记、注释以外的内容。
75.话题,是指谈话的题目与主题。话题是谈话的中心,但不限于谈话的中 心,加上各种意见才是一个充实的话题,其实也就是我们日常生活中关注的 各种事件的一个概括。
76.对于s2,可以从数据库中获取分词词典,也可以从第三方应用系统中获 取分词词典。分词词典中包括多个词语。
77.分词词典中包括多个词语(也就是元素)。
78.其中,所述分词词典,是采用爬虫技术从网络的话题库中搜索到的文本 数据,从搜索到的文本数据中提取的组成话题的元素。分词词典的词语包括: 粮食。
79.其中,将所述分词词典中的每个词语,在所述目标文章数据的目标文章 标题中进行查找,当查找成功时,将该词语作为文章标题元素;将各个文章 标题元素作为文章标题元素集;将所述分词词典中的每个词语,在所述目标 文章数据的目标文章正文中进行查找,当查找成功时,将该词语作为文章正 文元素;将各个文章正文元素作为文章正文元素集;将文章标题元素集和文 章正文元素集进行合并到一个集合,得到目标文章元素集。
80.也就是说,文章元素可以是文章标题元素,也可以是文章正文元。文章 元素是词语。
81.对于s3,可以从数据库中获取热点关联数据词典,也可以从第三方应用 系统中获取热点关联数据词典。
82.热点关联数据词典包括:多个热点关联数据。热点关联数据包括:专题、 话题、热点、文章标题和文章正文。首先采用爬虫技术从网络的中搜索的各 个专题、各个话题、各个热点的文章数据(文章标题和文章正文),根据获取 的每个文章数据及其对应的专题、话题、热点,生成热点关联数据;将各个 热点关联数据存入热点关联数据词典中。
83.专题,是指针对某个特定对象而特别收集制作而成的一种集中作品,这 个对象可以是具体的某个人物或者某个事物,也可以是某个抽象的范围或者 领域。在网络上这种作品一般表现为游戏专题或者新闻专题,其中的新闻专 题又包括人物专题和新闻热点专题等。
84.热点,指的是比较受广大群众关注,或者欢迎的新闻或者信息,或指某 时期引人注目的地方或问题。
85.预设话题元素分析模型,是通过对文章元素(包括文章标题元素和文章 正文元
素)与话题名称元素的关联性、话题的句子结构、话题的语序的规则 进行总结,用于进行文章元素与热点关联数据之间的匹配判断。
86.可选的,将所述目标文章元素集中的每个文章元素和所述热点关联数据 词典中的每个热点关联数据,输入预设话题元素分析模型进行匹配判断;当 文章元素符合热点关联数据的对文章元素与话题名称元素的关联性、话题的 句子结构、话题的语序的规则时,确定匹配结果为成功,否则确定匹配结果 为失败;将匹配结果为成功的各个热点关联数据作为所述待筛选的热点关联 数据集。
87.对于s4,对所述待筛选的热点关联数据集中的每个热点关联数据对应的 热点来源信息进行综合评分,根据综合评分结果对所述待筛选的热点关联数 据集进行排序,采用预设的筛选规则,从排序后的所述待筛选的热点关联数 据集中进行热点关联数据筛选,将筛选得到的各个热点关联数据作为所述目 标热点关联数据集。
88.可选的,所述预设的筛选规则设为预设数量。预设数量是大于0的整数。
89.可选的,所述预设的筛选规则设为预设比例。预设比例是0-1的数值,不 包括0,可以包括1。
90.对于s5,将所述目标热点关联数据集对应的各个文章元素输入所述预设 话题模板库中的每个话题模板进行话题生成,将生成的各个话题作为所述待 评估的话题集。
91.所述预设话题模板库包括:模板标识、话题倾向性评分和话题模板。模 板标识可以是话题模板名称、话题模板id等唯一标识一个话题模板的数据。
92.对于s6,可以从数据库中获取倾向性评分词典,也可以从第三方应用系 统中获取倾向性评分词典。
93.倾向性评分词典包括:倾向词和倾向性评分。
94.可选的,获得多个待提取的文章正文;对每个所述待提取的文章正文进 行倾向性标注,得到倾向性标注后的文章正文;根据各个所述倾向性标注后 的文章正文,基于图模型方法计算倾向性评分词典中的每个倾向词的倾向性 权重,将每个倾向性权重作为一个倾向性评分。
95.倾向词包括但不限于:中文正面情感词语、中文负面情感词语、中文正 面评价词语和中文负面评价词语。
96.其中,采用所述倾向性评分词典,对所述目标文章数据的正文进行倾向 性评分计算,将计算得到的倾向性评分作为所述文章正文倾向性评分。
97.采用所述倾向性评分词典,对所述目标文章数据的正文进行倾向性评分 计算的方法步骤在此不做赘述。
98.对于s7,从所述待评估的话题集中,筛选出倾向性方向与所述文章正文 倾向性评分对应的倾向性方向相同的话题,将筛选出的各个话题作为所述待 处理的话题集。
99.对于s8,对所述待处理的话题集中的每个话题和所述目标文章数据的正 文进行契合度计算,根据契合度进行话题推荐,将话题推荐的数据作为话题 推荐结果。
100.话题推荐结果中包括1个或多个话题。
101.在一个实施例中,上述根据所述预设话题元素分析模型和所述目标文章 元素集,在获取的热点关联数据词典中进行热点关联数据的匹配,得到待筛 选的热点关联数据集的步骤之前,还包括:
102.s31:获取多个热点关联样本数据;
103.s32:针对每个所述热点关联样本数据进行文章元素提取,得到每个所述 热点关联样本数据对应的文章标题元素样本集和文章正文元素样本集;
104.s33:根据所述文章标题元素样本集和所述文章正文元素样本集进行契合 度计算,得到每个所述热点关联样本数据对应的契合度样本集;
105.s34:采用机器学习方法,将各个所述契合度样本集输入初始模型进行正 弦函数拟合,其中,所述初始模型是基于所述线性回归模型得到的模型;
106.s35:将完成正弦函数拟合的所述初始模型作为所述预设话题元素分析模 型。
107.本实施例实现了采用机器学习方法,将各个所述契合度样本集输入初始 模型进行正弦函数拟合,以使初始模型对文章元素与话题名称元素的关联性、 话题的句子结构、话题的语序的规则进行总结,为后续进行文章元素与热点 关联数据的匹配判断提供了基础。
108.对于s31,可以获取用户输入的多个热点关联样本数据,也可以从数据库 中获取多个热点关联样本数据,还可以从第三方应用系统中获取多个热点关 联样本数据。
109.热点关联样本数据包括:专题、话题、热点、文章标题和文章正文。
110.对于s32,针对每个所述热点关联样本数据进行文章正文元素提取,将从 同一个所述热点关联样本数据提取的个文章正文元素作为文章正文元素样本 集;针对每个所述热点关联样本数据进行文章标题元素提取,将从同一个所 述热点关联样本数据提取的各个文章标题元素作为文章标题元素样本集。
111.对于s33,采用预设的契合度计算规则,根据所述文章标题元素样本集和 所述文章正文元素样本集进行契合度计算,将针对同一个所述热点关联样本 数据计算的各个契合度作为一个契合度样本集。
112.所述契合度样本集中包括:文章元素与所述文章正文元素样本集的契合 度、话题元素组合和所述文章正文元素样本集的契合度、文章标题语序组合 的契合度、同一事件的不同倾向性评分的文章标题的元素组合契合度。
113.契合度,是判明现象因果联系程度的一种方法,如果在被研究现象出现 的集中不同场合中,有一个情况是共同的,那么这个共同的情况就是被研究 现象的因果联系,契合度越高,这种联系就越紧密。
114.其中,先计算关系强度,然后根据各个关系强度进行加权计算,将加权 计算得到的数据作为契合度。文章元素与所述文章正文元素样本集的契合度, 是先计算每个文章元素(也就是,所述文章标题元素样本集和所述文章正文 元素样本集中的元素)与所述文章正文元素样本集的关系强度,然后对各个 关系强度进行契合度的加权计算得到文章元素与所述文章正文元素样本集的 契合度。比如,文章元素为m,所述文章正文元素样本集包括s1个,文章元 素为m在所述文章正文元素样本集中出现的次数为c1次,则获取预设强度分 q1,将q1
×
c1/s1的计算结果作为文章元素与所述文章正文元素样本集的关 系强度,在此举例不做具体限定。
115.对于s34,采用机器学习方法,将各个所述契合度样本集输入初始模型进 行正弦函数拟合的方法,在此不做赘述。
116.所述初始模型是基于所述线性回归模型得到的模型,通过正弦函数拟合 可以很
好的对文章元素与话题名称元素的关联性、话题的句子结构、话题的 语序的规则进行总结。
117.对于s35,完成正弦函数拟合的所述初始模型,已经很好的对文章元素与 话题名称元素的关联性、话题的句子结构、话题的语序的规则进行总结,因 此,可以将完成正弦函数拟合的所述初始模型作为所述预设话题元素分析模 型。
118.在一个实施例中,上述对所述待筛选的热点关联数据集进行热点关联数 据筛选,得到目标热点关联数据集的步骤,包括:
119.s41:获取所述待筛选的热点关联数据集中的每个热点关联数据对应的热 点来源信息;
120.s42:针对每个所述热点来源信息进行综合评分,得到综合评分结果;
121.s43:根据各个所述综合评分结果,对所述待筛选的热点关联数据集进行 排序,得到排序后的热点关联数据集;
122.s44:采用预设筛选比例和从开头开始筛选的方法,从所述排序后的热点 关联数据集中进行所述热点关联数据的筛选,得到所述目标热点关联数据集。
123.本实施例根据热点来源信息进行综合评分,根据综合评分结果对所述待 筛选的热点关联数据集进行排序,然后筛选出热点关联数据,从而有利于提 高目标热点关联数据集的可信度,也提高了话题推荐的准确性。
124.对于s41,可以获取用户输入的所述待筛选的热点关联数据集中的每个热 点关联数据对应的热点来源信息,也可以从数据库中获取所述待筛选的热点 关联数据集中的每个热点关联数据对应的热点来源信息,还可以从第三方应 用系统中获取所述待筛选的热点关联数据集中的每个热点关联数据对应的热 点来源信息。
125.热点来源信息包括:报道人、发布网站标识、报道单位标识。发布网站 标识可以是网站名称、网站id等唯一标识一个网站的数据。报道单位标识可 以是单位名称、单位id等唯一标识一个单位(包括但不限于:企业、报社、 政府宣传机构)的数据。
126.对于s42,获取预设的评分映射表;将所述热点来源信息的报道人在所述 预设的评分映射表的各个评分项目中进行查找,将查找到的评分项目在预设 的评分映射表中对应的评分作为报道人评分;将所述热点来源信息的发布网 站标识在所述预设的评分映射表的各个评分项目中进行查找,将查找到的评 分项目在预设的评分映射表中对应的评分作为发布网站评分;将所述热点来 源信息的报道单位标识在所述预设的评分映射表的各个评分项目中进行查找, 将查找到的评分项目在预设的评分映射表中对应的评分作为报道单位评分; 对同一所述热点来源信息对应的所述报道人评分、所述发布网站评分和所述 报道单位评分进行加权求和,将加权求和得到的数据作为一个综合评分结果。
127.预设的评分映射表包括:评分项目和评分。评分项目包括:报道人、发 布网站标识和报道单位标识中的任一种。
128.对于s43,对所述待筛选的热点关联数据集中的各个热点关联数据按所述 综合评分结果的数值进行倒序排序,将倒序排序后的各个热点关联数据作为 排序后的热点关联数据集。
129.对于s44,从所述排序后的热点关联数据集中的开头开始筛选,获取数量 符合预设筛选比例的所述热点关联数据,将获取的各个所述热点关联数据作 为所述目标热点关
联数据集。
130.在一个实施例中,上述根据所述文章正文倾向性评分,对所述待评估的 话题集进行话题筛选,得到待处理的话题集的步骤,包括:
131.s71:采用倾向性评分词典,对所述待评估的话题集中的各个话题进行话 题倾向性评分计算,得到初始话题倾向性评分集;
132.s72:从所述初始话题倾向性评分集中选出倾向性方向与所述文章正文倾 向性评分对应的倾向性方向相同的话题倾向性评分,得到待处理的话题倾向 性评分集;
133.s73:对所述待处理的话题倾向性评分集中的每个话题倾向性评分与所述 文章正文倾向性评分进行相减计算,得到待处理的倾向性评分差值集;
134.s74:获取预设倾向性评分阈值范围,从所述待处理的倾向性评分差值集 中找出数值位于所述预设倾向性评分阈值范围内的倾向性评分差值,得到目 标倾向性评分差值集;
135.s75:将所述目标倾向性评分差值集对应的各个话题作为所述待处理的话 题集。
136.本实施例从所述待评估的话题集中筛选出倾向性与所述文章正文倾向性 评分对应的倾向性相同的话题,将筛选出的各个话题作为所述待处理的话题 集,从而剔除了倾向性不同的话题,有利于提高话题推荐的准确性。
137.对于s71,采用倾向性评分词典,对所述待评估的话题集中的各个话题进 行话题倾向性评分计算,将计算得到的各个倾向性评分作为初始话题倾向性 评分集。可以理解的是,所述待评估的话题集中每个话题对应初始话题倾向 性评分集中的一个话题倾向性评分。
138.采用倾向性评分词典,对所述待评估的话题集中的各个话题进行话题倾 向性评分计算的方法步骤在此不做赘述。
139.对于s72,倾向性方向包括:正方向、无方向、负方向。倾向性评分大于 0时意味着倾向性方向为正方向,倾向性评分等于0时意味着倾向性方向为无 方向,倾向性评分小于0时意味着倾向性方向为负方向。
140.其中,从所述初始话题倾向性评分集中,选出倾向性方向与所述文章正 文倾向性评分对应的倾向性方向相同的各个话题倾向性评分,将选出的各个 话题倾向性评分作为待处理的话题倾向性评分集。也就是说,待处理的话题 倾向性评分集中的各个话题倾向性评分的倾向性方向均相同(也就是正方向、 无方向、负方向中的任一种)。
141.对于s73,将所述待处理的话题倾向性评分集中的每个话题倾向性评分减 去所述文章正文倾向性评分,将相减得到的每个差值作为一个倾向性评分差 值,将各个倾向性评分差值作为待处理的倾向性评分差值集。
142.对于s74,可以获取用户输入的预设倾向性评分阈值范围,也可以从数据 库中获取预设倾向性评分阈值范围,还可以从第三方应用系统中获取预设倾 向性评分阈值范围,还可以将预设倾向性评分阈值范围写入实现本技术的程 序中。
143.预设倾向性评分阈值范围包括:倾向性评分开始值和倾向性评分结束值。
144.从所述待处理的倾向性评分差值集中找出数值大于或等于倾向性评分开 始值,并且小于或等于倾向性评分结束值的倾向性评分差值,将找出的各个 倾向性评分差值作为目标倾向性评分差值集。
145.对于s75,将所述待评估的话题集中,与所述目标倾向性评分差值集中的 每个倾向性评分差值对应的话题作为一个待处理的话题,将各个待处理的话 题作为所述待处理的话题集。
146.在一个实施例中,上述根据所述待处理的话题集和所述目标文章数据的 正文进行话题推荐,得到话题推荐结果的步骤,包括:
147.s81:对所述待处理的话题集中的每个话题与所述目标文章数据的正文进 行契合度计算,得到待分析的契合度集;
148.s82:获取预设契合度阈值,从所述待分析的契合度集中找出数值大于所 述预设契合度阈值的契合度,得到目标契合度集;
149.s83:将所述目标契合度集对应的各个话题,作为所述话题推荐结果。
150.本实施例通过先计算待处理的话题集中的每个话题与所述目标文章数据 的正文进行契合度,然后根据计算的契合度进行话题推荐,从而是推荐的话 题与目标文章数据的正文更契合,进一步提高了话题推荐的准确性。
151.对于s81,采用预设的契合度计算规则,对所述待处理的话题集中的每个 话题与所述目标文章数据的正文之间进行契合度计算,将计算得到的各个契 合度作为待分析的契合度集。也就是说,待分析的契合度集中的契合度与所 述待处理的话题集中的话题一一对应。
152.对于s82,可以获取用户输入的预设契合度阈值,也可以从数据库中获取 预设契合度阈值,还可以从第三方应用系统中获取预设契合度阈值,还可以 将预设契合度阈值写入实现本技术的程序中。
153.预设契合度阈值,是一个具体数值。
154.其中,从所述待分析的契合度集中找出数值大于所述预设契合度阈值的 契合度,将找出的各个契合度作为目标契合度集,从而过滤掉了与所述目标 文章数据的正文的契合度不达标的话题。
155.对于s83,将所述待处理的话题集中的,与所述目标契合度集对应的各个 话题作为所述话题推荐结果。
156.在一个实施例中,上述将所述目标契合度集对应的各个话题,作为所述 话题推荐结果的步骤,包括:
157.s831:将所述目标契合度集对应的各个话题,作为待纠正的话题集;
158.s832:获取话题库,将所述待纠正的话题集中的每个话题与所述话题库 中的各个话题进行相似度计算,得到所述待纠正的话题集中的每个所述话题 对应的相似度集合;
159.s833:获取相似度阈值,从所述相似度集合中找出数值大于所述相似度 阈值的相似度,得到目标相似度;
160.s834:采用所述话题库中的与所述目标相似度对应的话题,对在所述待 纠正的话题集中的与所述目标相似度对应的话题进行替换;
161.s835:将所述待纠正的话题集作为所述话题推荐结果。
162.本实施例首先采用话题库对目标契合度集对应的各个话题进行纠正,将 纠正后的各个话题作为所述话题推荐结果,从而避免了相同含义的话题存在 不同的描述方式,进一步提高了话题推荐的准确性。
163.对于s831,将所述待处理的话题集中的,与所述目标契合度集对应的各 个话题作为所述待纠正的话题集。
164.对于s832,可以获取用户输入的获取话题库,也可以从数据库中获取获 取话题库,还可以从第三方应用系统中获取获取话题库。
165.话题库包括:话题。
166.其中,采用余弦相似性算法,对所述待纠正的话题集中的每个话题与所 述话题库中的各个话题之间进行相似度计算,将所述待纠正的话题集中的同 一个话题与所述话题库中的各个话题的相似度作为相似度集合。
167.对于s833,可以获取用户输入的相似度阈值,也可以从数据库中获取相 似度阈值,还可以从第三方应用系统中获取相似度阈值,还可以将相似度阈 值写入实现本技术的程序中。
168.相似度阈值,是一个具体数值。
169.其中,从所述相似度集合中找出数值大于所述相似度阈值的相似度,将 找出的每个相似度作为一个目标相似度,从而找到了符合要求的相似度。也 就是说,目标相似度的数量可以为1个,也可以为多个。
170.对于s834,采用所述话题库中的与所述目标相似度对应的话题,对在所 述待纠正的话题集中的与所述目标相似度对应的话题进行替换,从而完成对 所述待纠正的话题集的话题进行纠正,避免了相同的话题存在不同的描述方 式。
171.对于s835,将所述待纠正的话题集直接作为所述话题推荐结果。
172.在一个实施例中,上述根据所述待处理的话题集和所述目标文章数据的 正文进行话题推荐,得到话题推荐结果的步骤之后,包括:
173.s91:将所述话题推荐结果发送给与所述目标文章数据对应的客户端;
174.s92:获取所述客户端根据所述话题推荐结果发送的话题选择结果;
175.s93:根据所述话题选择结果和所述目标文章数据更新内容数据库。
176.本实施例通过将话题推荐结果发送给与目标文章数据对应的客户端,然 后获取用户通过客户端发送的话题选择结果,最后根据所述话题选择结果和 所述目标文章数据更新内容数据库,从而确定了所述目标文章数据的准确话 题,有利于内容平台基于内容数据库进行目标文章数据的准确发布。
177.对于s91,通过与所述目标文章数据对应的客户端的通信连接,将所述话 题推荐结果发送给与所述目标文章数据对应的客户端。
178.所述目标文章数据对应的客户端用于将所述话题推荐结果进行页面展示, 得到话题选择页面;用户在话题选择页面中进行最佳话题选择,选择完成点 击提交按钮;当提交按钮被点击时,将生成话题选择完成信号;根据话题选 择完成信号,从话题选择页面获取话题选择结果。
179.也就是说,话题选择结果中是被选中的话题。
180.对于s92,通过与所述目标文章数据对应的客户端的通信连接,获取所述 客户端根据所述话题推荐结果发送的话题选择结果。
181.对于s93,内容数据库包括:话题和文章数据。
182.其中,将所述话题选择结果和所述目标文章数据作为关联数据,将该关 联数据更
新到内容数据库中。
183.参照图2,本技术实施例中还提供一种基于人工智能的话题推荐装置,所 述装置包括:
184.目标文章数据获取模块100,用于获取目标文章数据;
185.目标文章元素集确定模块200,用于采用分词词典,对所述目标文章数据 进行文章元素提取,得到目标文章元素集;
186.待筛选的热点关联数据集确定模块300,用于获取预设话题元素分析模型, 根据所述预设话题元素分析模型和所述目标文章元素集,在获取的热点关联 数据词典中进行热点关联数据的匹配,得到待筛选的热点关联数据集,其中, 所述预设话题元素分析模型是基于线性回归模型训练得到的模型;
187.目标热点关联数据集确定模块400,用于对所述待筛选的热点关联数据集 进行热点关联数据筛选,得到目标热点关联数据集;
188.待评估的话题集确定模块500,用于采用预设话题模板库,根据所述目标 热点关联数据集对应的各个文章元素进行话题生成,得到待评估的话题集;
189.文章正文倾向性评分确定模块600,用于对所述目标文章数据的正文进行 倾向性评分计算,得到文章正文倾向性评分;
190.待处理的话题集确定模块700,用于根据所述文章正文倾向性评分,对所 述待评估的话题集进行话题筛选,得到待处理的话题集;
191.话题推荐结果确定模块800,用于根据所述待处理的话题集和所述目标文 章数据的正文进行话题推荐,得到话题推荐结果。
192.本实施例首先通过采用分词词典,对所述目标文章数据进行文章元素提 取,得到目标文章元素集,根据所述预设话题元素分析模型和所述目标文章 元素集,在获取的热点关联数据词典中进行热点关联数据的匹配,得到待筛 选的热点关联数据集,对所述待筛选的热点关联数据集进行热点关联数据筛 选,得到目标热点关联数据集,采用预设话题模板库,根据所述目标热点关 联数据集对应的各个文章元素进行话题生成,得到待评估的话题集,然后对 所述目标文章数据的正文进行倾向性评分计算,得到文章正文倾向性评分, 根据所述文章正文倾向性评分,对所述待评估的话题集进行话题筛选,得到 待处理的话题集,最后根据所述待处理的话题集和所述目标文章数据的正文 进行话题推荐,得到话题推荐结果,实现根据导入的文章进行自动化的话题 推荐,不需要手动创建话题,提高了话题更新的及时性;而且对目标文章数 据分别进行热点匹配、热点关联数据筛选、话题生成、话题筛选和话题推荐, 提高了话题的智能性和可选择性。
193.参照图3,本技术实施例中还提供一种计算机设备,该计算机设备可以是 服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的 处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提 供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储 器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器 为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机 设备的数据库用于储存基于人工智能的话题推荐方法等数据。该计算机设备 的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执 行时以实现一种基于人工智能的话题推荐方法。所述基于人工智能的话题推 荐方法,包括:获取目标
文章数据;采用分词词典,对所述目标文章数据进 行文章元素提取,得到目标文章元素集;获取预设话题元素分析模型,根据 所述预设话题元素分析模型和所述目标文章元素集,在获取的热点关联数据 词典中进行热点关联数据的匹配,得到待筛选的热点关联数据集,其中,所 述预设话题元素分析模型是基于线性回归模型训练得到的模型;对所述待筛 选的热点关联数据集进行热点关联数据筛选,得到目标热点关联数据集;采 用预设话题模板库,根据所述目标热点关联数据集对应的各个文章元素进行 话题生成,得到待评估的话题集;对所述目标文章数据的正文进行倾向性评 分计算,得到文章正文倾向性评分;根据所述文章正文倾向性评分,对所述 待评估的话题集进行话题筛选,得到待处理的话题集;根据所述待处理的话 题集和所述目标文章数据的正文进行话题推荐,得到话题推荐结果。
194.本实施例首先通过采用分词词典,对所述目标文章数据进行文章元素提 取,得到目标文章元素集,根据所述预设话题元素分析模型和所述目标文章 元素集,在获取的热点关联数据词典中进行热点关联数据的匹配,得到待筛 选的热点关联数据集,对所述待筛选的热点关联数据集进行热点关联数据筛 选,得到目标热点关联数据集,采用预设话题模板库,根据所述目标热点关 联数据集对应的各个文章元素进行话题生成,得到待评估的话题集,然后对 所述目标文章数据的正文进行倾向性评分计算,得到文章正文倾向性评分, 根据所述文章正文倾向性评分,对所述待评估的话题集进行话题筛选,得到 待处理的话题集,最后根据所述待处理的话题集和所述目标文章数据的正文 进行话题推荐,得到话题推荐结果,实现根据导入的文章进行自动化的话题 推荐,不需要手动创建话题,提高了话题更新的及时性;而且对目标文章数 据分别进行热点匹配、热点关联数据筛选、话题生成、话题筛选和话题推荐, 提高了话题的智能性和可选择性。
195.本技术一实施例还提供一种计算机可读存储介质,其上存储有计算机程 序,计算机程序被处理器执行时实现一种基于人工智能的话题推荐方法,包 括步骤:获取目标文章数据;采用分词词典,对所述目标文章数据进行文章 元素提取,得到目标文章元素集;获取预设话题元素分析模型,根据所述预 设话题元素分析模型和所述目标文章元素集,在获取的热点关联数据词典中 进行热点关联数据的匹配,得到待筛选的热点关联数据集,其中,所述预设 话题元素分析模型是基于线性回归模型训练得到的模型;对所述待筛选的热 点关联数据集进行热点关联数据筛选,得到目标热点关联数据集;采用预设 话题模板库,根据所述目标热点关联数据集对应的各个文章元素进行话题生 成,得到待评估的话题集;对所述目标文章数据的正文进行倾向性评分计算, 得到文章正文倾向性评分;根据所述文章正文倾向性评分,对所述待评估的 话题集进行话题筛选,得到待处理的话题集;根据所述待处理的话题集和所 述目标文章数据的正文进行话题推荐,得到话题推荐结果。
196.上述执行的基于人工智能的话题推荐方法,首先通过采用分词词典,对 所述目标文章数据进行文章元素提取,得到目标文章元素集,根据所述预设 话题元素分析模型和所述目标文章元素集,在获取的热点关联数据词典中进 行热点关联数据的匹配,得到待筛选的热点关联数据集,对所述待筛选的热 点关联数据集进行热点关联数据筛选,得到目标热点关联数据集,采用预设 话题模板库,根据所述目标热点关联数据集对应的各个文章元素进行话题生 成,得到待评估的话题集,然后对所述目标文章数据的正文进行倾向性评分 计算,得到文章正文倾向性评分,根据所述文章正文倾向性评分,对所述待 评估的话题集进行话题筛选,得到待处理的话题集,最后根据所述待处理的 话题集和所述目标文章数据
的正文进行话题推荐,得到话题推荐结果,实现 根据导入的文章进行自动化的话题推荐,不需要手动创建话题,提高了话题 更新的及时性;而且对目标文章数据分别进行热点匹配、热点关联数据筛选、 话题生成、话题筛选和话题推荐,提高了话题的智能性和可选择性。
197.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程, 是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储 于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如 上述各方法的实施例的流程。其中,本技术所提供的和实施例中所使用的对 存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失 性存储器。非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、 电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失 性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说 明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram (dram)、同步dram(sdram)、双速据率sdram(ssrsdram)、增 强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存 储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram (drdram)、以及存储器总线动态ram(rdram)等。
198.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在 涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方 法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括 为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下, 由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、装置、物 品或者方法中还存在另外的相同要素。
199.以上所述仅为本技术的优选实施例,并非因此限制本技术的专利范围, 凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接 或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献