一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

资讯文本生成模型的构造方法、装置、设备及存储介质与流程

2021-11-09 23:12:00 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,尤其是一种资讯文本生成模型的构造方法、装置、电子设备及存储介质。


背景技术:

2.随着知识图谱和深度学习技术的快速发展,基于这些前沿技术的文本生成在工业界快速落地的需求与日俱增。汽车行业知识较为专业,与开放领域或其他知识领域不同的是:车型品牌多样、配置参数复杂,车辆信息中描述到的测度众多,如外观、动力、内饰等,同时资讯文章类别众多,如新车上市、车型口碑对比、优惠信息等,这些都大大增加了文本生成的难度。
3.现有技术中,对资讯文本的生成大多是单纯的基于图数据到文本序列的深度学习模型来完成,或者只结合了简单的外部知识,还未利用图神经网络对图数据进行知识表示后再作为外部知识,导致资讯文本生成的内容不够丰富,文章语句单一,容易出现字词重复,语句不够通畅,应付不了复杂场景。
4.因此,需要一种能够满足汽车领域应用需求,快速生成大量高质量文本资讯数据的资讯文本生成模型的构造方法。


技术实现要素:

5.为此,本发明提供了一种资讯文本生成模型的构造方法、装置、电子设备及存储介质,以力图解决或者至少缓解上面存在的至少一个问题。
6.根据本发明的一个方面,提供了一种资讯文本生成模型的构造方法,所述方法适于采用图神经网络方法构建资讯文本生成模型,所述方法包括步骤:获取资讯文章信息,抽取所述资讯文章信息的关键属性信息,构建资讯知识图谱;依据所述资讯知识图谱,对所述资讯知识图谱进行图卷积操作,获取资讯文本生成模型。
7.可选的,所述获取资讯文章信息,抽取所述资讯文章信息的关键属性信息,构建资讯知识图谱的步骤包括:获取资讯文章信息,并按照资讯文章信息的类别标签进行分类;对所述资讯文章信息进行关键属性信息抽取,获取所述资讯文章信息的关键属性信息;依据所述资讯文章信息的关键属性信息,对所述资讯文章信息进行分词和分句操作;依据所述分词和分句操作,获取所述关键属性信息对应的第一分句集合,所述第一分句集合包括关键属性信息对应的分句,及分句中关键属性信息的排序;依据所述第一分句集合,获取第二分句集合,所述第二分句集合包括所有第一分句集合的元素组成的全局分句,及所述分句对应的关键属性信息上下文;依据所述第一分句集合和所述第二分句集合,构建资讯知识图谱。
8.可选的,所述对所述资讯文章信息进行关键属性信息抽取,获取所述资讯文章信息的关键属性信息的步骤包括:对所述资讯文章信息进行清洗,去掉所述资讯文章信息中的无用信息;对清洗后的资讯文章信息进行关键词抽取,获取第一关键属性集合;对清洗后
的资讯文章信息进行主谓宾三元组抽取和因果三元组抽取,将抽取结果进行去重处理后,获取第二关键属性集合;对清洗后的资讯文章信息进行汽车领域实体识别,获取第三关键属性集合;依据第一关键属性集合、第二关键属性集合、第三关键属性集合中元素的交集,获取所述资讯文章信息的关键属性信息。
9.可选的,对所述资讯文章信息进行关键属性信息抽取,获取所述资讯文章信息的关键属性信息的步骤还包括:依据所述资讯文章信息的分类,编写正则表达式提取各个所述资讯文章信息的分类下独有的关键属性元素,作为所述关键属性信息的补充。
10.可选的,所述依据所述分词和分句操作,获取所述关键属性信息对应的第一分句集合,所述第一分句集合包括关键属性信息对应的分句,及分句中关键属性信息的排序的步骤包括:对所述资讯文章信息进行分词和分句操作,抽取资讯文章信息中所述关键属性信息对应的分句;依据所述分句中关键属性信息出现的顺序,对所述关键属性信息进行排序,获取第四关键属性集合;依据所述分句及所述第四关键属性集合,获取第一分句集合。
11.可选的,所述依据所述第一分句集合,获取第二分句集合的步骤包括:依据第一分句集合,获取所述第一分句集合中所有元素组成的全局分句;依据所述第一分句集合中所有元素组成的全局分句,获取所述全局分句相应的关键属性信息上下文;依据所述全局分句,及所述全局分句相应的关键属性信息上下文,获取第二分句集合。
12.可选的,所述依据所述资讯知识图谱,对所述资讯知识图谱进行图卷积操作,获取资讯文本生成模型的步骤包括:使用图卷积网络算法对所述资讯知识图谱进行知识表示,获取第一表示全局上下文信息;构建文本生成网络,对每个关键属性信息进行编码,获取第一编码集合;使用多层神经网络连接所述第一编码集合,运算得到第一计划解码器;依据所述第一表示全局上下文信息和所述第一计划解码器,获取第一运算输出,所述第一运算输出中任一时刻的运算结果参与其下一时刻的运算过程;获取任一时刻的第一隐变量,所述任一时刻的第一隐变量由所述第一运算输出、第一表示全局上下文信息和前一时刻的第一隐变量经变分自编码器得到;依据所述第一表示全局上下文信息,对任一时刻的第一隐变量进行句子级别的解码操作,将解码结果作为下一时刻的第一隐变量的计算输入,参与解码;进行迭代训练,直至损失值收敛,获取资讯文本生成模型,所述资讯文本生成模型的生成文本指标大于设定阈值。
13.根据本发明的又一方面,公开了一种运用资讯文本生成模型生成资讯文本的方法,所述方法包括:依据所述资讯文本生成模型,整理资讯文章的关键属性信息框架,生成资讯文本。
14.根据本发明的又一方面,公开了一种资讯文本生成模型的构造装置,该装置适用于采用图神经网络方法构建资讯文本生成模型,该装置包括:
15.图谱构建模块,用于获取资讯文章信息,抽取所述资讯文章信息的关键属性信息,构建资讯知识图谱;
16.模型生成模块,用于依据所述资讯知识图谱,对所述资讯知识图谱进行图卷积操作,获取资讯文本生成模型。
17.根据本发明的又一方面,提供了一种计算设备,包括:一个或多个处理器;和存储器;一个或多个程序,其中所述一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,所述一个或多个程序包括用于执行如上所述资讯文本生成模型的构造方法中
的任一方法的指令,和/或,所述一个或多个程序包括用于执行如上所述运用资讯文本生成模型生成资讯文本的方法中的任一方法的指令。
18.根据本发明的又一方面,提供了一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当计算设备执行时,使得计算设备执行如上所述资讯文本生成模型的构造方法中的任一方法,和/或,所述一个或多个程序包括用于执行如上所述运用资讯文本生成模型生成资讯文本的方法中的任一方法的指令。
19.根据本发明的资讯文本生成模型的构造方案,通过获取资讯文章信息,抽取所述资讯文章信息的关键属性信息,构建资讯知识图谱;依据所述资讯知识图谱,对所述资讯知识图谱进行图卷积操作,获取资讯文本生成模型。构建的资讯知识图谱能够保证在后续的资讯文本生成过程中,可以作为有效的外部知识融入其中,对构建好的知识图谱进行图卷积操作,提取出知识图谱的全局知识表示,该知识表示将会参与后面的解码器的解码操作,将作为隐变量指导解码计算过程,达到控制句子之间逻辑关系的目的,同时发挥了图神经网络的推理能力,保证生成文章的事实正确性,解码时融合了图神经网络的计算结果,完成句子级别的解码和词级别的解码,使得生成的资讯内容在篇章结构上逻辑清晰,句子中用词得当,表达内容细节丰富。
附图说明
20.为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
21.图1示出了根据本发明一个实施例的计算设备100的构造示意图;以及
22.图2示出了根据本发明一个实施例的资讯文本生成模型的构造方法200的流程图;以及
23.图3示出了根据本发明一个实施例的资讯文本生成装置300的结构示意图。
具体实施方式
24.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
25.图1是示例计算设备100的框图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
26.取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器(μp)、微控制器(μc)、数字信息处理器(dsp)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(alu)、浮点数单元(fpu)、
text任务。这种任务的目标是从结构化数据源中生成文本,生成目标的主体和内容相对明确,适用于垂直领域。在早期的实现过程中一般不涉及复杂计算,更多的应用了大量的规则和模板,鲁棒性高,开发者需要根据用户的需求提前定制好这些模板;随着深度学习的发展,基于深度学习模型的方法成为data to text的主流方法,此类方法下涉及到的神经网络种类较多,包括但不局限于lstm(long short

term memory,长短期记忆网络)及其变种、变分自编码器、attention机制、图神经网络等,这类方法的统一特征是应用前需要整理大批量符合业务逻辑的规范数据,通过编码器把数据进行知识表示,再通过解码器生成目标文本。另外一种任务是基于大规模预训练模型的文本生成,在实现的首要步骤中,先要提供生成文本的开头部分,生成的内容较为发散,更适用于开放领域,典型的代表作有gpt2、gpt3、unilm等。
33.基于模板的文本生成方法,目前存在于工业界中最成熟的方法就是基于模板文本生成方法,此方法的核心思想是把有组织的结构化数据通过固定的模板或规则,快速的生成一段文本。以专利cn 101470700 a为代表,提供了一种依据文法规则确定关键槽位位置后,制定相应模板的文本生成方法。这种方案在很多领域中都得到了广泛的应用,在这些领域中,目标文本往往是叙述发生的客观事实,文本结构相对固定,因此这种方法的运行速度极快,可以达到每秒生成万级别的可观速度,只要提供的数据准确,最终生成的结果是非常可靠的;该方案的缺点是生成的文本不够丰富,且适用的领域有限,同时需要大量的人力设计模板,在维护上的工作较为繁重,不适合应用在大数据量的场景中,在资讯这类题材较多的领域中,模板生成的文章显得句式单一,行文刻板,最终导致用户失去阅读兴趣,长远来说对于媒体是不利的。
34.基于seq2seq架构的文本生成方法,随着深度学习的快速发展,基于模板的文本生成方法已经不能满足用户的多样化需求,因此基于seq2seq的文本生成方法得以快速发展。以专利cn106980683a和专利cn105930314a为代表,摒弃了基于模板的生成方法,构建了基于编码器

解码器的文本摘要生成方法,在最简单的开放领域简单对话场景中,只需要充分的训练数据,编码端和解码端往往是简单的rnn,gru等神经网络就能取得一定的效果,但是在文本摘要,个性化对话系统中,seq2seq的架构会更复杂,其往往在编码端的部分中加入更多的外部信息,融入主题或者其他外部知识,或者控制解码过程中的细节,这些改变确实让文本生成的结果更令人满意;该方案的主要缺点是文本生成的结果会过于简单,无法融入行业信息,应对不了领域的复杂场景,而且极容易出现字词重复,语句不通畅的问题。
35.基于大规模文本和transformer架构的文本与训练方法,随着transformer架构在自然语言处理领域的大行其道,基于此架构的文本生成方法也取得了不错的成绩,谷歌、百度、哈尔滨工业大学等都开源了基于此架构的中文预训练模型,用户只需要提供目标文本的前缀词,就可以获取一整段比较通顺的文本;该方案的主要缺点是预训练中文模型需要足够多的算力,成本极高,而且得到的预训练模型不能保证其在目标领域上的适用性,生成的文本虽然通顺,但是往往和用户所要表达的内容相去甚远。
36.图2示出了根据本发明一个实施例的资讯文本生成模型的构造方法200的流程图。如图2所示,该方法200方法适于采用图神经网络完成资讯信息的文本生成,方法200始于步骤s210,获取资讯文章信息,抽取所述资讯文章信息的关键属性信息,构建资讯知识图谱。
37.具体的,由于资讯信息非常广泛,类型条目非常多,因此,在获取资讯文章信息以
后,需要使用知识抽取算法抽取资讯文章信息中的关键知识点,具体的知识抽取算法是使用现有技术中的一种或多种,本技术在此不做具体的技术阐述。通过收集大量的资讯信息,包括汽车类新闻、资讯文章等,并按照文章的类别标签进行类别划分,然后去掉资讯文章信息中的无用信息,比如表格、广告、编者、超链接等,然后对处理后的资讯文章信息进行关键属性信息抽取,进而构建资讯知识图谱。
38.具体的,根据本发明的实施方式,所述获取资讯文章信息,抽取所述资讯文章信息的关键属性信息,构建资讯知识图谱的步骤包括:
39.获取资讯文章信息,并按照资讯文章信息的类别标签进行分类;
40.对所述资讯文章信息进行关键属性信息抽取,获取所述资讯文章信息的关键属性信息;具体的,所述关键属性信息就是资讯文章信息中的关键词,通过关键属性信息,可以获取资讯文章信息的主体内容,进而,通过关键词扩展,可以完整的获取资讯文章信息中的核心内容,而且去除次要内容。
41.依据所述资讯文章信息的关键属性信息,对所述资讯文章信息进行分词和分句操作;具体的,分词和分句操作的目的是获取一个关键词和关键句,从而获取所述资讯文章信息的核心内容。
42.依据所述分词和分句操作,获取所述关键属性信息对应的第一分句集合,所述第一分句集合包括关键属性信息对应的分句,及分句中关键属性信息的排序;具体的,所述第一分句集合是通过资讯文章信息的关键属性信息,来获取的资讯文章信息中的对应句子,将所有的关键属性信息对应的句子集合,即组成了所述关键属性信息对应的第一分句集合。比如,设定所述关键属性信息的集合为e,e中的每个元素即为一个关键属性信息,每一个关键属性信息对应一个分句,那么,将所有的关键属性信息所对应的分句集合为s,那么s就是第一分句集合。
43.依据所述第一分句集合,获取第二分句集合,所述第二分句集合包括所有第一分句集合的元素组成的全局分句,及所述分句对应的关键属性信息上下文;具体的,在获取了第一分句集合以后,还不能完全获取资讯文章信息中所需要的内容,第一分句集合中的分句仅仅是资讯文章信息中的关键句子,它并不是连贯的,而是离散的,并不是一个语序通顺的文章,第二分句集合的作用是将第一分句集合中的分句结合上下文,形成一个语序连贯的段落内容,从而形成符合中文语法以及文章语义的资讯知识。
44.依据所述第一分句集合和所述第二分句集合,构建资讯知识图谱。具体的,通过第一分句集合中的关键属性信息所对应的分句,以及第二分句集合中的分句对应的关键属性信息上下文,这样就可以获取最终的资讯知识图谱。此时的资讯知识图谱包括关键属性信息,关键属性信息对应的分句,以及关键属性信息对应分句对应的关键属性信息上下文。
45.具体的,在本技术的一个实施例中,所述对所述资讯文章信息进行关键属性信息抽取,获取所述资讯文章信息的关键属性信息的步骤包括:
46.对所述资讯文章信息进行清洗,去掉所述资讯文章信息中的无用信息;具体的,所述无用信息包括资讯文章信息中的图片、表格、评论、广告、作者信息、超链接等,将这些无用信息去除以后,即完成了对资讯文章信息的清洗。完成了对所述资讯文章信息的分类和清洗,数据清洗目的是在后面知识图谱的构建和模型训练的过程中不被垃圾文本干扰;做文本分类的目的是便于做数据分析,找到每个类别下独有的关键属性信息,并设计出每个
类别下的启动数据填写框架。
47.对清洗后的资讯文章信息进行关键词抽取,获取第一关键属性集合;具体的,资讯文章信息的关键词一般根据资讯文章信息所表达的文章语义来决定,关键词可以预先设定,比如,设定汽车的某个结构部件、汽车的性能特点、汽车的生产厂家、汽车的类型品牌等作为资讯文章信息的关键词,在进行关键词抽取时,直接从资讯文章信息中抽取,也可以由用户可以根据资讯文章信息的内容,自行设定抽取的关键词。需要特别说明的是,第一关键属性集合中的关键词只是离散的、不成语句的、其相互之间没有语义关联的词语。
48.对清洗后的资讯文章信息进行主谓宾三元组抽取和因果三元组抽取,将抽取结果进行去重处理后,获取第二关键属性集合;具体的,通过对汽车的主谓宾三元组抽取和因果三元组抽取,即获取更为符合文章语义逻辑的关键词,通过诸位并三元组抽取的关键词和通过因果三元组抽取的关键词之间可能会出现重复,因此需要去重处理。需要特别说明的是,第二关键属性集合中的一个或多个关键词之间是存在一定的因果关系或主谓宾关系的,也就是符合文章的语义逻辑或者因果逻辑。
49.对清洗后的资讯文章信息进行汽车领域实体识别,获取第三关键属性集合;具体的,所述汽车领域实体识别就是所抽取的关键词是汽车领域的关键词,即可以将汽车文章资讯信息中的实体识别表示为实体类型和实体值得结构,比如,第三关键属性集合可以表示为:{实体类型

type,实体值

value}得结构。
50.依据第一关键属性集合、第二关键属性集合、第三关键属性集合中元素的交集,获取所述资讯文章信息的关键属性信息。具体得,通过判断第三关键属性集合中得元素与第一关键属性集合、第二关键属性集合的交集,最终就可以得到所需要的关键属性信息,关键属性信息的表示形式为:{实体类型

type,实体值

value}。
51.使用关键词抽取算法、三元组抽取算法,综合得到所述资讯文章信息中的重要信息,并通过使用汽车领域的实体识别算法提取所述资讯文章信息中关键的实体类型

type和对应的实体值

value,并用它们分别过滤出在关键词抽取算法、三元组抽取算法中抽取中的信息,作为构建知识图谱和练数据的关键属性信息集。
52.具体的,在本技术的一个实施例中,对所述资讯文章信息进行关键属性信息抽取,获取所述资讯文章信息的关键属性信息的步骤还包括:
53.依据所述资讯文章信息的分类,编写正则表达式提取各个所述资讯文章信息的分类下独有的关键属性元素,作为所述关键属性信息的补充。具体的,由于对于某一个资讯文章信息而言,可能会有一些独有的关键属性元素,此时,如果不抽取这个独有的关键属性元素,将会影响资讯信息的文本生成的完整性,因此需要在完成资讯文章信息的关键属性信息的抽取以后,通过编写正则表达式,提取各个资讯文章信息的各个分类下独有的关键属性元素来补充关键属性信息。
54.具体的,在本技术的一个实施例中,所述依据所述分词和分句操作,获取所述关键属性信息对应的第一分句集合,所述第一分句集合包括关键属性信息对应的分句,及分句中关键属性信息的排序的步骤包括:
55.对所述资讯文章信息进行分词和分句操作,抽取资讯文章信息中所述关键属性信息对应的分句;具体的,分词操作是获取关键属性信息中的某一个关键词,分句操作是通过关键词而获取相应的语句。通过获取关键属性信息中的每一个关键词,来获取每一个关键
词所对应的分句,就得到了第一分句集合,特别的,第一分句集合中的分句之间也是离散的、不连贯的、不完全符合中文语义的。
56.依据所述分句中关键属性信息出现的顺序,对所述关键属性信息进行排序,获取第四关键属性集合;具体的,结合通过关键属性信息所获取的分句,然后再分句中,依据关键属性信息出现的顺序,对关键属性信息进行排序,所述第四关键属性集合就是对所有分局中的关键属性信息进行排序后的集合。通过第四关键属性集合可以获取结合资讯文章信息语义及语序的关键属性信息,这样能够更好、更快、更通顺的获取资讯文本。
57.依据所述分句及所述第四关键属性集合,获取第一分句集合。具体的,依据所有的关键属性信息对应的语句,以及所述语句中的关键属性信息进行排序后的第四关键属性集合,即组成了第一分句集合,所述第一分句集合的元素包括所有的关键属性信息对应的语句,以及所述语句中的关键属性信息进行排序后的第四关键属性集合。
58.在知识图谱中加入资讯文本信息,重点体现了一篇资讯可被分成几组句子,每组句子中所包含的关键属性信息有哪些,并且句子和关键属性信息的顺序,也会体现在资讯知识图谱中。
59.具体的,在本技术的一个实施例中,所述依据所述第一分句集合,获取第二分句集合的步骤包括:
60.依据第一分句集合,获取所述第一分句集合中所有元素组成的全局分句;具体的,将第一分句集合中的所有元素构建成全局分句,所述全局分句为结合资讯文章信息的全局语义,而将第一分句集合中的所有元素进行排列后,组成的全局分句。
61.依据所述第一分句集合中所有元素组成的全局分句,获取所述全局分句相应的关键属性信息上下文;具体的,通过获取全局分句相应的关键属性信息上下文可以得到表达更为准确、语义更为清洗、语序更为合理的分句组合。
62.依据所述全局分句,及所述全局分句相应的关键属性信息上下文,获取第二分句集合。具体的,第二分句集合包括全局分句,以及全局分句中的关键属性信息所对应的上下文。
63.具体的,通过构建资讯知识图谱,使用知识抽取算法抽取出资讯文章关键知识点,保证在后续的文本生成过程中,资讯知识图谱可以作为有效的外部知识融入到生成过程中。
64.通过步骤s220,依据所述资讯知识图谱,对所述资讯知识图谱进行图卷积操作,获取资讯文本生成模型。具体的,在获取资讯知识图谱以后,通过使用图卷积操作,将资讯知识图谱进行知识表示,然后通过多层神经网络编码,即可获取资讯文本生成模型。
65.具体的,在本技术的一个实施例中,所述依据所述资讯知识图谱,对所述资讯知识图谱进行图卷积操作,获取资讯文本生成模型的步骤包括:
66.使用图卷积网络算法对所述资讯知识图谱进行知识表示,获取第一表示全局上下文信息;
67.构建seq2seq框架的文本生成网络,使用双向gru对每个关键属性信息进行编码,获取第一编码集合;具体的,seq2seq框架是一种通用编码器和解码器框架,用于机器翻译、文本摘要、会话建模、图像描述等,所述gru(gate recurrent unit,门循环阵列)是rnn(recurrent neural network,循环神经网络)的一种,rnn是一类以序列数据为输入,在序
列的演进方向进行递归且所有节点按链式连接的递归神经网络,第一编码集合是使用双向gru对每个关键属性信息进行编码后得到的集合。构建seq2seq框架的文本生成网络是把资讯知识图谱的全局上下文信息带给解码器,辅助解码器计算出的结果更符合资讯知识图谱所表达出的知识和逻辑。
68.使用多层神经网络连接所述第一编码集合,运算得到第一计划解码器;具体的,通过多层神经网络连接第一编码集合进行运算,可以得到计划解码器,此时的计划解码器即为第一计划解码器。
69.依据所述第一表示全局上下文信息和所述第一计划解码器,通过gru运算,获取第一运算输出,所述第一运算输出中任一时刻的运算结果参与其下一时刻的运算过程;具体的,比如定义第一表示全局上下文信息表示为z
p
,第一计划解码器表示为那么通过将z
p
和通过gru运算,可以得到第一运算输出,将第一运算输出表示为g
t
,假设某一时刻t的第一运算输出为g
t
,则g
t
参与到第t 1时刻的g
t 1
的计算过程。
70.获取任一时刻的第一隐变量,所述任一时刻的第一隐变量由所述第一运算输出、第一表示全局上下文信息和前一时刻的第一隐变量经变分自编码器得到;具体的,假设某一t时刻的第一隐变量表示为且符合高斯分布,则某一时刻t的第一隐变量由第一运算输出g
t
、第一表示全局上下文信息z
p
、第t

1时刻的第一隐变量通过变分自编码器得到。在解码器中,构建句子级别和字级别的解码器,保证在生成文本时从粗粒度到细粒度过度,保证文本结构逻辑的合理,以及每个段落或句子的通顺。
71.依据所述第一表示全局上下文信息,使用gru对任一时刻的第一隐变量进行句子级别的解码操作,将解码结果作为下一时刻的第一隐变量的计算输入,参与解码;
72.进行迭代训练,直至损失值收敛,获取资讯文本生成模型,所述资讯文本生成模型的生成文本指标大于设定阈值。
73.应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
74.基于本技术的另一个方面,还公开一种运用资讯文本生成模型生成资讯文本的方法,所述方法包括:依据所述资讯文本生成模型,整理资讯文章的关键属性信息框架,生成资讯文本。
75.具体的,通过运用上述资讯文本生成模型,可以有效地将资讯文章生成资讯文本,在具体的执行过程中,以与生成目标文本的主体为中心,整理对应类别文章下的关键属性信息框架,完善关键属性信息,把完善的关键属性信息集输入到训练好的模型中,即生成所需要的资讯文本信息。
76.填入关键属性信息作为启动数据,根据资讯文章信息类别以及每个类别下特有的属性对进行关键属性信息框架的构建,例如在

新车上市’类别下,属性“上市时间”,“上市
地点”时其他类别资讯所不具备的,则此类属性被标记成特有属性;属性“车系”,“品牌”等式每个类别下几乎都会涵盖的属性信息,则此类属性标记为通用属性。特有属性与通用属性共同组成关键属性信息,由用户编辑好后输入到训练好的模型生成结果,保证生成的结果语句通顺、规避掉生成结果含有字词重复等容易纠正的错误。
77.在一个实施例中,如图3所示,提供了一种资讯文本生成模型的构造装置300,所述装置300包括:图谱构建模块、模型生成模块。
78.图谱构建模块,用于获取资讯文章信息,抽取所述资讯文章信息的关键属性信息,构建资讯知识图谱;模型生成模块,用于依据所述资讯知识图谱,对所述资讯知识图谱进行图卷积操作,获取资讯文本生成模型。
79.具体的,在本技术的另一个实施例中,所述图谱构建模块用于获取资讯文章信息,并按照资讯文章信息的类别标签进行分类;对所述资讯文章信息进行关键属性信息抽取,获取所述资讯文章信息的关键属性信息;依据所述资讯文章信息的关键属性信息,对所述资讯文章信息进行分词和分句操作;依据所述分词和分句操作,获取所述关键属性信息对应的第一分句集合,所述第一分句集合包括关键属性信息对应的分句,及分句中关键属性信息的排序;依据所述第一分句集合,获取第二分句集合,所述第二分句集合包括所有第一分句集合的元素组成的全局分句,及所述分句对应的关键属性信息上下文;依据所述第一分句集合和所述第二分句集合,构建资讯知识图谱。
80.具体的,在本技术的另一个实施例中,所述图谱构建模块用于对所述资讯文章信息进行清洗,去掉所述资讯文章信息中的无用信息;对清洗后的资讯文章信息进行关键词抽取,获取第一关键属性集合;对清洗后的资讯文章信息进行主谓宾三元组抽取和因果三元组抽取,将抽取结果进行去重处理后,获取第二关键属性集合;对清洗后的资讯文章信息进行汽车领域实体识别,获取第三关键属性集合;依据第一关键属性集合、第二关键属性集合、第三关键属性集合中元素的交集,获取所述资讯文章信息的关键属性信息。
81.具体的,在本技术的另一个实施例中,所述图谱构建模块用于依据所述资讯文章信息的分类,编写正则表达式提取各个所述资讯文章信息的分类下独有的关键属性元素,作为所述关键属性信息的补充。
82.具体的,在本技术的另一个实施例中,所述图谱构建模块用于对所述资讯文章信息进行分词和分句操作,抽取资讯文章信息中所述关键属性信息对应的分句;依据所述分句中关键属性信息出现的顺序,对所述关键属性信息进行排序,获取第四关键属性集合;依据所述分句及所述第四关键属性集合,获取第一分句集合。
83.具体的,在本技术的另一个实施例中,所述图谱构建模块用于依据第一分句集合,获取所述第一分句集合中所有元素组成的全局分句;依据所述第一分句集合中所有元素组成的全局分句,获取所述全局分句相应的关键属性信息上下文;依据所述全局分句,及所述全局分句相应的关键属性信息上下文,获取第二分句集合。
84.具体的,在本技术的另一个实施例中,所述模型生成模块用于使用图卷积网络算法对所述资讯知识图谱进行知识表示,获取第一表示全局上下文信息;构建seq2seq框架的文本生成网络,使用双向gru对每个关键属性信息进行编码,获取第一编码集合;使用多层神经网络连接所述第一编码集合,运算得到第一计划解码器;依据所述第一表示全局上下文信息和所述第一计划解码器,通过gru运算,获取第一运算输出,所述第一运算输出中任
一时刻的运算结果参与其下一时刻的运算过程;获取任一时刻的第一隐变量,所述任一时刻的第一隐变量由所述第一运算输出、第一表示全局上下文信息和前一时刻的第一隐变量经变分自编码器得到;依据所述第一表示全局上下文信息,使用gru对任一时刻的第一隐变量进行句子级别的解码操作,将解码结果作为下一时刻的第一隐变量的计算输入,参与解码;进行迭代训练,直至损失值收敛,获取资讯文本生成模型,所述资讯文本生成模型的生成文本指标大于设定阈值。
85.a7如a1所述的方法,其中,所述依据所述资讯文本生成模型,整理资讯文章的关键属性信息框架,生成资讯文本的步骤包括:
86.使用图卷积网络算法对所述资讯知识图谱进行知识表示,获取第一表示全局上下文信息;
87.构建文本生成网络,对每个关键属性信息进行编码,获取第一编码集合;
88.使用多层神经网络连接所述第一编码集合,运算得到第一计划解码器;
89.依据所述第一表示全局上下文信息和所述第一计划解码器,获取第一运算输出,所述第一运算输出中任一时刻的运算结果参与其下一时刻的运算过程;
90.获取任一时刻的第一隐变量,所述任一时刻的第一隐变量由所述第一运算输出、第一表示全局上下文信息和前一时刻的第一隐变量经变分自编码器得到;
91.依据所述第一表示全局上下文信息,对任一时刻的第一隐变量进行句子级别的解码操作,将解码结果作为下一时刻的第一隐变量的计算输入,参与解码;
92.进行迭代训练,直至损失值收敛,获取资讯文本生成模型,所述资讯文本生成模型的生成文本指标大于设定阈值。
93.应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
94.本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
95.本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
96.此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
97.此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
98.如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
99.尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献