文本摘要生成方法、装置、电子设备及存储介质与流程

2021-11-15 19:09:00 来源：中国专利 TAG：

技术特征：
1.一种文本摘要生成方法，包括：将目标文本输入文本摘要生成模型；针对所述文本摘要生成模型在每一轮单词预测输出的候选单词集合，按照每一候选单词的预测概率的降序顺序，从所述候选单词集合中选取累计概率超过预设阈值的目标单词集合，并从所述目标单词集合中选取当前轮次的预测单词；响应于选取的预测单词为结束标识符，依次将每一轮次的预测单词拼接，得到所述目标文本的摘要文本。2.根据权利要求1所述的方法，其中，所述文本摘要生成模型在每一轮单词预测输出的候选单词集合，是基于所述目标文本，和先前轮次选取的预测单词确定的。3.根据权利要求1所述的方法，其中，所述文本摘要生成模型是采用如下方式预先训练的：获取初始模型；获取多组样本文本集；其中，每一样本文本集包含一个样本目标文本和与该样本目标文本对应的多个不同文本风格的样本摘要文本；依次将每个样本目标文本和与该样本目标文本对应的一个样本摘要文本作为所述初始模型的训练样本，迭代训练所述初始模型；判断是否满足模型训练的终止条件，若满足，将当前模型确定为文本摘要生成模型。4.一种文本摘要生成模型训练方法，包括：获取初始模型；获取多组样本文本集；其中，每一样本文本集包含一个样本目标文本和与该样本目标文本对应的多个不同文本风格的样本摘要文本；依次将每个样本目标文本和与该样本目标文本对应的一个样本摘要文本作为所述初始模型的训练样本，迭代训练所述初始模型；判断是否满足模型训练的终止条件，若满足，将当前模型确定为文本摘要生成模型。5.根据权利要求4所述的方法，还包括：采用如下方式获取与所述样本目标文本对应的多个不同文本风格的样本摘要文本：获取所述样本目标文本和该样本目标文本对应的初始摘要文本；对所述初始摘要文本进行文本风格改写，得到多个改写摘要文本；将所述初始摘要文本和所述改写摘要文本确定为与所述样本目标文本对应的多个不同文本风格的样本摘要文本。6.一种文本摘要生成装置，包括：输入模块，用于将目标文本输入文本摘要生成模型；预测模块，用于针对所述文本摘要生成模型在每一轮单词预测输出的候选单词集合，按照每一候选单词的预测概率的降序顺序，从所述候选单词集合中选取累计概率超过预设阈值的目标单词集合，并从所述目标单词集合中选取当前轮次的预测单词；拼接模块，用于响应于选取的预测单词为结束标识符，依次将每一轮次的预测单词拼接，得到所述目标文本的摘要文本。7.根据权利要求6所述的装置，其中，
所述文本摘要生成模型在每一轮单词预测输出的候选单词集合，是基于所述目标文本，和先前轮次选取的预测单词确定的。8.根据权利要求6所述的装置，还包括训练模块，所述训练模型用于采用如下方式预先训练所述文本摘要生成模型：获取初始模型；获取多组样本文本集；其中，每一样本文本集包含一个样本目标文本和与该样本目标文本对应的多个不同文本风格的样本摘要文本；依次将每个样本目标文本和与该样本目标文本对应的一个样本摘要文本作为所述初始模型的训练样本，迭代训练所述初始模型；判断是否满足模型训练的终止条件，若满足，将当前模型确定为文本摘要生成模型。9.一种文本摘要生成模型训练装置，包括：第一获取模块，用于获取初始模型；第二获取模块，用于获取多组样本文本集；其中，每一样本文本集包含一个样本目标文本和与该样本目标文本对应的多个不同文本风格的样本摘要文本；迭代训练模块，用于依次将每个样本目标文本和与该样本目标文本对应的一个样本摘要文本作为所述初始模型的训练样本，迭代训练所述初始模型；判断模块，用于判断是否满足模型训练的终止条件，若满足，将当前模型确定为文本摘要生成模型。10.根据权利要求9所述的装置，还包括：改写模块，用于：采用如下方式获取与所述样本目标文本对应的多个不同文本风格的样本摘要文本：获取所述样本目标文本和该样本目标文本对应的初始摘要文本；对所述初始摘要文本进行文本风格改写，得到多个改写摘要文本；将所述初始摘要文本和所述改写摘要文本确定为与所述样本目标文本对应的多个不同文本风格的样本摘要文本。11.一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1
‑
5中任一项所述的方法。12.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1
‑
5中任一项所述的方法。13.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1
‑
5中任一项所述的方法。

技术总结
本公开提供了一种文本摘要生成方法、装置、电子设备及存储介质，涉及计算机技术，尤其涉及自然语言处理技术领域。具体实现方案为：将目标文本输入文本摘要生成模型；针对所述文本摘要生成模型在每一轮单词预测输出的候选单词集合，按照每一候选单词的预测概率的降序顺序，从所述候选单词集合中选取累计概率超过预设阈值的目标单词集合，并从所述目标单词集合中选取当前轮次的预测单词；响应于选取的预测单词为结束标识符，依次将每一轮次的预测单词拼接，得到所述目标文本的摘要文本。目标单词集合中单词数目会随着候选单词的概率分布进行动态调整，从中选取预测单词，提高了摘要文本的多样性。文本的多样性。文本的多样性。

技术研发人员：念天磊
受保护的技术使用者：北京百度网讯科技有限公司
技术研发日：2021.08.20
技术公布日：2021/11/14

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：内存快照创建方法、装置、设备及可读存储介质与流程

文本摘要生成方法、装置、电子设备及存储介质与流程

相关文献

最热文献