一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本预测方法、装置、电子设备及存储介质与流程

2021-10-20 00:56:00 来源:中国专利 TAG:自然语言 电子设备 装置 可读 文本

技术特征:
1.一种文本预测方法,其特征在于,所述方法包括:获取目标队列中文本的优先级;根据所述优先级选取所述目标队列中优先级最大的优先文本;利用预构建的文本回归预测模型预测所述优先文本的后续文本,得到多个不同后续文本和所述多个不同后续文本的预测概率;判断所述优先文本的丰富度是否大于预设的丰富度阈值,得到判断结果;根据所述判断结果选取不同的筛选操作,并结合所述预测概率从所述多个不同后续文本中筛选待连接文本,将所述待连接文本连接至所述优先文本,得到连接文本,将所述连接文本添加至所述目标队列;返回所述获取目标队列中文本的优先级的步骤继续执行,直至从所述目标队列中选取到的优先文本包含结束符时,确定包含所述结束符的优先文本为预测文本。2.如权利要求1所述的文本预测方法,其特征在于,所述获取目标队列中文本的优先级之前,所述方法还包括:接收用户输入的初始文本,按照预设置的配置方式对所述初始文本进行配置;将配置后的所述初始文本添加至所述目标队列。3.如权利要求2所述的文本预测方法,其特征在于,所述按照预设置的配置方式对所述初始文本进行配置,包括:将起始符添加至所述初始文本的前端,将分隔符添加至所述初始文本的后端;以及对所述初始文本的优先级和丰富度进行初始化赋值。4.如权利要求1所述的文本预测方法,其特征在于,所述将所述待连接文本连接至所述优先文本,得到连接文本之后,包括:利用反语言模型对所述待连接文本进行丰富度计算,得到所述待连接文本块对应的丰富度,确定所述待连接文本对应的丰富度为所述待连接文本连接至所述优先文本后得到的连接文本的丰富度;根据所述待连接文本对应的丰富度和预测概率计算所述待连接文本的优先级,确定所述待连接文本对应的优先级为所述待连接文本连接至所述优先文本后得到的连接文本的优先级。5.如权利要求1所述的文本预测方法,其特征在于,所述根据所述判断结果选取不同的筛选操作,并结合所述预测概率从所述多个不同后续文本中筛选待连接文本,包括:当所述优先文本的丰富度小于丰富度阈值时,从所述多个不同后续文本的预测概率中从大到小依次选取预测概率,当选取的预测概率之和大于第一概率阈值时,确定所述选取的预测概率为高概率集合;将所述高概率集合中的预测概率进行归一化计算,根据归一化运算结果在所述高概率集合中抽取目标后续文本,确定所述目标后续文本为待连接文本。6.如权利要求1所述的文本预测方法,其特征在于,所述根据所述判断结果选取不同的筛选操作,并结合所述预测概率从所述多个不同后续文本中筛选待连接文本,包括:当所述优先文本的丰富度大于丰富度阈值时,从所述多个不同后续文本的预测概率中筛选预测概率大于第二概率的后续文本,得到待连接文本。7.如权利要求1所述的文本预测方法,其特征在于,所述利用预构建的文本回归预测模
型预测所述优先文本的后续文本之前,所述方法还包括:将预构建的训练样本集进行编码及清洗操作,得到编码数据;利用所述编码数据对预构建的待训练文本回归预测模型进行第一阶段训练,得到初级文本回归测试模型;利用预构建的本地数据,对所述初级文本回归测试模型进行第二阶段训练,得到所述文本回归测试模型。8.一种文本预测装置,其特征在于,所述装置包括:优先文本选取模块,用于获取目标队列中文本的优先级,及根据所述优先级选取所述目标队列中优先级最大的优先文本;模型预测模块,用于利用预构建的文本回归预测模型预测所述优先文本的后续文本,得到多个不同后续文本和所述多个不同后续文本的预测概率;预测结果筛选模块,用于判断所述优先文本的丰富度是否大于预设的丰富度阈值,得到判断结果,及根据所述判断结果选取不同的筛选操作,并结合所述预测概率从所述多个不同后续文本中筛选待连接文本,将所述待连接文本连接至所述优先文本,得到连接文本,将所述连接文本添加至所述目标队列;结果输出模块,用于返回能够获取目标队列中文本的优先级的所述优先文本选取模块继续执行,直至从所述目标队列中选取到的优先文本包含结束符时,确定包含所述结束符的优先文本为预测文本。9.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序指令,所述计算机程序指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一项所述的文本预测方法。10.一种计算机可读存储介质,包括存储数据区和存储程序区,存储数据区存储创建的数据,存储程序区存储有计算机程序;其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的文本预测方法。

技术总结
本发明涉及自然语言处理的技术领域,揭露了一种文本预测方法,包括:获取目标队列中文本的优先级;选取目标队列中优先级最大的优先文本;预测所述优先文本的后续文本,得到多个不同后续文本和所述多个不同后续文本的预测概率;判断优先文本的丰富度是否大于丰富度阈值;选取不同的筛选操作结合预测概率从多个不同后续文本中筛选待连接文本,将所述待连接文本连接至所述优先文本,得到连接文本,将所述连接文本添加至所述目标队列;直至从所述目标队列中选取到的优先文本包含结束符时,结束符的优先文本为预测文本。本发明还提出了文本预测装置、设备及计算机可读存储介质。本发明目的在于获取语义丰富的文本,提高文本预测结果的可用性。的可用性。的可用性。


技术研发人员:林大权 徐国强
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:2021.04.23
技术公布日:2021/10/19
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜