一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种信息处理方法、装置、设备和计算机存储介质与流程

2021-10-27 20:04:00 来源:中国专利 TAG:自然语言 装置 计算机 方法 设备

技术特征:
1.一种信息处理方法,其特征在于,所述方法包括:获取第一输入信息,其中所述第一输入信息中包含非规范性语言;基于所述第一输入信息,生成第二输入信息,其中所述第二输入信息中修正了所述非规范性语言;将所生成的第二输入信息作为深度学习模型的输入进行训练,生成第一输出信息,其中所述第一输出信息包含所述第一输入信息中特定领域词汇的标签信息;基于所述第一输出信息,生成第二输出信息,其中所述第二输入信息中修正了所述非规范性语言;按照所述特定领域词汇的层级关系,对所述第二输出信息进行聚合处理。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一输入信息,生成第二输入信息,包括:利用所述特定领域的词汇表确定所述第一输入信息中的非规范性语言;确定所述词汇表中对应于所述非规范性语言的规范性语言;将所述词汇表中对应的规范性语言替换所述第一输入信息中的非规范性语言。3.根据权利要求2所述的方法,其特征在于,所述确定所述词汇表中对应于所述非规范性语言的规范性语言,包括:将所述非规范性语言与所述词汇表中的各个已存词汇进行相似度比对;将相似度最高的词汇作为所述非规范性语言的规范性语言。4.根据权利要求1所述的方法,其特征在于,所述深度学习模型包括语言表示模型、循环神经网络和条件随机场;所述语言表示模型用于接收所述第二输入信息,对应输出词向量;所述循环神经网络用于接收所述词向量,对应输出中间向量,其中所述中间词向量用于表征给所述第二输入信息内词汇赋予标签信息的概率;所述条件随机场用于接收所述中间向量,生成所述第一输出信息。5.根据权利要求4所述的方法,其特征在于,所述语言表示模型为bert预训练模型,所述循环神经网络为bilstm网络模型。6.根据权利要求1所述的方法,其特征在于,所述按照所述特定领域词汇的层级关系,对所述第二输出信息进行聚合处理,包括:基于所述特定领域词汇的层级关系,确定所述第二输出信息中的相邻词汇的上下级关系;将确定为上下级关系的词汇进行聚合处理。7.根据权利要求1所述的方法,其特征在于,所述方法应用于车载对话系统;相应的,所述特定领域为地理位置领域。8.一种信息处理装置,其特征在于,所述装置包括:信息获取模块,用于获取第一输入信息,其中所述第一输入信息中包含非规范性语言;第一信息修正模块,用于基于所述第一输入信息,生成第二输入信息,其中所述第二输入信息中修正了所述非规范性语言;信息输出模块,用于将所生成的第二输入信息作为深度学习模型的输入进行训练,生成第一输出信息,其中所述第一输出信息包含所述第一输入信息中特定领域词汇的标签信
息;第二信息修正模块,用于基于所述第一输出信息,生成第二输出信息,其中所述第二输入信息中修正了所述非规范性语言;信息聚合模块,用于按照所述特定领域词汇的层级关系,对所述第二输出信息进行聚合处理。9.一种信息处理设备,其特征在于,所述设备包括存储器和处理器;所述存储器用于存储指令,所述指令用于控制所述处理器进行操作以执行时实现权利要求1

7任一项所述的信息处理方法。10.一种可读存储介质,其特征在于,所述存储介质包括一组计算机可执行指令,当所述指令被执行时用于执行权利要求1

7任一项所述的信息处理方法。

技术总结
本发明公开了一种信息处理方法、装置、设备和计算机存储介质,方法包括:获取第一输入信息,其中第一输入信息包含非规范性语言;基于第一输入信息,生成第二输入信息,其中第二输入信息修正了非规范性语言;将所生成的第二输入信息作为深度学习模型的输入进行训练,生成第一输出信息,其中第一输出信息包含第一输入信息中特定领域词汇的标签信息;基于第一输出信息,生成第二输出信息,其中第二输入信息修正了非规范性语言;按照特定领域词汇的层级关系,对第二输出信息进行聚合处理。本发明经过对信息进行修正处理,并且经过层级关系进行聚合处理,可提高非规范化语言解析的准确率,利用深度学习模型,提高了系统的泛化能力。提高了系统的泛化能力。提高了系统的泛化能力。


技术研发人员:夏林旭 李媛媛
受保护的技术使用者:出门问问信息科技有限公司
技术研发日:2021.07.08
技术公布日:2021/10/26
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜