一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于人工智能的自然语言处理方法及系统

2022-09-04 08:05:51 来源:中国专利 TAG:

技术特征:
1.一种基于人工智能的自然语言处理方法,其特征在于,包括如下步骤:获取待处理语言语句,所述待处理语言语句至少使用一种语言类型;将所述待处理语言语句输入至语言类型匹配模型中,得到该待处理语言语句使用的所有语言类型;根据所有语言类型,对所述待处理语言语句进行划分,得到多个待处理字词句,其中,任一所述待处理字词句仅使用一种语言类型;按照各个语言类型,依次将所述待处理语言语句转换为多个格式化语句,任一所述格式化语句仅使用一种语言类型且该格式化语句中包含对应语言类型的所有待处理字词句;基于任一格式化语句使用的语言类型,将该格式化语句输入至对应的自然语言处理模型中,得到对应的语义解析结果,所述自然语言处理模型为利用语句内字词关系相似度和语句相似度对对应语言类型的基础字词匹配模型进行更新得到的模型;根据所有格式化语句的语义解析结果,按照预置人工语言格式,将所述待处理语言语句转换为人工语言,得到自然语言处理结果。2.根据权利要求1所述的基于人工智能的自然语言处理方法,其特征在于,所述基于任一格式化语句使用的语言类型,将该格式化语句输入至对应的自然语言处理模型中,得到对应的语义解析结果的步骤之前,还包括:根据任一格式化语句使用的语言类型,获取多个第一训练样本和多个第二训练样本,所述第一训练样本包括语句间相似度高于第一相似度的多个语句,所述第二训练样本包括语句内字词间相似度高于第二相似度的多个语句;基于该格式化语句使用的语言类型,获取训练好的基础字词匹配模型;将所述多个第一训练样本输入至训练好的基础字词匹配模型,得到所述基础字词匹配模型的第一处理偏差值;将所述多个第二训练样本输入至训练好的基础字词匹配模型,得到所述基础字词匹配模型的第二处理偏差值;基于所述第一处理偏差值和所述第二处理偏差值,对训练好的基础字词匹配模型进行更新,得到该语言类型对应的自然语言处理模型。3.根据权利要求2所述的基于人工智能的自然语言处理方法,其特征在于,基于所述第一处理偏差值和所述第二处理偏差值,对训练好的基础字词匹配模型进行更新,得到该语言类型对应的自然语言处理模型的步骤之后,还包括:获取与该语言类型相匹配的测试数据库;利用所述测试数据库测试该语言类型对应的自然语言处理模型,生成测试报告;根据所述测试报告,对所述自然语言处理模型进行调整优化。4.根据权利要求2所述的基于人工智能的自然语言处理方法,其特征在于,所述基于该格式化语句使用的语言类型,获取训练好的基础字词匹配模型的步骤之前,还包括:根据所有语言类型,建立多个基础字词匹配模型,所述基础字词匹配模型与所述语言类型一一对应;基于任一基础字词匹配模型对应的语言类型,获取多个第三训练样本,所述第三训练样本包括使用该语言类型的多个字词句;利用所述多个第三训练样本训练所述基础字词匹配模型,得到训练好的基础字词匹配
模型。5.根据权利要求1所述的基于人工智能的自然语言处理方法,其特征在于,所述按照各个语言类型,依次将所述待处理语言语句转换为多个格式化语句的步骤包括:针对任一语言类型,将所述待处理语言语句中使用该语言类型的待处理字词句进行保留,且将使用其他语言类型的待处理字词句替换为预设符号,以得到对应格式化语句。6.根据权利要求1所述的基于人工智能的自然语言处理方法,其特征在于,将所述待处理语言语句输入至语言类型匹配模型中,得到该待处理语言语句使用的所有语言类型的步骤包括:获取各个语言类型对应的语料库,并利用所有语料库构建语言类型匹配模型;所述语言类型匹配模型将所述待处理语言语句中的每个字与所有语料库进行对比,以判断所述待处理语言语句中所有字的语言类型。7.根据权利要求1所述的基于人工智能的自然语言处理方法,其特征在于,所述待处理语言语句包括口头语言和书面语言。8.一种基于人工智能的自然语言处理系统,其特征在于,包括:待处理语言语句获取模块,用于获取待处理语言语句,所述待处理语言语句至少使用一种语言类型;语言类型匹配模块,用于将所述待处理语言语句输入至语言类型匹配模型中,得到该待处理语言语句使用的所有语言类型;语句划分模块,用于根据所有语言类型,对所述待处理语言语句进行划分,得到多个待处理字词句,其中,任一所述待处理字词句仅使用一种语言类型;格式化语句转换模块,用于按照各个语言类型,依次将所述待处理语言语句转换为多个格式化语句,任一所述格式化语句仅使用一种语言类型且该格式化语句中包含对应语言类型的所有待处理字词句;语义解析模块,用于基于任一格式化语句使用的语言类型,将该格式化语句输入至对应的自然语言处理模型中,得到对应的语义解析结果,所述自然语言处理模型为利用语句内字词关系相似度和语句相似度对对应语言类型的基础字词匹配模型进行更新得到的模型;语言转换模块,用于根据所有格式化语句的语义解析结果,按照预置人工语言格式,将所述待处理语言语句转换为人工语言,得到自然语言处理结果。9.一种电子设备,其特征在于,包括:存储器,用于存储一个或多个程序;处理器;当所述一个或多个程序被所述处理器执行时,实现如权利要求1-7中任一项所述的方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。

技术总结
本发明提出了一种基于人工智能的自然语言处理方法及系统,涉及计算机处理技术领域。该方法包括:获取待处理语言语句。将待处理语言语句输入至语言类型匹配模型中,得到所有语言类型。根据所有语言类型,划分待处理语言语句,得到仅使用一种语言类型的待处理字词句。针对各个语言类型,将待处理语言语句转换为多个格式化语句。基于任一格式化语句使用的语言类型,将该格式化语句输入至对应的自然语言处理模型中。自然语言处理模型根据格式化语句中语句内字词关系和语句关系对格式化语句进行语义分析处理,得到语义解析结果。根据所有语义解析结果,将待处理语言语句转换为人工语言得到的自然语言处理结果,避免了计算机交互处理的偏差和错误。理的偏差和错误。理的偏差和错误。


技术研发人员:买志玉 赵冬 马超凡
受保护的技术使用者:中原工学院
技术研发日:2022.06.17
技术公布日:2022/9/2
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献