一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

中文文本的转换方法、装置、设备及介质与流程

2022-02-21 04:24:38 来源:中国专利 TAG:

技术特征:
1.一种中文文本的转换方法,其特征在于,所述方法包括:获取待转换的中文文本;基于预设的词根库对待匹配文本执行预设的匹配操作,以得到所述待匹配文本对应的匹配词根和尾部文本,其中,所述待匹配文本是基于所述待转换的中文文本确定出的,所述待匹配文本的初始值为所述中文文本,所述词根库预先存储有多个中文词根,且每个所述中文词根均预先设置有对应的英文词根,所述尾部文本是指所述待匹配文本中除去所述匹配词根的部分文本;将所述匹配词根添加至预设的词根容器中;判断所述尾部文本是否为空值;当判断出所述尾部文本不为空值时,将所述尾部文本确定为新的待匹配文本,并触发执行所述基于预设的词根库对待匹配文本执行预设的匹配操作,以得到所述待匹配文本对应的匹配词根和尾部文本的步骤;当判断出所述尾部文本为空值时,从所述词根容器中提取出所有的所述匹配词根,并按照每个所述匹配词根添加至所述词根容器的先后顺序,将每个所述匹配词根在所述词根库中对应的英文词根进行组合,以得到所述中文文本对应的英文文本。2.根据权利要求1所述的中文文本的转换方法,其特征在于,所述基于预设的词根库对待匹配文本执行预设的匹配操作,以得到所述待匹配文本对应的匹配词根和尾部文本,包括:查询预设的词根库中是否存在与待匹配文本相同的目标中文词根;当查询出所述词根库中不存在所述目标中文词根时,将所述待匹配文本中的最后一个字符删除,并触发执行所述查询预设的词根库中是否存在与待匹配文本相同的目标中文词根的步骤;当查询出所述词根库中存在所述目标中文词根时,将所述目标中文词根确定为所述待匹配文本对应的匹配词根,将所述待匹配文本中除去所述匹配词根的部分文本确定为所述待匹配文本对应的尾部文本。3.根据权利要求2所述的中文文本的转换方法,其特征在于,在查询出所述词根库中不存在所述目标中文词根之后,所述将所述待匹配文本中的最后一个字符删除之前,所述方法还包括:判断所述待匹配文本中的字符数量是否大于等于二;当判断出所述待匹配文本中的字符数量大于等于二时,触发执行所述将所述待匹配文本中的最后一个字符删除的步骤;当判断出所述待匹配文本中的字符数量未大于等于二时,输出用于提示用户匹配失败的错误提示。4.根据权利要求3所述的中文文本的转换方法,其特征在于,在判断出所述待匹配文本中的字符数量未大于等于二之后,所述方法还包括:从所述词根容器中提取出目标匹配词根,并将所述目标匹配词根从所述词根容器中删除,其中,所述目标匹配词根是指所述词根容器中最后添加至所述词根容器的匹配词根;根据所述目标匹配词根,从所述中文文本中选取出目标文本以作为新的待匹配文本,其中,所述目标文本为所述中文文本中以所述目标匹配词根为起始,以所述中文文本的最
后一个字符为结束的部分文本;基于所述词根库和所述目标匹配词根对所述待匹配文本执行预设的二次匹配操作,以得到所述待匹配文本对应的二次匹配词根和二次尾部文本;将所述二次匹配词根添加至所述词根容器中;将所述二次尾部文本确定为新的待匹配文本,并触发执行所述基于预设的词根库对待匹配文本执行预设的匹配操作,以得到所述待匹配文本对应的匹配词根和尾部文本的步骤。5.根据权利要求4所述的中文文本的转换方法,其特征在于,所述基于所述词根库和所述目标匹配词根对所述待匹配文本执行预设的二次匹配操作,以得到所述待匹配文本对应的二次匹配词根和二次尾部文本,包括:查询所述词根库中是否存在二次中文词根,其中,所述二次中文词根是指与待匹配文本相同且与所述目标匹配词根不同的中文词根;当查询出所述词根库中不存在所述二次中文词根时,将所述待匹配文本中的最后一个字符删除,并触发执行所述查询所述词根库中是否存在二次中文词根的步骤;当查询出所述词根库中存在所述二次中文词根时,将所述二次中文词根确定为所述待匹配文本对应的二次匹配词根,将所述待匹配文本中除去所述二次匹配词根的部分文本确定为所述待匹配文本对应的二次尾部文本。6.根据权利要求5所述的中文文本的转换方法,其特征在于,在查询出所述词根库中不存在所述二次中文词根之后,所述将所述待匹配文本中的最后一个字符删除之前,所述方法还包括:判断所述待匹配文本中的字符数量是否大于等于二;当判断出所述待匹配文本中的字符数量大于等于二时,触发执行所述将所述待匹配文本中的最后一个字符删除的步骤;当判断出所述待匹配文本中的字符数量未大于等于二时,输出用于提示用户二次匹配失败的错误提示。7.根据权利要求4所述的中文文本的转换方法,其特征在于,所述将所述二次尾部文本确定为新的待匹配文本之前,所述方法还包括:判断所述二次尾部文本是否为空值;当判断出所述二次尾部文本不为空值时,触发执行所述将所述二次尾部文本确定为新的待匹配文本的步骤;当判断出所述二次尾部文本为空值时,触发执行所述从所述词根容器中提取出所有的所述匹配词根,并按照每个所述匹配词根添加至所述词根容器的先后顺序,将每个所述匹配词根在所述词根库中对应的英文词根进行组合,以得到所述中文文本对应的英文文本的步骤。8.一种中文文本的转换装置,其特征在于,所述装置包括:获取模块,用于获取待转换的中文文本;匹配模块,用于基于预设的词根库对待匹配文本执行预设的匹配操作,以得到所述待匹配文本对应的匹配词根和尾部文本,其中,所述待匹配文本是基于所述待转换的中文文本确定出的,所述待匹配文本的初始值为所述中文文本,所述词根库预先存储有多个中文
词根,且每个所述中文词根均预先设置有对应的英文词根,所述尾部文本是指所述待匹配文本中除去所述匹配词根的部分文本;添加模块,用于将所述匹配词根添加至预设的词根容器中;判断模块,用于判断所述尾部文本是否为空值;确定模块,用于当判断出所述尾部文本不为空值时,将所述尾部文本确定为新的待匹配文本,并触发执行所述基于预设的词根库对待匹配文本执行预设的匹配操作,以得到所述待匹配文本对应的匹配词根和尾部文本的步骤;组合模块,用于当判断出所述尾部文本为空值时,从所述词根容器中提取出所有的所述匹配词根,并按照每个所述匹配词根添加至所述词根容器的先后顺序,将每个所述匹配词根在所述词根库中对应的英文词根进行组合,以得到所述中文文本对应的英文文本。9.一种计算机设备,其特征在于,所述计算机设备包括:存储有可执行程序代码的存储器;与所述存储器连接的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1-7任一项所述的中文文本的转换方法。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的中文文本的转换方法。

技术总结
本发明涉及人工智能领域,公开了一种中文文本的转换方法,包括:获取待转换的中文文本,基于预设的词根库对待匹配文本执行预设的匹配操作,以得到待匹配文本对应的匹配词根和尾部文本,将匹配词根添加至预设的词根容器中,判断尾部文本是否为空值,当判断出尾部文本不为空值时,将尾部文本确定为新的待匹配文本,并再次执行预设的匹配操作,当判断出尾部文本为空值时,从词根容器中提取出所有的匹配词根,并将每个匹配词根对应的英文词根进行组合,以得到中文文本对应的英文文本。可见,本发明能够通过简单的词根匹配来实现文本的转换,提高文本转换的转换效率和转换准确度。提高文本转换的转换效率和转换准确度。提高文本转换的转换效率和转换准确度。


技术研发人员:贺光明
受保护的技术使用者:中国平安财产保险股份有限公司
技术研发日:2021.10.19
技术公布日:2022/1/21
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献