一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本识别方法、装置、电子设备、存储介质及转账方法与流程

2021-10-30 01:54:00 来源:中国专利 TAG:方法 转账 人工智能 电子设备 识别

技术特征:
1.一种文本识别方法,包括:获取非标准文本内容,对所述非标准文本内容进行第一预处理,生成非标准语料库,所述非标准文本内容属于标准类别库的一种;对所述标准类别库中的标准文本内容进行第二预处理,生成标准语料库;比对所述标准语料库的标准词汇和所述非标准语料库中的非标准词汇,基于比对结果对所述非标准语料库中的非标准词汇进行第三预处理,生成准标准语料库,所述第三预处理包括添加和/或删除所述非标准语料库中的非标准词汇;对所述标准语料库的标准词汇和所述准标准语料库中的准标准词汇进行后置处理以生成相似度排名,根据所述相似度排名输出文本识别结果。2.根据权利要求1所述的文本识别方法,其中,所述获取非标准文本内容,对所述非标准文本内容进行第一预处理,生成非标准语料库包括:获取非标准文本内容,对所述非标准文本内容进行分词处理,生成所述非标准词汇,所述非标准词汇包含关键词;根据所述非标准词汇中的关键词确定所述非标准文本内容所在的所述标准类别库;对所述非标准词汇进行过滤处理,生成所述非标准语料库。3.根据权利要求2所述的文本识别方法,其中,所述对所述标准类别库中的标准文本内容进行第二预处理,生成标准语料库包括:获取所述标准类别库中的所有标准文本内容;对每一条所述标准文本内容进行分词处理,生成所述标准词汇;对所述标准词汇进行过滤处理,生成所述标准语料库。4.根据权利要求3所述的文本识别方法,其中,基于比对结果对所述非标准语料库中的非标准词汇进行第三预处理包括:若所述非标准词汇存在于所述非标准语料库中,且不存在所述标准语料库中,则删除所述非标准语料库中的所述非标准词汇。5.根据权利要求4所述的文本识别方法,其中,所述基于比对结果对所述非标准语料库中的词汇进行第三预处理还包括:获取所述非标准语料库中的每一个所述非标准词汇,根据获取的所述非标准词汇,提取所述标准语料库中包含所述非标准词汇的所述标准词汇;根据提取的所述标准词汇生成交集词汇;若所述交集词汇不在所述非标准语料库中,则将生成的所述交集词汇添加至所述非标准语料库,以生成准标准语料库,所述准标准语料库包含准标准词汇。6.根据权利要求5所述的文本识别方法,其中,所述对所述标准语料库的标准词汇和所述准标准语料库中的准标准词汇进行后置处理以生成排名,根据所述排名输出文本识别结果包括:对所述标准语料库的标准词汇和所述准标准语料库中的准标准词汇进行向量化处理;根据所述向量化处理结果,计算所述标准词汇的向量和所述准标准词汇的向量的余弦相似度;基于余弦相似度生成相似度排名,选择排名大于设定阈值的所述标准词汇所对应的标准文本作为目标文本输出。
7.根据权利要求6所述的文本识别方法,其中,所述目标文本还包括与所述标准文本对应的标准编号。8.根据权利要求1至7中任一项所述的文本识别方法,其中,所述非标准文本内容包括用户输入的文本内容,所述标准文本内容包括存储在服务器的设定文本内容。9.一种银行转账方法,应用于付款服务器,包括:接收银行账户的转账请求,所述转账请求包括:付款账户信息、收款账户信息和转账金额信息;比对所述转账请求中的所述付款账户信息与付款服务器中的第一标准账户信息;基于比对结果向收款服务器进行转账交易;其中所述付款账户信息和收款账户信息中的至少一者是通过权利要求1至8中任一项所述的文本识别方法识别获取的。10.一种银行转账方法,应用于收款服务器,包括:接收付款服务器的收款请求,所述收款请求包括:付款账户信息、收款账户信息和收款金额;比对所述收款请求中的所述收款账户信息与收款服务器中的第二标准账户信息;基于比对结果向服务器返回转账交易结果;其中,所述付款账户信息和收款账户信息中的至少一者是通过权利要求1至8中任一项所述的文本识别方法识别获取的。11.一种文本识别装置,其中,包括:第一预处理模块,配置为获取非标准文本内容,对所述非标准文本内容进行第一预处理,生成非标准语料库,所述非标准文本内容属于标准类别库的一种;第二预处理模块,配置为对所述标准类别库中的标准文本内容进行第二预处理,生成标准语料库;第三预处理模块,比对所述标准语料库的标准词汇和所述非标准语料库中的非标准词汇,基于比对结果对所述非标准语料库中的非标准词汇进行第三预处理,生成准标准语料库,所述第三预处理包括添加和/或删除所述非标准语料库中的非标准词汇;后置处理模块,配置为对所述标准语料库的标准词汇和所述准标准语料库中的准标准词汇进行后置处理以生成相似度排名,根据所述相似度排名输出文本识别结果。12.一种电子设备,包括:一个或多个处理器;存储装置,用于存储可执行指令,所述可执行指令在被所述处理器执行时,实现根据权利要求1至8中任一项所述的文本识别方法。13.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时,实现根据权利要求1至8中任一项所述的文本识别方法。14.一种计算机程序产品,包括计算机程序,所述计算机程序被处理执行时实现根据权利要求1至8中任一项所述的文本识别方法。

技术总结
本公开提供了一种文本识别方法、装置、电子设备、可读存储介质及转账方法,可以应用于人工智能技术领域、金融领域或其他领域。该文本识别方法,包括:获取非标准文本内容,对非标准文本内容进行第一预处理,生成非标准语料库,非标准文本内容属于标准类别库的一种;对标准类别库中的标准文本内容进行第二预处理,生成标准语料库;比对标准语料库的标准词汇和非标准语料库中的非标准词汇,基于比对结果对非标准语料库中的非标准词汇进行第三预处理,生成准标准语料库,第三预处理包括添加和/或删除非标准语料库中的非标准词汇;对标准语料库的标准词汇和准标准语料库中的准标准词汇进行后置处理以生成排名,根据排名输出文本识别结果。别结果。别结果。


技术研发人员:徐志 毛群 戴辛晨 王宇 梁晨翊 罗杰文
受保护的技术使用者:中国工商银行股份有限公司
技术研发日:2021.07.29
技术公布日:2021/10/29
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜