一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本处理方法、相关设备、存储介质及计算机程序产品与流程

2022-04-13 22:40:00 来源:中国专利 TAG:

技术特征:
1.一种文本处理方法,其特征在于,包括:获取待处理文本的句法结构特征及文本特征,以及获取结构化数据的结构化特征,所述待处理文本是在目标业务下产生的,所述结构化数据是指与所述目标业务相关的具有结构化特点的数据;对所述句法结构特征、所述文本特征及所述结构化特征进行特征融合处理,得到融合特征;基于所述融合特征对所述待处理文本进行文本分类。2.根据权利要求1所述的方法,其特征在于,所述待处理文本包括一个或多个文本字符;获取所述待处理文本的句法结构特征,包括:采用文本分类模型对所述待处理文本进行句法结构分析,得到每个文本字符的依存角色;获取所述每个文本字符的依存角色对应的特征值,并基于获取到的特征值生成所述待处理文本的句法结构特征。3.根据权利要求1所述的方法,其特征在于,所述结构化数据包括一个或多个数据对象;所述获取结构化数据的结构化特征,包括:调用文本分类模型对所述结构化数据中每个数据对象进行预处理,得到所述每个数据对象的对象特征;基于所述每个数据对象的对象特征以及特征向量化规则,对所述每个数据对象进行向量化处理,得到所述每个数据对象对应的特征向量;基于所述每个数据对象对应的特征向量进行预设运算,得到所述结构化数据的结构化特征。4.根据权利要求1或2所述的方法,其特征在于,文本分类模型包括文本特征提取网络;获取所述待处理文本的文本特征,包括:调用所述文本特征提取网络分别对所述待处理文本进行词法特征提取、句法特征提取以及语义特征提取,得到所述待处理文本对应词法特征、句法特征以及语义特征;基于所述待处理文本对应的词法特征、所述句法特征以及所述语义特征,确定所述待处理文本的文本特征。5.根据权利要求1所述的方法,其特征在于,所述文本特征是调用文本特征提取网络对所述待处理文本进行特征提取得到的,所述文本特征提取网络是基于训练文本进行训练得到的,或者所述文本特征提取网络是基于所述训练文本和所述训练文本对应的句法结构特征训练得到的。6.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取训练数据,所述训练数据包括:训练文本、与所述训练文本相关的结构化训练数据,以及所述训练文本对应的文本分类标签;采用文本分类模型对所述训练文本进行文本分析处理,得到所述训练文本的句法结构特征及文本特征,并采用所述文本分类模型对所述结构化训练数据进行特征提取处理,得到所述结构化训练数据的结构化特征;对所述训练文本的句法结构特征及文本特征,以及所述结构化训练数据的结构化特征进行融合处理,得到目标训练特征;
基于所述目标训练特征对所述训练文本进行文本分类处理,得到所述训练文本的预测分类标签;基于所述预测分类标签与所述文本分类标签之间的差异信息,调整所述文本分类模型的模型参数。7.根据权利要求6所述的方法,其特征在于,所述结构化训练数据的结构化特征是所述文本分类模型基于特征向量化规则进行特征提取处理得到的;所述特征向量化规则包括一个或多个参数,所述模型参数包括每个依存角色对应的特征值,以及所述特征向量化规则中的每个参数;所述基于所述预测分类标签与所述文本分类标签之间的差异信息,调整所述文本分类模型的模型参数,包括:基于所述预测分类标签与所述文本分类标签之间的差异信息,对所述依存角色对应的特征值以及所述特征向量化规则中的每个参数进行调整。8.一种文本处理装置,其特征在于,包括:获取单元,用于获取待处理文本的句法结构特征及文本特征,以及获取结构化数据的结构化特征,所述待处理文本是在目标业务下产生的,所述结构化数据是指与所述目标业务相关的具有结构化特点的数据;处理单元,用于对所述句法结构特征、所述文本特征及所述结构化特征进行特征融合处理,得到融合特征;分类单元,用于基于所述融合特征对所述待处理文本进行文本分类。9.一种计算机设备,其特征在于,包括:处理器,所述处理器适于实现一条或多条计算机程序;计算机存储介质,所述计算机存储介质存储有一条或多条计算机程序,所述一条或多条计算机程序适于由所述处理器加载并执行如权利要求1-7任一项所述的文本处理方法。10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有一条或多条计算机程序,所述一条或多条计算机程序适于由处理器加载并执行如权利要求1-7任一项所述的文本处理方法。11.一种计算机程序产品或计算机程序,其特征在于,所述计算机程序产品包括所述计算机程序,所述计算机程序适于由处理器加载并执行如权利要求1-7任一项所述的文本处理方法。

技术总结
本申请实施例公开了一种文本处理方法、相关设备、存储介质及计算机程序产品,其中方法包括:获取待处理文本的句法结构特征及文本特征,以及获取结构化数据的结构化特征,所述待处理文本是在目标业务下产生的,所述结构化数据是指与所述目标业务相关的具有结构化特点的数据;对所述句法结构特征、文本特征及所述结构化特征进行特征融合处理,得到融合特征;基于所述融合特征对所述待处理文本进行文本分类,可以提升文本分类的准确度。可以提升文本分类的准确度。可以提升文本分类的准确度。


技术研发人员:铁瑞雪
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2021.11.12
技术公布日:2022/4/12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献