一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种文本分类的方法、装置、设备和可读存储介质与流程

2022-07-02 11:48:47 来源:中国专利 TAG:

技术特征:
1.一种文本分类的方法,其特征在于,包括:计算待分类文本中多个词语中的相邻两个词语对应向量的多个差值;基于所述多个差值和所述多个词语对应的多个向量,确定所述待分类文本对应的向量矩阵;基于所述向量矩阵,确定所述待分类文本对应的多个类别和每一类别对应的置信度;基于所述待分类文本对应的多个类别和每一类别对应的置信度,将所述置信度最高的对应的类别作为所述待分类文本的所属类别。2.根据权利要求1所述的方法,其特征在于,所述基于所述多个差值和所述多个词语对应的多个向量,确定所述待分类文本对应的向量矩阵,包括:基于所述多个差值的比例,在所述待分类文本中多个词语中的相邻两个词语对应向量之间插入对应数量的插值向量;将插入的所述插值向量和所述待分类文本中多个词语对应的向量转化成所述向量矩阵。3.根据权利要求1或2所述的方法,其特征在于,所述计算待分类文本中多个词语中的相邻两个词语对应向量的多个差值,包括:将所述待分类文本中多个词语转化成词向量,并进行归一化处理,得到处理后的多个词向量;计算所述多个词向量中相邻两个词向量的差值。4.根据权利要求1或2所述的方法,其特征在于,在所述计算待分类文本中多个词语中的相邻两个词语对应向量的多个差值之前,所述方法还包括:将初始文本进行预处理,得到所述待分类文本,其中,所述预处理包括:去除标点和格式统一化。5.一种文本分类的装置,其特征在于,包括:计算模块,用于计算待分类文本中多个词语中的相邻两个词语对应向量的多个差值;第一确定模块,用于基于所述多个差值和所述多个词语对应的多个向量,确定所述待分类文本对应的向量矩阵;第二确定模块,用于基于所述向量矩阵,确定所述待分类文本对应的多个类别和每一类别对应的置信度;分类模块,用于基于所述待分类文本对应的多个类别和每一类别对应的置信度,将所述置信度最高的对应的类别作为所述待分类文本的所属类别。6.根据权利要求5所述的装置,其特征在于,所述第一确定模块具体用于:基于所述多个差值的比例,在所述待分类文本中多个词语中的相邻两个词语对应向量之间插入对应数量的插值向量;将插入的所述插值向量和所述待分类文本中多个词语对应的向量转化成所述向量矩阵。7.根据权利要求5或6所述的装置,其特征在于,所述计算模块具体用于:将所述待分类文本中多个词语转化成词向量,并进行归一化处理,得到处理后的多个词向量;计算所述多个词向量中相邻两个词向量的差值。
8.根据权利要求5或6所述的装置,其特征在于,所述装置还包括:预处理模块,用于所述计算模块在计算待分类文本中多个词语中的相邻两个词语对应向量的多个差值之前,将初始文本进行预处理,得到所述待分类文本,其中,所述预处理包括:去除标点和格式统一化。9.一种文本分类的设备,其特征在于,包括:存储器和处理器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如权利要求1-4中任一项所述方法中的步骤。10.一种计算机可读存储介质,其特征在于,包括:计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1-4中任一项所述的方法。

技术总结
本申请提供一种文本分类的方法、装置、设备和可读存储介质,该方法包括,计算待分类文本中多个词语中的相邻两个词语对应向量的多个差值;基于多个差值和多个词语对应的多个向量,确定待分类文本对应的向量矩阵;基于向量矩阵,确定待分类文本对应的多个类别和每一类别对应的置信度;基于待分类文本对应的多个类别和每一类别对应的置信度,将置信度最高的对应的类别作为待分类文本的所属类别。通过该方法可以达到对复杂文本进行准确的分类处理的效果。效果。效果。


技术研发人员:熊涛 杜新凯 吕超 王建辉 刘广鹏
受保护的技术使用者:阳光保险集团股份有限公司
技术研发日:2022.04.15
技术公布日:2022/7/1
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献