一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

目标文本类别的确定方法、装置、电子设备和存储介质与流程

2022-08-17 06:37:22 来源:中国专利 TAG:

技术特征:
1.一种目标文本类别的确定方法,其特征在于,所述方法包括:从待检测文本中选取至少一个目标词汇;根据目标检测模型对所述至少一个目标词汇进行处理,得到所述目标词汇的词汇分值,其中,所述目标检测模型是基于q矩阵得到的;根据所述至少一个目标词汇的词汇分值,确定所述待检测文本的文本分值;根据预设的预设分值范围和文本类别之间的对应关系,将所述文本分值对应的文本类别作为所述待检测文本的目标文本类别。2.根据权利要求1所述的方法,其特征在于,将所述文本分值对应的文本类别作为所述待检测文本的目标文本类别之后,所述方法还包括:将所述目标词汇和所述目标文本类别作为训练样本,对回报矩阵进行更新,其中,所述回报矩阵中的回报值是基于样本词汇和样本文本的文本类别确定的,所述样本词汇存在于所述样本文本中;根据更新后的回报矩阵生成更新后的q矩阵;根据更新后的q矩阵得到更新后的目标检测模型;基于所述更新后的目标检测模型确定新的待检测文本的文本类别。3.根据权利要求1所述的方法,其特征在于,根据目标检测模型对所述至少一个目标词汇进行处理之前,所述方法还包括:建立初始q矩阵和初始回报矩阵,其中,所述初始q矩阵和所述初始回报矩阵中均包括n
×
n个初始化为0的元素值,n为按照预设方式排列的样本词汇的数量;基于所述初始回报矩阵,通过样本词汇和样本文本的样本类别确定回报矩阵;针对每个样本文本中的词汇排列顺序,基于初始q矩阵和所述回报矩阵构建q矩阵,其中,所述q矩阵中的每行指示一个词汇,所述q矩阵中的每列指示从当前词汇跳转到下一个词汇的动作;通过所述q矩阵生成所述目标检测模型。4.根据权利要求3所述的方法,其特征在于,所述基于所述初始回报矩阵,通过样本词汇和样本文本的样本类别确定回报矩阵包括:确定所述样本词汇的邻接词汇,其中,所述邻接词汇指示所述样本词汇在所述初始回报矩阵中的下一个词汇,所述初始回报矩阵和所述回报矩阵具有相同的样本词汇;在所述样本词汇和所述邻接词汇不属于同一样本文本的情况下,确定所述样本词汇的回报值为第一预设值,其中,所述第一预设值不指示奖励或惩罚;在所述样本词汇和所述邻接词汇属于同一样本文本的情况下,确定所述样本文本的样本类别;根据所述样本类别确定所述回报值为第二预设值,其中,所述第二预设值指示奖励或惩罚;基于所述第一预设值和所述第二预设值构建所述回报矩阵。5.根据权利要求4所述的方法,其特征在于,所述根据所述样本类别确定所述回报值为第二预设值包括:在所述样本类别为预设类别的情况下,确定回报矩阵中的回报值为奖励值;在所述样本类别为非预设类别的情况下,确定回报矩阵中的回报值为惩罚值;
将所述奖励值和所述惩罚值作为所述第二预设值。6.根据权利要求3所述的方法,其特征在于,所述针对每个样本文本中的词汇排列顺序,基于初始q矩阵和所述回报矩阵构建q矩阵包括:采用如下方式遍历每个样本文本中每个样本词汇:确定所述样本文本中的当前词汇;按照所述样本文本中的词汇排列顺序,确定所述当前词汇对应的预设词汇,其中,所述预设词汇为所述当前词汇在所述样本文本中的下一个词汇;基于所述当前词汇在所述回报矩阵中的回报值,和所述预设词汇在所述初始q矩阵中的矩阵值,确定所述当前词汇的矩阵值;基于每个矩阵值构建所述q矩阵。7.根据权利要求1所述的方法,其特征在于,所述根据预设的预设分值范围和文本类别之间的对应关系,将所述文本分值对应的文本类别作为所述待检测文本的目标文本类别包括:获取数据库中存储的预设分值范围和文本类别之间的对应关系;从所述预设分值范围中选取出所述文本分值所在的目标分值范围;根据所述对应关系,将目标分值范围对应的文本类别作为所述待检测文本的目标文本类别。8.一种目标文本类别的确定装置,其特征在于,所述装置包括:选取模块,用于从待检测文本中选取至少一个目标词汇;处理模块,用于根据目标检测模型对所述至少一个目标词汇进行处理,得到所述目标词汇的词汇分值,其中,所述目标检测模型是基于q矩阵得到的;确定模块,用于根据所述至少一个目标词汇的词汇分值,确定所述待检测文本的文本分值;作为模块,用于根据预设的预设分值范围和文本类别之间的对应关系,将所述文本分值对应的文本类别作为所述待检测文本的目标文本类别。9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一的方法步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一的方法步骤。

技术总结
本申请涉及一种目标文本类别的确定方法、装置、电子设备和存储介质,所述方法包括:从待检测文本中选取至少一个目标词汇;根据目标检测模型对所述至少一个目标词汇进行处理,得到所述目标词汇的词汇分值,其中,所述目标检测模型是基于Q矩阵得到的;根据所述至少一个目标词汇的词汇分值,确定所述待检测文本的文本分值;根据预设的预设分值范围和文本类别之间的对应关系,将所述文本分值对应的文本类别作为所述待检测文本的目标文本类别。本申请提高检测到的文本类别的准确性。检测到的文本类别的准确性。检测到的文本类别的准确性。


技术研发人员:李佳奕
受保护的技术使用者:上海众源网络有限公司
技术研发日:2022.04.24
技术公布日:2022/8/16
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献