一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本分类方法、装置、设备以及计算机可读存储介质与流程

2022-06-18 00:34:34 来源:中国专利 TAG:

技术特征:
1.一种文本分类方法,其特征在于,所述文本分类方法包括:获取待分类文本,提取所述待分类文本中的至少一个关键词;确定所述至少一个关键词的至少一个权重信息;根据所述至少一个权重信息确定所述至少一个关键词的评分,根据所述至少一个关键词的评分确定所述待分类文本在多个类别中的每个类别的评分;根据所述待分类文本在所述每个类别的评分从所述多个类别中确定所述待分类文本的类别。2.如权利要求1所述的文本分类方法,其特征在于,所述至少一个权重信息包括至少一个局部权重和至少一个全局权重,所述确定所述至少一个关键词的权重信息的步骤之前,还包括:获取目标文本集中多个目标文本的多个关键词;根据所述多个关键词在所述多个目标文本中的出现次数以及所述多个目标文本中的每个目标文本的类别确定所述多个关键词的多个全局权重;根据所述多个关键词之间的关联度确定所述多个关键词的多个局部权重;所述确定所述至少一个关键词的至少一个权重信息的步骤包括:在所述多个全局权重和所述多个局部权重中查询所述至少一个权重信息。3.如权利要求2所述的文本分类方法,其特征在于,所述根据所述多个关键词在所述多个目标文本中的出现次数以及所述多个目标文本中的每个目标文本的类别确定所述多个关键词的多个全局权重的步骤包括:根据所述多个目标文本的类别以及所述多个关键词在所述多个目标文本中的出现次数确定所述多个关键词在所述每个类别中的出现次数;根据所述多个目标文本的类别确定所述每个类别中出现同一关键词的文本数量;根据所述多个关键词对应的所述出现次数以及所述文本数量确定所述多个关键词的所述多个全局权重。4.如权利要求2所述的文本分类方法,其特征在于,所述根据所述多个关键词之间的关联度确定所述多个关键词的多个局部权重的步骤还包括:确定所述多个关键词之间的共现关系,根据所述共现关系生成所述多个关键词之间的关联度;根据所述关联度确定所述多个关键词的所述多个局部权重。5.如权利要求2所述的文本分类方法,其特征在于,所述根据所述待分类文本在所述每个类别的评分从所述多个类别中确定所述待分类文本的类别的步骤之后,还包括:若所述待分类文本为测试文本,则比对所述待分类文本的参考类别以及得到的所述待分类文本的类别;若所述参考类别与所述待分类文本的类别不一致,则将测试文本添加至所述目标文本集,以更新所述目标文本集。6.如权利要求5所述的文本分类方法,其特征在于,所述比对所述待分类文本的参考类别以及得到的所述待分类文本的类别的步骤之后,还包括:若所述参考类别与所述待分类文本的类别不一致,则将所述测试文本的至少一个关键词添加至关键词库中,其中,根据所述关键词库提取所述分类文本中的至少一个关键词。
7.如权利要求1所述的文本分类方法,其特征在于,所述根据所述待分类文本在所述每个类别的评分从所述多个类别中确定所述待分类文本的类别的步骤包括:将所述待分类文本在所述每个类别的评分进行归一化处理;比对归一化处理后的所述每个类别的评分以及所述每个类别的参考评分;根据所述归一化处理后的所述每个类别的评分大于所述参考评分的类别确定所述待分类文本的类别。8.如权利要求7所述的文本分类方法,其特征在于,所述根据所述归一化处理后的所述每个类别的评分大于所述参考评分的类别确定所述待分类文本的类别的步骤包括:获取所述归一化处理后的所述每个类别的评分大于所述参考评分的类别作为目标类别;比对所述待分类文本的关键词数量与所述目标类别对应的参考数量;在所述关键词数量大于所述参考数量时,将所述目标类别作为所述待分类文本的类别。9.如权利要求1所述的文本分类方法,其特征在于,所述提取所述待分类文本中的至少一个关键词的步骤之前,还包括:删除所述待分类文本中的预设的停用词和/或预设词性的分词。10.一种文本分类装置,其特征在于,所述文本分类装置包括:获取模块,用于获取待分类文本,提取所述待分类文本中的至少一个关键词;确定模块,用于确定所述至少一个关键词的至少一个权重信息;计算模块,用于根据所述至少一个权重信息确定所述至少一个关键词的评分,根据所述至少一个关键词的评分确定所述待分类文本在多个类别中的每个类别的评分;分类模块,用于根据所述待分类文本在所述每个类别的评分从所述多个类别中确定所述待分类文本的类别。11.一种文本分类设备,其特征在于,所述文本分类设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的文本分类程序,所述文本分类程序被所述处理器执行时实现如权利要求1至9中任一项所述的文本分类方法的各个步骤。12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有文本分类程序,所述文本分类程序被处理器执行时实现如权利要求1至9中任一项所述的文本分类方法的各个步骤。

技术总结
本发明公开了一种文本分类方法、装置、设备以及计算机存储介质,所述文本分类的方法包括:获取待分类文本,提取所述待分类文本中的至少一个关键词;确定所述至少一个关键词的至少一个权重信息;根据所述至少一个权重信息确定所述至少一个关键词的评分,根据所述至少一个关键词的评分确定所述待分类文本在多个类别中的每个类别的评分;根据所述待分类文本在所述每个类别的评分从所述多个类别中确定所述待分类文本的类别。本发明提高了文本分类的效率。效率。效率。


技术研发人员:尚保林 李可
受保护的技术使用者:深信服科技股份有限公司
技术研发日:2020.12.15
技术公布日:2022/6/16
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献