一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种案件分类预测方法、装置、计算机设备及存储介质

2022-05-31 17:48:36 来源:中国专利 TAG:

技术特征:
1.一种案件分类预测方法,其特征在于,所述案件分类预测方法包括:获取待分类案件数据;基于预设的关键词提取方式,对所述待分类案件数据进行关键词提取,并对提取到的每一个关键词进行文本向量化,得到所述关键词对应的关键词向量;基于对比学习方式,对所述待分类案件数据中的句子进行数据增强处理,得到至少一个增强句子;对所有所述增强句子进行文本向量化,得到每一个所述增强句子对应的句子向量;按照预设顺序,对所有所述关键词向量和所有所述句子向量进行拼接,得到拼接向量;对所述拼接向量进行上下文信息提取和预测分类,得到所述待分类案件数据对应的分类结果。2.如权利要求1所述的案件分类预测方法,其特征在于,所述获取待分类案件数据的步骤包括:获取案件文档;基于预设规则提取方式,对所述案件文档进行文本提取,得到所述案件文档对应的事实描述文段;对所述事实描述文段进行预处理,得到待分类案件数据。3.如权利要求1所述的案件分类预测方法,其特征在于,所述基于预设的关键词提取方式,对所述待分类案件数据进行关键词提取,并对提取到的每一个关键词进行文本向量化,得到所述关键词对应的关键词向量的步骤包括:基于预设分词方式,对所述待分类案件数据进行分词处理,得到至少一个分词结果;根据所有所述分词结果,确定所述待分类案件数据对应的语料库;将所述待分类案件数据出现在所述语料库中的词作为候选词,并将所述候选词加入候选词集合中;基于tf-idf算法,对所述候选词集合中每个候选词进行关键词概率计算,得到每一个所述候选词对应的关键词概率;按照所述关键词概率从大到小的顺序,选取与预设关键词数量相同的候选词作为关键词;针对每一个所述关键词,对所述关键词进行文本向量化,得到所述关键词对应的关键词向量。4.如权利要求1所述的案件分类预测方法,其特征在于,所述基于对比学习方式,对所述待分类案件数据中的句子进行数据增强处理,得到至少一个增强句子的步骤包括:基于预设的正样本构造方式,对所述待分类案件数据中的句子进行正样本对构造,得到与预设数量相同的正样本对;采用对比学习方式,依次对所有所述正样本对进行数据增强,得到每一个正样本对应的增强句子。5.如权利要求1所述的案件分类预测方法,其特征在于,所述对所述拼接向量进行上下文信息提取和预测分类,得到所述待分类案件数据对应的分类结果的步骤包括:基于训练好的分类器,对所述拼接向量进行上下文信息提取,得到上下文信息向量,其中,所述分类器包括全连接层、dropout层和softmax层;
基于所述全连接层和所述dropout层,对所述上下文信息向量进行全连接,得到全连接向量;基于所述softmax层,对所述全连接向量进行分类,得到所述待分类案件数据对应的分类结果。6.一种案件分类预测装置,其特征在于,所述案件分类预测装置包括:待分类案件数据获取模块,用于获取待分类案件数据;关键词向量提取模块,用于基于预设的关键词提取方式,对所述待分类案件数据进行关键词提取,并对提取到的每一个关键词进行文本向量化,得到所述关键词对应的关键词向量;增强句子获取模块,用于基于对比学习方式,对所述待分类案件数据中的句子进行数据增强处理,得到至少一个增强句子;句子向量获取模块,用于对所有所述增强句子进行文本向量化,得到每一个所述增强句子对应的句子向量;拼接模块,用于按照预设顺序,对所有所述关键词向量和所有所述句子向量进行拼接,得到拼接向量;分类结果获取模块,用于对所述拼接向量进行上下文信息提取和预测分类,得到所述待分类案件数据对应的分类结果。7.如权利要求6所述的案件分类预测装置,其特征在于,所述待分类案件数据获取模块包括:案件文档获取单元,用于获取案件文档;事实描述文段获获取单元,用于基于预设规则提取方式,对所述案件文档进行文本提取,得到所述案件文档对应的事实描述文段;预处理单元,用于对所述事实描述文段进行预处理,得到待分类案件数据。8.如权利要求6所述的案件分类预测装置,其特征在于,所述关键词获取模块包括:分词单元,用于基于预设分词方式,对所述待分类案件数据进行分词处理,得到至少一个分词结果;语料库确定单元,用于根据所有所述分词结果,确定所述待分类案件数据对应的语料库;候选关键词集合获取单元,用于将所述待分类案件数据出现在所述语料库中的词作为候选词,并将所述候选词加入候选词集合中;关键词概率获取单元,用于基于tf-idf算法,对所述候选词集合中每个候选词进行关键词概率计算,得到每一个所述候选词对应的关键词概率;关键词获取单元,用于针对每一个所述关键词,对所述关键词进行文本向量化,得到所述关键词对应的关键词向量。9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的案件分类预测方法。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的案件分类预测方法。

技术总结
本发明公开了一种案件分类预测方法、装置、计算机设备及存储介质,所述方法包括:获取待分类案件数据;对待分类案件数据进行关键词提取,并对提取到的每一个关键词进行文本向量化,得到关键词对应的关键词向量;对待分类案件数据中的句子进行数据增强处理,得到至少一个增强句子;对所有增强句子进行文本向量化,得到每一个增强句子对应的句子向量;按照预设顺序,对所有所述关键词向量和所有所述句子向量进行拼接,得到拼接向量;对拼接向量进行上下文信息提取和预测分类,得到待分类案件数据对应的分类结果,采用本发明以提高对案件分类预测的准确率。预测的准确率。预测的准确率。


技术研发人员:陈晓红 付震坤 胡东滨 梁伟 徐雪松
受保护的技术使用者:湖南工商大学
技术研发日:2022.04.25
技术公布日:2022/5/30
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献