一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于舆情数据识别的数据处理方法和装置与流程

2021-11-06 06:47:00 来源:中国专利 TAG:

技术特征:
1.一种用于舆情数据识别的数据处理方法,其特征在于,包括:获取待处理舆情数据;基于预设文本切分规则,对所述待处理舆情数据进行分割操作,获得多个过程舆情数据;基于预设筛选规则,对所述多个过程舆情数据进行筛选处理,获得目标舆情数据;基于预设舆情分类模型,对所述目标舆情数据进行识别,获得分类结果数据。2.根据权利要求1所述的数据处理方法,其特征在于,基于预设文本切分规则,对所述待处理舆情数据进行分割操作,获得多个过程舆情数据,包括:基于预设分词词典生成规则,对所述预设法院关键词数据库进行分词词典生成操作,获得分词词典,其中所述预设法院关键词数据库包括法院机构词和法院行业词;基于所述分词词典,对所述待处理舆情数据进行分割操作,获得多个过程舆情数据。3.根据权利要求1所述的数据处理方法,其特征在于,基于预设筛选规则,对所述多个过程舆情数据进行筛选处理,获得目标舆情数据,包括:基于预设相关性评分规则,对所述多个过程舆情数据进行相关性评分处理,获得多个相关性评分数据,其中,所述相关性评分数据为所述过程舆情数据与预设法院关键词的相关性评分;基于所述多个相关性评分数据,对所述多个过程舆情数据进行筛选,获得所述输入舆情数据,其中,所述输入舆情数据为最高相关性评分数据对应的过程舆情数据。4.根据权利要求1所述的数据处理方法,其特征在于,基于预设舆情分类模型,对所述目标舆情数据进行识别,获得分类结果数据,包括:基于预设法院关键词数据库,对所述输入舆情数据进行识别,获得输入法院关键词;基于预设拆分规则,对所述输入法院关键词进行拆分处理,获得输入法院关键词特征数据;对所述输入舆情数据进行拆分处理,获得输入舆情特征数据;对所述输入法院关键词特征数据与所述输入舆情特征数据进行舆情分类处理,获得所述分类结果数据。5.根据权利要求1所述的数据处理方法,其特征在于,基于预设舆情分类模型,对所述目标舆情数据进行识别,获得分类结果数据之后,还包括:对所述分类结果数据进行筛选,若所述分类结果数据满足第一预设条件且分类标签为负向舆情标签时,获得第一分类结果数据,输出负面舆情提示信息,其中,所述负面舆情提示信息包括所述第一分类结果数据与所述第一分类结果数据对应的待处理舆情数据;若所述分类结果数据满足所述第一预设条件且分类标签为正向舆情标签时,获得第二分类结果数据,输出更新数据提示信息,其中,所述更新数据提示信息包括所述第二分类结果数据与所述第二分类结果数据对应的待处理舆情数据;若所述分类结果数据不满足所述第一预设条件时,获得第三分类结果数据,输出审核提示信息,其中,所述审核提示信息包括所述第三分类结果数据与所述第三分类结果数据对应的待处理舆情数据。6.一种用于舆情数据识别的数据处理装置,其特征在于,包括:数据获取模块,用于获取待处理舆情数据;分割模块,基于预设文本切分规则,对所述待处理舆情数据进行分割操作,获得多个过
程舆情数据;筛选模块,基于预设筛选规则,对所述多个过程舆情数据进行筛选处理,获得目标舆情数据;识别模块,基于预设舆情分类模型,对所述目标舆情数据进行识别,获得分类结果数据。7.根据权利要求6所述的数据处理装置,其特征在于,分割模块,包括:分词词典模块,基于预设分词词典生成规则,对所述预设法院关键词数据库进行分词词典生成操作,获得分词词典,其中所述预设法院关键词数据库包括法院机构词和法院行业词;分割模块,基于所述分词词典,对所述待处理舆情数据进行分割操作,获得多个过程舆情数据。8.根据权利要求6所述的数据处理方法,其特征在于,筛选模块,包括:相关性评分模块,基于预设相关性评分规则,对所述多个过程舆情数据进行相关性评分处理,获得多个相关性评分数据,其中,所述相关性评分数据为所述过程舆情数据与预设法院关键词的相关性评分;过程筛选模块,基于所述多个相关性评分数据,对所述多个过程舆情数据进行筛选,获得所述输入舆情数据,其中,所述输入舆情数据为最高相关性评分数据对应的过程舆情数据。9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1

5任意一项所述的用于舆情数据识别的数据处理方法。10.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1

5任意一项所述的用于舆情数据识别的数据处理方法。

技术总结
本申请公开了一种用于舆情数据识别的数据处理方法和装置。该方法包括:通过对待处理舆情数据进行分割,获得多个过程舆情数据,对切分获得的多个过程舆情数据进行相关性评分,根据评分筛选获得输入舆情分类模型的输入舆情数据,通过舆情分类模型对输入舆情分类模型进行舆情识别,获得舆情分类结果数据,通过上述方法,解决现有技术中对长文本舆情数据舆情识别效果较差的技术问题,提高长文本舆情数据识别的识别效果。识别的识别效果。识别的识别效果。


技术研发人员:吴云朝 杜向阳
受保护的技术使用者:南京擎盾信息科技有限公司
技术研发日:2021.08.23
技术公布日:2021/11/5
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献