一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于单一舆情事件的互联网数据处理方法与流程

2021-10-24 13:00:00 来源:中国专利 TAG:数据处理 舆情 互联网 特别 事件

技术特征:
1.基于单一舆情事件的互联网数据处理方法,其特征在于,包括以下步骤:通过实时获取来自公共网络的舆情数据,建立elasticsearch整合大数据平台;根据单一目标舆情事件的关键词和匹配要求,在elasticsearch整合大数据平台的数据仓库中匹配提取单一目标舆情事件的关联互联网数据;利用elasticsearch整合大数据平台进行单一目标舆情事件的关联互联网数据的汇总和展示;其中,所述匹配提取目标舆情的步骤包括:利用模糊匹配算法,匹配调用数据仓库中与目标舆情事件相关的互联网数据;根据预设的精准匹配筛选条件进行精准匹配。2.如权利要求1所述的基于单一舆情事件的互联网数据处理方法,其特征在于,所述预设的精准匹配筛选条件包括:单一目标舆情事件的关键字、单一目标舆情事件的时间和单一目标舆情事件的地点。3.如权利要求1所述的基于单一舆情事件的互联网数据处理方法,其特征在于,所述实时获取来自公共网络的舆情数据,包括:设置通用的解析模型,进行公共网络数据的规则化汇总提取,其具体为:通过解析模型获取所有舆情数据的中文父标签;将所有的父标签每n行进行一个分组,并拣选出包含文字数量最多的一个分组;拣选后的分组对应的父标签所包含的所有内容为文本正文内容,并对文本正文内容进行数据规则化解析提取。4.如权利要求3所述的基于单一舆情事件的互联网数据处理方法,其特征在于,还包括:在公共网络数据规则化提取后,对未被成功提取出来的数据,进行标记识别,并通过预先准备的特定格式化规则库进行格式化解析提取;根据待汇总公共网络的域名建立相应的域名数据库,建立对应的特殊提取解析规则,对解析提取后的数据进行数据格式化,利用elasticsearch整合大数据平台进行展示。5.如权利要求1所述的基于单一舆情事件的互联网数据处理方法,其特征在于,还包括:对来自各个公共网络的舆情数据进行不同字段的识别,对每个公共网络的多条舆情数据进行去重,确保数据在隶属公共网络中的唯一性。6.如权利要求1所述的基于单一舆情事件的互联网数据处理方法,其特征在于,所述公共网络包括:社交网站、搜索平台、新闻发布平台和舆情发布平台。

技术总结
本发明公开了基于单一舆情事件的互联网数据处理方法,涉及数据处理技术领域,对微博、微信公众号、百度、360搜索等众多社交平台和搜索引擎进行数据提取,汇总了公共网络的舆情数据,并在储存之后使用Elasticsearch整合大数据平台进行搜索。部署单一舆情事件的关键词进行搜索,由Elasticsearch整合大数据平台进行展示,完成了针对单一舆情事件相关数据信息的汇总工作,解决传统搜索平台,社交网站数据不共享,信息不通信的缺点,为应对单一舆情事件的数据汇总工作提供数据支持。的数据汇总工作提供数据支持。的数据汇总工作提供数据支持。


技术研发人员:郭齐
受保护的技术使用者:西安康奈网络科技有限公司
技术研发日:2021.07.30
技术公布日:2021/10/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜