一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种互联网舆情信息采集方法与流程

2021-11-05 20:52:00 来源:中国专利 TAG:


1.本发明涉及网络舆情领域,尤其是涉及了一种互联网舆情信息采集方法。


背景技术:

2.网络舆情是指在互联网上流行的对社会问题不同看法的网络舆论,是社会舆论的一种表现形式,通过互联网传播的公众对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的言论和观点。网络舆情以网络为载体,以事件为核心,是广大网民情感、态度、意见、观点的表达、传播与互动,以及后续影响力的集合。
3.近年来,网络舆情对政治生活秩序和社会稳定的影响与日俱增,一些重大的网络舆情事件使人们开始认识到网络对社会监督起到的巨大作用。同时,网络舆情突发事件如果处理不当,极有可能诱发民众的不良情绪,引发群众的违规和过激行为,进而对社会稳定构成威胁。对于网络舆情的特点,社会管理者应当了然于心。对现实中出现的各种网络舆论,社会管理者应能做出及时反馈,防微杜渐,防患于未然。因此,必须利用现代信息技术对网络舆情予以采集和分析,从而进行控制和引导。
4.现有的网络舆情采集主要是通过网络页面之间的链接关系,从网上自动获取页面信息,并且随着链接不断向整个网络扩展。采集后进行数据清理、数据统计等处理后,提取主要内容、发言人、发言时间等信息,最后形成格式化的信息。但是目前的网络舆情采集主要对单一事件的网络舆情信息进行提取,通过关注偏激或负面舆情信息,对单一事件进行安全把控,无法在大时间跨度上对舆论者的态度变化进行了解,不方便对国民认知的成长性进行观察,也不便于对新事件发生时进行预估。


技术实现要素:

5.为了解决背景技术中所存在的问题,本发明提出了一种互联网舆情信息采集方法。
6.一种互联网舆情信息采集方法,包括步骤
7.s01、获取第一事件的网络舆情信息;
8.s02、提取该网络舆情信息中的发言人相关信息,并标记为第一发言人相关信息;
9.s03、调取第二事件网络舆情信息的第二发言人相关信息,将第一发言人相关信息与第二发言人相关信息中相同发言人的舆情信息进行提取;
10.s04、分析并统计步骤s03中的提取信息,并将分析统计结果进行存储记录。
11.基于上述,步骤s03包括:
12.s301、获取第二事件的网络舆情信息;
13.s302、提取该网络舆情信息中的发言人相关信息,并标记为第二发言人相关信息;
14.s303、建立分析参考库,将所提取的第二发言人相关信息记录并存储入分析参考库。
15.基于上述,第二事件为第一事件的同主题在先事件。
16.基于上述,步骤s04中的分析统计结果存储记录入分析参考库中。
17.基于上述,所述发言人相关信息至少包括发言人id信息、发言倾向信息、发言时间信息。
18.基于上述,所述分析统计结果包括变化群体的统计信息,至少包括发言倾向改变的相同发言人的数量、发言倾向变化信息、时间跨度信息和占比信息。
19.基于上述,所述分析统计结果包括重点群体的统计信息,至少包括发言倾向持续偏激或负面的相同发言人的数量、发言倾向信息、时间跨度信息和占比信息。
20.基于上述,根据统计信息,建立预估模型并结合分析参考库,持续完善和修正预估模型。
21.本发明相对现有技术具有突出的实质性特点和显著的进步,具体的说,本发明通过对相同事件的网络舆情信息进行采集,统计相同发言人的观点倾向变化,掌握了解网络舆论者的成长情况,并根据统计结果建立预估模型,以便对新发生的同主题事件进行预估指导,具有对互联网舆情信息采集面广,舆情变化情况统计价值度高的优点。
附图说明
22.图1是本发明的流程示意框图。
具体实施方式
23.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
24.如图1所示,一种互联网舆情信息采集方法,包括步骤s01、获取第一事件的网络舆情信息;s02、提取该网络舆情信息中的发言人相关信息,并标记为第一发言人相关信息;s03、调取第二事件网络舆情信息的第二发言人相关信息,将第一发言人相关信息与第二发言人相关信息中相同发言人的舆情信息进行提取;s04、分析并统计步骤s03中的提取信息,并将分析统计结果进行存储记录。
25.对不同的相同主题事件中,发言人相关信息进行提取,对相同发言人的舆情进行进行提取后,进行分析统计,以掌握对第一事件和第二事件均有舆论的发言人的观点倾向变化情况、占比情况、观点发生变化时的时间跨度情况等。
26.具体的,步骤s03包括:s301、获取第二事件的网络舆情信息;s302、提取该网络舆情信息中的发言人相关信息,并标记为第二发言人相关信息;s303、建立分析参考库,将所提取的第二发言人相关信息记录并存储入分析参考库。实际中,第二事件为第一事件的同主题在先事件,分析参考库中存储记录有多个事件,并按主题进行分类,每个分类下有多个同主题的事件。在进行第二发言人相关信息提取时,第二事件有多个,分别提取发言人相关信息,并提取相同发言人的舆情信息。现实中,还将第一事件的网络舆情信息存储入分析参考库。分析统计结束时,步骤s04中的分析统计结果存储记录入分析参考库中,以对后来事件进行参考指导。
27.本实施例中,所述发言人相关信息至少包括发言人id信息、发言倾向信息、发言时
间信息。
28.实际中,所述分析统计结果包括变化群体的统计信息,至少包括发言倾向改变的相同发言人的数量、发言倾向变化信息、时间跨度信息和占比信息,占比信息包括相同发言人在第一事件中的占比、在第二事件中的占比,发言倾向变化的相同发言人数量在相同发言人中的占比等。通过统计和分析,可了解网络舆论者在对同一主题事件的关注兴趣发生的变化,可了解对同一主题事件的观点态度的变化、成长性等。
29.优选地,所述分析统计结果包括重点群体的统计信息,至少包括发言倾向持续偏激或负面的相同发言人的数量、发言倾向信息、时间跨度信息和占比信息。占比信息包括发言倾向持续偏激或负面的相同发言人在第一事件中的占比、在第二事件中的占比,发言倾向持续偏激或负面的相同发言人数量在相同发言人中的占比等。通过统计和分析,可了解对同一主题事件的发言倾向持续偏激或负面的网络舆论者群体重点关注,也可对该群体进行持续关注以进行了解和分析,掌握该情况的成因等,以方便对该群体进行帮助及预防。
30.现实中,还可根据统计信息,根据不同群体占比或观点倾向变化率、变化速率等,建立预估模型并结合分析参考库,持续完善和修正预估模型,以便在未来发生同主题事件时,有效的进行预估和参考。
31.对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献