一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种社交数据采集方法及装置与流程

2022-08-10 21:56:48 来源:中国专利 TAG:

技术特征:
1.一种社交数据采集方法,其特征在于,包括步骤:获取待观察的主社区中所有第一社交账号的关系型数据;获取所述主社区对应的特征词语组集合;根据所述关系型数据获取与每一所述第一社交账号对应的第二社交账号,根据所述第二社交账号生成与所述第一社交账号对应的子社区;获取所述子社区中所有所述第二社交账号的信息;根据所述第二社交账号的信息生成与所述第二社交账号一一对应的特征词语组;判断所述特征词语组与所述特征词语组集合是否有交集,若是,则将所述特征词语组对应的第二社交账号加入所述主社区。2.根据权利要求1所述的一种社交数据采集方法,其特征在于,所述获取所述主社区对应的特征词语组集合包括:获取所述主社区中所有所述第一社交账号的文本数据;根据所述文本数据生成与每一所述第一社交账号对应的特征词语组,并生成与所述主社区对应的特征词语组集合。3.根据权利要求1所述的一种社交数据采集方法,其特征在于,所述获取所述主社区对应的特征词语组集合包括:设置预监测的文本数据;根据所述预监测的文本数据生成与所述主社区对应的特征词语组集合。4.根据权利要求2或3所述的一种社交数据采集方法,其特征在于,所述生成与所述主社区对应的特征词语组集合包括:清洗所述文本数据,得到所述文本数据的主干语段;抽取所述主干语段中的关键词;标注所述关键词,得到关键词集合;通过加权计数计算所述关键词集合的热度排名,得到所述特征词语组集合。5.根据权利要求1所述的一种社交数据采集方法,其特征在于,所述根据所述关系型数据获取与每一所述第一社交账号对应的第二社交账号,根据所述第二社交账号生成与所述第一社交账号对应的子社区包括:根据所述关系型数据计算与所述第一社交账号有关联的所有社交账号的亲密度排序;根据所述亲密度排序获取所述第二社交账号,并根据所述第二社交账号生成与所述第一社交账号对应的所述子社区。6.根据权利要求1所述的一种社交数据采集方法,其特征在于,所述获取待观察的主社区中所有第一社交账号的关系型数据包括:根据所述关系型数据生成所有所述第一社交账号之间的亲密关系,并生成亲密关系集合;根据所述亲密关系集合迭代计算得到强关联账号集合。7.根据权利要求1所述的一种社交数据采集方法,其特征在于,所述获取待观察的主社区中所有第一社交账号的关系型数据之前包括:获取所有所述第一社交账号的全量数据;所述全量数据包括所述关系型数据;
将所述全量数据分类,并对实时文件进行存储。8.根据权利要求7所述的一种社交数据采集方法,其特征在于,将所述全量数据分类,并对实时文件进行存储包括:将所述全量数据分类并存入一个分布式的搜索和分析引擎中。9.根据权利要求7所述的一种社交数据采集方法,其特征在于,所述将所述全量数据分类,并进行分布式实时文件存储包括:将所述全量数据对应的字段生成索引,并与所述实时文件对应。10.一种社交数据采集终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7任意一项所述的一种社交数据采集方法中的各个步骤。

技术总结
本发明公开一种社交数据采集方法及装置,通过获取待观察的主社区中所有第一社交账号的关系型数据和与主社区对应的特征词语组集合,并根据关系型数据获取与每一第一社交账号对应的第二社交账号生成对应的子社区,再获取子社区中第二社交账号的信息生成特征词语组,通过特征词语组与特征词语组集合之间的关系判断第二社交账号与主社区之间的关系,即能够追踪到当前时间段内与主社区群体事件相关的第二社交账号,并将第二社交账号加入主社区内进行监测,从而能够有效的将群体事件的参与者们进行关联并采集对应的事件信息;并且将第二社交账号加入主社区,还实现对主社区的动态扩展,从而实现对群体事件发展的动态监控。从而实现对群体事件发展的动态监控。从而实现对群体事件发展的动态监控。


技术研发人员:吴春萍 王静 陈强 林志扬 李火泉
受保护的技术使用者:厦门市美亚柏科信息股份有限公司
技术研发日:2022.06.06
技术公布日:2022/8/9
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献