一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于特定话题下的社交网络数据获取方法与流程

2023-02-04 12:47:39 来源:中国专利 TAG:

技术特征:
1.一种基于特定话题下的社交网络数据获取方法,其特征在于,它包括如下步骤:s1、根据目标用户自定义待关注的特定话题,生成特定话题下的社交关系判定请求,根据社交关系判定请求对每个目标用户在特定话题下的社交关系进行关联分析,获得目标用户在特定话题下的社交网络数据;s2、根据所述社交网络数据构建对应的基于特定话题的社交网络无向图;在所述社交网络无向图中,节点表示在该社交网络中的每个用户,边表示每两个相邻用户之间存在的社交行为关系;s3、将所有用户的社交网络无向图进行连接,合成社交网络全信息无向图;s4、根据所述社交网络全信息无向图判定相邻两个用户之间的社交关系,将目标用户发布的社交信息用二元组进行表示;将相邻两个用户之间的关系用三元组进行表示;s5、对s4中所述的二元组和三元组进行无量纲化处理;获得目标用户发布社交信息的总次数和相邻两用户进行社交行为的总次数;s6、根据相邻两用户之间的社交关系分别预设不同社交行为的权重,根据不同社交行为的权重以及目标用户发布社交信息的总次数和相邻两用户进行社交行为的总次数计算两个用户之间的社交关联度;s7、根据关联用户的要素计算获得关联用户的影响力,根据影响力设立采集规则,采集关联用户针对特定话题的社交网络数据,并统计追踪热度;当采集的总数据量达到预设数量时,停止采集。2.根据权利要求1所述的一种基于特定话题下的社交网络数据获取方法,其特征在于,在s1中,所述目标用户在特定话题下的社交网络数据包括但不限于用户id、用户名、用户简介、用户链接页面、关注数和/或粉丝数。3.根据权利要求2所述的一种基于特定话题下的社交网络数据获取方法,其特征在于,在s2中,所述社交网络无向图的构建基于获取目标用户在该特定话题下的社交行为次数以及与该社交行为关联的用户id。4.根据权利要求2所述的一种基于特定话题下的社交网络数据获取方法,其特征在于,在s4中,所述目标用户发布社交信息用二元组进行表示:<目标用户id,发布社交信息的次数>;所述目标用户与关联用户的关系用三元组进行表示:<目标用户id,关联用户id,两用户之间的社交行为的次数>。5.根据权利要求1所述的一种基于特定话题下的社交网络数据获取方法,其特征在于,在s5中,所述目标用户发布社交信息的次数的具体获取方式包括如下步骤:s51、预设时间周期和时间间隔,根据时间间隔将时间周期平均分成m个时间区间;s52、根据目标用户在不同的时间区间内发布的社交信息的次数,将目标用户发布社交信息的时间映射到对应的时间区间内,从而获得目标用户在整个时间周期内发布社交信息的总次数。6.根据权利要求1所述的一种基于特定话题下的社交网络数据获取方法,其特征在于,在s5中,所述相邻两用户进行社交行为的次数的具体获取方式包括如下步骤:s53、预设时间周期和时间间隔,根据时间间隔将时间周期平均分成m个时间区间;s54、根据目标用户被关联用户在不同的时间区间内进行社交行为的次数,将目标用户被关联用户在不同的时间区间内进行社交行为的时间映射到对应的时间区间内,从而获得
目标用户在整个时间周期内被关联用户进行社交行为的总次数;s55、将目标用户发布社交信息的总次数和目标用户被关联用户进行社交行为的总次数进行无量纲处理。7.根据权利要求1所述的一种基于特定话题下的社交网络数据获取方法,其特征在于,在s7中,所述关联用户的要素包括活跃度、传播力和话题参与度。8.根据权利要求1所述的一种基于特定话题下的社交网络数据获取方法,其特征在于,在s7中,所述统计追踪热度具体包括如下步骤:s71、设立采集周期步长,评估一个采集周期内当前关联用户的活跃度;计算一个采集周期内当前关联用户的传播力;设立自适应重访规则,根据当前关联用户的影响力计算对当前关联用户再次采集的重访时间间隔,根据所述重访时间间隔得到每个关联用户的下次采集时间;s72、采集关联用户针对特定话题的社交网络数据,并根据重访时间间隔确定每个关联用户的下次采集时间和剩余采集次数,从而统计出未来时间段内需要采集的关联用户数量,即追踪热度。

技术总结
一种基于特定话题下的社交网络数据获取方法,涉及网络信息采集领域,本发明针对现有的社交网络获取方法采集结果不准确、效率低、获取数据不完整、考虑维度不全面的缺陷,提供了一种社交网络数据获取方法:对目标用户在特定话题下的社交关系进行关联分析,获得社交网络数据;构建并合成社交网络全信息无向图;获得目标用户发布社交信息的总次数和相邻两用户进行社交行为的总次数;预设不同社交行为的权重,计算两个用户之间的社交关联度;获得关联用户的影响力,采集关联用户针对特定话题的社交网络数据,并统计追踪热度;当采集的总数据量达到预设数量时,停止采集。用于获取特定话题下的社交网络数据。话题下的社交网络数据。话题下的社交网络数据。


技术研发人员:欧圣波 杨博 李致 徐彦婷 王海洋 隋明爽 董一凡 初杰
受保护的技术使用者:国家计算机网络与信息安全管理中心 国家计算机网络与信息安全管理中心上海分中心
技术研发日:2022.11.11
技术公布日:2023/2/3
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献