一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于图数据库的社交网络平台用户行为分析方法及系统与流程

2022-03-31 10:40:55 来源:中国专利 TAG:


1.本发明属于社交网络营销领域,具体涉及一种基于图数据库的社交网络平台用户行为分析方法及系统。


背景技术:

2.社交网络(social network),即一种在信息网络上由社会个体集合及个体之间的连接关系构成的社会性结构。社交网络的诞生,使人类利用互联网的方式从简单的信息检索和网页浏览,发展到在线社会关系的构建和维护,以及基于社会关系的内容创造、交流和共享。它不仅丰富了人与人之间的交往方式,而且给社会群体的形成和发展带来了深刻的变革。
3.在21世纪的移动互联网时代,用户产生内容(ugc)不断发展,社交网络的普及度持续走高,且深入人心,用户可以随时随地在网络上创造、分享内容,由此产生了海量的用户数据,如:微信每分钟有39万以上的人进行登录,其中1.9万人以上在进行视频聊天或语音聊天;在新浪微博,用户每分钟发出(或转发)6.4万篇以上微博;facebook用户每天分享的内容超40亿条记录;每天通过twitter的数据量超3.4亿。由此,社交网络产生的用户数据价值已远远大于网络媒体平台本身,用户数据价值期待被挖掘的更多。社交用户行为数据相对于搜索、电商等大数据,其传播路径更短,具有更高的价值,能直接、强烈地影响消费者,能提升品牌、产品或其他的市场推广和用户认知度。
4.社交营销作为社交网络的衍生产物,借助于大数据技术和移动社交技术,使社交应用呈现显著的移动化、本地化特征,是很好的商业营销导流入口。像电商、游戏、视频、互联网金融领域,甚至在线教育也都开始在社交网络上布局,以通过社交网络快传播,拉动用户规模和提升用户粘性。
5.目前,社交网络具有发展规模大、涵盖面全的特点,其上的营销行为处于同质化的竞争阶段,因此,差异化的竞争将是未来在社交营销上取胜的关键。因为市场的进一步细分将成为差异化竞争的有效途径,同时产业专业化分工、市场专业细分是任何产业的必然,社交网络市场也如此,必将出现定位更细分、竞争能力更强的细分主体,这也更加奠定了社交营销垂直化发展的趋势。
6.在这个存量时代背景下,面对社交网站快速增长的用户数量和活跃的用户,挖掘其行为痕迹背后的商业价值将是在细分化、垂直化市场盈利的重要途径。社交网络将在三个方面发挥出比较积极的意义:其一是可以进一步挖掘用户的潜在需求;其二是可以完成更加精准的用户定位;其三是可以构建价值增量更大的服务网络。对于品牌方来说,社交网络的吸引力在于能够影响更多的年轻用户,从而实现品牌自身的价值。
7.面对社交网站快速增长的用户数量和活跃的用户,挖掘其行为痕迹背后的商业价值将是在细分化、垂直化市场盈利的重要途径,社交网络将在三个方面发挥出比较积极的意义:其一是可以进一步挖掘用户的潜在需求;其二是可以完成更加精准的用户定位;其三是可以构建价值增量更大的服务网络。对于品牌方来说,社交网络的吸引力在于能够影响
更多的年轻用户,从而实现品牌自身的价值。


技术实现要素:

8.为了实现上述目的,本发明提出基于图数据库的社交网络平台用户行为分析方法及系统,解决了关系型数据库无法快速进行多表数据之间的多层关联查询与计算的问题,使得品牌或商家能快速、精准定位目标用户及影响目标用户的kol,实现更大盈利。从而匹配用户的潜在需求,完成更加精准的用户定位,增强品牌影响力营销,将品牌或者产品通过kol展现给消费者。
9.本发明的目的是采用下述技术方案实现的:
10.基于图数据库的社交网络平台用户行为分析方法,所述方法包括:
11.根据预先定义的样本数据来源、样本数据集内容和规模,建立样本数据集;
12.利用样本数据集中,基于社交网络用户个人信息数据和发文数据,构建社交关系与用户行为关联的图模型;
13.接收业务诉求,根据业务诉求查询所述图模型中的相应字段,对社交网络中的目标用户行为进行分析;
14.反馈业务诉求对应的目标用户行为数据分析结果。
15.优选的,所述根据预先定义的样本数据来源、样本数据集内容和规模,建立样本数据集包括:
16.采集社交网络平台的用户社交账号信息及用户产生的行为数据;所述行为数据包括:用户发布的源数据、用户转发博文数据;
17.定义所述样本数据的数据内容,其包括用户个人信息、用户发文信息、用户兴趣信息和关键词分类信息;
18.确定样本数据集规模;其中,所述数据集规模包括:普通用户数量、大v用户数量,用户发文提及的关键词数量、兴趣领域标签数目以及关于公司和发文标签的类别数量。
19.优选的,所述图模型以大v用户、普通用户、发文标签、标签领域和兴趣领域为点,以关注、用户原创发文、用户转发发文、发文标签的标签所属领域、用户兴趣领域为边进行构建。
20.优选的,所述业务诉求包括:通过pagerank算法计算用户的影响力排名,得到最能影响用户群体的用户;
21.基于社交关系,寻找最大程度覆盖目标用户粉丝群体的大v用户,获取此大v用户最擅长的发文领域。
22.优选的,所述根据业务诉求查询所述图模型中的相应字段,对社交网络中的目标用户行为进行分析包括:
23.提取业务诉求对应的字段;
24.基于所述字段获取查询语句,根据所述查询语句在图模型中进行查询,并返回查询结果;
25.基于返回的查询结果对查询结果中的对应的用户进行人工排序,将排名在首位的用户和领域标识为影响度最高的用户群体的关联账号和领域;
26.其中,所述查询结果包括:用户的影响力排名结果以及用户的发文领域查询结果。
27.进一步地,所述根据查询语句在图模型中进行查询包括:若业务诉求为通过pagerank算法计算用户的影响力排名,得到最有用户影响力的用户,则以查询与指定用户类型为条件;
28.查询计算用户群体中的pagerank,用于衡量每个顶点相对于其它顶点的影响程度,根据指定顶点被指向的数量,及指向点的数量来计算图中每个顶点的重要程度;
29.根据重要程度分值进行排序,选取排名靠前的预设数量的用户。
30.进一步地,所述根据查询语句在图模型中进行查询还包括:
31.若业务诉求为基于社交关系,寻找最大程度覆盖目标用户粉丝群体的大v用户,获取此大v用户最擅长的发文领域,则查询用户的粉丝用户共同关注的最多的其他大v用户;
32.查询得到的大v用户的历史发文中最常提及的关键词,且分类统计关键词所属的行业标签;
33.返回所述大v用户最常发文的前三领域以及其统计结果。
34.基于图数据库的社交网络平台用户行为分析系统,所述系统包括:
35.建立模块,用于根据预先定义的样本数据来源、样本数据集内容和规模,建立样本数据集;
36.构建模块,用于利用样本数据集中,基于社交网络用户个人信息数据和发文数据,构建社交关系与用户行为关联的图模型;
37.用户行为分析模块,用于接收业务诉求,根据业务诉求查询所述图模型中的相应字段,对社交网络中的目标用户行为进行分析;
38.反馈模块,用于反馈业务诉求对应的目标用户行为数据分析结果。
附图说明
39.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
40.图1为本发明实施例提供的基于图数据库的社交网络平台用户行为分析方法流程图;
41.图2为本发明实施例提供的基于社交网络的精准营销模型图;
42.图3为本发明实施例提供目标用户“6610115119”的关注关系网络示意图。
具体实施方式
43.下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
44.需要注意的是,除非另有说明,本技术使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
45.图数据库解决方案能够更快对社交网络中的用户行为数据进行分析,找到kol营销的最优解(即高投资回报率),快速把握市场先机。利用图数据库关联用户-用户、用户-发文(兴趣)、用户-标签(行业)之间的关系,分析人员能解决关系型数据库无法快速进行多表
数据之间的多层关联查询与计算的问题,品牌或商家能快速、精准定位目标用户及影响目标用户的kol,实现更大盈利。
46.基于此,本发明具体实施方式提供基于图数据库的社交网络平台用户行为分析方法,所述方法如图1所示,其包括:
47.s1根据预先定义的样本数据来源、样本数据集内容和规模,建立样本数据集;
48.s2利用样本数据集中,基于社交网络用户个人信息数据和发文数据,构建社交关系与用户行为关联的图模型;
49.s3接收业务诉求,根据业务诉求查询所述图模型中的相应字段,对社交网络中的目标用户行为进行分析;
50.s4反馈业务诉求对应的目标用户行为数据分析结果。
51.步骤s1中,根据预先定义的样本数据来源、样本数据集内容和规模,建立样本数据集包括:
52.采集社交网络平台的用户社交账号信息及用户产生的行为数据;所述行为数据包括:用户发布的源数据、用户转发博文数据;
53.定义所述样本数据的数据内容,其包括用户个人信息、用户发文信息、用户兴趣信息和关键词分类信息;
54.确定样本数据集规模;其中,所述数据集规模包括:普通用户数量、大v用户数量,用户发文提及的关键词数量、兴趣领域标签数目以及关于公司和发文标签的类别数量。
55.样本数据集1说明:
56.样本数据集来源:部分微博用户的账号信息和用户的原创/转发博文;
57.样本数据集内容:用户个人信息、用户发文信息、用户兴趣信息、关键词分类信息等;
58.样本数据集规模:样本数据集包含普通用户60人、大v用户10人的用户信息;
59.用户发文提及的关键词3276个、兴趣领域标签6个、发文标签的类别60个;
60.具体实施方式
61.样本数据集内容详细说明:
62.·
用户的基础信息:如账号id、性别、用户类型、认证类型等
63.·
用户之间的社交信息:如关注等
64.·
用户的兴趣信息:如“游戏”等
65.·
用户发文信息:如博文中提及的关键词
66.·
关键词分类信息:如“关键词x,类别y”,即“任天堂,游戏”67.如图2所示,步骤s2中,图模型的构建具体包括:所述图模型以大v用户、普通用户、发文标签、标签领域和兴趣领域为点,以关注、用户原创发文、用户转发发文、发文标签的标签所属领域、用户兴趣领域为边进行构建。
68.图模型说明:
69.图模型中的点类型有:
70.点类型属性大v用户账号uid、用户类型、认证类型普通用户账号uid、用户类型、性别
发文标签关键词标签领域领域名称兴趣领域领域名称
71.图模型中的边关系有:
72.起始点类型边类型终止点类型属性用户关注用户/用户用户原创发文发文标签提及次数用户用户转发发文发文标签提及次数发文标签标签所属领域标签领域/用户用户兴趣领域兴趣领域/
73.步骤s3中,所述业务诉求包括:通过pagerank算法计算用户的影响力排名,得到最能影响用户群体的用户;
74.基于社交关系,寻找最大程度覆盖目标用户粉丝群体的大v用户,获取此大v用户最擅长的发文领域。
75.所述根据业务诉求查询所述图模型中的相应字段,对社交网络中的目标用户行为进行分析包括:
76.提取业务诉求对应的字段;
77.基于所述字段获取查询语句,根据所述查询语句在图模型中进行查询,并返回查询结果;
78.基于返回的查询结果对查询结果中的对应的用户进行人工排序,将排名在首位的用户和领域标识为影响度最高的用户群体的关联账号和领域;
79.其中,所述查询结果包括:用户的影响力排名结果以及用户的发文领域查询结果。
80.所述根据查询语句在图模型中进行查询包括:若业务诉求为通过pagerank算法计算用户的影响力排名,得到最有用户影响力的用户,则以查询与指定用户类型为条件;
81.查询计算用户群体中的pagerank,用于衡量每个顶点相对于其它顶点的影响程度,根据指定顶点被指向的数量,及指向点的数量来计算图中每个顶点的重要程度;
82.根据重要程度分值进行排序,选取排名靠前的预设数量的用户。
83.所述根据查询语句在图模型中进行查询还包括:
84.若业务诉求为基于社交关系,寻找最大程度覆盖目标用户粉丝群体的大v用户,获取此大v用户最擅长的发文领域,则查询用户的粉丝用户共同关注的最多的其他大v用户;
85.查询得到的大v用户的历史发文中最常提及的关键词,且分类统计关键词所属的行业标签;
86.返回所述大v用户最常发文的前三领域以及其统计结果。
87.实施例1:
88.我们从口碑传播到媒体传播,再到信息爆炸时代,已经迎来了信息传播的第四个浪潮——影响力营销时代。并且数字营销在消费者眼中逐渐免疫、选择屏蔽,传统广告正在渐渐退出历史舞台,而影响力营销可以用一个更完整的方式把品牌与消费者联系起来。
89.因此,为了匹配用户的潜在需求,完成更加精准的用户定位,品牌需要影响力营销,将品牌或者产品通过kol(key opinion leader,关键意见领袖)展现给消费者。有数据
统计,2017年有59%的品牌在影响力营销上投入的越来越多。但是如何把一个有吸引力的产品与一个匹配度很好的影响者结合起来形成roi(return on investment,投资回报率)是品牌面临的挑战。
90.以时尚美妆行业为例,假设需要推广新的化妆品、衣服等,需要在众多的时尚美妆或其他领域的kol中选择最优的kol,这就需要深入分析用户的社交网络行为数据来确定推荐的kol。基于关系型数据库构建的传统分析解决方案,往往需要连接包含用户基础信息、用户发文信息、用户评论信息、行业标签信息等大型数据表,成本和耗时都是极大的开销,无法快速完成在瞬息万变的社交网络中实时分析用户数据的任务。
91.业务诉求1:
92.基于社交网络图谱,对用户的社交行为数据进行分析(社交行为为:关注),通过pagerank算法对所有用户进行影响力排名,得到最能影响用户群体的用户。
93.目的是帮助品牌或商家快速、精准找到适合的kol,且该kol为大v用户,以便进行后续的营销活动。
94.查询说明:
95.查询计算用户群体中pagerank(pagerank算法用来衡量每个顶点相对于其它顶点的影响程度,该算法根据某顶点被指向(入度)的数量,及指向顶点(出度)的数量来计算图中每个顶点的重要程度)分值前5的用户;
96.并且限制用户类型user_type为“大v”(粉丝数大于10000的定义为“kol”);
97.返回结果显示前5的大v用户。
98.查询语句:
99.//调用图算法pagerank的apoc接口,参数说明:迭代轮数设置为10,阻尼系数为0.85,输出pagerank分值按照降序展示前10个结果
100.call apoc.algo.pagerank({iterations:10,damping:0.85,limit:10,usememory:true})yield elementid,score
101.match(n:大v)
102.//转换elementid为外部唯一标识
103.where id(n)=elementid
104.//输出最能影响群体的前5大v用户
105.return n,elementid,score limit 5
106.查询结果:
107.pagerank查询结果表
108.排名uidpagerank值126906752233.82251100342563.48323534564242.83453366790061.88554019941791.23
109.以上是利用pagerank算法得到的,相对于群落最重要的前5个用户的账号id和相应的pagerank分值。其中以账号id“2690675223”最为重要(排名为1的账户),说明该账号用
是最能影响用户“6610115119”粉丝群体的大v用户,该大v用户最常原创发文的三个领域为旅游、娱乐、两性情感,说明该用户年轻化、感性,喜欢自由等特点,这为品牌如何将自身品牌(产品)与该大v用户进行契合提供了帮助。
131.社交网络图谱的应用还有很多,这里只例举了利用pagerank算法计算用户影响力排名和确定最能影响目标粉丝群体的大v用户的发文领域,两种查询语句都是为了帮助品牌或商家更快、更高效地确定能够影响目标群体的影响力者以及其在精准营销方面的帮助。
132.社交网络模型可以助益更多的其他业务问题,如:设计更加复杂、精准的用户影响力算法;关联更多限制条件下的“人、发文、基础属性”之间的关系;依据用户发文的产品标签词对用户进行分群,得到“产品二分群”等。
133.面对每日新增的海量数据,图数据库依旧可以在图上很好的对此进行增量存储,满足实时分析计算的用户需求,最大程度的释放数据价值,为用户的营销决策提供支持。
134.实施例2:基于同一技术构思,本发明还提供基于图数据库的社交网络平台用户行为分析系统,所述系统包括:
135.建立模块,用于根据预先定义的样本数据来源、样本数据集内容和规模,建立样本数据集;
136.构建模块,用于利用样本数据集中,基于社交网络用户个人信息数据和发文数据,构建社交关系与用户行为关联的图模型;
137.用户行为分析模块,用于接收业务诉求,根据业务诉求查询所述图模型中的相应字段,对社交网络中的目标用户行为进行分析;
138.反馈模块,用于反馈业务诉求对应的目标用户行为数据分析结果。
139.最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献