一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种面向网络购物广告的用户时序行为可视化方法与流程

2021-10-24 07:19:00 来源:中国专利 TAG:可视 时序 可视化 化与 网络购物


1.本发明涉及信息可视化与可视分析技术领域,具体为一种面向网络购物广告的用户时序行为可视化方法。


背景技术:

2.随着互联网技术和电商经济的蓬勃发展,淘宝、京东等便捷的网络购物平台已逐渐深入人们的生活。网络购物平台的重要收入来源是广告服务,即将广告投放给特定的用户以促进商品销售,并向广告主收取费用。与传统媒介不同,网络购物平台不仅能够获取用户的人口学属性,还能获取用户的时序行为数据,例如商品浏览行为、加入购物车/收藏夹行为、商品购买行为,以及对网购平台上的广告点击行为。如何发现这些数据中隐含的有用信息,例如用户的周期性行为、不同时间尺度下的行为模式等,有效理解和总结用户的时序行为模式以更有效地广告投放,是广告分析人员的关注焦点。
3.以往的在线广告效果优化方法大多是基于统计分析与数据挖掘的,例如通过定向技术提升受众识别率,研究算法提升ctr(点击通过率)预测模型的准确性。但统计分析方法存在分析效率低下、分析结果单一、分析程度较浅等问题;数据挖掘方法存在结果可解释性较差、分析方法操作复杂等缺点。在实际场景中,由于缺乏直观有效的工具,广告分析人员需要花费大量时间阅读复杂的数据报表,比较和探索用户的行为,总结得出先验知识后才能进行算法建模。
4.信息可视化与可视分析方法的出现给广告分析人员提供了新的解决思路,分析人员可以利用可视化呈现的直观性与视图间灵活的交互来探索数据背后的规律与模式。信息可视化方法将数据转化为可感知的图形、符号、颜色等,来增强数据识别效率,传递有效信息。同时,可视分析方法能够结合人类智慧与机器智能,利用交互式可视化界面将人的知识与经验引入分析流程,辅助分析人员全面直观地完成数据分析和推理决策。
5.目前,面向网络购物广告用户行为分析的可视化相关研究主要关注简单的用户行为或商品交易数据,没有包含用户的广告点击、加入购物车等行为,在分析的时间尺度上也较为单一。此外,现有方法的视图设计和交互设计难以多角度地分析网购用户的时序行为,发现数据中潜藏的有用信息,尤其是难以发现用户的周期性行为规律,不同时间尺度下的行为模式,以及广告点击与其他购物行为之间的具体时序关系。


技术实现要素:

6.针对上述问题,本发明的目的在于提供一种面向网络购物广告的用户时序行为可视化方法,基于网购平台的多种用户时序行为数据,设计并实现具有交互能力的周期行为视图与行为模式视图。本发明不仅可以展现用户的周期性行为规律,还支持在不同时间尺度上探索用户的行为模式,以及广告点击与其他购物行为之间的时序关系,帮助广告分析人员从大规模的时序数据中直观高效地进行可视知识发现,进而优化广告投放策略。具体技术方案如下:
7.一种面向网络购物广告的用户时序行为可视化方法,包括以下步骤:
8.s1:数据获取与处理
9.获取网络购物平台提供的用户行为数据与广告基本信息后,进行数据结构设计以及数据存储,并对原始数据进行数据清洗与筛选,选取拟分析时间范围内的行为数据,保留有效信息;
10.s2:可视化映射
11.通过视觉通道将经步骤s1获得的数据进行可视化映射:
12.设计周期行为视图,用环形热力图映射用户的各种购物行为在所选周期范围上的周期性频次分布,用南丁格尔玫瑰图映射用户的广告点击行为在所选周期范围上的频次分布;
13.设计行为模式视图,用矩形热力图映射用户每个小时的行为总次数,用小圆点代表广告点击行为次数;用起伏的面积图映射用户在分钟粒度上的行为总次数;用不同的符号分别映射不同的行为,符号之间的连线表示两个不同行为之间的时序演变情况;
14.s3:可视化布局与实现
15.对s2中完成映射的视觉模块进行可视化布局并实现:
16.周期行为视图中,将环形热力图从零点方向按顺时针环形排列,最外层为周一到周日的弧形标签,中间为三层环形热力图,南丁格尔玫瑰图内嵌于圆心附近;
17.行为模式视图中,整体采用双时间轴的布局方法,视图顶部是带有热力图的小时粒度时间轴模块,其中的一周热力图和一日热力图分别置于小时粒度的时间轴的上方和下方;视图底部是带有面积图的分钟粒度时间轴模块;视图中部是带有行为符号和连线的行为模式演变模块;视图左侧是行为符号的图例;
18.s4:交互设计
19.在周期行为视图中点击某一天时,行为模式视图联动地展示这一天内该用户的时序行为模式;在行为模式视图内部支持高亮、提示和刷选交互操作,点选某个小时后高亮对应时间轴中的矩形,鼠标悬浮于行为符号后显示信息提示框,通过刷选带有面积图的分钟粒度时间轴来进一步展开选中的时间范围内的行为模式。
20.进一步地,在步骤s1中,数据获取与处理的具体过程为:
21.s11:从网络购物平台获取用户行为相关的数据,包括格式为csv的用户购物行为表、广告点击行为表和广告基本信息表;
22.s12:根据数据的特点进行数据库模式设计,将数据存入postgresql数据库;
23.s13:根据具体需求,确定周期长度,选取合适的时间展示范围,去除用户购物行为表和广告点击行为表中不在时间范围内的数据;
24.s14:删除用户购物行为表和广告点击行为表中重复的记录,以及广告基本信息表中的无效数据,并清洗字段缺失和无意义的数据。
25.更进一步地,在步骤s2中,可视化映射具体为:
26.s21:对周期行为视图中的环形热力图进行形状、位置、颜色映射:用矩形图元映射该用户一天中某种购物行为的总次数,外层均分的7个的圆弧依次映射星期一到星期日;内部几层环形分别映射数据集中的周数;在每个1/7环形中,四列矩形图元依次映射浏览商品、加入购物车、收藏商品和购买商品四种行为;用颜色的深浅来映射行为数量的多少;
27.s22:对周期行为视图中的南丁格尔玫瑰图进行形状、位置、面积映射:用花瓣形图元映射该用户在一天中广告点击行为的总次数,7个花瓣依次映射星期一到星期日,用花瓣的面积映射行为数量的多少;
28.s23:对行为模式视图中的矩形热力图时间轴进行形状、位置、颜色映射:用2行24列矩形分别映射0

23时,第1行代表具有广告点击数据的一周,第2行代表在该星期中选定的一日,小圆点从左至右放置于一周热力图和一日热力图的矩形中,表示该用户在对应时间内的广告点击次数;一周热力图和一日热力图采用双色相序列颜色映射方案来实现连续插值,热力图的颜色深浅,代表用户在这一小时内进行的总行为次数的多少;
29.s24:对行为模式视图中的面积图时间轴进行位置、面积映射:时间轴在横向上被分代表一分钟的60个刻度,起伏波动的面积图映射对应时间上的行为总次数;每分钟面积的大小与这分钟的总行为次数成正比例;
30.s25:对行为模式视图中的行为演变模块进行形状、位置映射:采用五种符号来映射五种行为,即用三角形表示浏览商品、方形表示加入购物车、圆形表示收藏商品、十字形表示购买商品、五角星形表示广告点击;符号之间的连线表示行为间的时序关系,同一分钟内的行为竖直连接,相邻分钟的尾部行为和头部行为用三次贝塞尔曲线连接;行为符号与分钟时间轴刻度相对应。
31.更进一步的,所述双色相序列颜色映射方案具体为:
32.s231:以两种数量中更大的数值范围为基准,为两种色相赋予采用统一的定义域;
33.s232:判断数据归属于一周或一日;
34.s233:根据判断结果,将数据映射到不同的色相中;
35.s234:求得最终颜色,颜色映射公式如下所示:
[0036][0037]
式中:hexcolori代表颜色在rgb颜色所对应的十六进制数值,hexcolormax和hexcolormin分别代表颜色在rgb颜色所对应的十六进制数值的最大值和最小值;datai代表对应时间内行为的次数;datamax和datamin分别代表对应时间内行为次数的最大值和最小值。
[0038]
更进一步的,在步骤s3中,所述周期行为视图的可视化布局与实现的具体过程如下:
[0039]
s3a:使用线性比例尺构造周粒度的圆角度比例尺,将一个圆周均分为七等份;
[0040]
s3b:使用线性比例尺构造日粒度的圆角度比例尺,根据周粒度的圆角度比例尺计算得出的起始角度到终止角度,将此角度均分为四等份;
[0041]
s3c:在最外层,定义内外半径和间隔角度构造弧,使用周粒度的圆角度比例尺来确定星期一到星期日在圆周上的位置,并放置对应的星期几标识文本来展示具体的星期数所在的位置;
[0042]
s3d:在中间层,通过日粒度的圆角度比例尺顺时针沿着圆周从0
°
开始按角度递增放置浏览商品、加入购物车、收藏商品和购买商品四种行为的热力图图元,使用颜色来映射行为次数,从外向内,依次放置各周的数据;
[0043]
s3e:在最内层,通过周粒度的圆角度比例尺确认南丁格尔玫瑰图中每片花瓣的起
始角度和终止角度,使用花瓣半径映射广告点击行为出现的次数,绘制完每片花瓣后形成完整的玫瑰图。
[0044]
更进一步的,在步骤s3中,所述行为模式视图的可视化布局与实现的具体过程如下:
[0045]
s31:确定小时时间轴粒度,设计对应周和日的两种热力图,确定颜色映射,将带有热力图的小时粒度时间轴模块进行布局并实现;
[0046]
s32:确定分钟时间轴粒度,设计面积图,确定面积图的面积映射方案,将带有面积图的分钟粒度时间轴模块进行布局并实现;
[0047]
s33:确定各行为对应的符号,确定行为序列的展示形式,包括布局位置和连线绘制方式,将行为模式演变模块进行布局并实现;
[0048]
s34:绘制行为符号图例。
[0049]
更进一步的,所述s31中,带有热力图的小时粒度时间轴模块的布局与实现,具体如下:
[0050]
s311:小时粒度时间轴中的时间序列以一小时为一个时间节点,以一天24个小时进行划分;
[0051]
s312:布局拆分为上层一周热力图、下层一日热力图和中间小时粒度时间轴三个部分,各部分的各个矩形紧密相连,在垂直方向上令三个部分的矩形之间有序偏移整数个矩形高度,最后将时间序列以数字文本的形式居中填充中间的小时粒度时间轴矩形。
[0052]
更进一步的,所述s32中,带有面积图的分钟粒度时间轴模块的布局与实现,具体如下:
[0053]
s321:分钟粒度时间轴中的时间序列跨度为一小时,以分钟为基本时间单位将1小时分为60分钟;
[0054]
s322:上半部分放置分钟粒度时间轴,下半部分放置面积图,上下两部分构造配置相同的带状比例尺,面积图定义域由初始值确定,分钟粒度时间轴定义域随刷选交互改变;
[0055]
s323:增加一个与带状比例尺具有相同定义域和值域的线性比例尺,执行刷选交互时,根据框选的线性比例尺的值域实时计算新的定义域,实现分钟粒度时间轴定义域随刷选交互改变。
[0056]
更进一步的,所述s33中,模式演变模块的布局与实现,具体如下:
[0057]
s331:用一个符号节点表示一个行为,一条连线表示两个不同行为之间的时序演变;连接多个节点形成连线,对行为模式的演变过程进行追踪,引入商品类目数据,在鼠标悬浮于节点时提供简洁的行为提示信息;
[0058]
s332:行为节点在水平方向上的坐标由该行为发生的时间决定,在垂直方向上的坐标由该行为在所属分钟内的出现顺序决定,将属于同一时刻的行为节点在垂直方向归于一组,同一组的节点中心处于相同垂线上;
[0059]
s333:将所属同一时刻组的节点用直线连接,相邻两个时刻的行为尾部和头部用三次贝塞尔曲线连接。
[0060]
本发明的有益效果是:
[0061]
1)本发明弥补了现有方法在用户周期性行为规律分析方面的不足。传统的环形热力图通常只能编码一种数据类型,然而现实的用户行为分析中通常需要在编码多种行为类
型的同时凸显某种特殊的行为类型。面对这些挑战,本方法设计了多层次的环形热力图表示多种行为类型,并融入了南丁格尔玫瑰图以突出展示某种重要的行为数据,能够全面地展现和分析用户的多种周期性行为。
[0062]
2)本发明弥补了现有方法无法多时间尺度地分析用户时序行为的不足。该可视化方法将用户行为编码到具体时刻,并提供带有热力图的小时粒度时间轴与带有面积图的分钟粒度时间轴帮助分析人员定位要分析的时间范围,将行为类型映射为不同符号,并用清晰的连线连接时序行为,以满足分析人员分析用户每个时刻行为的需求。有别于传统的线性时间可视化方法,该方法在布局方法和信息呈现方面具有更强的灵活性,充分利用了有限的屏幕空间,使分析人员能够更为全面地观察用户个体的行为模式。同时,提供高亮、提示和刷选等交互手段辅助分析,帮助分析人员渐进式地挖掘用户行为模式。
附图说明
[0063]
图1是本发明面向网络购物广告的用户时序行为可视化方法整体流程框架示意图。
[0064]
图2是本发明中周期行为视图的视觉编码与可视化布局示意图。
[0065]
图3是本发明中行为模式视图的视觉编码与可视化布局示意图。
[0066]
图4是本发明中行为符号之间的三次贝塞尔曲线绘制示意图。
[0067]
图5是本发明的实现效果及整体布局示意图。
[0068]
图6是本发明中行为模式视图交互设计示意图。
具体实施方式
[0069]
下面结合附图和具体数据实施对本发明做进一步详细说明。
[0070]
本发明通过有效的信息可视化方法,结合多视图联动策略以及灵活的交互手段,实现对网络购物平台用户时序行为的多角度分析,帮助广告分析师发现周期性行为规律,不同时间尺度下的行为模式,以及广告点击与其他购物行为之间的具体时序关系。技术方案包括:数据获取与处理,可视化映射,可视化布局与实现,交互设计。具体步骤如下:
[0071]
步骤一:数据获取与处理
[0072]
根据网络购物平台提供的用户行为相关的数据,筛选有效信息,进行数据存储。
[0073]
1、数据获取:从网购平台获取三个用户行为相关的csv文件,分别为用户购物行为表、广告点击行为表和广告基本信息表。其中,用户购物行为表包含字段:用户id、购物行为类型(浏览商品,加入购物车,收藏商品,购买商品)、时间戳、商品类目id和商品品牌id;广告点击行为表包含字段:用户id、广告i d、时间戳、广告资源位和是否点击;广告基本信息表包含:广告id、商品类目id、广告计划id、广告主id、商品品牌id和价格。原始数据包含超过106万个用户22天(2017年4月22日至2017年5月13日)内的7亿余条网络购物行为和8天(2017年5月6日

2017年5月13日)内的2600万余条广告点击行为。
[0074]
2、数据处理:本方法采用postgresql数据库存储数据,在数据库中构建与上述csv文件相对应的三张表,并根据实际需求,进行一系列的数据清洗、整合等预处理。
[0075]
(1)时间范围筛选:周期时间可视化时,需要提供固定周期范围的数据,以达到较好的视觉效果。为此对用户购物行为表和广告点击行为表进行筛选,在前者中取时间跨度
为三周的数据(2017年4月22日至2017年5月12日),在后者中取时间跨度为一周的数据(2017年5月6日至2017年5月12日)。
[0076]
(2)数据去重:网购平台在数据采集时,存在多个部门分别记录不同类型行为数据的情况,在数据集打包时,会产生很小的数据偏差,例如,两个不同的时间戳实际上是同一次用户行为。如果以用户id和时间戳这两个属性为主键,会导致一些重复的记录。因此,首先对用户购物行为表和广告点击行为表进行了数据去重操作。
[0077]
(3)数据清洗:筛选时间范围后,用户购物行为和广告点击行为数据减少,需要将多余的广告基本信息删除。对于部分数据表中的缺失值或无效值,也需要进行清洗操作。此外,部分数据表中存在多余的数据字段需要删除,例如,广告基本信息表中广告资源位是数据分析过程中的噪声数据,商品类目id与商品品牌id也只需要保留其一进行分析。
[0078]
完成数据处理后,数据库中存储的数据表及字段如下:用户购物行为表(用户id,时间戳,购物行为类型,商品类目id);广告点击行为表(用户id,广告i d,时间戳,是否点击);广告基本信息表(广告i d,商品类目i d)。
[0079]
步骤二:可视化映射
[0080]
经过数据获取与处理后,对本发明中的周期行为视图(如图2所示)和行为模式视图(如图3所示)进行可视化映射方案设计。
[0081]
1、周期行为视图
[0082]
(1)环形热力图
[0083]
形状:用矩形图元映射该用户一天中某种购物行为的总次数;
[0084]
位置:外层均分的7个的圆弧分别从零点开始顺时依次映射星期一到星期日;内部三层环形从外到内分别表示数据集中的第一周、第二周和第三周;在每个1/7环形中,沿顺时针方向的四列矩形图元依次映射浏览商品、加入购物车、收藏商品和购买商品四种行为;
[0085]
颜色:用颜色的深浅来表示行为数量的多少,颜色越深表示次数越多,颜色越浅表示次数越少。
[0086]
(2)南丁格尔玫瑰图
[0087]
形状:用花瓣形图元映射该用户在一天中广告点击行为的总次数;
[0088]
位置:与环形热力图一致,7个花瓣从零点开始顺时针依次映射星期一到星期日;
[0089]
面积:用花瓣的面积映射行为数量的多少,面积越大表示次数越多,面积越小表示次数越少。
[0090]
2、行为模式视图
[0091]
(1)矩形热力图时间轴
[0092]
形状:使用矩形作为热力图基本图元代表该用户在特定时间范围内的行为总次数,使用小圆点代表广告点击行为次数,帮助迅速找到广告点击行为发生的时刻;
[0093]
位置:矩形热力图由2行24列共48个矩形组成,24列从左至右分别映射0

23时,第1行代表具有广告点击数据的一周,第2行代表在该星期中选定的一日,即上方热力图展示该用户在一周内每小时行为次数之和,下方热力图展示该用户在选中日期内每小时行为次数之和。小圆点从左至右放置于一周热力图和一日热力图的矩形中,表示该用户在对应时间内的广告点击次数;
[0094]
颜色:一周热力图和一日热力图采用双色相序列颜色映射方案来实现连续插值,
热力图的颜色越深,代表用户在这一小时内进行的总行为次数越多。单色相序列颜色映射方案首先将数据序列转换为0到1之间的数值序列,然后将转换后的数值对应到颜色序列中,最后返回确切的颜色。与之不同的是,本方法采用的双色相序列颜色映射方案存在两种色相,其计算步骤如下所示:
[0095]
1)以两种数量中更大的数值范围为基准,为两种色相赋予采用统一的定义域,以保证数据类型存在差异时,颜色的渐变情况一致;
[0096]
2)在运算执行之初,先行判断数据类型。具体到当前场景中,则是判断数据归属于一周或一日;
[0097]
3)根据判断结果,将数据映射到不同的色相中;
[0098]
4)求得最终颜色。
[0099]
通过这种方案,一周热力图和一日热力图分别采用两种色相相近的颜色来完成视觉编码(本方法采用红色与橙色),其颜色映射公式如下所示:
[0100][0101]
式中:hexcolori代表颜色在rgb颜色所对应的十六进制数值,hexcolormax和hexcolormin分别代表颜色在rgb颜色所对应的十六进制数值的最大值和最小值;datai代表对应时间内行为的次数;datamax和datamin分别代表对应时间内行为次数的最大值和最小值。
[0102]
对于周与日这种同时包含小时这一相同时间序列的双数据序列,双色相序列颜色映射方案可以使视觉表达更加完善,根据颜色即可对不同类型的数据做出区分。
[0103]
(2)面积图时间轴
[0104]
位置:时间轴在横向上被分代表一分钟的60个刻度,起伏波动的面积图映射对应时间上的行为总次数;
[0105]
面积:每分钟面积的大小与这分钟的总行为次数成正比例,面积越大,则行为次数越多。
[0106]
(3)行为演变模块
[0107]
形状:采用五种符号来映射五种行为,即用三角形表示浏览商品、方形表示加入购物车、圆形表示收藏商品、十字形表示购买商品、五角星形表示广告点击。符号之间的连线表示行为间的时序关系;选定时间范围内,图标数量越多,则表示该用户状态活跃,行为次数多。
[0108]
位置:同一分钟内的行为用直线连接,处于相同垂直位置;相邻分钟的尾部行为和头部行为用三次贝塞尔曲线连接;行为符号与分钟时间轴刻度相对应。通过区分视图上符号分布,可以迅速发现何种行为是该用户最常进行的行为。
[0109]
步骤三:可视化布局与实现
[0110]
读取指定用户的行为数据,在周期行为视图中完成环形热力图与南丁格尔玫瑰图的布局与实现(如图2所示);在行为模式视图中完成顶部带有热力图的小时粒度时间轴模块、中部行为模式演变模块、底部带有面积图的分钟粒度时间轴模块,以及左侧行为图例的布局与实现(如图3所示),具体如下:
[0111]
1、周期行为视图可视化布局与实现
[0112]
环形热力图在揭示时序数据的周期规律方面具有显著的优势。通过将数据按确切的周期划分,并按环形布局方法呈现,可以在较小的画布中洞察具有各种时间跨度的时序数据。就其本质而言,传统的环形热力图是一种径向布局的热力图,通常只能编码一种数据类型。然而,本方法要解决的问题是通过可视化视图来发现网络购物与广告点击过程中的五种行为,需要一次编码五种数据类型。此外,在数据集中,网络购物的四种行为涵盖了三周的日志记录,而广告点击行为的日志记录仅出现在最后一周。面对这些挑战,传统的环形热力图无法有效工作。为了解决这些问题,本方法对传统的环形热力图进行了一些改进,使其能够在环形上编码多种行为类型,同时支持突出显示一种最为重要的行为类型。其布局方法如下所示:
[0113]
(1)使用线性比例尺构造周粒度的圆角度比例尺,定义域为从1到7的整数,代表一周七天;值域为0到2π;最终的目的是将一个圆周均分为七等份;
[0114]
(2)使用线性比例尺构造日粒度的圆角度比例尺,定义域为从1到4的整数,代表浏览商品、加入购物车、收藏商品和购买商品四种行为;值域为根据周粒度的圆角度比例尺计算得出的起始角度到终止角度;最终的目的是将角度均分为四等份。
[0115]
(3)在最外层,通过定义适宜的内外半径和间隔角度构造弧,使用周粒度的圆角度比例尺来确定星期一到星期日在圆周上的位置,并放置标识文本用于确定具体的星期数所在的位置;
[0116]
(4)在中间层,通过日粒度的圆角度比例尺沿着圆周从0
°
开始按角度递增放置四种行为图元,使用颜色插值函数映射行为次数。次数越多,颜色越深。从外向内,成一定倍数地调整间隔角度,依次放置第一周到第三周的数据;
[0117]
(5)在最内层,通过周粒度的圆角度比例尺确认南丁格尔玫瑰图中每片花瓣的起始角度和终止角度。绘制玫瑰花瓣,使其能够与最外层的星期数一一对应。最终在热力图内部形成嵌套的玫瑰图。
[0118]
2、行为模式视图可视化布局与实现:
[0119]
行为模式可视化方法主要包括带有热力图的小时粒度时间轴模块、带有面积图的分钟粒度时间轴模块和行为模式演变模块。具体布局与实现流程如下:
[0120]
(1)带有热力图的小时粒度时间轴模块实现
[0121]
数据定义:时粒度时间轴中的时间序列hourarr以一小时为一个时间节点,将一天24个小时进行划分,其具体定义如下所示:
[0122]
hourarr={hour
i
|i∈[0,23]}
[0123]
布局计算:本模块的布局可以拆分为一周热力图、一日热力图和小时粒度时间轴三个部分。本模块中矩形之间的间隔xpadding统一设置为0,使各个矩形能够紧密相连。在y轴的布局上,令矩形有序偏移i个矩形高度rectheight。例如,一周热力图的矩形沿y轴偏移0个矩形高度,小时粒度时间轴的矩形沿y轴偏移1个矩形高度。y轴坐标ypos定义如下:
[0124]
ypos
i
=(i

1)
·
rectheight,i∈[1,3]
[0125]
三个部分的矩形放置完成后,将时间序列以文本的形式居中填充小时粒度时间轴矩形,可得到完整的带有热力图的小时粒度时间轴。
[0126]
(2)带有面积图的分钟粒度时间轴模块实现
[0127]
数据定义:分钟粒度时间轴中的时间序列minarr跨度为一小时,划分规则是以分
钟为基本时间单位将1小时分为60分钟,其具体定义如下所示:
[0128]
minarr={min
i
|i∈[0,59]}
[0129]
布局计算:带有面积图的分钟粒度时间轴模块主要用于呈现概览信息。模块上半部分为分钟粒度时间轴,下半部分为面积图。上下两部分需要构造配置相同的带状比例尺,面积图定义域由初始值确定,分钟粒度时间轴定义域随刷选交互改变。经过该x轴带状比例尺计算后,每分钟对应的刻度文本水平位置xpos如下所示:
[0130]
xpos
i
=i
·
(xbandwidth),i∈[0,59]
[0131]
为了实现上述目的,需要增加一个与带状比例尺具有相同定义域和值域的线性比例尺。执行刷选交互时,根据框选的线性比例尺的值域实时计算新的定义域。
[0132]
(3)行为模式演变模块实现
[0133]
数据定义:节点与连线是本模块的两个重要元素,一个节点即是一个行为,一条连线即代表两个不同行为之间的时序演变。要确认一个行为的发生,需要引入行为时间behtime和行为类型behtype。连接多个节点形成连线,可以对行为模式的演变过程进行追踪。此外,还应引入商品类目等数据,以便在鼠标悬浮于节点时为分析人员提供简洁的提示信息。
[0134]
行为节点配置:将属于同一时刻的行为节点放置于同一纵坐标,在节省屏幕空间的情况的同时能够支持更高效的行为演变追踪。任一行为节点behnode在水平方向上的坐标由该行为发生的时间决定,在垂直方向上的坐标由该行为在所属分钟内的出现顺序决定。根据行为类型behtype,行为符号behsymbol由符号生成函数symbolgenerator计算:
[0135]
behsymbol
behtype
=symbolgenerator(behtype)
[0136]
式中:behtype表示浏览商品、加入购物车、收藏商品、购买商品或广告点击行为;behsymbol表示与行为对应的三角形、正方形、圆形、十字形或五角星形。
[0137]
x轴坐标由带有面积图的分钟粒度时间轴模块中的带状比例尺计算行为时间behtime确定,y轴坐标由线性比例尺计算确定。该线性比例尺的值域为行为模式演变模块高度behheight,定义域由全部分钟时刻下的最大节点数量nodenumber
max
确定。在这一比例尺支持下,节点之间的间隔距离可根据behheight和nodenumber
max
自适应生成。
[0138]
按数据的时间属性将行为数据集进行划分后,属于同一时刻的行为节点将归于一堆。同一时刻堆中的节点中心处于相同垂线上。划分后的数据集包含60个时刻堆,设第i个时刻堆中的节点个数为nodenumber
i
,则有:
[0139][0140]
令画布与视图顶部和底部预留的间隔距离为margin,带有热力图的小时粒度时间轴模块高度为hourheight,行为模式演变模块距离上下时间轴模块的距离总和为padding。在求得nodenumber
max
后,可计算自适应y轴坐标ypos为:
[0141][0142]
式中:i表示具体的分钟粒度;j表示第分钟内的第j个行为节点,从1开始依次递增。
[0143]
行为连线绘制:在行为连线的设计中,所属同一时刻堆的节点用直线连接,相邻两个时刻堆的节点用三次贝塞尔曲线连接。绘制三次贝塞尔曲线需要用到四个点,分别是:起
始点startpoint、终止点endpoint以及控制点controlpoint1和controlpoint2。
[0144]
基于这四个点,绘制后的结果如图4所示。两个控制点坐标的确定方式如下所示:
[0145][0146][0147]
式中:startpointx
i1
表示第i个时刻堆的第1个起始点x轴坐标;startpointy
i1
表示第i个时刻堆的第1个起始点的y轴坐标;endpointx
i1
表示第i个时刻堆的第1个终止点x轴坐标;controlval表示自定义常量,用于控制曲率。
[0148]
完成上述两个视图的可视化布局与实现后,本发明的实现效果及整体布局示如图5所示。
[0149]
步骤四:交互设计
[0150]
在周期行为视图中点击最外层圆弧的某一天时,该圆弧高亮(如图5左),行为模式视图中的一日热力图会联动地展示这一天24小时中该用户的时序行为模式。进一步点击小时粒度时间轴上的某个小时,在行为模式演变模块同步显示该小时内用户的时序行为,可以通过刷选下方的分钟粒度时间轴聚焦感兴趣的时间段,形成“概览 细节”的组合。通过两种时间轴组合,可以精确地控制视图所要展示的时刻,既可以对要展示的小时粒度进行点选,也可以对要展示的分钟粒度进行刷选。
[0151]
具体来说,在行为模式视图内部支持高亮、提示和刷选交互操作:
[0152]
高亮:小时粒度时间轴由24小时组成。假如把所有时间展示在同一视图中,会造成视觉混淆,很难从繁杂的信息中获得有价值的知识。本方法通过点选小时粒度时间轴上的具体的某个小时来对时变数据进行过滤,可以使数据对象更加精炼和具体(图6(a))。
[0153]
提示:当鼠标悬浮于行为符号上时,半透明的提示框会同步地悬浮于光标附近。通过这一交互,可以在提示框中看到该行为发生的时间、行为类型和所对应的商品类目等信息(图6(b))。
[0154]
刷选:在不做刷选的情况下,视图可以呈现选中的某个小时内包含的详细数据。带有面积图的分钟粒度时间轴模块允许在面积图中刷选数据,被选中的时间范围会进一步被展开,有利于清晰地观察和总结行为模式(图6(c))。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜