一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

网页信息获取方法、装置、电子设备及计算机存储介质与流程

2022-06-05 21:29:24 来源:中国专利 TAG:


1.本技术涉及互联网技术领域,具体涉及一种网页信息获取方法、装置、电子设备及计算机存储介质。


背景技术:

2.随着网络技术的发展,采集用户在应用程序页面或者浏览器页面上操作行为,以明确用户需求的业务场景的需求越来越多。例如,可以基于采集到的用户操作行为数据的统计分析结果进行产品分析和产品优化等等,从而为用户提供更好的数据服务。然而,由于现阶段网页的页面结构设置越来越复杂,使得采集到的用户操作行为的数据存在不准确的情况。


技术实现要素:

3.本技术实施例提供了一种网页信息获取方法、装置、电子设备及计算机存储介质。
4.第一方面,本技术实施例提供了一种网页信息获取方法,该方法包括:
5.获取针对目标网页的点击事件,生成所述点击事件的标识信息;其中,所述标识信息包括区域字段;
6.基于所述区域字段确定所述点击事件在所述目标网页中发生的区域。
7.本技术实施例通过对目标网页发生点击事件的区域进行标识的方式,确定了点击事件在目标页面中发生的区域,解决了现阶段网页的页面结构设置越来越复杂,采集到的用户操作行为的具体数据不准确等问题。
8.在一种可能的实现方式中,所述标识信息还包括属性字段;
9.所述基于所述区域字段确定所述点击事件在所述目标网页中发生的区域之后,所述方法还包括:
10.基于所述点击事件的属性字段,确定所述点击事件发生区域的点击数量;
11.基于所述点击事件发生区域的点击数量,确定所述目标网页中各区域发生点击事件的数量。
12.本技术实施例利用属性字段对目标页面中各区域的点击次数进行统计,便于了解用户对于目标页面中各区域的喜好程度。
13.在一种可能的实现方式中,所述获取针对目标网页的点击事件之前,还包括:
14.基于所述目标网页中各区域的区域标识生成所述目标网页的节点树;其中,所述节点树包括:用于表示标识信息的节点、以及各区域之间层级关系的节点连接关系;
15.所述基于所述点击事件的属性字段,确定所述点击事件发生区域的点击数量,包括:
16.在当前点击事件的属性字段与预设字段匹配的情况下,确定所述当前点击事件所在的区域发生一次点击事件;
17.在所述当前点击事件所在区域对应的节点的属性字段与所述预设字段不匹配的
情况下,遍历所述当前点击事件所在区域对应的节点的上层各级节点,确定所述上层各级节点中是否存在与所述预设字段匹配的属性字段;
18.若所述上层各级节点中存在与所述预设字段匹配的属性字段,则在所述上层各级节点中与所述预设字段匹配的属性字段的节点对应的区域发生一次点击事件;
19.所述基于所述点击事件发生区域的点击数量,确定所述目标网页中各区域发生点击事件的数量,包括:统计预设时间内各点击事件发生区域的点击数量。
20.本技术实施例利用对目标网页解析生成节点树的方式,可以实现对目标网页中嵌套区域的点击事件的数量的统计,并利用预设时间统计所需时段内点击事件的数量,不仅实现了对目标网页中各区域点击事件数量的灵活统计,还满足了目标网页开发的需要,使得开发人员可以实时了解目标网页中各区域点击事件数量变化的动态信息。
21.在一种可能的实现方式中,所述标识信息还包括用户字段;
22.所述基于所述点击事件发生区域的点击数量,确定所述目标网页中各区域发生点击事件的数量之后,所述方法还包括:基于所述用户字段确定所述目标网页中各区域的访客数量。
23.本技术实施例可以在点击事件的标识信息增加用户字段,以统计目标网页的访客数量,不仅实现了对目标网页的访问用户的特征信息的统计,以便于目标网页后期的开发利用,还可以实现对恶意访问的监控。
24.在一种可能的实现方式中,所述基于所述用户字段确定所述目标网页中各区域的访客数量之后,所述方法还包括:对所述目标网页中各区域发生点击事件的数量和/或所述访客数量进行展示。
25.本技术实施例可以通过对目标网页的点击事件的数量和/或访客数量进行展示的方式,使工作人员了解目标网页中点击事件的数量和/或访问数量
26.在一种可能的实现方式中,所述对所述目标网页中各区域的点击事件的数量和/或所述访客数量进行展示,包括:
27.在所述目标网页上展示所述各区域发生点击事件的数量和/或所述访客数量;或,
28.生成用于展示所述目标网页中各区域发生点击事件的数量和/或所述访客数量的报表页。
29.本技术实施例可以在目标网页上展示点击事件的数量和/或访客数量,也可以生成用于展示目标网页中各区域发生点击事件的数量和/或访客数量的报表页,便于工作人员可以快速了解目标网页中点击事件的数量和访问数量。
30.在一种可能的实现方式中,所述在所述目标网页上展示所述各区域发生点击事件的数量和/或所述访客数量,包括:
31.在所述目标网页的各区域中添加用于显示所述各区域发生点击事件的数量和/或所述访客数量的标签。
32.本技术实施例可以通过在各区域附近添加标签的方式,对目标网页中点击事件的数量和访问数量进行直观的展示,不仅可以使网页设计人员可以快速了解用户喜欢点击的区域,还给网页后期的运营和营销等工作提供了宝贵的信息。
33.在一种可能的实现方式中,所述基于所述点击事件的用户字段确定所述目标网页中各区域的访客数量之后,所述方法还包括:
34.基于所述目标网页中各区域发生点击事件的数量对应的预设颜色阈值,在所述目标网页上生成用于显示所述目标网页中各区域用户喜好程度的第一热力图;和/或,
35.基于所述目标网页中各区域的访客数量对应的预设颜色阈值,在所述目标网页上生成用于显示所述目标网页中各区域用户喜好程度的第二热力图;其中,预设颜色阈值用于表示点击事件的数量和/或访客数量所在的数量范围对应的颜色,不同数量范围对应不同颜色。
36.本技术实施例可以通过生成热力图的方式,对目标网页中点击事件的数量和访问数量进行直观的展示,不仅可以使网页设计人员可以快速了解用户喜欢点击的区域,还给网页后期的运营和营销等工作提供了宝贵的信息。
37.第二方面,本技术实施例提供了一种网页信息获取装置,该装置包括:
38.标识生成模块,用于获取针对目标网页的点击事件,生成所述点击事件的标识信息;其中,所述标识信息包括区域字段;
39.第一确定模块,用于基于所述区域字段确定所述点击事件在所述目标网页中发生的区域。
40.在一种可能的实现方式中,所述标识信息还包括属性字段;
41.所述装置还包括:
42.第二确定模块,用于在所述第一确定模块基于所述区域字段确定所述点击事件在所述目标网页中发生的区域之后,基于所述点击事件的属性字段,确定所述点击事件发生区域的点击数量;
43.第三确定模块,用于基于所述点击事件发生区域的点击数量,确定所述目标网页中各区域发生点击事件的数量。
44.在一种可能的实现方式中,所述装置还包括:
45.节点树生成模块,用于在所述标识生成模块获取针对目标网页的点击事件,生成所述点击事件的标识信息之前,基于所述目标网页中各区域的区域标识生成所述目标网页的节点树;其中,所述节点树包括:用于表示标识信息的节点、以及各区域之间层级关系的节点连接关系;
46.所述第二确定模块,具体用于:
47.在当前点击事件的属性字段与预设字段匹配的情况下,确定所述当前点击事件所在的区域发生一次点击事件;
48.在所述当前点击事件所在区域对应的节点的属性字段与所述预设字段不匹配的情况下,遍历所述当前点击事件所在区域对应的节点的上层各级节点,确定所述上层各级节点中是否存在与所述预设字段匹配的属性字段;
49.若所述上层各级节点中存在与所述预设字段匹配的属性字段,则在所述上层各级节点中与所述预设字段匹配的属性字段的节点对应的区域发生一次点击事件;
50.所述第三确定模块,具体用于:统计预设时间内各点击事件发生区域的点击数量。
51.在一种可能的实现方式中,所述标识信息还包括用户字段;
52.所述装置还包括:第四确定模块,用于在所述第三确定模块基于所述点击事件发生区域的点击数量,确定所述目标网页中各区域发生点击事件的数量之后,基于所述用户字段确定所述目标网页中各区域的访客数量。
53.在一种可能的实现方式中,所述装置还包括:展示模块,用于在所述第四确定模块基于所述用户字段确定所述目标网页中各区域的访客数量之后,对所述目标网页中各区域发生点击事件的数量和/或所述访客数量进行展示。
54.在一种可能的实现方式中,所述展示模块,包括:
55.展示单元,用于在所述目标网页上展示所述各区域发生点击事件的数量和/或所述访客数量;和/或,
56.报表页生成单元,用于生成用于展示所述目标网页中各区域发生点击事件的数量和/或所述访客数量的报表页。
57.在一种可能的实现方式中,所述展示单元,具体用于:
58.在所述目标网页的各区域中添加用于显示所述各区域发生点击事件的数量和/或所述访客数量的标签。
59.在一种可能的实现方式中,所述装置还包括:
60.第一热力图生成单元,用于在所述第四确定模块基于所述用户字段确定所述目标网页中各区域的访客数量之后,基于所述目标网页中各区域发生点击事件的数量对应的预设颜色阈值,在所述目标网页上生成用于显示所述目标网页中各区域用户喜好程度的第一热力图;和/或,
61.第二热力图生成单元,用于在所述第四确定模块基于所述用户字段确定所述目标网页中各区域的访客数量之后,基于所述目标网页中各区域的访客数量对应的预设颜色阈值,在所述目标网页上生成用于显示所述目标网页中各区域用户喜好程度的第二热力图;其中,预设颜色阈值用于表示点击事件的数量和/或访客数量所在的数量范围对应的颜色,不同数量范围对应不同颜色。
62.第三方面,本技术实施例提供了一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行本技术实施例第一方面提供的方法步骤。
63.第四方面,本技术实施例提供了一种电子设备,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由处理器加载并执行:
64.在一种可能的实现方式中,所述标识信息还包括属性字段;
65.所述处理器基于所述区域字段确定所述点击事件在所述目标网页中发生的区域之后,还用于执行:
66.基于所述点击事件的属性字段,确定所述点击事件发生区域的点击数量;
67.基于所述点击事件发生区域的点击数量,确定所述目标网页中各区域发生点击事件的数量。
68.在一种可能的实现方式中,所述处理器获取针对目标网页的点击事件之前,还用于执行:
69.基于所述目标网页中各区域的区域标识生成所述目标网页的节点树;其中,所述节点树包括:用于表示标识信息的节点、以及各区域之间层级关系的节点连接关系;
70.所述处理器基于所述点击事件的属性字段,确定所述点击事件发生区域的点击数量时,具体执行:
71.在当前点击事件的属性字段与预设字段匹配的情况下,确定所述当前点击事件所在的区域发生一次点击事件;
72.在所述当前点击事件所在区域对应的节点的属性字段与所述预设字段不匹配的情况下,遍历所述当前点击事件所在区域对应的节点的上层各级节点,确定所述上层各级节点中是否存在与所述预设字段匹配的属性字段;
73.若所述上层各级节点中存在与所述预设字段匹配的属性字段,则在所述上层各级节点中与所述预设字段匹配的属性字段的节点对应的区域发生一次点击事件;
74.所述基于所述点击事件发生区域的点击数量,确定所述目标网页中各区域发生点击事件的数量,包括:统计预设时间内各点击事件发生区域的点击数量。
75.在一种可能的实现方式中,所述标识信息还包括用户字段;
76.所述处理器基于所述点击事件发生区域的点击数量,确定所述目标网页中各区域发生点击事件的数量之后,还用于执行:基于所述用户字段确定所述目标网页中各区域的访客数量。
77.在一种可能的实现方式中,所述处理器基于所述用户字段确定所述目标网页中各区域的访客数量之后,还用于执行:对所述目标网页中各区域发生点击事件的数量和/或所述访客数量进行展示。
78.在一种可能的实现方式中,所述处理器在对所述目标网页中各区域的点击事件的数量和/或所述访客数量进行展示时,具体执行:
79.在所述目标网页上展示所述各区域发生点击事件的数量和/或所述访客数量;和/或,
80.生成用于展示所述目标网页中各区域发生点击事件的数量和/或所述访客数量的报表页。
81.在一种可能的实现方式中,所述处理器在所述目标网页上展示所述各区域发生点击事件的数量和/或所述访客数量时,具体执行:
82.在所述目标网页的各区域中添加用于显示所述各区域发生点击事件的数量和/或所述访客数量的标签。
83.在一种可能的实现方式中,所述处理器基于所述点击事件的用户字段确定所述目标网页中各区域的访客数量之后,还用于执行:
84.基于所述目标网页中各区域发生点击事件的数量对应的预设颜色阈值,在所述目标网页上生成用于显示所述目标网页中各区域用户喜好程度的第一热力图;和/或,
85.基于所述目标网页中各区域的访客数量对应的预设颜色阈值,在所述目标网页上生成用于显示所述目标网页中各区域用户喜好程度的第二热力图;其中,预设颜色阈值用于表示点击事件的数量和/或访客数量所在的数量范围对应的颜色,不同数量范围对应不同颜色。
86.可以理解地,上述提供的第二方面提供的网页信息获取装置、第三方面提供的计算机存储介质、以及第四方面提供的电子设备,均用于执行第一方面所提供的网页信息获取方法。因此,其所能达到的有益效果可参考第一方面所提供的模型训练方法中的有益效果,此处不再赘述。
附图说明
87.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例中所需使用的附
图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
88.图1为本技术实施例提供的一种网页信息获取方法的应用场景图;
89.图2为本技术实施例提供的一种网页信息获取方法的系统架构图;
90.图3为本技术实施例提供的一种网页信息获取方法的流程示意图;
91.图4为本技术实施例提供的另一种网页信息获取方法的流程示意图;
92.图5为本技术实施例提供的再一种网页信息获取方法的流程示意图;
93.图6a为本技术实施例提供的一种网页信息获取方法的目标网页示意图;
94.图6b为本技术实施例提供的一种网页信息获取方法的目标网页的节点树示意图;
95.图7为本技术实施例提供的一种网页信息获取方法的流程示意图;
96.图8为本技术实施例提供的另一种网页信息获取方法的流程示意图;
97.图9为本技术实施例提供的一种网页信息获取方法的目标网页中各区域的点击量和访问量标注示意图;
98.图10为本技术实施例提供的一种网页信息获取方法的目标网页中各区域的点击量和访问量的柱状图;
99.图11为本技术实施例提供的一种网页信息获取设备的结构示意图;
100.图12为本技术实施例提供的电子设备的结构示意图。
具体实施方式
101.下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
102.在本技术的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本技术中的具体含义。此外,在本技术的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
103.图1示例性示出了本技术实施例提供的网页信息获取方法的应用场景图。如图1所示,目标网页10可以包括:位于目标网页10上部的标题类别部分11、位于目标网页中部的滚动图片部分12、以及位于目标网页下部的信息条目部分13。其中:
104.标题类别部分11具体可以包括:新闻、购物、娱乐、旅游、教育、汽车等6个类别,当用户点击任一类别标题时,可以生成该标题类别对应的新的内容页面;当用户的鼠标滑动到任一类别标题时,滚动图片部分12可以对该类别的热点进行展示。滚动图片部分12具体可以包括:背景部分、图片部分、以及滑动部分;其中,背景部分可以包括“新闻热点”后的可点击的 按钮,用户点击该 按钮后即可完成对“新闻热点”内容的关注;图片部分可以包括多张热点新闻图片,当用户点击当前热点新闻图片时,可以生成当前热点新闻对应的内容页面;滑动部分位于热点新闻图片的两侧,用户可以通过点击左侧或右侧的滑动按钮查看
上一张或下一张热点新闻图片。信息条目部分13具体可以包括不同类别下的多个信息条目,例如,对于新闻类别,目标网页10从左到右的4个单元具体可以展示:本市新闻、本省新闻、国内新闻、国际新闻,用户点击本市新闻中的第一条新闻,可以生成该条新闻的具体内容页面。
105.图2示出应用于本技术实施例的一种网页信息获取方法的系统架构图。如图2所示,本技术实施例的执行主体是终端,该终端具有显示屏的电子设备,该终端包括但不限于:手持设备、个人电脑、平板电脑、车载设备、智能手机、计算设备或连接到无线调制解调器的其它处理设备等。在不同的网络中终端设备可以叫做不同的名称,例如:用户设备、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置、蜂窝电话、无绳电话、个人数字处理(personal digital assistant,pda)、第五代移动通信技术(5th generation mobile networks,5g)网络或未来演进网络中的终端设备等。终端系统是指可以运行在终端上的操作系统,是管理和控制终端硬件和终端应用的程序,是终端不可或缺的系统应用。该系统包括担不限于安卓android系统、ios系统、windows phone(wp)系统和ubuntu移动版操作系统等。
106.根据一些实施例,终端可以通过网络和服务器连接。网络用以在终端和服务器之间提供通信链路。网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。应该理解,图2中的终端、网络和服务器的数目仅仅是示意性的。根据现实需要,可以具有任意数目的终端、网络和服务器。比如服务器可以是多个服务器组成的服务器集群等。用户可以使用终端通过网络与服务器交互,以获取网页信息等。
107.接下来结合图1介绍的网页信息获取方法的应用场景图及图2介绍的系统架构图,来介绍本技术实施例提供的网页信息获取方法,该方法可由上述终端设备执行。本技术实施例提供的网页信息获取方法可适用于终端和服务器实时进行通信的场景。
108.在一个实施例中,图3所示,提供了一种网页信息获取方法流程图。如图3所示,该网页信息获取方法包括如下步骤:
109.s301,获取针对目标网页的点击事件,生成点击事件的标识信息。
110.其中,标识信息可以包括区域字段。
111.在本技术实施例中标识信息用于表示记录点击事件基本情况的信息,例如,其包括的区域字段用于表示该点击事件在目标网页中发生的具体区域。例如,当用户点击图1中目标网页的购物标题时,生成的点击事件1的标识信息tag可以为v1_index_shopping,即tag:v1_index_shopping。
112.可能地,本技术实施例可以针对目标网页中的点设置坐标,根据坐标信息生成点击事件标识信息。
113.具体地,针对目标网页的长宽设置横纵坐标轴,目标网页中每个点对应一个坐标,当用户点击目标网页中的某个点时,会自动生成该点的横纵坐标,若果该点的坐标处于可生成标识信息的预设坐标范围内,则自动生成该点击事件的标识信息,否则,该点击事件无法生成标识信息,即该点击事件为无效,例如,假设购物标题可生成标识信息的预设坐标范围的横坐标为50-70,纵坐标为230-240,若当前点击事件的坐标为(62,240),则可以生成该点击事件的标识信息v1_index_shopping;若当前点击事件的坐标为(45,225),则该点击事件无法生成标识信息。
114.s302,基于区域字段确定点击事件在目标网页中发生的区域。
115.具体地,服务器可以根据终端中的目标网页生成的标识信息tag:v1_index_shopping中的区域字段v1_index_shopping可以确定,用户点击的是图1中目标网页10上部的标题类别部分11中的购物标题。
116.在一个具体的例子中,当用户点击图1中目标网页中部时,生成该点击事件的坐标(85,170),由于该坐标属于滚动图片部分12中的图片部分的预设横坐标30-280、预设纵坐标130-200的范围内,故生成该点击事件的标识信息tag:v2_index_mainphoto,并根据该标识信息中的区域字段v2_index_mainphoto可以确定该点击事件发生在目标网页的滚动图片部分12中的图片部分。
117.在本技术实施例中,通过获取针对目标网页的点击事件,生成点击事件的标识信息,基于区域字段确定点击事件在目标网页中发生的区域。由此,本技术实施例可以通过对目标网页发生点击事件的区域进行标识的方式,解决现阶段网页的页面结构设置越来越复杂,采集到的用户操作行为的具体数据不准确等问题。
118.在一些实施方式中,标识信息还可以包括属性字段。其中,属性字段用于表示点击事件的属性,例如,用户点击的是滚动图片部分12中背景部分的“新闻热点”后的 按钮,生成该点击事件的标识信息tag:pk:v2_index_pressb1,其中属性字段为pk,表示用户点击事件的属性是按钮。
119.在一个实施例中,图4所示,提供了一种网页信息获取方法流程图。如图4所示,该网页信息获取方法可以包括如下步骤:
120.s401,获取针对目标网页的点击事件,生成点击事件的标识信息。
121.具体地,s401与s301一致,此处不再赘述。
122.s402,基于区域字段确定点击事件在目标网页中发生的区域。
123.具体地,s402与s302一致,此处不再赘述。
124.s403,基于点击事件的属性字段,确定点击事件发生区域的点击数量。
125.例如,若用户的点击事件均发生在图1中目标网页下部最左侧的信息条目部分,生成的点击事件的标识信息分别为tag1:bk:v3_index_iteme、tag2:bk:v3_index_iteme、tag3:bk:v3_index_iteme、tag4:bk:v3_index_iteme、tag5:bk:v3_index_iteme,这些标识信息中的属性字段bk出现5次,可以基于该属性字段确定发生这些点击事件的目标网页下部最左侧的信息条目部分的点击数量为5。
126.s404,基于点击事件发生区域的点击数量,确定目标网页中各区域发生点击事件的数量。
127.在一个具体的例子中,若用户的点击事件均发生在图1中目标网页下部的信息条目部分,生成的点击事件的标识信息分别为tag1:bk:v3_index_iteme、tag2:bk:v3_index_itemf、tag3:bk:v3_index_itemf、tag4:bk:v3_index_itemf、tag5:bk:v3_index_itemh、tag6:bk:v3_index_itemg、tag7:bk:v3_index_iteme、tag8:bk:v3_index_itemf、tag9:bk:v3_index_itemg、tag10:bk:v3_index_itemh,对这些标识信息中的区域字段进行统计,可以得出目标网页下部的信息条目部分的点击数量分别为2、4、2、2,此外,由于用户的点击事件均发生在图1中目标网页下部,因此,目标网页的其他区域点击事件的数量为0。
128.由此,本技术实施例可以通过点击事件标识信息中的属性字段确定目标网页中每
个区域的点击事件的数量,从而进一步对目标网页各区域的点击事件进行统计分析,确定目标网页中用户对各区域的喜好程度,不仅有利于目标网页的进一步开发利用,还可以根据用户的喜好确定目标网页中各区域的价值以进行广告信息的投放等操作。
129.在一个实施例中,图5所示,提供了一种网页信息获取方法流程图。如图5所示,该网页信息获取方法可以包括如下步骤:
130.s501,基于目标网页中各区域的区域标识生成目标网页的节点树。
131.其中,节点树可以包括:用于表示标识信息的节点、以及各区域之间层级关系的节点连接关系。
132.例如,图6b示出了图6a中目标网页的节点树,其中,第一层级节点可以包括目标网页中的标题类别部分的标题节点a、标题节点b、标题节点c、滚动图片部分中的背景节点d、以及信息条目部分中的条目单元节点e、条目单元节点f、条目单元节点g、条目单元节点h;第二层级节点可以包括滚动图片部分中的图片部分的图片节点d1、背景部分中“新闻热点”后的可点击的 按钮节点d3、以及条目单元节点e中的条目节点e1、条目节点e2、条目节点e3、条目单元节点f中的条目节点f1、条目节点f2、条目节点f3、条目单元节点g中的条目节点g1、条目节点g2、条目节点g3、条目单元节点h中的条目节点h1、条目节点h2、条目节点h3;第三层级节点可以包括滚动图片部分中的滑动按钮节点d2。
133.具体地,上述例子中各层级中节点之间的关系可以是:第三层级中滑动按钮节点d2的父节点可以是第二层级中的图片节点d1,第二层级中的图片节点d1和 按钮节点d3的父节点可以是第一层级中的背景节点d,第二层级中条目节点e1、条目节点e2、条目节点e3的父节点可以是第一层级中的条目单元节点e,第二层级中的条目节点f1、条目节点f2、条目节点f3的父节点可以是第一层级中的条目单元节点f,第二层级中的条目节点g1、条目节点g2、条目节点g3的父节点可以是第一层级中的条目单元节点g,第二层级中的条目节点h1、条目节点h2、条目节点h3中的父节点可以是第一层级中的条目单元节点h。
134.s502,获取针对目标网页的点击事件,生成点击事件的标识信息。
135.具体地,s502与s301一致,此处不再赘述。
136.s503,基于区域字段确定点击事件在目标网页中发生的区域。
137.具体地,s503与s302一致,此处不再赘述。
138.s504,在当前点击事件的属性字段与预设字段匹配的情况下,确定当前点击事件所在的区域发生一次点击事件。
139.其中,预设字段用于表示用于记录点击事件发生的字段。
140.具体地,假设预设字段为bk,则当点击事件的标识信息中的属性字段出现bk时,记录当前点击事件所在的区域发生一次点击事件,例如,若当前点击事件对应的条目单元节点e的标识信息若为tag1:bk:v3_index_iteme,该标识信息中的属性字段bk与预设字段bk匹配,则记录当前点击事件所在的条目单元e所在的区域生一次点击事件。若当前点击事件对应的 按钮节点d3的标识信息tag:pk:v2_index_pressb1,其中属性字段为pk与预设字段bk不匹配,则 按钮节点d3所在的 按钮区域不记录当前点击事件的发生。
141.s505,在当前点击事件所在区域对应的节点的属性字段与预设字段不匹配的情况下,遍历当前点击事件所在区域对应的节点的上层各级节点,确定上层各级节点中是否存在与预设字段匹配的属性字段。
142.进一步地,在当前点击事件所在区域对应的节点的属性字段与预设字段不匹配的情况下,确定该当前点击事件所在区域对应的节点是否存在父节点,若存在父节点,则继续确定该当前点击事件所在区域对应的父节点的属性字段与预设字段是否匹配,若该当前点击事件所在区域对应的父节点的属性字段与预设字段仍不匹配,继续遍历上层节点,若该当前点击事件所在区域对应的节点的所有上层节点中的属性字段均与预设字段不匹配,则该次点击事件不参与区域记录。
143.s506,若上层各级节点中存在与预设字段匹配的属性字段,则在上层各级节点中与预设字段匹配的属性字段的节点对应的区域发生一次点击事件。
144.举例来说,若当前点击事件对应的滑动按钮节点d2的标识信息tag:pk:v2_index_pressb2,其中属性字段为pk与预设字段bk不匹配,则滑动按钮节点d2所在的滑动按钮区域不记录当前点击事件的发生,进一步再确定该滑动按钮节点d2是否存在父节点,由于该滑动按钮节点d2的父节点为第二层级的图片节点d1,则继续确定图片节点d1对应的标识信息tag:fk:v2_index_mainphoto中的属性字段与预设字段是否匹配,由于图片节点d1对应的属性字段fk与预设字段bk仍不匹配,继续确定该图片节点d1是否存在父节点,由于该图片节点d1的父节点为第一层级中的背景节点d,则继续确定该背景节点d对应的标识信息tag:bk:v2_index_background中的属性字段与预设字段是否匹配,由于该背景节点d对应的属性字段bk与预设字段bk匹配,则记录该背景节点d对应的背景部分发生一次点击事件。
145.s507,统计预设时间内各点击事件发生区域的点击数量。
146.其中,预计时间用于表示预先设置的时间段,例如,预设时间可以为每3小时、或每6小时、或每天,具体可以根据目标网页的内容设定。
147.具体地,可以预设时间为1小时,即每隔1小时统计目标网页中各区域发生点击事件的数量,例如,针对图6a中的目标网页,统计2020年11月22日17:00-2020年11月22日18:00时,标题区域a、标题区域b、标题区域c、滚动图片区域d、以及条目单元区域e、条目单元区域f、条目单元区域g、条目单元区域h的点击数量。
148.可能地,完成预设时间内各区域点击数量的统计后,可以将该统计数量存入数据库后,从0开始重新统计下一预设时间内的点击量,也可以基于当前的点击数量继续进行点击数量的累计统计。
149.由此,本技术实施例利用对目标网页解析生成节点树的方式,可以实现对目标网页中嵌套区域的点击事件的数量的统计,并利用预设时间统计所需时段内点击事件的数量,不仅实现了对目标网页中各区域点击事件数量的灵活统计,还满足了目标网页开发的需要,可以实时了解目标网页中各区域点击事件数量变化的动态信息。
150.在一些实施方式中,标识信息还可以包括用户字段。其中,用户字段用于表示访问目标页面的用户信息,例如包括但不限于:用户的手机号,系统生成的数字与字母组合形式的会员账号。
151.例如,用户甲的手机号为123456789,当用户甲的点击图1中目标网页的购物标题时,生成的点击事件1的标识信息tag:bk:v1_index_shopping:123456789中的123456789即为用户字段。
152.在一个实施例中,图7所示,提供了一种网页信息获取方法流程图。如图7所示,该网页信息获取方法可以包括如下步骤:
153.s701,获取针对目标网页的点击事件,生成点击事件的标识信息。
154.具体地,s701与s301一致,此处不再赘述。
155.s702,基于区域字段确定点击事件在目标网页中发生的区域。
156.具体地,s702与s302一致,此处不再赘述。
157.s703,基于点击事件的属性字段,确定点击事件发生区域的点击数量。
158.具体地,s703与s403一致,此处不再赘述。
159.s704,基于点击事件发生区域的点击数量,确定目标网页中各区域发生点击事件的数量。
160.具体地,s704与s404一致,此处不再赘述。
161.s705,基于用户字段确定目标网页中各区域的访客数量。
162.具体地,本技术实施例可以根据点击事件生成的标识信息中的用户字段确定发生该次点击事件的用户信息,当发生多个点击事件的标识信息中的用户字段相同时,可以确定其为同一个用户发生的点击事件。
163.例如,若用户甲的多次对图1中目标网页下部最左侧的信息条目部分中的各条目进行点击浏览,生成的点击事件的标识信息分别为tag1:bk:v3_index_iteme1:123456789、tag2:bk:v3_index_iteme3:123456789、tag3:bk:v3_index_iteme2:123456789、tag4:bk:v3_index_iteme2:123456789、tag5:bk:v3_index_iteme4:123456789,这些标识信息中的属性字段bk出现5次,可以基于该属性字段确定发生这些点击事件的目标网页下部最左侧的信息条目部分的点击数量为5,这些标识信息中的用户字段均为123456789,可以基于该用户字段确定发生这些点击事件的目标网页下部最左侧的信息条目部分的访客数量为1。
164.由此,本技术实施例可以在点击事件的标识信息增加用户字段,以统计目标网页的访客数量,不仅实现了对目标网页的访问用户的特征信息的统计,以便于目标网页后期的开发利用,还可以实现对恶意访问的监控。
165.在一个实施例中,图8所示,提供了一种网页信息获取方法流程图。如图8所示,该网页信息获取方法可以包括如下步骤:
166.s801,获取针对目标网页的点击事件,生成点击事件的标识信息。
167.s802,基于区域字段确定点击事件在目标网页中发生的区域。
168.s803,基于点击事件的属性字段,确定点击事件发生区域的点击数量。
169.s804,基于点击事件发生区域的点击数量,确定目标网页中各区域发生点击事件的数量。
170.s805,基于用户字段确定目标网页中各区域的访客数量。
171.s806,对目标网页中各区域发生点击事件的数量和/或访客数量进行展示。
172.优选地,本技术实施例可以在目标网页上展示各区域发生点击事件的数量和/或访客数量。
173.例如,在目标网页的各区域中添加用于显示各区域发生点击事件的数量和/或访客数量的标签,如图9所示,可以在目标网页中的标题区域a附近标注该区域的点击量为167、访问量为106的标签;标题区域b附近标注该区域的点击量为662、访问量为421的标签;标题区域c附近标注该区域的点击量为351、访问量为200的标签;滚动图片部分中的背景区域d附近标注该区域的点击量为6953,访问量为5661的标签;信息条目部分中的条目单元区
域e附近标注该区域的点击量为266、访问量为123的标签;条目单元区域f附近标注该区域的点击量为89、访问量为50的标签;条目单元区域g附近标注该区域的点击量为523、访问量为400的标签;条目单元区域h附近标注该区域的点击量为1122,访问量为1008的标签。
174.优选地,本技术实施例还可以生成用于展示目标网页中各区域发生点击事件的数量和/或访客数量的报表页,例如,表1为根据目标网页中各区域发生点击事件的数量和访客数量生成的报表页。
175.表1
176.区域点击量访问量a167106b622421c351200d69535661e266123f8950g523400h11221008
177.可能地,本技术实施例还可以根据表1中的各区域发生点击事件的数量和访客数量生成柱状图、折线图、饼状图、条形图等图形信息。
178.如图10所示的根据目标网页中各区域发生点击事件的数量和访客数量生成的柱状图可以直观的展示出各区域的点击量和访问量,便于根据目标网页中各区域的信息的后期处理分析等操作。
179.在一些实施方式中,本技术实施例还可以基于目标网页中各区域发生点击事件的数量对应的预设颜色阈值,在目标网页上生成用于显示目标网页中各区域用户喜好程度的第一热力图;和/或,基于目标网页中各区域的访客数量对应的预设颜色阈值,在目标网页上生成用于显示目标网页中各区域用户喜好程度的第二热力图。
180.其中,预设颜色阈值用于表示点击事件的数量和/或访客数量所在的数量范围对应的颜色,不同数量范围对应不同颜色。
181.具体地,预设颜色阈值可以具体分为不同颜色对应的不同数量阈值范围,例如,数量在0-100范围内对应绿色、数量在101-500范围内对应黄色、数量在501-2000范围内对应橘红色、数量在2001-8000范围内对应红色,并进一步可以基于目标网页中各区域的点击量或访问量对应的数量阈值范围在目标网页上生成关于点击量的第一热力图或关于访问量的第二热力图。
182.由此,本技术实施例可以通过在各区域附近添加标签、生成报表页、展示图、或热力图等方式,对目标网页中点击事件的数量和访问数量进行直观的展示,不仅可以使网页设计人员可以快速了解用户喜欢点击的区域,还给网页后期的运营和营销等工作提供了宝贵的信息。
183.图11是本技术一示例性实施例提供的网页信息获取装置的结构示意图。该网页信息获取装置可以设置于终端设备、服务器等电子设备中,执行本技术上述任一实施例的网页信息获取方法。如图11所示,该网页获取装置包括:
184.标识生成模块111,用于获取针对目标网页的点击事件,生成所述点击事件的标识信息;其中,所述标识信息包括区域字段;
185.第一确定模块112,用于基于所述区域字段确定所述点击事件在所述目标网页中发生的区域。
186.在本技术实施例中,通过获取针对目标网页的点击事件,生成点击事件的标识信息,基于区域字段确定点击事件在目标网页中发生的区域。由此,本技术实施例可以通过对目标网页发生点击事件的区域进行标识的方式,解决现阶段网页的页面结构设置越来越复杂,采集到的用户操作行为的具体数据不准确等问题。
187.在一些可能的实施例中,所述标识信息还包括属性字段;
188.所述装置还包括:
189.第二确定模块,用于在所述第一确定模块112基于所述区域字段确定所述点击事件在所述目标网页中发生的区域之后,基于所述点击事件的属性字段,确定所述点击事件发生区域的点击数量;
190.第三确定模块,用于基于所述点击事件发生区域的点击数量,确定所述目标网页中各区域发生点击事件的数量。
191.在一些可能的实施例中,所述装置还包括:
192.节点树生成模块,用于在所述标识生成模块111获取针对目标网页的点击事件,生成所述点击事件的标识信息之前,基于所述目标网页中各区域的区域标识生成所述目标网页的节点树;其中,所述节点树包括:用于表示标识信息的节点、以及各区域之间层级关系的节点连接关系;
193.所述第二确定模块,具体用于:
194.在当前点击事件的属性字段与预设字段匹配的情况下,确定所述当前点击事件所在的区域发生一次点击事件;
195.在所述当前点击事件所在区域对应的节点的属性字段与所述预设字段不匹配的情况下,遍历所述当前点击事件所在区域对应的节点的上层各级节点,确定所述上层各级节点中是否存在与所述预设字段匹配的属性字段;
196.若所述上层各级节点中存在与所述预设字段匹配的属性字段,则在所述上层各级节点中与所述预设字段匹配的属性字段的节点对应的区域发生一次点击事件;
197.所述第三确定模块,具体用于:统计预设时间内各点击事件发生区域的点击数量。
198.在一些可能的实施例中,所述标识信息还包括用户字段;
199.所述装置还包括:第四确定模块,用于在所述第三确定模块基于所述点击事件发生区域的点击数量,确定所述目标网页中各区域发生点击事件的数量之后,基于所述用户字段确定所述目标网页中各区域的访客数量。
200.在一些可能的实施例中,所述装置还包括:展示模块,用于在所述第三确定模块基于所述点击事件发生区域的点击数量,确定所述目标网页中各区域发生点击事件的数量之后,对所述目标网页中各区域发生点击事件的数量和/或所述访客数量进行展示。
201.在一些可能的实施例中,所述展示单元,具体用于:
202.展示单元,用于在所述目标网页上展示所述各区域发生点击事件的数量和/或所述访客数量;和/或,
203.报表页生成单元,用于生成用于展示所述目标网页中各区域发生点击事件的数量和/或所述访客数量的报表页。
204.在一些可能的实施例中,所述展示单元,具体用于:
205.在所述目标网页的各区域中添加用于显示所述各区域发生点击事件的数量和/或所述访客数量的标签。
206.在一些可能的实施例中,所述装置还包括:
207.第一热力图生成单元,用于在所述第三确定模块基于所述点击事件发生区域的点击数量,确定所述目标网页中各区域发生点击事件的数量之后,基于所述目标网页中各区域发生点击事件的数量对应的预设颜色阈值,在所述目标网页上生成用于显示所述目标网页中各区域用户喜好程度的第一热力图;和/或,
208.第二热力图生成单元,用于在所述第三确定模块基于所述点击事件发生区域的点击数量,确定所述目标网页中各区域发生点击事件的数量之后,基于所述目标网页中各区域的访客数量对应的预设颜色阈值,在所述目标网页上生成用于显示所述目标网页中各区域用户喜好程度的第二热力图;其中,预设颜色阈值用于表示点击事件的数量和/或访客数量所在的数量范围对应的颜色,不同数量范围对应不同颜色。
209.需要说明的是,上述实施例提供的网页信息获取装置在执行网页信息获取方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的网页信息获取装置与网页信息获取方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
210.上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
211.请参见图12,为本技术实施例提供了一种电子设备的结构示意图。如图12所示,所述电子设备120可以包括:至少一个处理器121,至少一个网络接口124,用户接口123,存储器125,至少一个通信总线122。
212.其中,通信总线122用于实现这些组件之间的连接通信。
213.其中,用户接口123可以包括显示屏(display)、摄像头(camera),可选用户接口123还可以包括标准的有线接口、无线接口。
214.其中,网络接口124可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。
215.其中,处理器121可以包括一个或者多个处理核心。处理器121利用各种借口和线路连接整个电子设备120内的各个部分,通过运行或执行存储在存储器125内的指令、程序、代码集或指令集,以及调用存储在存储器125内的数据,执行电子设备120的各种功能和处理数据。可选的,处理器121可以采用数字信号处理(digital signal processing,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器121可集成中央处理器(central processing unit,cpu)、图像处理器(graphics processing unit,gpu)和调制解调器等中的一种或几种的组合。其中,cpu主要处理操作系统、用户界面和应用程序等;gpu用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器121中,单独通过一块芯片进行实现。
216.其中,存储器125可以包括随机存储器(random access memory,ram),也可以包括只读存储器(read-only memory)。可选的,该存储器125包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器125可用于存储指令、程序、代码、代码集或指令集。存储器125可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器125可选的还可以是至少一个位于远离前述处理器121的存储装置。如图12所示,作为一种计算机存储介质的存储器125中可以包括操作系统、网络通信模块、用户接口模块以及网页信息获取应用程序。
217.在图12所示的电子设备120中,用户接口123主要用于为用户提供输入的接口,获取用户输入的数据;而处理器121可以用于调用存储器125中存储的网页信息获取应用程序,并具体执行以下操作:
218.获取针对目标网页的点击事件,生成所述点击事件的标识信息;其中,所述标识信息包括区域字段;
219.基于所述区域字段确定所述点击事件在所述目标网页中发生的区域。
220.在一种可能的实施例中,所述标识信息还包括属性字段;
221.所述处理器121在执行基于所述区域字段确定所述点击事件在所述目标网页中发生的区域之后,还用于执行:
222.基于所述点击事件的属性字段,确定所述点击事件发生区域的点击数量;
223.基于所述点击事件发生区域的点击数量,确定所述目标网页中各区域发生点击事件的数量。
224.在一种可能的实施例中,所述处理器121在执行获取针对目标网页的点击事件之前,还执行:
225.基于所述目标网页中各区域的区域标识生成所述目标网页的节点树;其中,所述节点树包括:用于表示标识信息的节点、以及各区域之间层级关系的节点连接关系;
226.所述处理器121在执行基于所述点击事件的属性字段,确定所述点击事件发生区域的点击数量时,具体执行:
227.在当前点击事件的属性字段与预设字段匹配的情况下,确定所述当前点击事件所在的区域发生一次点击事件;
228.在所述当前点击事件所在区域对应的节点的属性字段与所述预设字段不匹配的情况下,遍历所述当前点击事件所在区域对应的节点的上层各级节点,确定所述上层各级节点中是否存在与所述预设字段匹配的属性字段;
229.若所述上层各级节点中存在与所述预设字段匹配的属性字段,则在所述上层各级节点中与所述预设字段匹配的属性字段的节点对应的区域发生一次点击事件;
230.所述处理器121在执行基于所述点击事件发生区域的点击数量,确定所述目标网页中各区域发生点击事件的数量时,具体执行:统计预设时间内各点击事件发生区域的点击数量。
231.在一种可能的实施例中,所述标识信息还包括用户字段;
232.所述处理器121在执行基于所述点击事件发生区域的点击数量,确定所述目标网
页中各区域发生点击事件的数量之后,还用于执行:基于所述用户字段确定所述目标网页中各区域的访客数量。
233.在一种可能的实施例中,所述处理器121在执行于所述用户字段确定所述目标网页中各区域的访客数量之后,还执行:对所述目标网页中各区域发生点击事件的数量和/或所述访客数量进行展示。
234.在一种可能的实施例中,所述处理器121在执行对所述目标网页中各区域的点击事件的数量和/或所述访客数量进行展示时,具体执行:
235.在所述目标网页上展示所述各区域发生点击事件的数量和/或所述访客数量;或,
236.生成用于展示所述目标网页中各区域发生点击事件的数量和/或所述访客数量的报表页。
237.在一种可能的实施例中,所述处理器121在执行在所述目标网页上展示所述各区域发生点击事件的数量和/或所述访客数量时,具体执行:
238.在所述目标网页的各区域中添加用于显示所述各区域发生点击事件的数量和/或所述访客数量的标签。
239.在一种可能的实施例中,所述处理器121在执行基于所述点击事件的用户字段确定所述目标网页中各区域的访客数量之后,还用于执行:
240.基于所述目标网页中各区域发生点击事件的数量对应的预设颜色阈值,在所述目标网页上生成用于显示所述目标网页中各区域用户喜好程度的第一热力图;和/或,
241.基于所述目标网页中各区域的访客数量对应的预设颜色阈值,在所述目标网页上生成用于显示所述目标网页中各区域用户喜好程度的第二热力图;其中,预设颜色阈值用于表示点击事件的数量和/或访客数量所在的数量范围对应的颜色,不同数量范围对应不同颜色。
242.本技术实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机或处理器上运行时,使得计算机或处理器执行上述图3-图5、以及图7-图8所示实施例中的一个或多个步骤。上述网页信息获取装置的各组成模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在所述计算机可读取存储介质中。
243.在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者通过所述计算机可读存储介质进行传输。所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字多功能光盘(digital versatile disc,dvd))、或者半导体介质(例如,固态硬盘(solid state disk,ssd))等。
244.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。而前述的存储介质包括:制度存储器(read onlymemory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可存储程序代码的介质。在不冲突的情况下,本实施例和实施方案中的技术特征可以任意组合。
245.以上所述的实施例仅仅是本技术的优选实施例方式进行描述,并非对本技术的范围进行限定,在不脱离本技术的设计精神的前提下,本领域普通技术人员对本技术的技术方案作出的各种变形及改进,均应落入本技术的权利要求书确定的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献