一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于大数据的人口特征分析方法、系统和存储介质与流程

2021-12-01 01:21:00 来源:中国专利 TAG:


1.本技术属于数据分析和处理领域,更具体的,涉及一种基于大数据的人口特征分析方法、系统和存储介质。


背景技术:

2.人口统计是一种从"量"的方面去研究人口现象的方法或学问。通过人口统计,可以揭示人口过程的规律性和人口现象的本质。在中国,通过人口统计,可以为控制人口数量,提高人口素质服务,使人口发展同经济和社会的发展相适应。
3.传统的人口统计手段存在数据获取的样本量小、采集周期滞后、采集成本较高、过程耗时过长,灵活性不强等诸多约束。目前随着大数据的应用,在人口统计时可以通过居民的各种大数据进行分析,得到人口的相关信息。但现有技术中,仅仅是将一些简单的大数据进行统计,并未有针对人口特征的专用大数据统计方法,因此,现有技术存在缺陷,亟待改进。


技术实现要素:

4.有鉴于此,本发明提供的一种基于大数据的人口特征分析方法、系统和存储介质,可以获取人口的各种相关数据,然后进行整合分析,能够更加精确的体现出人口的相关特征,并且通过可视化的方式显示出来,提高了用户使用体验感,并且增加了直观可视性。还能够通过对关系的梳理,得到用户之间的关系信息,有利于追踪用户的关系网,帮助政府人员或者公安机关进行追踪的工作。
5.本发明第一方面公开了一种基于大数据的人口特征分析方法,包括:获取目标人口数据信息;根据所述目标人口数据信息确定用户标识信息;获取用户标识信息的第一数据信息;分析所述第一数据信息,确定人口特征,得到人口特征信息;将所述人口特征信息发送至预设终端按照预设方式显示。
6.本方案中,所述分析所述第一数据信息,确定人口特征,得到人口特征信息,具体为:将所述第一数据信息进行多维度分类,得到多维度分类数据;根据所述多维度分类数据进行驻留时间分析,得到驻留时间信息;根据所述驻留时间和多维度分类数据进行关联,得到第一人口特征信息。
7.本方案中,还包括:将获得的每个用户的所述多维度分类数据与其他用户的多维度分类数据进行关联度分析,得到对应的关联度值;若所述关联度值超过预设的关联度阈值,则根据对应的维度的分类数据进行分析,确定用户之间的关系,得到第二人口特征信息。
8.本方案中,所述将获得的每个用户的所述多维度分类数据与其他用户的多维度分类数据进行关联度分析,具体为:建立用户之间的时间和多维度分类信息映射表;分析映射表中交叉点的关联度,得到关联度值;将大于预设第一关联度值的内容进行逐一分析,得到用户之间的关系信息,作为第二人口特征信息。
9.本方案中,包括:获取历史驻留信息;将历史驻留信息分为长周期信息和短周期信息;根据所述长周期信息和短周期信息分析确定用户的停留信息,得到第三人口特征信息。
10.本方案中,所述获取用户标识信息的第一数据信息,具体为:获取用户的移动设备通信数据和第三方平台交易数据;将所述移动设备通信数据和第三方平台交易数据进行预处理,得到第一数据信息。
11.本发明第二方面公开了一种基于大数据的人口特征分析系统,包括存储器和处理器,所述存储器中包括一种基于大数据的人口特征分析方法程序,所述一种基于大数据的人口特征分析方法程序被所述处理器执行时实现如下步骤:获取目标人口数据信息;根据所述目标人口数据信息确定用户标识信息;获取用户标识信息的第一数据信息;分析所述第一数据信息,确定人口特征,得到人口特征信息;将所述人口特征信息发送至预设终端按照预设方式显示。
12.本方案中,所述分析所述第一数据信息,确定人口特征,得到人口特征信息,具体为:将所述第一数据信息进行多维度分类,得到多维度分类数据;根据所述多维度分类数据进行驻留时间分析,得到驻留时间信息;根据所述驻留时间和多维度分类数据进行关联,得到第一人口特征信息。
13.本方案中,还包括:将获得的每个用户的所述多维度分类数据与其他用户的多维度分类数据进行关联度分析,得到对应的关联度值;若所述关联度值超过预设的关联度阈值,则根据对应的维度的分类数据进行分析,确定用户之间的关系,得到第二人口特征信息。
14.本方案中,所述将获得的每个用户的所述多维度分类数据与其他用户的多维度分类数据进行关联度分析,具体为:建立用户之间的时间和多维度分类信息映射表;分析映射表中交叉点的关联度,得到关联度值;将大于预设第一关联度值的内容进行逐一分析,得到用户之间的关系信息,作为第二人口特征信息。
15.本方案中,包括:获取历史驻留信息;将历史驻留信息分为长周期信息和短周期信息;根据所述长周期信息和短周期信息分析确定用户的停留信息,得到第三人口特征信息。
16.本方案中,所述获取用户标识信息的第一数据信息,具体为:获取用户的移动设备通信数据和第三方平台交易数据;将所述移动设备通信数据和第三方平台交易数据进行预处理,得到第一数据信息。
17.本发明第三方面公开了一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于大数据的人口特征分析方法程序,所述一种基于大数据的人口特征分析方法程序被处理器执行时,实现如上述任一项所述的一种基于大数据的人口特征分析方法的步骤。
18.本发明提供的一种基于大数据的人口特征分析方法、系统和存储介质,可以获取人口的各种相关数据,然后进行整合分析,能够更加精确的体现出人口的相关特征,并且通过可视化的方式显示出来,提高了用户使用体验感,并且增加了直观可视性。还能够通过对关系的梳理,得到用户之间的关系信息,有利于追踪用户的关系网,帮助政府人员或者公安机关进行追踪的工作。
附图说明
19.图1示出了本发明一种基于大数据的人口特征分析方法的流程图;图2示出了本发明实施例中工作人口居住半径的统计分析示意图;图3示出了本发明关联度信息的实施例示意图;图4示出了本发明一种基于大数据的人口特征分析系统的框图。
具体实施方式
20.为使得本技术的目的、特征、优点能够更加的明显和易懂,对本技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本技术一部分实施例,而非全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。
21.图1示出了本发明一种基于大数据的人口特征分析方法的流程图。
22.如图1所示,本发明公开了一种基于大数据的人口特征分析方法,包括:s102,获取目标人口数据信息;s104,根据所述目标人口数据信息确定用户标识信息;s106,获取用户标识信息的第一数据信息;s108,分析所述第一数据信息,确定人口特征,得到人口特征信息;s110,将所述人口特征信息发送至预设终端按照预设方式显示。
23.需要说明的是,所述目标人口数据信息为预设大区域中的目标群体,例如,北京市的常住人口的数据信息可以定为目标人口数据信息,大兴区中的常住人口的数据信息可以
定为目标人口数据信息。获取了目标人口数据信息之后可以确定用户标识信息,所述的用户标识信息为用户的id信息,用于表示用户的代码或者编号。通过用户标识信息可以获取用户相关的第一数据信息,其中第一数据信息包括用户的消费、出行、工作、人际关系等信息,通过第一数据信息可以分析得到人口特征信息内容,得到人口特征信息。所述的人口特征为区域内人口的消费特征、流动特征、人口组成特征、社交关系特征、居住稳定度特征、工作稳定度特征、兴趣分布等等。人口特征包含多种,可以在分析之后将人口特征信息按照预设方式进行显示,其中预设方式为本领域技术人员根据实际需要进行设置的,例如,如图2所示,显示了对北京某些地区的工作人口居住半径的统计分析。人口特征信息包括第一人口特征信息、第二人口特征信息、第三人口特征信息、第四人口特征信息,每个不同的特征信息都表示不同的维度的人口特征内容。本技术的基于大数据的人口特征分析方法,可以获取人口的各种相关数据,然后进行整合分析,能够更加精确的体现出人口的相关特征,并且通过可视化的方式显示出来,提高了用户使用体验感,并且增加了直观可视性。
24.根据本发明实施例,所述分析所述第一数据信息,确定人口特征,得到人口特征信息,具体为:将所述第一数据信息进行多维度分类,得到多维度分类数据;根据所述多维度分类数据进行驻留时间分析,得到驻留时间信息;根据所述驻留时间和多维度分类数据进行关联,得到第一人口特征信息。
25.需要说明的是,第一数据信息包括用户的消费、出行、工作、人际关系等信息,所以需要对第一数据进行筛选和预处理,将第一数据进行多维度分类,得到多维度数据,每个维度的数据都是同类型的数据内容,例如,第一数据分为消费数据、出行数据等。然后根据多维度数据进行驻留时间分析,得到驻留时间信息,所述的驻留时间信息为同维度类型的数据在预设时间段内的消费频率,具体为:设置预设时间段;获取所述多维度信息在预设时间段出现的频率;若所述频率超过频率阈值,则为有效统计数据;若所述频率未超过频率阈值,则为无效数据;确定有效统计数据为驻留时间信息,进行分析。例如,设置预设时间为15天,则用户在15内的消费频率为10,大于了预设的3次的消费频率阈值,则确定为有效统计数据,证明此用户应该是在此区域中常住人口。最后,根据所述驻留时间和多维度分类数据进行关联,得到第一人口特征信息。所述第一人口特征信息为用户常去和停留的地区的统计数据信息,表现出人口的驻留时间。例如,手机用户a主要活动区域为城区,居住在高层居民区,工作区域为写字楼,较长去会展中心、机场等;7

12岁的人口群体常去的地方为学校、图书馆等。本发明的关联分析方法可以采用现有技术中的关联性分析法,例如,采用协方差或者相关系数的方式进行分析,本发明不再一一赘述。
26.根据本发明实施例,还包括:将获得的每个用户的所述多维度分类数据与其他用户的多维度分类数据进行关联度分析,得到对应的关联度值;若所述关联度值超过预设的关联度阈值,则根据对应的维度的分类数据进行分析,确定用户之间的关系,得到第二人口特征信息。
27.需要说明的是,统计用户之间的关系可以通过用户产生的大数据进行分析得到,如果用户的一些行为重合度较高,则可能表明他们是家人或者是同事的关系。首先,获得了人口的多维度信息之后,将获得的每个用户的所述多维度分类数据与其他用户的多维度分
类数据进行关联度分析,得到对应的关联度值,其中关联度的计算可以采用现有技术中的关联度计算方法。得到的关联度值越高,则说明这两个用户之间存在关系的可能性就越高。若所述关联度值超过预设的关联度阈值,则根据对应的维度的分类数据进行分析,确定用户之间的关系,得到第二人口特征信息。超过了预设的关联度阈值,则说明用户之间存在一定的关系联系,那么可以针对对应的维度数据进行进一步分析,确定用户之间的关系,本发明所指的关系可以是社会关系、家庭关系、接触关系等中的任何一种。其中,第二人口特征信息为表示独立用户之间关系的特征信息,也可以是用户在某些时刻的驻留或者相遇关系。通过对关系的梳理,可以得到用户之间的关系信息,有利于追踪用户的关系网,帮助政府人员或者公安机关进行追踪的工作。
28.根据本发明实施例,所述将获得的每个用户的所述多维度分类数据与其他用户的多维度分类数据进行关联度分析,具体为:建立用户之间的时间和多维度分类信息映射表;分析映射表中交叉点的关联度,得到关联度值;将大于预设第一关联度值的内容进行逐一分析,得到用户之间的关系信息,作为第二人口特征信息。
29.需要说明的是,在进行人口用户的关系分析时,可以计算每个用户之间的关联,通过关联度分析得到用户的关系。首先,建立用户之间的时间和多维度分类信息映射表,分析映射表中交叉点的关联度,得到关联度值。将大于预设第一关联度值的内容进行逐一分析,得到用户之间的关系信息,其中,第一关联度值可以由本领域技术人员根据实际需要设置,优选的,本发明设置第一关联度值为1%,也就是说,在关联度大于1%时,才认为有效,进行下一步分析,得到第二人口特征信息。如图3所示,图3示出了本发明关联度信息的实施例示意图。在用户1和2可以识别出来是家庭用户;用户4和7的得分高,可以判断出来白天同事、晚上邻居,且节假日经常结伴活动;用户4和5的得分可以判断出白天同事,非工作日一起在单位加班。
30.根据本发明实施例,包括:获取历史驻留信息;将历史驻留信息分为长周期信息和短周期信息;根据所述长周期信息和短周期信息分析确定用户的停留信息,得到第三人口特征信息。
31.需要说明的是,在进行人口特征分析的时候,往往需要借助于历史数据进行分析,通过历史数据的分析可以使得分析结果更加准确。首先,获取历史驻留信息,所述历史驻留信息为用户在过去经过和停留的区域信息,包括地点和时间等信息,可以通过第三方平台或者政务平台获取,也可以通过用户的历史通信数据间接获取。然后将历史驻留信息分为长周期信息和短周期信息,所述长周期信息为时间段较长的信息,一般取40天以上的信息,短周期信息为时间段较短的信息,一般为20天内。例如,长周期信息为过去50天内的驻留信息,短周期为最近15天内驻留信息。通过长周期和短周期的结合分析,能够使得分析更加准确,例如,在一些用户来京出差7天,那么最近的7天可能会有较为活跃的第一数据信息,但是如果拉长到更久的时间,会发现之前并未出现第一数据信息,那么这部分的人群可以筛选或者剔除出来,分析其他用户的特征。所述长周期和短周期信息可以由本领域技术人员
根据实际需要进行设置。最后根据所述长周期信息和短周期信息确定用户的停留信息和用户之间的关系,得到第三人口特征信息。所述的第三人口特征信息为用户的停留信息,以及反映用户停留时产生一些行为的内容信息,例如,用户在近几个月在国贸停留时长为5%,消费为每天n元钱。
32.根据本发明实施例,所述获取用户标识信息的第一数据信息,具体为:获取用户的移动设备通信数据和第三方平台交易数据;将所述移动设备通信数据和第三方平台交易数据进行预处理,得到第一数据信息。
33.需要说明的是,获取的第一数据可以通过第三方平台以及移动通信数据获得,移动通信数据包括用户的手机与基站的通信信息,通过基站的位置可以间接得到用户的活动位置;第三方平台的交易数据包括每个支付平台的消费记录,购买记录等内容。获取了移动设备通信数据和第三方平台交易数据之后,将数据进行预处理,例如,进行归一化处理或者格式转换处理,得到方便进行分析统计的数据内容,也就得到了第一数据信息。
34.根据本发明实施例,还包括:获取第一数据信息中第三方平台交易数据;根据所述第三方平台交易数据分析得到用户消费特征信息。
35.需要说明的是,第三方平台的交易数据反应了用户的消费习惯和购买记录等信息,例如,用户购买婴幼儿产品较多,则可以通过交易数据获取用户的家庭消费能力和婴幼儿等相关信息。获取了第三方平台交易数据之后,可以分析得到用户消费特征信息。
36.根据本发明实施例,还包括:获取企业信息;根据所述第一数据信息和企业信息进行关联度分析,得到企业关联度值;统计企业关联度值超过第二关联度值的用户,得到用户群体集合;分析所述用户群体集合的用户数据,得到第四人口特征信息。
37.需要说明的是,在分析人口特征信息时,还可以结合企业信息进行分析,使得分析维度更加多元化,分析的结果也会更加准确。首先,获取企业信息,企业信息可以通过政务平台或者其他第三方平台获得,包括企业的社保人数、营业额、地址等信息。然后根据所述第一数据信息和企业信息进行关联度分析,得到企业关联度值,所述的企业关联度值表示用户与企业的关联度的大小,例如,用户a与企业b的关联度值,较为常见的,可以通过用户驻留时间结合企业地址进行分析,得到与企业相关联的关联度值,本领域技术人员可以根据实际需要进行关联度值的计算,但任何得到关联度的方案都将落入本发明的保护范围。得到了企业关联度值后,统计企业关联度值超过第二关联度值的用户,得到用户群体集合。再分析所述用户群体集合的用户数据,得到第四人口特征信息。所述第四人口特征信息为人口和企业之间的关联信息以及企业中人口的组成人口特征信息。例如,公司a的员工性别、年龄组成,员工的居住半径等信息。
38.人口特征信息包括第一人口特征信息、第二人口特征信息、第三人口特征信息、第四人口特征信息中的一种或几种,但不局限于此,每个不同的特征信息都表示不同的维度的人口特征内容。在进行人口特征信息显示时,可以按照实际需求进行显示。
39.图4示出了本发明一种基于大数据的人口特征分析系统的框图。
40.如图4所示,本发明公开了一种基于大数据的人口特征分析系统,包括存储器和处理器,所述存储器中包括一种基于大数据的人口特征分析方法程序,所述一种基于大数据的人口特征分析方法程序被所述处理器执行时实现如下步骤:获取目标人口数据信息;根据所述目标人口数据信息确定用户标识信息;获取用户标识信息的第一数据信息;分析所述第一数据信息,确定人口特征,得到人口特征信息;将所述人口特征信息发送至预设终端按照预设方式显示。
41.需要说明的是,所述目标人口数据信息为预设大区域中的目标群体,例如,北京市的常住人口的数据信息可以定为目标人口数据信息,大兴区中的常住人口的数据信息可以定为目标人口数据信息。获取了目标人口数据信息之后可以确定用户标识信息,所述的用户标识信息为用户的id信息,用于表示用户的代码或者编号。通过用户标识信息可以获取用户相关的第一数据信息,其中第一数据信息包括用户的消费、出行、工作、人际关系等信息,通过第一数据信息可以分析得到人口特征信息内容,得到人口特征信息。所述的人口特征为区域内人口的消费特征、流动特征、人口组成特征、社交关系特征、居住稳定度特征、工作稳定度特征、兴趣分布等等。人口特征包含多种,可以在分析之后将人口特征信息按照预设方式进行显示,其中预设方式为本领域技术人员根据实际需要进行设置的,例如,如图2所示,显示了对北京某些地区的工作人口居住半径的统计分析。人口特征信息包括第一人口特征信息、第二人口特征信息、第三人口特征信息、第四人口特征信息,每个不同的特征信息都表示不同的维度的人口特征内容。本技术的基于大数据的人口特征分析方法,可以获取人口的各种相关数据,然后进行整合分析,能够更加精确的体现出人口的相关特征,并且通过可视化的方式显示出来,提高了用户使用体验感,并且增加了直观可视性。
42.根据本发明实施例,所述分析所述第一数据信息,确定人口特征,得到人口特征信息,具体为:将所述第一数据信息进行多维度分类,得到多维度分类数据;根据所述多维度分类数据进行驻留时间分析,得到驻留时间信息;根据所述驻留时间和多维度分类数据进行关联,得到第一人口特征信息。
43.需要说明的是,第一数据信息包括用户的消费、出行、工作、人际关系等信息,所以需要对第一数据进行筛选和预处理,将第一数据进行多维度分类,得到多维度数据,每个维度的数据都是同类型的数据内容,例如,第一数据分为消费数据、出行数据等。然后根据多维度数据进行驻留时间分析,得到驻留时间信息,所述的驻留时间信息为同维度类型的数据在预设时间段内的消费频率,具体为:设置预设时间段;获取所述多维度信息在预设时间段出现的频率;若所述频率超过频率阈值,则为有效统计数据;若所述频率未超过频率阈值,则为无效数据;确定有效统计数据为驻留时间信息,进行分析。例如,设置预设时间为15天,则用户在15内的消费频率为10,大于了预设的3次的消费频率阈值,则确定为有效统计数据,证明此用户应该是在此区域中常住人口。最后,根据所述驻留时间和多维度分类数据进行关联,得到第一人口特征信息。所述第一人口特征信息为用户常去和停留的地区的统计数据信息,表现出人口的驻留时间。例如,手机用户a主要活动区域为城区,居住在高层居民区,工作区域为写字楼,较长去会展中心、机场等;7

12岁的人口群体常去的地方为学校、
图书馆等。本发明的关联分析方法可以采用现有技术中的关联性分析法,例如,采用协方差或者相关系数的方式进行分析,本发明不再一一赘述。
44.根据本发明实施例,还包括:将获得的每个用户的所述多维度分类数据与其他用户的多维度分类数据进行关联度分析,得到对应的关联度值;若所述关联度值超过预设的关联度阈值,则根据对应的维度的分类数据进行分析,确定用户之间的关系,得到第二人口特征信息。
45.需要说明的是,统计用户之间的关系可以通过用户产生的大数据进行分析得到,如果用户的一些行为重合度较高,则可能表明他们是家人或者是同事的关系。首先,获得了人口的多维度信息之后,将获得的每个用户的所述多维度分类数据与其他用户的多维度分类数据进行关联度分析,得到对应的关联度值,其中关联度的计算可以采用现有技术中的关联度计算方法。得到的关联度值越高,则说明这两个用户之间存在关系的可能性就越高。若所述关联度值超过预设的关联度阈值,则根据对应的维度的分类数据进行分析,确定用户之间的关系,得到第二人口特征信息。超过了预设的关联度阈值,则说明用户之间存在一定的关系联系,那么可以针对对应的维度数据进行进一步分析,确定用户之间的关系,本发明所指的关系可以是社会关系、家庭关系、接触关系等中的任何一种。其中,第二人口特征信息为表示独立用户之间关系的特征信息,也可以是用户在某些时刻的驻留或者相遇关系。通过对关系的梳理,可以得到用户之间的关系信息,有利于追踪用户的关系网,帮助政府人员或者公安机关进行追踪的工作。
46.根据本发明实施例,所述将获得的每个用户的所述多维度分类数据与其他用户的多维度分类数据进行关联度分析,具体为:建立用户之间的时间和多维度分类信息映射表;分析映射表中交叉点的关联度,得到关联度值;将大于预设第一关联度值的内容进行逐一分析,得到用户之间的关系信息,作为第二人口特征信息。
47.需要说明的是,在进行人口用户的关系分析时,可以计算每个用户之间的关联,通过关联度分析得到用户的关系。首先,建立用户之间的时间和多维度分类信息映射表,分析映射表中交叉点的关联度,得到关联度值。将大于预设第一关联度值的内容进行逐一分析,得到用户之间的关系信息,其中,第一关联度值可以由本领域技术人员根据实际需要设置,优选的,本发明设置第一关联度值为1%,也就是说,在关联度大于1%时,才认为有效,进行下一步分析,得到第二人口特征信息。如图3所示,图3示出了本发明关联度信息的实施例示意图。在用户1和2可以识别出来是家庭用户;用户4和7的得分高,可以判断出来白天同事、晚上邻居,且节假日经常结伴活动;用户4和5的得分可以判断出白天同事,非工作日一起在单位加班。
48.根据本发明实施例,包括:获取历史驻留信息;将历史驻留信息分为长周期信息和短周期信息;根据所述长周期信息和短周期信息分析确定用户的停留信息,得到第三人口特征信息。
49.需要说明的是,在进行人口特征分析的时候,往往需要借助于历史数据进行分析,通过历史数据的分析可以使得分析结果更加准确。首先,获取历史驻留信息,所述历史驻留信息为用户在过去经过和停留的区域信息,包括地点和时间等信息,可以通过第三方平台或者政务平台获取,也可以通过用户的历史通信数据间接获取。然后将历史驻留信息分为长周期信息和短周期信息,所述长周期信息为时间段较长的信息,一般取40天以上的信息,短周期信息为时间段较短的信息,一般为20天内。例如,长周期信息为过去50天内的驻留信息,短周期为最近15天内驻留信息。通过长周期和短周期的结合分析,能够使得分析更加准确,例如,在一些用户来京出差7天,那么最近的7天可能会有较为活跃的第一数据信息,但是如果拉长到更久的时间,会发现之前并未出现第一数据信息,那么这部分的人群可以筛选或者剔除出来,分析其他用户的特征。所述长周期和短周期信息可以由本领域技术人员根据实际需要进行设置。最后根据所述长周期信息和短周期信息确定用户的停留信息和用户之间的关系,得到第三人口特征信息。所述的第三人口特征信息为用户的停留信息,以及反映用户停留时产生一些行为的内容信息,例如,用户在近几个月在国贸停留时长为5%,消费为每天n元钱。
50.根据本发明实施例,所述获取用户标识信息的第一数据信息,具体为:获取用户的移动设备通信数据和第三方平台交易数据;将所述移动设备通信数据和第三方平台交易数据进行预处理,得到第一数据信息。
51.需要说明的是,获取的第一数据可以通过第三方平台以及移动通信数据获得,移动通信数据包括用户的手机与基站的通信信息,通过基站的位置可以间接得到用户的活动位置;第三方平台的交易数据包括每个支付平台的消费记录,购买记录等内容。获取了移动设备通信数据和第三方平台交易数据之后,将数据进行预处理,例如,进行归一化处理或者格式转换处理,得到方便进行分析统计的数据内容,也就得到了第一数据信息。
52.根据本发明实施例,还包括:获取第一数据信息中第三方平台交易数据;根据所述第三方平台交易数据分析得到用户消费特征信息。
53.需要说明的是,第三方平台的交易数据反应了用户的消费习惯和购买记录等信息,例如,用户购买婴幼儿产品较多,则可以通过交易数据获取用户的家庭消费能力和婴幼儿等相关信息。获取了第三方平台交易数据之后,可以分析得到用户消费特征信息。
54.根据本发明实施例,还包括:获取企业信息;根据所述第一数据信息和企业信息进行关联度分析,得到企业关联度值;统计企业关联度值超过第二关联度值的用户,得到用户群体集合;分析所述用户群体集合的用户数据,得到第四人口特征信息。
55.需要说明的是,在分析人口特征信息时,还可以结合企业信息进行分析,使得分析维度更加多元化,分析的结果也会更加准确。首先,获取企业信息,企业信息可以通过政务平台或者其他第三方平台获得,包括企业的社保人数、营业额、地址等信息。然后根据所述第一数据信息和企业信息进行关联度分析,得到企业关联度值,所述的企业关联度值表示用户与企业的关联度的大小,例如,用户a与企业b的关联度值,较为常见的,可以通过用户
驻留时间结合企业地址进行分析,得到与企业相关联的关联度值,本领域技术人员可以根据实际需要进行关联度值的计算,但任何得到关联度的方案都将落入本发明的保护范围。得到了企业关联度值后,统计企业关联度值超过第二关联度值的用户,得到用户群体集合。再分析所述用户群体集合的用户数据,得到第四人口特征信息。所述第四人口特征信息为人口和企业之间的关联信息以及企业中人口的组成人口特征信息。例如,公司a的员工性别、年龄组成,员工的居住半径等信息。
56.人口特征信息包括第一人口特征信息、第二人口特征信息、第三人口特征信息、第四人口特征信息中的一种或几种,但不局限于此,每个不同的特征信息都表示不同的维度的人口特征内容。在进行人口特征信息显示时,可以按照实际需求进行显示。
57.本发明第三方面公开了一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于大数据的人口特征分析方法程序,所述一种基于大数据的人口特征分析方法程序被处理器执行时,实现如上述任一项所述的一种基于大数据的人口特征分析方法的步骤。
58.本发明提供的一种基于大数据的人口特征分析方法、系统和存储介质,可以获取人口的各种相关数据,然后进行整合分析,能够更加精确的体现出人口的相关特征,并且通过可视化的方式显示出来,提高了用户使用体验感,并且增加了直观可视性。还能够通过对关系的梳理,得到用户之间的关系信息,有利于追踪用户的关系网,帮助政府人员或者公安机关进行追踪的工作。
59.在本技术所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
60.上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
61.另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
62.本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
63.或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以
是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献