一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种家庭用户识别方法和电子设备与流程

2022-03-04 22:08:11 来源:中国专利 TAG:


1.本发明涉及数据处理领域,尤其涉及一种家庭用户识别方法和电子设备。


背景技术:

2.随着移动通信的发展,家庭用户市场是近几年出现的一个新兴市场,家庭用户已成为运营商战略布局的关键。目前家庭用户已不满足于单一的语音、上网需求,对移动通信企业来说,用户的需求点转向了娱乐、生活应用类的服务需求,因此各大电信运营商陆续开始发展家庭业务。
3.家庭业务是针对于家庭成员之间的特殊性而提供的业务,家庭成员之间往往存在的频繁联系、通信资源共享等需求。为了给家庭用户提供更好的服务,就需要准确识别一个家庭中的各个家庭成员,从而有针对性地开展家庭业务。
4.如何高效准确地识别家庭用户,是本技术所要解决的技术问题。


技术实现要素:

5.本技术实施例的目的是提供一种家庭用户识别方法和电子设备,用以解决现有技术中识别家庭用户不准确的问题。
6.第一方面,提供了一种家庭用户识别方法,包括:
7.获取各用户的历史通信记录中的多个特征维度的用户数据,其中,任意两个用户的所述用户数据能够用于指示所述两个用户之间的家庭关系;
8.基于各用户的所述用户数据,识别各用户之间是否存在家庭关系;
9.通过复杂网络算法将识别出存在家庭关系的用户映射在网络中,得到家庭关系模型;
10.根据所述家庭关系模型和所述用户数据对用户的家庭群体进行标识,得到各家庭群体下的用户。
11.第二方面,提供了一种电子设备,包括:
12.一种电子设备,其特征在于,包括:
13.获取模块,获取各用户的历史通信记录中的多个特征维度的用户数据,其中,任意两个用户的所述用户数据能够用于指示所述两个用户之间的家庭关系;
14.识别模块,基于各用户的所述用户数据,识别各用户之间是否存在家庭关系;
15.映射模块,通过复杂网络算法将识别出存在家庭关系的用户映射在网络中,得到家庭关系模型;
16.标识模块,根据所述家庭关系模型对用户的家庭群体进行标识,得到各家庭群体下的用户。
17.第三方面,提供了一种电子设备,该电子设备包括处理器、存储器及存储在该存储器上并可在该处理器上运行的计算机程序,该计算机程序被该处理器执行时实现如第一方面该的方法的步骤。
18.第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质上存储计算机程序,该计算机程序被处理器执行时实现如第一方面该的方法的步骤。
19.在本技术实施例中,通过获取各用户的历史通信记录中的多个特征维度的用户数据,其中,任意两个用户的所述用户数据能够用于指示所述两个用户之间的家庭关系;基于各用户的所述用户数据,识别各用户之间是否存在家庭关系;通过复杂网络算法将识别出存在家庭关系的用户映射在网络中,得到家庭关系模型;根据所述家庭关系模型和所述用户数据对用户的家庭群体进行标识,得到各家庭群体下的用户。通过以上方案能根据用户数据识别出各用户之间是否存在家庭关系,由于用户数据具有多维度指标特征,因此能从多方面判断各用户之间的关系。通过组合多维度的特征数据,能提高判断各用户之间是否存在家庭关系的准确性。其中,家庭关系模型能体现出用户之间是否存在家庭关系,结合用户数据能进一步判断两用户是否属于同一个家庭,进而可以根据需求对用户的家庭群体进行标识。通过标识可以区分出各用户属于哪个家庭,进而确定出属于同一个家庭群体的各个用户。从而高效准确地识别属于同一家庭的用户。
附图说明
20.此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
21.图1是本发明的一个实施例一种家庭用户识别方法的流程示意图之一;
22.图2a是本发明的一个实施例一种家庭用户识别方法的流程示意图之二;
23.图2b是本发明的一个实施例家庭关系模型的部分结构示意图;
24.图3是本发明的一个实施例一种家庭用户识别方法的流程示意图之三;
25.图4是本发明的一个实施例一种家庭用户识别方法的流程示意图之四;
26.图5是本发明的一个实施例一种家庭用户识别方法的流程示意图之五;
27.图6是本发明的一个实施例一种家庭用户识别方法的流程示意图之六;
28.图7是本发明的一个实施例一种家庭用户识别方法的流程示意图之七;
29.图8是本技术的一个电子设备的结构示意图之一;
30.图9是本技术的一个电子设备的结构示意图之二。
具体实施方式
31.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本技术中附图编号仅用于区分方案中的各个步骤,不用于限定各个步骤的执行顺序,具体执行顺序以说明书中描述为准。
32.随着移动通信的发展,家庭用户市场成为了近几年出现的新兴市场,家庭用户已成为运营商战略布局的关键。目前,家庭用户已不满足于单一的语音、上网需求,而是转向了娱乐、生活应用类的服务需求,准确高效地识别出家庭用户能有助于为家庭用户提供用户所需的服务。
33.为了解决现有技术中存在的问题,本技术实施例提供一种家庭用户识别方法,如
图1所示,包括以下步骤:
34.s11:获取各用户的历史通信记录中的多个特征维度的用户数据,其中,任意两个用户的所述用户数据能够用于指示所述两个用户之间的家庭关系;
35.s12:基于各用户的所述用户数据,识别各用户之间是否存在家庭关系;
36.s13:通过复杂网络算法将识别出存在家庭关系的用户映射在网络中,得到家庭关系模型;
37.s14:根据所述家庭关系模型和所述用户数据对用户的家庭群体进行标识,得到各家庭群体下的用户。
38.在步骤s11中,用户的历史通信记录可以由用户周期性上报得到,也可以在用户进行通信时采集得到。历史通信记录包括但不限于用户通过手机、平板电脑、电子手表等移动终端进行通信的记录,也可以包括用户通过电脑、智能电视等电子设备进行通信的记录。
39.在采集到多个特征维度的用户数据之后,可以对用户数据进行预处理。例如过滤无效数据、对残缺数据进行填补等。用户进行通信时,往往涉及多名用户。例如,用户向家人打电话时,通信至少涉及用户本人和家人。如果用户发起群聊天,则通信可以涉及用户本人和群内的多名用户。因此,历史通信记录中的用户数据能够指示通信所涉及的至少两名用户之间是否存在家庭关系。
40.具体的,可以根据用户数据来对两用户之间的家庭属性进行评分,将评分等于或大于预设评分值的两用户确定为具有家庭关系的用户,将评分小于预设评分值的两用户确定为不具有家庭关系的用户。
41.随后,在步骤s12中,可以通过多个特征维度中的重要特征维度来判断两用户之间是否有家庭关系,也可以组合多个特征维度来判断两用户之间是否有家庭关系。
42.举例而言,可以通过夜间定位数据和用户通话关系数据来判断两用户之间是否有家庭关系。
43.也可以先根据连接wifi的历史记录选出连接同一个wifi的多个用户,再剔除疑似公用wifi和合租用户,进一步的,还可以根据夜间定位数据和通话关系数据来判断两用户之间是否有家庭关系。
44.或者,先确定出预设时间段内使用同一个imei的多个用户,如果多个用户对该imei使用时长大于一定时长,则可以进一步根据夜间定位数据和通话关系数据来判断两用户之间是否有家庭关系。如果用户离网,还可以根据用户的证件信息确定该离网用户的同产权在网号码,以便对用户的通信数据进行追踪,进而确定该离网用户与其他用户是否存在家庭关系。
45.再或者,根据用户的证件信息筛选住址相同的用户,进而通过夜间定位数据和通话关系数据来判断两用户之间是否存在家庭关系。
46.除此之外,由于一个家庭的家庭成员的数量有可能大于2个,还可以根据一个用户的通信交往圈来确定与该用户有家庭关系的用户。比如,与该用户夜间定位一致的用户、与该用户户籍一致的用户、与该用户在春节期间漫游地一致的用户、与该用户姓氏一致的用户、与该用户的年龄符合家庭关系年龄的用户等。
47.通过以上方案能根据用户数据识别出各用户之间是否存在家庭关系,由于用户数据具有多维度指标特征,因此能从多方面判断各用户之间的关系。通过组合多维度的特征
数据,能提高判断各用户之间是否存在家庭关系的准确性。
48.接着,在步骤s13中,通过复杂网络算法将识别出存在家庭关系的用户映射在网络中,得到家庭关系模型。基于上述步骤可以确定出存在家庭关系的用户,将这些存在家庭关系的用户通过复杂网络算法映射至网络中,得到的家庭关系模型能体现出各用户之间的关系,有利于进一步对各个用户进行所属家庭的划分。
49.最后,在步骤s14中,根据所述家庭关系模型和所述用户数据对用户的家庭群体进行标识,得到各家庭群体下的用户。其中,家庭关系模型能体现出用户之间是否存在家庭关系,结合用户数据能进一步判断两用户是否属于同一个家庭,进而可以根据需求对用户的家庭群体进行标识。通过标识可以区分出各用户属于哪个家庭,进而确定出属于同一个家庭群体的各个用户。
50.本方案以各用户的历史通信记录中的多个特征维度的用户数据为基础,通过抽样排除、组合分析等分析方法对两个用户之间的关系进行判定,首先识别出各个用户之间是否存在家庭关系,然后把识别出具有家庭关系的用户以及用户之间的家庭关系映射到复杂网络,利用复杂网络社区划分算法把不同家庭群体进行标识,以识别出属于同一个家庭群体的各个用户。本方案综合多个维度的用户数据来识别家庭用户,具有识别效率高、准确率高、易于实现的优点。
51.基于上述实施例提供的方案,可选的,如图2a所示,上述步骤s13,通过复杂网络算法将识别出存在家庭关系的用户映射在网络中,得到家庭关系模型,包括以下步骤:
52.s21:通过复杂网络算法将所述存在家庭关系的用户和用户之间的家庭关系映射在网络中,得到家庭关系模型,其中,所述家庭关系模型包括多个虚拟节点和所述多个虚拟节点之间的虚拟链接,所述虚拟节点由所述存在家庭关系的用户映射生成,所述虚拟链接由用户之间的家庭关系映射生成。
53.本实施例提供的方案中,家庭关系模型包括多个表征用户的虚拟节点和连接上述虚拟节点的虚拟链接。家庭关系模型中的任何一个虚拟节点都通过虚拟链接与另外的至少一个虚拟节点连通。对于一个虚拟节点,可以通过虚拟链接与另外的多个不同的虚拟节点连通。如图2b所示,图中示出了家庭关系模型中的一部分,其中与用户a连接的用户包括关联用户1~关联用户5,表明了与用户a具有家庭关系的用户至少包括上述关联用户1~关联用户5。
54.进一步的,连接在具有家庭关系的两个用户的虚拟节点之间的虚拟链接还可以用于表征相连的这两个用户的家庭关系权值,例如可以在虚拟链接的边的端点标注权值。
55.通过以上实施例提供的方法,有效地判断出存在家庭关系的用户,再结合复杂网络社区算法,把用户及用户之间的家庭关系映射到复杂网络,有利于更准确合理地划分用户之间的家庭关系,大幅提升预测准确度。
56.基于上述实施例提供的方案,可选的,如图3所示,上述步骤s21,通过复杂网络算法将所述存在家庭关系的用户和用户之间的家庭关系映射在网络中,得到家庭关系模型,包括以下步骤:
57.s31:通过随机游走法从确定家庭关系模型中的核心用户;
58.s32:基于所述核心用户和与所述核心用户存在家庭关系的用户构建所述家庭关系模型。
59.通过上述方案能够得到家庭关系模型,该家庭关系模型中用户作为网络中的顶点,用户之间的家庭关系作为两顶点的边。在该家庭关系模型中,节点间有着更多的联系,而不同社区间的联系则相对较少。因此,本方案基于random walk随机游走法评估节点对该网络社区的重要性,然后以重要性较高的节点作为核心构造网络社区,使构造的模型能更准确地表征出用户之间的家庭关系。
60.本方案从家庭关系模型的网络的属性空间中发现具有良好特性的子属性空间,再将其映射到网络中的虚拟节点,并构建原节点与虚拟节点间的虚拟链接,从而实现将属性信息转化为拓扑结构信息。以网络的拓扑结构为基础,量化节点间的不对称转移概率,并通过有限制的随机转移来获得节点的核心系数,以此评估节点对社区的重要性。参见以下公式(1-1):
[0061][0062]
其中,back表示随机游走过程中的回溯概率,p表示节点转移概率矩阵,其中n为原网络中的节点个数。
[0063]
然后基于转移概率及核心系数确定节点的聚类方向,实现节点自发地聚类,再根据位于簇边缘节点的核心系数对簇形状进行调整,形成社区序列。再计算属性空间中每一属性的信息熵,去掉信息熵大于阈值th的属性,再将剩余属性按信息熵升序排列,以此来评估网络节点间的影响力。属性关系产生的影响力参见以下公式(1-2):
[0064][0065]
其中i为加入虚拟节点后的邻接矩阵,α
attr
为属性因子。然后将影响力矩阵的每一行归一化矩阵中的元素f
ij
即为从节点i随机转移到节点j的概率;归一化参见以下公式(1-3):
[0066][0067]
本技术实施例提供的方案,能解决现有的社区发现算法在真实网络中表现不佳的问题。本方案将事件传播规律与random walk方法相结合以评价节点对社区的重要性,并在此基础上确定核心节点来划分社区。不仅构造属性子空间并生成属性增强网络,还使评估节点对社区重要性并使节点自发地向所属社区靠拢,进一步的,还可以对社区的边缘进行修剪来实现社区优化。本发明方案在人工模拟数据集和真实数据集上均有较好的识别表现。
[0068]
基于上述实施例提供的方案,可选的,如图4所示,上述步骤s12,基于各用户的所述用户数据,识别各用户之间是否存在家庭关系,包括以下步骤:
[0069]
s41:通过逻辑回归模型对所述各用户的用户数据进行识别,以确定各用户之间是否存在家庭关系。
[0070]
在本技术实施例中,应用逻辑回归模型对用户数据进行识别,实际上,还可以根据实际需求选用其他模型来执行上述识别。例如,可以选用决策树算法、随机森林算法等机器
学习算法执行上述识别。或者,还可以结合分布式系统执行上述识别。
[0071]
本方案通过融合多维度数据源,基于组合分析识别两个用户之间的家庭属性评分,并利用逻辑回归模型对数据进行训练,从而实现用户分类。
[0072]
为了进一步提高识别准确性,基于上述实施例提供的方案,可选的,如图5所示,上述步骤s41,通过逻辑回归模型对所述各用户的用户数据进行识别,以确定各用户之间是否存在家庭关系,包括以下步骤:
[0073]
s51:对各用户的用户数据中的多个特征执行分箱处理;
[0074]
s52:通过逻辑回归模型对经过分箱处理后的用户数据进行识别,以确定各用户之间是否存在家庭关系。
[0075]
分箱的主要目的包括去噪,将连续数据离散化,增加粒度等。对用户数据中的特征进行分箱处理能提高逻辑回归模型识别结果的准确性。
[0076]
为了进一步提高识别准确性,基于上述实施例提供的方案,可选的,如图6所示,上述步骤s52,通过逻辑回归模型对经过分箱处理后的用户数据进行识别,以确定各用户之间是否存在家庭关系,包括以下步骤:
[0077]
s61:根据各用户的用户数据建立惩罚项;
[0078]
s62:根据所述惩罚项通过逻辑回归模型对经过分箱处理后的用户数据进行识别,以确定各用户之间是否存在家庭关系。
[0079]
下面,通过举例说明本方案:
[0080]
本技术实施例提供的方案中,基于上述用户数据的多维度特征指标,对样本数据进行逻辑回归模型训练,对上述用户数据的多维度特征指标进行分箱处理,计算各个特征指标的证据权重,并根据证据权重计算各个特征指标的信息价值。记信令位置数据指标为对应的指标模型系数为基于指标模型系数建立惩罚项为:
[0081][0082]
其中,λ为惩罚系数,s为总指标个数。在本方案中,每个关系为正样本的概率可用p表示,则逻辑回归模型可表示为下式(2-1):
[0083][0084]
其中xi(i=1,2,...,s)为指标,s表示指标数,由于p取值在0到1之间,而通过逻辑变换后,取值范围可变换为任意实数值,需要求解的是β=(β0,β1,...,βs)t,模型训练求解公式为下式(2-2):
[0085][0086]
则逻辑回归模型β=(β0,β1,...,βs)t的估计量定义为下式(2-3):
[0087]
[0088]
使用正负样本数据求解β=(β0,β1,...,βs)t后,即得到用于评估两个号码是否构成稳定家庭关系的自适应的逻辑回归家庭关系识别模型。最后求解得到的模型表达式为下式(2-4):
[0089][0090]
在模型训练求解的过程中,为了确保指标在模型贡献较高的权重,考虑添加惩罚项,基于指标模型系数建立惩罚项:
[0091][0092]
其中,λ为惩罚系数,为常数;s为总指标个数;通过惩罚项约束每一项非信令位置数据指标的指标模型系数。再结合边权模型,对存在家庭关系的两用户证据权重进行统一增加。该权重足以让所连接的用户确定为家庭成员关系。
[0093]
通过本技术实施例提供的上述方案,有效地确定用户之间是否存在的家庭关系,再结合复杂网络社区算法,把用户之间关系映射到复杂网络,更准确合理地划分用户之间的家庭关系,大幅提升预测准确度。
[0094]
基于上述实施例提供的方案,可选的,如图7所示,上述步骤s14,在根据所述家庭关系模型和所述用户数据对用户的家庭群体进行标识,得到各家庭群体下的用户之后,还包括以下步骤:
[0095]
s71:将所述家庭关系模型中与目标虚拟节点存在家庭关系的用户确定为所述目标虚拟节点的相邻节点;
[0096]
s72:根据所述用户数据指示的所述相邻节点与所述目标虚拟节点之间的家庭关系对所述目标虚拟节点进行投票;
[0097]
s73:根据投票结果调整所述目标虚拟节点的标识。
[0098]
本方案利用投票方式针对用户的所有相邻用户集进行筛选,利用算法集合进行投票,分别给出关于待判定数据对的投票结果,对于任意一个集合gi,其对待判定数据对的投票结果si的计算方法为下式(3-1):
[0099][0100]
其中,ji表示算法集合gi中算法的总数,s
ij
表示采用算法集合gi中第j个算法计算出的。
[0101]
例如,在复杂网络中,先获取用户b的所有相邻用户集,相邻用户集中可以包括多个与用户b存在家庭关系的用户,这些用户可能属于相同的一个家庭也可能属于不同的多个家庭。根据相邻用户的家庭标签以及两个用户之间的家庭关系对用户b进行投票,选取投票最多的家庭标签标记为用户b的家庭投票标签。第一轮投票后把步骤s14中标记的用户的标识和家庭投票标签一致的用户先筛选出来,可以确定筛选出的这些用户的原始标识能够表征出用户真实的所属家庭。而对于用户的标识和家庭投票标签不一致的用户,可以根据
家庭投票标签的数量,结合上述步骤s14中标记的权重与家庭投票标签的权重来对用户的标记进行优化。例如,假设用户c在上述步骤s14中被标记为家庭m用户,但家庭投票标签指示出该用户c很可能是家庭n用户,则可以将原标识“家庭m用户”调整为“家庭n用户”,从而优化标识,使优化后的标识能准确表征出用户真实的所属家庭。
[0102]
进一步的,基于上述实施例提供的方案中得到的具有标识的用户,还可以进一步确定用户的身份标签,标签例如可以包括:疑似户主、家庭用户结构、成员属性结构、家庭宽带、用户主套、活跃成员、友商用户数等。
[0103]
上述标签能进一步表明用户的身份,为开展业务、推动营销提供数据支持。举例而言,在家庭宽带业务领域,通过本实施例提供的方案,能根据用户的标识确定用户所属的家庭,进而利用用户的家庭定位对家庭用户宽带资源覆盖率进行分析,针对宽带覆盖的家庭用户开展宽带外呼营销,提高宽带外呼访问成功的下单率,增加覆盖家庭网成员数量。本实施例提供的方案能有效提升宽带外呼成功率,节约外呼人力成本。
[0104]
在一线一网融合业务领域,根据本技术实施例提供的方案,能根据用户的标识确定用户所属的家庭,进而通过宽带触点拓展家庭v网业务,提升家庭用户触点58 客户的宽带下单率以及一线一网融合率,有效提升一线渠道触点家庭v网办理率。
[0105]
在家庭v网拓展业务领域,根据本技术实施例提供的方案,能根据用户的标识确定用户所属的家庭,进而可以针对家庭网中同产权用户进行家庭v网批开,提高成功批开家庭网数量,提高批开效率,降低网络拓展成本。
[0106]
本方案在历史通信记录的用户数据基础上,对各用户之间的家庭属性进行评分,确定用户之间是否存在家庭关系,把存在家庭关系的用户及用户之间的关系映射到复杂网络上,利用复杂网络社区划分实现家庭群内用户的划分,并利用投票选举方式对家庭用户标签进行优化。更准确合理地划分用户之间的家庭关系,大幅提升预测准确度。
[0107]
本技术实施例提供的方案具有以下优点:
[0108]
本方案利用逻辑回归模型对数据进行训练,将家庭属性进行分类,识别出各用户之间是否存在家庭关系,对各用户的家庭属性进行评分,能有效地确定用户之间存在的家庭属性关系。
[0109]
本方案利用复杂网络社区发现算法,更好的将用户和用户之间的关系映射到网络中,优化同一家庭下的所有用户的识别结果。
[0110]
本方案基于random walk方法确定核心用户,对不同家庭群体进行标识,使映射结果能准确表征用户之间的关系。不仅构造属性子空间并生成属性增强网络,还使评估节点对社区重要性并使节点自发地向所属社区靠拢,再对社区的边缘进行修剪。本发明在人工模拟数据集和真实数据集上均有较好的表现,分析的结果可靠性高、有效性强。
[0111]
本方案利用投票方式针对用户的所有相邻用户集进行筛选,利用算法集合进行投票,分别给出关于待判定数据对的投票结果,对家庭用户标识进行优化。
[0112]
本技术方案利用投票方式在复杂网络中,先获取用户的所有相邻用户集,根据相邻用户的家庭标签已经两个用户之间的家庭属性评分对用户进行投票,选取投票最多的家庭标签登记为用户的家庭投票标签。第一轮投票后把用户家庭标签和家庭投票标签一致的用户先筛选出来,然后逐层优化,最终完成所有用户的家庭标签优化。
[0113]
为了解决现有技术中存在的问题,本技术实施例还提供一种电子设备80,如图8所
示,包括:
[0114]
获取模块81,获取各用户的历史通信记录中的多个特征维度的用户数据,其中,任意两个用户的所述用户数据能够用于指示所述两个用户之间的家庭关系;
[0115]
识别模块82,基于各用户的所述用户数据,识别各用户之间是否存在家庭关系;
[0116]
映射模块83,通过复杂网络算法将识别出存在家庭关系的用户映射在网络中,得到家庭关系模型;
[0117]
标识模块84,根据所述家庭关系模型对用户的家庭群体进行标识,得到各家庭群体下的用户。
[0118]
可选的,上述映射模块83,用于:
[0119]
通过复杂网络算法将所述存在家庭关系的用户和用户之间的家庭关系映射在网络中,得到家庭关系模型,其中,所述家庭关系模型包括多个虚拟节点和所述多个虚拟节点之间的虚拟链接,所述虚拟节点由所述存在家庭关系的用户映射生成,所述虚拟链接由用户之间的家庭关系映射生成。
[0120]
可选的,上述映射模块83,用于:
[0121]
通过随机游走法从确定家庭关系模型中的核心用户;
[0122]
基于所述核心用户和与所述核心用户存在家庭关系的用户构建所述家庭关系模型。
[0123]
可选的,上述识别模块82,用于:
[0124]
通过逻辑回归模型对所述各用户的用户数据进行识别,以确定各用户之间是否存在家庭关系。
[0125]
可选的,上述识别模块82,用于:
[0126]
对各用户的用户数据中的多个特征执行分箱处理;
[0127]
通过逻辑回归模型对经过分箱处理后的用户数据进行识别,以确定各用户之间是否存在家庭关系。
[0128]
可选的,上述识别模块82,用于:
[0129]
根据各用户的用户数据建立惩罚项;
[0130]
根据所述惩罚项通过逻辑回归模型对经过分箱处理后的用户数据进行识别,以确定各用户之间是否存在家庭关系。
[0131]
可选的,如图9所示,上述电子设备还包括投票模块85,用于:
[0132]
将所述家庭关系模型中与目标虚拟节点存在家庭关系的用户确定为所述目标虚拟节点的相邻节点;
[0133]
根据所述用户数据指示的所述相邻节点与所述目标虚拟节点之间的家庭关系对所述目标虚拟节点进行投票;
[0134]
根据投票结果调整所述目标虚拟节点的标识。
[0135]
上述实施例提供的电子设备,能根据用户数据识别出各用户之间是否存在家庭关系,由于用户数据具有多维度指标特征,因此能从多方面判断各用户之间的关系。通过组合多维度的特征数据,能提高判断各用户之间是否存在家庭关系的准确性。其中,家庭关系模型能体现出用户之间是否存在家庭关系,结合用户数据能进一步判断两用户是否属于同一个家庭,进而可以根据需求对用户的家庭群体进行标识。通过标识可以区分出各用户属于
哪个家庭,进而确定出属于同一个家庭群体的各个用户。从而高效准确地识别属于同一家庭的用户。
[0136]
优选的,本发明实施例还提供一种电子设备,包括处理器,存储器,存储在存储器上并可在所述处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述一种家庭用户识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0137]
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述一种家庭用户识别方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等。
[0138]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0139]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
[0140]
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献