一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种用户识别方法、装置和计算机设备与流程

2023-03-29 10:29:41 来源:中国专利 TAG:


1.本发明属于计算机技术领域,具体地涉及一种用户识别方法、装置和计算机设备。


背景技术:

2.随着通信技术的快速发展,手机等通信设备已成为人们生活和工作中必不可少的一部分,给用户带来了极大地便利,但是同时也为用户带来了诸多隐患。
3.互联网服务机构虽然获知客户资金变化相关情况,但不能及时对客户进行精准的风险提示。而目前在预警识别工作进展中,存在以下问题:1.系统数据分散,各个模型主要人工操作,人工处理量大,需要考虑自动化;2.功能零散,不成体系化;3.当前主要分析的是移动电话行为,缺乏互联网行为快速识别手段;4.需要引入大数据和算法ai技术,优化模型,使系统更加智能化地进行识别。此外,在如何提升识别诈用户的精确度或行为的精确度等多方面仍存在很大改进空间。
4.因此,有必要提供一种改进了的用户识别方法,以解决上述问题。


技术实现要素:

5.(一)要解决的技术问题
6.本发明旨在解决现有方法难以精确判别行为,无法进行及时拦截,缺乏互联网快速识别手段,以及进一步提高识别用户的精确度或行为的精确度等的技术问题。
7.(二)技术方案
8.为解决至少部分上述技术问题,本发明的一方面提出一种用户识别方法,所述用户识别方法包括如下步骤:构建至少两个用户识别模型,所述两个用户识别模型包括与第一应用平台相对应的第一用户识别模型、及与第二应用平台相对应的第二用户识别模型;构建融合识别模型,所述融合识别模型包括确定是否进行联邦学习的步骤;在使用所述第一用户识别模型和所述第二用户识别模型中的至少一个对待识别用户进行目标用户识别以确定所述待识别用户为目标用户时,进一步使用融合识别模型对所述待识别用户进行目标用户识别,以确定所述待识别用户是否为目标用户。
9.根据本发明的优选实施方式,所述使用所述第一用户识别模型和所述第二用户识别模型中的至少一个对待识别用户进行目标用户识别,包括:使用所述第一用户识别模型和所述第二用户识别模型对待识别用户进行目标用户识别。
10.根据本发明的优选实施方式,所述用户识别方法包括:基于神经网络,构建所述融合识别模型、所述第一用户识别模型、所述第二用户识别模型,并分别使用与所述第一应用平台和所述第二应用平台相对应的用户样本数据,建立第一训练数据集和第二训练数据集,以分别用于训练所述第一用户识别模型、所述第二用户识别模型,其中,所述第一训练数据集包括具有第一用户欺诈标签或第一用户风险标签的用户样本数据;所述第二训练数据集包括具有第二用户欺诈标签或第二用户风险标签的用户样本数据;在所述第一用户识别模型的模型精度大于第一阈值时,获取所述第一用户识别模型的模型参数;在所述第二
用户识别模型的模型精度大于第二阈值时,获取所述第二用户识别模型的模型参数。
11.根据本发明的优选实施方式,所述融合识别模型包括确定是否进行联邦学习的步骤,包括:在判断所述第一应用平台的第一模型特征变量与所述第二应用平台的第二模型特征变量的重叠度之后,确定所述第一用户识别模型和所述第二用户识别模型各自的聚合权值;基于所述聚合权值、所述第一用户识别模型的模型参数和所述第二用户识别模型的模型参数,使所述融合识别模型进行联邦学习,以得到训练好的融合识别模型。
12.根据本发明的优选实施方式,包括:获取所述第一应用平台的历史用户数据、历史欺诈数据,构建第一用户欺诈网络图,并基于所述第一用户欺诈网络图提取第一模型特征变量;获取所述第二应用平台的历史用户数据、历史欺诈数据,构建第二用户欺诈网络图,并基于所述第二用户欺诈网络图提取第二模型特征变量。
13.根据本发明的优选实施方式,所述用户识别方法包括:确定所述第一模型特征变量和所述第二模型特征变量的重叠度;在所计算的重叠度小于设置值时,确定所述第一用户识别模型和所述第二用户识别模型各自的聚合权值。
14.根据本发明的优选实施方式,还包括:提取所述第一用户欺诈网络图中的网络连接信息和所述第二用户欺诈网络图中的网络连接信息,分别用作所述第一模型特征变量和所述第二模型特征变量。
15.根据本发明的优选实施方式,还包括:分别使用与所述第一应用平台和所述第二应用平台相对应的用户样本数据,建立第一验证数据集和第二验证数据集,分别使用所述第一验证数据集和所述第二验证数据集,进行模型验证,并对所述第一用户识别模型的模型参数和所述第二用户识别模型的模型参数进行调优。
16.本发明的二方面提出一种用户识别装置,包括:第一模型构建模块,用于构建至少两个用户识别模型,所述两个用户识别模型包括与第一应用平台相对应的第一用户识别模型、及与第二应用平台相对应的第二用户识别模型;第二模型构建模块,用于构建融合识别模型,所述融合识别模型包括确定是否进行联邦学习的步骤;确定模块,在使用所述第一用户识别模型或所述第二用户识别模型对待识别用户进行目标用户识别以确定所述待识别用户为目标用户时,进一步使用融合识别模型对所述待识别用户进行目标用户识别,以确定所述待识别用户是否为目标用户。
17.本发明的三方面提出一种计算机设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机可执行程序被所述处理器执行时,所述处理器执行如本发明得第一方面所述的用户识别方法。
18.本发明第四方面提出一种计算机程序产品,存储有计算机可执行程序,所述计算机可执行程序被执行时,实现上述任一项所述的用户识别方法。
19.(三)有益效果
20.与现有技术相比,本发明通过构建至少两个用户识别模型和融合识别模型,并通过在使用所述第一用户识别模型和所述第二用户识别模型中的至少一个对待识别用户进行目标用户识别以确定所述待识别用户为目标用户时,进一步使用融合识别模型对所述待识别用户进行目标用户识别,能够更精确地识别确定待识别用户是否为目标用户,能够提高用户识别模型和融合识别模型的模型精度。
21.此外,通过计算所述第一应用平台的第一模型特征变量与所述第二应用平台的第
二模型特征变量的相似度,确定所述第一应用平台的第一模型特征变量与所述第二应用平台的第二模型特征变量的重叠度,并基于所计算的重叠度,确定初始的融合识别模型是否进行融合学习,并进一步确定所述第一用户识别模型和所述第二用户识别模型各自的聚合权值,能够进一步提高融合识别模型的模型精度。
22.此外,通过模型训练和模型验证过程,得到精确度更高的第一用户识别模型和第二用户识别模型。
23.此外,通过调整融合识别模型的模型参数,并根据所配置的停止模型训练的条件进行模型参数优化,能够得到更优化的模型参数,进而提高模型精度。
附图说明
24.图1是本发明的实施例1的用户识别方法的一示例的流程图;
25.图2是本发明的实施例1的用户识别方法的另一示例的流程图;
26.图3是本发明的实施例1的用户识别方法中确定初始的融合识别模型是否进行联邦学习的流程示意图;
27.图4是本发明的实施例2的用户识别装置的一示例的示意图;
28.图5是本发明的实施例2的用户识别装置的另一示例的示意图;
29.图6是本发明的实施例2的用户识别装置的又一示例的示意图;
30.图7是本发明的一个实施例的计算机设备的结构示意图;
31.图8是本发明的一个实施例的计算机程序产品的示意图。
具体实施方式
32.在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。
33.附图中的流程图仅是一种示例性的流程演示,不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等,在不脱离本发明的发明主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。
34.附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理单元装置和/或微控制器装置中实现这些功能实体。
35.各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本发明实质的技术方案。此外,术语“和/或”、“及/或”是指包括所列出项目中的任一个或多个的所有组合。
36.鉴于上述问题,本发明通过构建至少两个用户识别模型和融合识别模型,并通过
在使用所述第一用户识别模型和所述第二用户识别模型中的至少一个对待识别用户进行目标用户识别以确定所述待识别用户为目标用户时,进一步使用融合识别模型对所述待识别用户进行目标用户识别,能够更精确地识别确定待识别用户是否为目标用户。
37.需要说明的是,本发明中的“优选地”、“可选地”、“具体地”、“更具体地”、“进一步地”、“更进一步地”、“在一示例中”、“在另一示例中”、“根据本发明的优选实施方式”等语句所引出的描述内容仅作为可选或优选示例进行说明,仅是便于读者更好地理解本发明,并不旨在构成对本发明的限制。
38.为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
39.图1是本发明的实施例1的用户识别方法的一示例的流程图。
40.如图1所示,本发明提供了一种用户识别方法,所述方法包括:
41.步骤s101,构建至少两个用户识别模型,所述两个用户识别模型包括与第一应用平台相对应的第一用户识别模型、及与第二应用平台相对应的第二用户识别模型。
42.步骤s102,构建融合识别模型,所述融合识别模型包括确定是否进行联邦学习的步骤。
43.步骤s103,在使用所述第一用户识别模型和所述第二用户识别模型中的至少一个对待识别用户进行目标用户识别以确定所述待识别用户为目标用户时,进一步使用融合识别模型对所述待识别用户进行目标用户识别,以确定所述待识别用户是否为目标用户。
44.首先,在步骤s101中,构建至少两个用户识别模型,所述两个用户识别模型包括与第一应用平台相对应的第一用户识别模型、及与第二应用平台相对应的第二用户识别模型。
45.具体地,基于神经网络,构建第一用户识别模型、第二用户识别模型两个用户识别模型,其中,所述第一用户识别模型与第一应用平台相对应,并用于第一应用平台进行目标用户识别;所述第二用户识别模型与第二应用平台相对应,并用于第二应用平台进行目标用户识别。
46.可选地,使用bp神经网络,构建第一用户识别模型和第二用户识别模型。
47.需要说明的是,在本实施方式中,所述第一应用平台包括电信运营平台以及可进行电信业务的其他渠道。所述第二应用平台包括与互联网保险业务平台相对应的平台。但是不限于此,在其他实施方式中,包括与信用查询相关的第三应用平台或者信用查询平台(例如征信查询银行所公开的失信用户数据),和/或还可以包括与各类产品销售平台相对应的第四应用平台。相应地,所述用户识别模型还包括与第三应用平台相对应的第三用户识别模型,和/或与第四应用平台相对应的第四用户识别模型。
48.具体地,分别使用与所述第一应用平台和所述第二应用平台相对应的用户样本数据,建立第一训练数据集和第二训练数据集,以分别用于训练所述第一用户识别模型、所述第二用户识别模型。
49.更具体地,所述第一训练数据集包括具有第一用户欺诈标签或第一用户风险标签的用户样本数据,用户样本数据包括用户标识;所述第二训练数据集包括具有第二用户欺诈标签或第二用户风险标签的用户样本数据,用户样本数据包括用户标识。
50.可选地,所述第一训练数据集还包括第一应用平台、第三方平台或者其他公共平
台所公开其他用户数据,例如用户性别、收入、关联人信息数据等。所述第二训练数据集还包括第二应用平台所公开的保险购买信息、保险服务违约信息、保险服务资源使用信息、投保人信息、受保人信息等。
51.对于第一用户欺诈标签或第一用户风险标签的确定,例如通过指定时间段内同一用户更换手机号的次数或频率所确定的,例如在一个月~三个月的指定时间段内同一用户更换手机号的次数大于设定值(例如一个月内更换手机号的次数大于8次),则为正样本(即为目标用户或欺诈用户),而一个月内更换手机号的次数小于等于8次,则为负样本(即为非目标用户或非欺诈用户)。
52.对于第二用户欺诈标签或第二用户风险标签的确定,例如通过同一用户对保险服务投入费缴纳的违约率,例如超出保险服务业务的缴费时间一周以上未完成保险服务投入费缴纳的用户为目标用户或风险用户,例如超出保险服务业务的缴费时间一周以上完成服务投入费缴纳的用户为目标用户或风险用户。
53.需要说明的是,对于第一用户欺诈标签或第一用户风险标签的确定,在其他方式中,还包括使用指定时间段内同一用户的同一手机号被标记为骚扰电话或者非正常号码的次数所确定的。此外,对于第二用户欺诈标签或第二用户风险标签的确定,在其他实施方式中,还包括使用在指定时间段内保险服务投入费缴纳的违约率来确定,上述仅作为可选示例进行说明,不能理解成对本发明的限制。
54.进一步地,分别使用上述所建立的第一训练数据集和第二训练数据集,对第一用户识别模型和第二用户识别模型进行训练。
55.优选地,分别使用与所述第一应用平台和所述第二应用平台相对应的用户样本数据,建立第一验证数据集和第二验证数据集,分别使用所述第一验证数据集和所述第二验证数据集,进行模型验证,并对所述第一用户识别模型的模型参数和所述第二用户识别模型的模型参数进行调优。
56.对于模型参数优化过程,使用第一验证数据集对初始训练好的第一用户识别模型进行模型验证,在所述第一用户识别模型的模型精度大于第一阈值(例如75%~85%)时,获取所述第一用户识别模型的模型参数,该模型参数包括连接权值、学习率等。而对于在所述第一用户识别模型的模型精度小于或等于第一阈值(例如75%~85%)时,继续进行模型训练,直至所述第一用户识别模型的模型精度大于第一阈值(例如75%~85%)时,停止模型训练。
57.使用第二验证数据集对初始训练好的第一用户识别模型进行模型验证,在所述第二用户识别模型的模型精度大于第二阈值(例如70%~90%)时,获取所述第二用户识别模型的模型参数,该模型参数包括连接权值、学习率等。而对于在所述第二用户识别模型的模型精度小于或等于第二阈值(例如70%~90%)时,继续进行模型训练,直至所述第二用户识别模型的模型精度大于第一阈值(例如70%~90%)时,停止模型训练。
58.具体地,所述第一用户识别模型的输入例如为用户标识,输出为属于目标用户的概率或者直接输出是否为目标用户;所述第二用户识别模型的输入例如为用户标识,输出为属于目标用户的概率或者直接输出是否为目标用户。
59.由此,通过模型训练和模型验证过程,得到精确度更高的第一用户识别模型和第二用户识别模型。
60.接着,在步骤s102中,构建融合识别模型,所述融合识别模型包括确定是否进行联邦学习的步骤。
61.具体地,基于神经网络,具体使用bp神经网络构,构建所述融合识别模型。
62.在本实施方式中,使用融合平台的用户样本数据,建立第三训练数据集。
63.具体地,所述第三训练数据集包括具有第三欺诈标签的用户样本数据,其中,例如通过指定时间段内同一用户更换手机号的次数大于设定值(例如指定时间为一个月,设定值例如为2次)且通过该用户对保险服务投入费缴纳的违约率大于设定值(例如20%),来确定第三欺诈标签;用户样本数据包括用户标识。例如将在一个月内同一用户更换手机号的次数大于2次,且该用户对保险服务投入费缴纳的违约率大于20%的用户,定义为正样本;而将在一个月内同一用户更换手机号的次数小于或等于2次,且该用户对保险服务投入费缴纳的违约率小于或等于20%的用户,定义为负正样本。
64.进一步地,使用所述第三训练数据集训练融合识别模型,得到初始的融合识别模型。所述融合识别模型的输入为用户标识,输出为属于目标用户的概率,或者输出是否为目标用户。
65.更进一步地,在所述初始的融合识别模型的基础上,进行联邦学习,以得到最终的融合识别模型。
66.在另一实施方式中,如图2所示,所述用户识别方法包括步骤s101、s102’、s201、s103。
67.在步骤s201中,确定初始的融合识别模型是否进行联邦学习。
68.需要说明的是,在图2的示例中,省略了步骤s101、步骤s102’和步骤s103与图1的示例中的步骤s101、步骤s102和步骤s103中相同部分的说明。
69.在步骤s201中,确定初始的融合识别模型是否进行联邦学习,以用于进一步确定确定所述第一用户识别模型和所述第二用户识别模型各自的聚合权值。
70.具体地,如图3所示,所述确定初始的融合识别模型是否进行联邦学习包括如下步骤:
71.步骤s3001,判断所述第一应用平台的第一模型特征变量与所述第二应用平台的第二模型特征变量的重叠度。
72.步骤s3002,在所计算的重叠度小于设置值时,确定初始的融合识别模型进行融合学习;而在所计算的重叠度大于或等于设定值时,确定初始的融合识别模型不进行融合学习,可直接使用所述初始的融合识别模型进行目标用户识别。
73.在步骤s3001中,通过判断所述第一应用平台的第一模型特征变量与所述第二应用平台的第二模型特征变量的重叠度,来用于确定初始的融合识别模型是否进行联邦学习。
74.具体地,获取所述第一应用平台的历史用户数据、历史欺诈数据,构建第一用户欺诈网络图,并基于所述第一用户欺诈网络图提取第一模型特征变量。
75.此外,获取所述第二应用平台的历史用户数据、历史欺诈数据,构建第二用户欺诈网络图,并基于所述第二用户欺诈网络图提取第二模型特征变量。
76.在本实施方式中,例如根据时间参数和地区参数,分别提取所述第一用户欺诈网络图中的网络连接信息和所述第二用户欺诈网络图中的网络连接信息,来用作所述第一模
型特征变量和所述第二模型特征变量。
77.需要说明的是,上述仅作为优选示例进行说明,不能理解成对本发明的限制,在其他实施方式中,还可以提取与已知的目标用户的关联度大的关联用户的风险特征信息作为模型特征变量。
78.具体地,计算所述第一应用平台的第一模型特征变量与所述第二应用平台的第二模型特征变量的相似度,以确定所述第一应用平台的第一模型特征变量与所述第二应用平台的第二模型特征变量的重叠度。
79.进一步地,在判断所述第一应用平台的第一模型特征变量与所述第二应用平台的第二模型特征变量的重叠度之后,确定初始的融合识别模型是否进行融合学习。
80.更进一步地,在确定初始的融合识别模型进行融合学习时,进一步确定所述第一用户识别模型和所述第二用户识别模型各自的聚合权值。
81.接着,在步骤s3002中,在所计算的重叠度小于设置值时,确定初始的融合识别模型进行融合学习。而在所计算的重叠度大于或等于设定值时,确定初始的融合识别模型不进行融合学习,可直接使用所述初始的融合识别模型进行目标用户识别。
82.可选地,根据所计算的重叠度和所述第一用户识别模型的精确度以及所述第一用户识别模型的精确度,确定所述第一用户识别模型的第一聚合权值和所述第二用户识别模型的第二聚合权值。
83.具体地,例如根据历史经验数据确定重叠度和模型精确度之间的对应关系表,根据所述对应关系表,确定所述第一用户识别模型的第一聚合权值和所述第二用户识别模型的第二聚合权值。
84.可选地,所述第一用户识别模型的聚合权值和所述第二用户识别模型的聚合权值的比例为1:2~1:5。
85.进一步地,基于所确定的第一聚合权值和第二聚合权值、以及上述所获取的第一用户识别模型的模型参数和所述第二用户识别模型的模型参数,使所述初始的融合识别模型进行联邦学习,以得到训练好的融合识别模型。
86.可选地,将所述第一聚合权值和第二聚合权值作为加权系数,分别与第一用户识别模型的模型参数和所述第二用户识别模型的模型参数进行加权求和或者加权求方差,以作为进行联邦学习的模型参数进行学习,或者使用所得到的模型参数进行增量学习,以得到最终(或者训练好)的融合识别模型。
87.通过计算所述第一应用平台的第一模型特征变量与所述第二应用平台的第二模型特征变量的相似度,确定所述第一应用平台的第一模型特征变量与所述第二应用平台的第二模型特征变量的重叠度,并基于所计算的重叠度,确定初始的融合识别模型是否进行融合学习,并进一步确定所述第一用户识别模型和所述第二用户识别模型各自的聚合权值,能够进一步提高融合识别模型的模型精度。
88.在另一实施方式中,对于所述融合识别模型的训练,还包括模型参数优化的步骤。
89.具体地,使用融合平台的用户样本数据,建立第三验证数据集,并使用第三验证数据集对初始的融合识别模型进行模型验证,通过调整模型参数(例如包括连接权值、学习率等),以使得所述融合识别模型的模型精度达到第三阈值(例如75%~85%)时,停止模型训练。
90.在另一实施方式中,使用第三验证数据集对初始的融合识别模型进行模型验证,通过调整模型参数(例如包括连接权值、学习率等),以使得所述融合识别模型的模型精度达到第三阈值(例如75%~85%)且训练运行时间缩短设定时间时,停止模型训练。
91.由此,通过调整融合识别模型的模型参数,并根据所配置的停止模型训练的条件进行模型参数优化,能够得到更优化的模型参数,进而提高模型精度。
92.需要说明的是,上述仅作为优选示例进行说明,不能理解成对本发明的限制。
93.接着,在步骤s103中,在使用所述第一用户识别模型和所述第二用户识别模型中的至少一个对待识别用户进行目标用户识别以确定所述待识别用户为目标用户时,进一步使用融合识别模型对所述待识别用户进行目标用户识别,以确定所述待识别用户是否为目标用户。
94.在一实施方式中,在进行目标用户识别时,先使用步骤s101所得到的第一用户识别模型进行目标用户识别。
95.具体地,将待识别用户的用户标识输入所述第一用户识别模型,输出是否为目标用户的输出结果,例如为目标用户。
96.在使用所述第一用户识别模型对待识别用户的识别结果是目标用户时,进一步使用步骤s102所得到的融合识别模型对所述待识别用户进行目标用户识别,以确定所述待识别用户是否为目标用户或者非目标用户。
97.在另一实施方式中,在进行目标用户识别时,先使用步骤s101所得到的第二用户识别模型进行目标用户识别。
98.具体地,将待识别用户的用户标识输入所述第二用户识别模型,输出是否为目标用户的输出结果,所述输出结果例如为目标用户或者非目标用户。
99.在使用所述第一用户识别模型对待识别用户的识别结果是目标用户时,进一步使用步骤s102所得到的融合识别模型对所述待识别用户进行目标用户识别,所述融合识别模型输出属于目标用户的概率,或者直接输出是否为目标用户,以确定所述待识别用户是否为目标用户。
100.在又一实施方式方式中,使用所述第一用户识别模型和所述第二用户识别模型均对待识别用户进行目标用户识别,在所述第一用户识别模型的输出结果为目标用户,且所述第二用户识别模型的输出结果为目标用户时,确定使用融合识别模型进一步对所述待识别用户进行目标用户识别,其中,确定所述融合识别模型是否进行融合学习。
101.需要说明的是,由于在该步骤中确定所述融合识别模型是否进行融合学习的过程与步骤s102中确定所述融合识别模型是否进行融合学习的过程相同,因此,省略了其相同部分的说明。
102.与现有技术相比,本发明通过构建至少两个用户识别模型和融合识别模型,并通过在使用所述第一用户识别模型和所述第二用户识别模型中的至少一个对待识别用户进行目标用户识别以确定所述待识别用户为目标用户时,进一步使用融合识别模型对所述待识别用户进行目标用户识别,能够更精确地识别确定待识别用户是否为目标用户。
103.此外,通过计算所述第一应用平台的第一模型特征变量与所述第二应用平台的第二模型特征变量的相似度,确定所述第一应用平台的第一模型特征变量与所述第二应用平台的第二模型特征变量的重叠度,并基于所计算的重叠度,确定初始的融合识别模型是否
进行融合学习,并进一步确定所述第一用户识别模型和所述第二用户识别模型各自的聚合权值,能够进一步提高融合识别模型的模型精度。
104.此外,通过模型训练和模型验证过程,得到精确度更高的第一用户识别模型和第二用户识别模型。
105.此外,通过调整融合识别模型的模型参数,并根据所配置的停止模型训练的条件进行模型参数优化,能够得到更优化的模型参数,进而提高模型精度。
106.需要说明的是,上述仅作为示例进行说明,不应理解成对本发明的限制。
107.实施例2
108.下面描述本发明的装置实施例,该装置可以用于执行本发明的方法实施例。对于本发明装置实施例中描述的细节,应视为对于上述方法实施例的补充;对于在本发明装置实施例中未披露的细节,可以参照上述方法实施例来实现。
109.参照图4至图6,将说明本发明的实施例1的用户识别装置400。
110.如图4所示,本发明实施例的用户识别装置400包括:第一模型构建模块410、第二模型构建模块420和确定模块430。
111.具体地,第一模型构建模块410用于构建至少两个用户识别模型,所述两个用户识别模型包括与第一应用平台相对应的第一用户识别模型、及与第二应用平台相对应的第二用户识别模型。
112.进一步地,第二模型构建模块420用于构建融合识别模型,所述融合识别模型包括确定是否进行联邦学习的步骤。
113.可选地,确定模块430在使用所述第一用户识别模型或所述第二用户识别模型对待识别用户进行目标用户识别以确定所述待识别用户为目标用户时,进一步使用融合识别模型对所述待识别用户进行目标用户识别,以确定所述待识别用户是否为目标用户。
114.优选地,基于神经网络,构建所述融合识别模型、所述第一用户识别模型、所述第二用户识别模型,并分别使用与所述第一应用平台和所述第二应用平台相对应的用户样本数据,建立第一训练数据集和第二训练数据集,以分别用于训练所述第一用户识别模型、所述第二用户识别模型,其中,所述第一训练数据集包括具有第一用户欺诈标签或第一用户风险标签的用户样本数据;所述第二训练数据集包括具有第二用户欺诈标签或第二用户风险标签的用户样本数据。
115.在另一实施方式中,如图5所示,用户识别装置400还包括参数获取模块510,所述参数获取模块510用于获取第一用户识别模型的模型参数和所述第二用户识别模型的模型参数。
116.需要说明的是,在图5的示例中的第一模型构建模块410、第二模型构建模块420和确定模块430与图4的示例中的第一模型构建模块410、第二模型构建模块420和确定模块430大致相同,因此,省略了其相同部分的说明。
117.具体地,在所述第一用户识别模型的模型精度大于第一阈值时,参数获取模块510获取所述第一用户识别模型的模型参数。
118.而在所述第二用户识别模型的模型精度大于第二阈值时,参数获取模块510获取所述第二用户识别模型的模型参数。
119.在又一实施方式中,如图6所示,所述用户识别装置400还包括判断处理模块610,
所述判断处理模块610用于判断确定使用融合识别模型,该融合识别模型是通过联邦学习而得到的。
120.需要说明的是,在图6的示例中的第一模型构建模块410、第二模型构建模块420和确定模块430与图4的示例中的第一模型构建模块410、第二模型构建模块420和确定模块430大致相同,因此,省略了其相同部分的说明。
121.具体地,在判断所述第一应用平台的第一模型特征变量与所述第二应用平台的第二模型特征变量的重叠度之后,确定所述第一用户识别模型和所述第二用户识别模型各自的聚合权值。
122.更具体地,获取所述第一应用平台的历史用户数据、历史欺诈数据,构建第一用户欺诈网络图,并基于所述第一用户欺诈网络图提取第一模型特征变量。获取所述第二应用平台的历史用户数据、历史欺诈数据,构建第二用户欺诈网络图,并基于所述第二用户欺诈网络图提取第二模型特征变量。
123.优选地,提取所述第一用户欺诈网络图中的网络连接信息和所述第二用户欺诈网络图中的网络连接信息,分别用作所述第一模型特征变量和所述第二模型特征变量。
124.可选地,确定所述第一模型特征变量和所述第二模型特征变量的重叠度。在所计算的重叠度小于设置值时,确定所述第一用户识别模型和所述第二用户识别模型各自的聚合权值。
125.进一步地,基于所述聚合权值、所述第一用户识别模型的模型参数和所述第二用户识别模型的模型参数,使所述融合识别模型进行联邦学习,以得到训练好的融合识别模型。
126.优选地,分别使用与所述第一应用平台和所述第二应用平台相对应的用户样本数据,建立第一验证数据集和第二验证数据集,分别使用所述第一验证数据集和所述第二验证数据集,进行模型验证,并对所述第一用户识别模型的模型参数和所述第二用户识别模型的模型参数进行调优。
127.在一实施方式中,使用所述第一用户识别模型和所述第二用户识别模型对待识别用户进行目标用户识别,并在所述第一用户识别模型的识别结果和所述第二用户识别模型的识别结果均为目标用户时,确定使用融合识别模型进一步对所述待识别用户进行目标用户识别,其中,确定所述融合识别模型是否进行融合学习。
128.在另一实施方式中,使用所述第一用户识别模型或所述第二用户识别模型对待识别用户进行目标用户识别。
129.需要说明的是,在实施例2中,省略了与实施例1相同的部分的说明。
130.本领域技术人员可以理解,上述装置实施例中的各模块可以按照描述分布于装置中,也可以进行相应变化,分布于不同于上述实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
131.与现有技术相比,本发明通过第一模型构建模块和第二模型构建模块构建至少两个用户识别模型和融合识别模型,并通过确定模块在使用所述第一用户识别模型和所述第二用户识别模型中的至少一个对待识别用户进行目标用户识别以确定所述待识别用户为目标用户时,进一步使用融合识别模型对所述待识别用户进行目标用户识别,能够更精确地识别确定待识别用户是否为目标用户。
132.实施例3
133.下面描述本发明的计算机设备实施例,该计算机设备可以视为对于上述本发明的方法和装置实施例的具体实体实施方式。对于本发明计算机设备实施例中描述的细节,应视为对于上述方法或装置实施例的补充;对于在本发明计算机设备实施例中未披露的细节,可以参照上述方法或装置实施例来实现。
134.图7是本发明的一个实施例的计算机设备的结构示意图,该计算机设备包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行图1的方法。
135.如图7所示,计算机设备以通用计算设备的形式表现。其中处理器可以是一个,也可以是多个并且协同工作。本发明也不排除进行分布式处理,即处理器可以分散在不同的实体设备中。本发明的计算机设备并不限于单一实体,也可以是多个实体设备的总和。
136.所述存储器存储有计算机可执行程序,通常是机器可读的代码。所述计算机可读程序可以被所述处理器执行,以使得计算机设备能够执行本发明的方法,或者方法中的至少部分步骤。
137.所述存储器包括易失性存储器,例如随机存取存储单元(ram)和/或高速缓存存储单元,还可以是非易失性存储器,如只读存储单元(rom)。
138.可选的,该实施例中,计算机设备还包括有i/o接口,其用于计算机设备与外部的设备进行数据交换。i/o接口可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
139.应当理解,图7显示的计算机设备仅仅是本发明的一个示例,本发明的计算机设备中还可以包括上述示例中未示出的元件或组件。例如,有些计算机设备中还包括有显示屏等显示单元,有些计算机设备还包括人机交互元件,例如按钮、键盘等。只要该计算机设备能够执行存储器中的计算机可读程序以实现本发明方法或方法的至少部分步骤,均可认为是本发明所涵盖的计算机设备。
140.图8是本发明的一个实施例的计算机程序产品的示意图。如图8所示,计算机程序产品中存储有计算机可执行程序,所述计算机可执行程序被执行时,实现本发明上述方法。所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
141.可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c 等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网
(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
142.通过以上对实施方式的描述,本领域的技术人员易于理解,本发明可以由能够执行特定计算机程序的硬件来实现,例如本发明的系统,以及系统中包含的电子处理单元、服务器、客户端、手机、控制单元、处理器等。本发明也可以由执行本发明的方法的计算机软件来实现,例如由微处理器、电子控制单元,客户端、服务器端等执行的控制软件来实现。但需要说明的是,执行本发明的方法的计算机软件并不限于由一个或特定个的硬件实体中执行,其也可以是由不特定具体硬件的以分布式的方式来实现。对于计算机软件,软件产品可以存储在一个计算机可读的存储介质(可以是cd-rom,u盘,移动硬盘等)中,也可以分布式存储于网络上,只要其能使得计算机设备执行根据本发明的方法。
143.以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者计算机设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献