一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种模型训练方法及相关装置与流程

2022-04-16 12:59:41 来源:中国专利 TAG:


1.本技术涉及人工智能技术领域,尤其涉及一种模型训练方法及相关装置。


背景技术:

2.在实际应用中,存在许多只有正样本以及大量未标记样本的情况,出现这种情况通常是因为负样本的获取难度较高、或者负样本过于多样化且动态变化。
3.对于上述情况,目前通常采用半监督学习中的pu learning(positive and unlabeled data learning)来解决。pu learning通常基于两步法实现;第一步是采用预设的分类方法,从未标记样本中选出置信度较高的负样本;第二步是利用所选出的负样本和本身就正确的正样本组成训练样本集,进而,利用该训练样本集进行模型训练。
4.然而,经本技术发明人研究发现,上述pu learning的实现方法存在以下缺陷:在第二步中仅利用通过第一步选出的负样本和正样本进行模型训练,而丢弃其余没有被选出作为负样本的未标记样本,将会导致训练得到的模型存在局限性,难以全面准确地识别各种输入数据;其原因在于,没有被选出作为负样本的未标注样本往往占比较大,其中蕴含着丰富的关键信息,在模型训练过程中放弃学习此部分关键信息,将会导致训练得到的模型难以准确地识别包括此类关键信息的输入数据。


技术实现要素:

5.本技术实施例提供了一种模型训练方法及相关装置,能够使训练得到的模型可以更全面准确地识别各种输入数据。
6.有鉴于此,本技术第一方面提供了一种模型训练方法,所述方法包括:
7.基于负样本衡量机制,确定未标记样本集合中各未标记样本各自对应的负样本置信度;
8.根据所述未标记样本集合中各未标记样本各自对应的负样本置信度,从所述未标记样本集合中选出目标负样本;基于所述目标负样本和目标正样本,构建第一训练样本集;
9.根据参考未标记样本集合中各未标记样本各自对应的负样本置信度,从所述参考未标记样本集合中选出参考正样本和参考负样本,所述参考未标记样本集合包括所述未标记样本集合中除所述目标负样本以外的未标记样本;基于所述目标负样本和所述参考负样本、以及所述目标正样本和所述参考正样本,构建第二训练样本集;
10.基于所述第一训练样本集和所述第二训练样本集,训练目标分类模型。
11.本技术第二方面提供了一种模型训练装置,所述装置包括:
12.置信度确定模块,用于基于负样本衡量机制,确定未标记样本集合中各未标记样本各自对应的负样本置信度;
13.第一样本集构建模块,用于根据所述未标记样本集合中各未标记样本各自对应的负样本置信度,从所述未标记样本集合中选出目标负样本;基于所述目标负样本和目标正样本,构建第一训练样本集;
14.第二样本集构建模块,用于根据参考未标记样本集合中各未标记样本各自对应的负样本置信度,从所述参考未标记样本集合中选出参考正样本和参考负样本,所述参考未标记样本集合包括所述未标记样本集合中除所述目标负样本以外的未标记样本;基于所述目标负样本和所述参考负样本、以及所述目标正样本和所述参考正样本,构建第二训练样本集;
15.模型训练模块,用于基于所述第一训练样本集和所述第二训练样本集,训练目标分类模型。
16.本技术第三方面提供了一种计算机设备,所述设备包括处理器和存储器:
17.所述存储器用于存储计算机程序;
18.所述处理器用于根据所述计算机程序,执行如上述第一方面所述的模型训练方法的步骤。
19.本技术第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述第一方面所述的模型训练方法的步骤。
20.本技术第五方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面所述的模型训练方法的步骤。
21.从以上技术方案可以看出,本技术实施例具有以下优点:
22.本技术实施例提供了一种模型训练方法,该方法采用pu learning基于未标记样本和目标正样本训练目标分类模型时,不仅会根据未标记样本集合中各未标记样本各自对应的负样本置信度,从该未标记样本集合中选出目标负样本(即较为可靠的负样本),利用所选出的目标负样本和已知的目标正样本构建训练样本集;还会根据未标记样本集合中除目标负样本外的未标记样本对应的负样本置信度,对未标记样本集合中剩余的未标记样本进行二轮筛选,以选出对于模型训练具有参考价值的参考负样本和参考正样本,进而利用所选出的参考负样本和此前选出的目标负样本、以及所选出的参考正样本和已知的目标正样本,构建另一训练样本集;最终,利用所构建的两个训练样本集协同训练目标分类模型。如此,对于未标记样本集合中除目标负样本以外的其它未标记样本,实现了充分合理的利用,使得这些未被选出作为目标负样本的未标记样本也可以参与到目标分类模型的训练过程;相应地,在模型训练过程中,可以使所训练的目标分类模型学习到此类未标记样本中蕴含的关键信息,从而提升所训练的目标分类模型的模型性能,使该目标分类模型能够更全面准确地识别各种输入数据。
附图说明
23.图1为本技术实施例提供的模型训练方法的应用场景示意图;
24.图2为本技术实施例提供的模型训练方法的流程示意图;
25.图3为本技术实施例提供的pu bagging算法的实现原理示意图;
26.图4为本技术实施例提供的spy算法的实现原理示意图;
27.图5为本技术实施例提供的训练样本集的构建原理示意图;
28.图6为本技术实施例提供的目标分类模型的训练过程的实现架构示意图;
29.图7为本技术实施例提供的模型训练方法的实现架构示意图;
30.图8为本技术实施例提供的一种模型训练装置的结构示意图;
31.图9为本技术实施例提供的另一种模型训练装置的结构示意图;
32.图10为本技术实施例提供的又一种模型训练装置的结构示意图;
33.图11为本技术实施例提供的终端设备的结构示意图;
34.图12为本技术实施例提供的服务器的结构示意图。
具体实施方式
35.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
36.本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
37.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
38.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
39.机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
40.本技术实施例提供的方案涉及人工智能的机器学习技术,具体通过如下实施例进行说明:
41.相关技术中,采用pu learning基于未标记样本和正样本训练分类模型时,通常会从未标记样本集合中选出可靠的负样本,进而,利用所选出的负样本与正样本组成训练样
本集,基于该训练样本集训练分类模型。对于未标记样本集合中没有被选出的未标记样本,通常会直接丢弃,不会使这部分未标记样本参与到模型训练过程中。然而,这部分没有被选出的未标记样本通常占比较大,其中蕴含着丰富的关键信息,若丢弃这些未标记样本进行模型训练,将会导致训练得到的分类模型难以全面准确地识别各种输入数据。
42.为了解决上述相关技术存在的问题,本技术实施例提供了一种模型训练方法,该方法可以对未标记样本集合中除可靠负样本以外的未标记样本进行合理有效地利用,使这部分未标记样本参与到模型训练过程中,从而提升所训练的分类模型的性能,使其能够更全面准确地识别各种输入数据。
43.具体的,在本技术实施例提供的模型训练方法中,先基于负样本衡量机制,确定未标记样本集合中各未标记样本各自对应的负样本置信度。然后,根据未标记样本集合中各未标记样本各自对应的负样本置信度,从该未标记样本集合中选出比较可靠的目标负样本,并基于所选出的目标负样本和已有的目标正样本,构建第一训练样本集。进而,再根据参考未标记样本集合中各未标记样本各自对应的负样本置信度,从该参考未标记样本集合中选出对于模型训练比较有参考价值的参考正样本和参考负样本,此处的参考未标记样本集合包括未标记样本集合中除目标负样本以外的其它未标记样本;并且基于目标负样本和参考负样本、以及目标正样本和参考正样本,构建第二训练样本集。最终,基于所构建的第一训练样本集以及第二训练样本集,训练目标分类模型。
44.上述模型训练方法,采用pu learning基于未标记样本和目标正样本训练目标分类模型时,不仅会根据未标记样本集合中各未标记样本各自对应的负样本置信度,从该未标记样本集合中选出目标负样本,利用所选出的目标负样本和已知的目标正样本构建训练样本集;还会根据未标记样本集合中除目标负样本外的未标记样本对应的负样本置信度,对未标记样本集合中剩余的未标记样本进行二轮筛选,以选出对于模型训练具有参考价值的参考负样本和参考正样本,进而利用所选出的参考负样本和此前选出的目标负样本、以及所选出的参考正样本和已知的目标正样本,构建另一训练样本集;最终,利用所构建的两个训练样本集协同训练目标分类模型。如此,对于未标记样本集合中除目标负样本以外的其它未标记样本,实现了充分合理的利用,使得这些未被选出作为目标负样本的未标记样本也可以参与到目标分类模型的训练过程;相应地,在模型训练过程中,可以使所训练的目标分类模型学习到此类未标记样本中蕴含的关键信息,从而提升所训练的目标分类模型的模型性能,使该目标分类模型能够更全面准确地识别各种输入数据。
45.应理解,本技术实施例提供的模型训练方法可以由具备数据处理能力的计算机设备执行,该计算机设备可以是终端设备或服务器。其中,终端设备具体可以为计算机、智能手机、平板电脑、个人数字助理(personal digital assistant,pda)等;服务器具体可以为应用服务器或web服务器,在实际部署时,可以为独立服务器,也可以为由多个物理服务器构成的集群服务器或云服务器。本技术实施例涉及数据可以保存于区块链上。
46.为了便于理解本技术实施例提供的模型训练方法,下面以该模型训练方法的执行主体为服务器为例,对该模型训练方法的应用场景进行示例性介绍。
47.参见图1,图1为本技术实施例提供的模型训练方法的应用场景示意图。如图1所示,该应用场景包括服务器110和数据库120,服务器110可以通过网络从数据库120中调取数据,或者数据库120也可以集成在服务器110中。其中,数据库120用于存储目标业务场景
中的未标记样本以及目标正样本;服务器110用于执行本技术实施例提供的模型训练方法,以基于数据库120存储的未标记样本和目标正样本,训练适用于目标业务场景的目标分类模型。
48.在实际应用中,当服务器110需要训练适用于目标业务场景的目标分类模型时,服务器110需要从数据库120中调取其存储的未标记样本集合以及所有目标正样本。需要说明的是,未标记样本集合中存储有大量未标记样本,未标记样本是指目标业务场景中难以界定所属类别的样本数据;目标正样本是指目标业务场景中能够确定所属类别为所规定的正类别的样本数据。
49.服务器110获取到未标记样本集合以及所有目标正样本后,可以先采用负样本衡量机制,确定该未标记样本集合中各未标记样本各自对应的负样本置信度。作为示例,服务器可以采用半监督算法、无监督算法以及预设业务规则中的一种或多种作为上述负样本衡量机制;此处的半监督算法例如可以为spy机制、pu bagging(positive and unlabeled data bagging),此处的无监督算法例如可以是kmeans算法、k最邻近分类(k-nearestneighbor,knn)算法,此处的预设业务规则可以是根据目标业务场景中具有普适性的数据分类规律制定的数据分类规则。
50.服务器110确定出未标记样本集合中各未标记样本各自对应的负样本置信度后,可以根据各未标记样本各自对应的负样本置信度,针对未标记样本集合进行第一轮筛选,以从该未标记样本集合中选出较为可靠的目标负样本。进而,利用所选出的目标负样本、以及从数据库120中调取的各目标正样本,构建第一训练样本集。
51.服务器110完成目标负样本的筛选后,可以利用未标记样本集合中除所选出的目标负样本以外的未标记样本组成参考未标记样本集合。然后,根据该参考未标记样本集合中各未标记样本各自对应的负样本置信度,进行第二轮筛选,以从该参考未标记样本集合中选出对于模型训练能够起到帮助作用的参考正样本和参考负样本。进而,利用所选出的参考负样本和此前选出的目标负样本组成负样本集,利用所选出的参考正样本和从数据库120中调取的目标正样本组成正样本集,并利用该负样本集和该正样本集构建第二训练样本集。
52.最终,服务器110可以利用所构建的第一训练样本集和第二训练样本集,训练目标分类模型。示例性的,所要训练的目标分类模型可以包括第一训练样本集和第二训练样本集各自对应的子分类模型以及融合结构;训练该目标分类模型时,可以先利用第一训练样本集训练第一训练样本集对应的子分类模型,利用第二训练样本集训练第二训练样本集对应的子分类模型,进而,在已训练好的两个子分类模型的基础上,利用标注训练样本训练该目标分类模型中的融合结构。
53.应理解,图1所示的应用场景仅为示例,在实际应用中,本技术实施例提供的模型训练方法还可以应用于其它场景,在此不对本技术实施例提供的模型训练方法适用的应用场景做任何限定。
54.下面通过方法实施例对本技术提供的模型训练方法进行详细介绍。
55.参见图2,图2为本技术实施例提供的模型训练方法的流程示意图。为了便于描述,下述实施例仍以该模型训练方法的执行主体为服务器为例进行介绍。如图2所示,该模型训练方法包括以下步骤:
56.步骤201:基于负样本衡量机制,确定未标记样本集合中各未标记样本各自对应的负样本置信度。
57.服务器采用pu learning基于未标记样本和目标正样本训练目标分类模型时,需要先利用负样本衡量机制,确定未标记样本集合中各未标记样本各自对应的负样本置信度。
58.需要说明的是,未标记样本集合中包括大量未标记样本,该未标记样本是指业务场景中难以界定其所属类别的样本数据。目标正样本是指业务场景中能够确定其所属类别为预设的正类别的样本数据。目标分类模型是用于针对输入的数据识别其是属于预设的正类别、还是属于预设的负类别的模型。
59.以本技术实施例提供的方法用于检测目标网络平台上的目标账号是否存在异常行为为例。在该场景中,目标网络平台可以是以互联网为技术基础的、支持任意网络服务活动的后台系统,如游戏网络平台、社交网络平台、购物网络平台等;目标账号可以是目标网络平台上特定类型的注册账号,如游戏网络平台上注册身份为成年人的游戏账号,社交网络平台或购物网络平台上实名注册的账号等;所要检测的异常行为可以是与目标账号的常规行为相悖的反常行为,例如,异常行为可以是目标账号被并非该目标账号对应的目标对象使用的行为。
60.在上述场景中,通常会采用特定的参考验证方式对目标账号进行验证;对于没有通过参考验证、被识别为使用用户并非目标对象(目标对象为目标账号的合法使用对象,所谓合法使用对象为具有该目标账号的使用权限的对象)的目标账号,该目标账号的特征数据(用于反映目标账号实际使用特征的数据)可以被视为目标正样本;对于通过参考验证、被识别为使用用户为目标对象的目标账号,由于该识别结果很有可能是通过代验产生的(如通过黑产代验产生的),该目标账号的特征数据将被视为未标记样本。相应地,基于上述未标记样本和目标正样本训练的目标分类模型,是用于根据输入的目标账号的特征数据,识别该目标账号的实际使用用户是否为该目标账号对应的目标对象的模型。
61.应理解,本技术实施例提供的模型训练方法可以应用于任意业务场景,在此不对本技术实施例提供的模型训练方法所应用的业务场景做任何限定。当本技术实施例提供的模型训练方法应用在其它业务场景中时,未标记样本和目标正样本也会有所不同,所训练的目标分类模型所要实现的功能也会有所不同,在此不对本技术实施例中的未标记样本和目标正样本做任何限定,也不对本技术实施例中的目标分类模型的功能做任何限定。
62.需要说明的是,负样本衡量机制是用于衡量各未标记样本属于负样本的可能性的机制;该负样本衡量机制例如可以基于半监督学习算法、无监督学习算法、或预设的业务规则实现。未标记样本对应的负样本置信度是用于表征该未标记样本属于负样本的可能性的参数。仍以本技术实施例提供的方法用于检测目标账号是否存在异常行为为例,在该场景中,负样本衡量机制可以用于衡量通过参考验证的目标账号的特征数据属于目标对象产生的特征数据的可能性,未标记样本对应的负样本置信度则用于表征该未标记样本中的特征数据是由目标对象产生的行为特征数据的可能性。
63.在一种可能的实现方式中,服务器可以基于一种负样本衡量机制,针对未标记样本集合中各未标记样本确定其各自对应的负样本置信度。
64.示例性的,服务器可以采用pu learning中的1-dnf算法确定各未标记样本各自对
应的负样本置信度。1-dnf算法的基本思想是,针对各未标记样本中包括的每个特征,判断其在所有目标正样本中的出现频率是否高于其在各未标记样本中的出现频率,若是,则将该特征归入正特征集;完成对于各未标记样本包括的各特征的归类处理后,可以针对每个未标记样本,确定其中包括的属于正特征集的特征的数量,作为该未标记样本对应的负样本置信度;应理解,未标记样本包括的属于正特征集的特征越少,则说明该未标记样本属于负样本的可能性越大,反之,未标记样本包括的属于正特征集的特征越多,则说明该未标记样本属于负样本的可能性越小。
65.应理解,在实际应用中,服务器还可以采用其它负样本衡量机制(如半监督学习算法、无监督学习算法和预设的业务规则中的任一种),针对未标记样本集合中各未标记样本确定其各自对应的负样本置信度;本技术在此不对仅采用一种负样本衡量机制确定各未标记样本各自对应的负样本置信度时,所采用的负样本衡量机制做任何限定。
66.在另一种可能的实现方式中,服务器可以基于多种负样本衡量机制,针对未标记样本集合中各未标记样本,确定其各自在每种负样本衡量机制下的负样本置信度。
67.具体的,在pu learning的第一步使用的负样本衡量机制通常比较简单,具有较大的局限性,仅采用一种负样本衡量机制筛选目标负样本容易导致有偏抽样,使得筛选出的目标负样本无法代表完整的负样本群体。为了解决该问题,本技术实施例创新性地在pu learning的第一步中引入了多种负样本衡量机制;通过多种负样本衡量机制,确定各未标记样本各自在每种负样本衡量机制下的负样本置信度;进而,基于各未标记样本各自在每种负样本衡量机制下的负样本置信度,选出每种负样本衡量机制下的目标负样本。由于通过不同的负样本衡量机制选出的目标负样本可以表征不同类型的负样本特征,因此,通过多种负样本衡量机制,可以选出多种分布情况不同的目标负样本,即使得所选出的目标负样本呈多样化分布。
68.作为一种示例,服务器可以从半监督学习方法、无监督学习方法和预设的业务规则中选择至少两种,作为在pu learning的第一步使用的负样本衡量机制。
69.当服务器采用的负样本衡量机制包括半监督学习方法时,服务器可以基于未标记样本集合中的未标记样本以及目标正样本,训练半监督分类模型;进而,通过该半监督分类模型,确定未标记样本集合中各未标记样本各自在半监督机制下的负样本置信度。
70.具体的,服务器可以按照预设的样本选取规则,从未标记样本集合以及所有目标正样本中,选取用于半监督学习的模拟正样本和模拟负样本。然后,利用所选取的模拟正样本和模拟负样本训练半监督分类模型。进而,通过该半监督分类模型,确定未标记样本集合中各未标记样本各自在该半监督机制下的负样本置信度。
71.示例性的,服务器可以选择pu learning中比较成熟的半监督学习算法pu bagging和spy中的至少一种,确定各未标记样本各自在半监督机制下的负样本置信度。
72.当服务器选择pu bagging确定各未标记样本各自在半监督机制下的负样本置信度时,服务器可以将未标记样本集合划分为m(m为大于1的整数)个未标记样本子集合;然后,针对每个未标记样本子集合,将该未标记样本子集合包括的未标记样本作为第一模拟负样本,基于目标正样本和第一模拟负样本,训练该未标记样本子集合对应的第一半监督分类模型;进而,通过m个第一半监督分类模型,确定未标记样本集合中各未标记样本各自在第一半监督机制下的负样本置信度。
73.图3为本技术实施例提供的pu bagging算法的实现原理示意图。如图3所示,服务器可以将未标记样本集合划分为m个未标记样本子集合;对于每个未标记样本子集合而言,未标记样本集合中除去该未标记样本子集合包括的未标记样本数据外的其余未标记样本数据,均可被视为该未标记样本子集合对应的袋外数据(out of bag,oob)。针对每个未标记样本子集合,服务器可以将该未标记样本子集合包括的各未标记样本数据视为第一模拟负样本,然后,基于该第一模拟负样本和目标正样本(在此半监督学习过程中直接被视为第一模拟正样本),训练该未标记样本子集合对应的第一半监督分类模型;进而,利用该未标记样本子集合对应的第一半监督分类模型,对该未标记样本子集合对应的各袋外数据分别进行分类处理,以确定该未标记样本子集合对应的各袋外数据各自的子负样本置信度。完成m个未标记样本子集合各自对应的第一半监督分类模型的训练,并得到m个未标记样本子集合各自对应的各袋外数据的子负样本置信度后,服务器可以根据m个未标记样本子集合各自对应的各袋外数据的子负样本置信度,确定未标记样本集合中各未标记样本各自在第一半监督机制下的负样本置信度;具体的,对于未标记样本集合中每个未标记样本数据,其应当属于m-1个未标记样本子集合对应的袋外数据,即该未标记样本数据应对应有m-1个子负样本置信度,基于此,服务器可以计算这m-1个子负样本置信度的均值,作为该未标记样本数据在第一半监督机制下的负样本置信度。应理解,通过上述方式计算得到的未标记样本数据在第一半监督机制下的负样本置信度越高,则说明该未标记样本越有可能属于正样本,反之,通过上述方式计算得到的未标记样本数据在第一半监督机制下的负样本置信度越地,则说明该未标记样本越有可能属于负样本。
74.如此,通过pu bagging算法,确定各未标记样本各自在第一半监督机制下的负样本置信度,可以在一定程度上保证所确定的负样本置信度的准确性和可靠性,即基于通过该pu bagging算法确定的负样本置信度,有利于实现目标负样本的准确筛选。
75.当服务器选择spy确定各未标记样本各自在半监督机制下的负样本置信度时,服务器可以从所有目标正样本中选出部分目标正样本,并将所选出的目标正样本、以及未标记样本集合中的各未标记样本作为第二模拟负样本;然后,基于未选出的目标正样本和第二模拟负样本,训练第二半监督分类模型;进而,通过该第二半监督分类模型,确定未标记样本集合中各未标记样本各自在第二半监督机制下的负样本置信度。
76.图4为本技术实施例提供的spy算法的实现原理示意图。如图4所示,对于所获取的所有目标正样本,服务器可以从中选择部分目标正样本,并将所选择的这部分目标正样本以及未标记样本集合中各未标记样本均作为第二模拟负样本。然后,基于上述第二模拟负样本以及未被选出的目标正样本(在此半监督学习过程中被视为第二模拟正样本),训练第二半监督分类模型。完成第二半监督分类模型的训练后,服务器可以利用该第二半监督分类模型,对各目标正样本和未标记样本集合中各未标记样本分别进行分类处理,确定各目标正样本各自在第二半监督机制下的负样本置信度、以及各未标记样本各自在第二半监督机制下的负样本置信度。由于训练第二半监督分类模型时,是以将部分目标正样本作为第二模拟负样本作为前提训练的,通过训练得到的第二半监督分类模型对此部分目标正样本进行分类处理,所得到的此部分目标正样本在第二半监督机制下的负样本置信度本质上可以作为分类阈值,对于所对应的负样本置信度高于该分类阈值的未标记样本,服务器可以认为该未标记样本大概率属于正样本,而对于所对应的负样本置信度低于该分类阈值的未
标记样本,服务器可以认为该未标记样本大概率属于负样本。
77.如此,通过spy算法,确定各未标记样本各自在第二半监督机制下的负样本置信度,可以直接基于目标正样本在第二半监督机制下的负样本置信度,确定用于筛选目标负样本的分类阈值,从而避免人工设定分类阈值时存在的阈值设定不准确的问题,即可以保证后续选出的目标负样本的可靠性。
78.应理解,上述pu bagging算法和spy算法仅为示例,在实际应用中,服务器也可以采用其它类型的半监督学习算法,确定各未标记样本各自在半监督机制下的负样本置信度,本技术在此不对所采用的半监督学习算法做任何限定。
79.当服务器采用的负样本衡量机制包括无监督学习方法时,服务器可以根据未标记样本集合中各未标记样本以及各目标正样本在特征空间的分布情况,确定未标记样本集合中各未标记样本各自在无监督机制下的负样本置信度。
80.具体的,服务器可以根据未标记样本集合中各未标记样本各自包括的特征数据,将各未标记样本映射至特征空间,以及根据各目标正样本数据各自包括的特征数据,将各目标正样本数据映射至特征空间。进而,根据各未标记样本以及各目标正样本在特征空间的分布情况,确定未标记样本集合中各未标记样本各自在无监督机制下的负样本置信度。应理解,在特征空间中,未标记样本与各目标正样本之间的距离越远,则说明该未标记样本越有可能属于负样本,反之,未标记样本与各目标正样本之间的距离越近,则说明该未标记样本越不可能属于负样本。
81.示例性的,服务器可以选择kmeas算法和knn算法中的至少一种,确定各未标记样本各自在无监督机制下的负样本置信度。
82.当服务器选择kmeas算法确定各未标记样本各自在无监督机制下的负样本置信度时,服务器可以对未标记样本集合中各未标记样本、以及各目标正样本进行聚类处理,得到多个聚类簇;然后,针对未标记样本集合中每个未标记样本,根据其所属的聚类簇中包括的目标正样本的数量,确定该未标记样本在第一无监督机制下的负样本置信度。
83.具体的,服务器将各未标记样本和各目标正样本映射至特征空间中后,可以从该特征空间中选择k(k为大于1的整数)个点作为初始聚集的簇心;然后,计算每个样本点(即未标记样本和目标正样本在特征空间中的映射点)到k个簇心之间的距离(可以为欧式距离或余弦距离),并找到该样本点距离最近的簇心,将该样本点归属至该簇心对应的聚类簇中;将所有样本点归属至对应的聚类簇中后,可以根据各聚类簇中各样本点的位置重新计算各聚类簇的簇心。如此,重复执行上述操作,直至达到预设的中止条件(例如迭代次数达到预设次数);达到中止条件后,可以得到k个聚类簇。
84.对于未标记样本集合中每个未标记样本,服务器可以根据该未标记样本所属的聚类簇中包括的目标正样本的数量,确定该未标记样本在第一无监督机制下的负样本置信度;应理解,该未标记样本所属的聚类簇中包括的目标正样本越少,则说明该未标记样本越有可能为负样本,反之,该未标记样本所属的聚类簇中包括的目标正样本越多,则说明该未标记样本越不可能为负样本。
85.如此,通过kmeans算法,确定各未标记样本各自在第一无监督机制下的负样本置信度,可以根据未标记样本中包括的特征数据与目标正样本中包括的特征数据的分布情况,衡量未标记样本是否属于负样本,在一定程度上能够保证所确定的负样本置信度的准
确性和可靠性。
86.当服务器选择knn算法确定各未标记样本各自在无监督机制下的负样本置信度时,服务器可以针对未标记样本集合中每个未标记样本,在特征空间中确定该未标记样本对应的多个邻近样本;进而,根据这多个邻近样本中包括的目标正样本的数量,确定该未标记样本在第二无监督机制下的负样本置信度。
87.具体的,服务器将各未标记样本和各目标正样本映射至特征空间中后,可以针对每个未标记样本数据对应的映射点,确定该映射点与特征空间中其它映射点(即其它未标记样本数据和目标正样本数据对应的映射点)之间的距离,并对该映射点与其它映射点之间的距离排序,据此选择与该映射点距离最近的k(k为大于1的整数)个映射点,这k个映射点对应的样本即为该未标记样本对应的邻近样本。进而,服务器可以根据这k个邻近样本中包括的目标正样本的数量,确定该未标记样本在第二无监督机制下的负样本置信度;应理解,该未标记样本对应的邻近样本中包括的目标正样本越少,则说明该未标记样本越有可能为负样本,反之,该未标记样本对应的邻近样本中包括的目标正样本越多,则说明该未标记样本越不可能为负样本。
88.如此,通过knn算法,确定各未标记样本各自在第二无监督机制下的负样本置信度,可以根据未标记样本与目标正样本在特征空间中的距离,衡量未标记样本是否属于负样本,在一定程度上能够保证所确定的负样本置信度的准确性和可靠性。
89.应理解,上述kmeans算法和knn算法仅为示例,在实际应用中,服务器也可以采用其它类型的无监督学习算法,确定各未标记样本各自在无监督机制下的负样本置信度,本技术在此不对采用的无监督学习算法做任何限定。
90.当服务器采用的负样本衡量机制包括预设的业务规则时,服务器可以获取未标记样本集合中各未标记样本各自对应的参考特征;然后,根据目标业务场景下的业务规则、以及未标记样本集合中各未标记样本各自对应的参考特征,确定未标记样本集合中各未标记样本各自在强规则机制下的负样本置信度;此处的目标业务场景是指产生未标记样本的业务场景。
91.具体的,服务器可以根据产生未标记样本的目标业务场景,确定该目标业务场景中适用于划分样本数据所属类别的业务规则、以及基于该业务规则划分样本数据所属类别时所需的参考特征。基于此,服务器需要获取未标记样本集合中各未标记样本各自对应的参考特征,进而,基于该目标业务场景中适用于划分样本数据所属类别的业务规则,根据各未标记样本各自对应的参考特征,确定各未标记样本各自在强规则机制下的负样本置信度。
92.仍以本技术实施例提供的方法用于检测目标网络平台上的目标账号是否存在异常行为为例,在该场景中,未标记样本为已通过参考验证、被识别为使用用户为目标对象的目标账号的特征数据;服务器基于业务规则确定各未标记样本各自在强规则机制下的负样本置信度时,可以获取未标记样本集合中各未标记样本各自所属的目标账号的历史参考验证次数、以及历史参考验证通过次数;进而,针对未标记样本集合中每个未标记样本,根据该未标记样本所属的目标账号的历史参考验证次数、以及历史参考验证通过次数,确定该未标记样本在强规则机制下的负样本置信度。
93.具体的,在检测目标账号是否存在异常行为的场景中,目标账号被命中触发参考
验证(例如可以为人脸验证)的次数、以及目标账号历史通过参考验证的次数,均能在一定程度上反映该目标账号的实际使用用户并非目标对象的可能性。例如,若某目标账号历史被命中触发参考验证的次数较多,则说明该目标账号的实际使用用户很有可能并非该目标账号的合法使用对象(即目标对象);又例如,若某目标账号历史被命中触发参考验证,且在被命中的多数情况下均没有通过参考验证,则也可说明该目标账号的实际使用用户很有可能并非该目标账号的合法使用用户。
94.基于上述理论,服务器可以针对未标记样本集合中每个未标记样本,获取该未标记样本所属的目标账号的历史参考验证次数(即历史上触发参考验证的次数)和历史参考验证通过次数(即历史上通过参考验证的次数)中的至少一种,作为该未标记样本对应的参考特征。当所获取的参考特征为未标记样本所属的目标账号的历史参考验证次数时,服务器可以根据该历史参考验证次数,确定该未标记样本在强规则机制下的负样本置信度;应理解,未标记样本所属的目标账号的历史参考验证次数越多,则该未标记样本越有可能属于负样本。当所获取的参考特征包括未标记样本所属的目标账号的历史参考验证次数和历史参考验证通过次数时,服务器可以计算该历史参考验证通过次数在历史参考验证次数中的占比,并据此确定该未标记样本在强规则机制下的负样本置信度;应理解,历史参考验证通过次数在历史参考验证次数中的占比越大,则说明该未标记样本越有可能属于负样本。
95.应理解,当本技术实施例提供的方法应用在其它业务场景中时,服务器可以获取其它类型的数据作为参考特征,并采用相应的业务规则确定未标记样本数据在强规则下的负样本置信度。本技术在此不对所获取的参考特征、以及所采用的业务规则做任何限定。
96.由于基于业务规则确定负样本置信度时,使用的参考特征通常比较单一,与半监督学习算法和无监督学习算法中使用的多特征之间具有明显的区别,因此,基于业务规则确定负样本置信度,并基于如此确定的负样本置信度选择强规则机制下的目标负样本,能够保证所选择强规则机制下的目标负样本与通过其它机制选择的目标负样本存在较大的差别,从而有利于在后续模型训练过程中使所训练的模型学习到更丰富的信息。
97.步骤202:根据所述未标记样本集合中各未标记样本各自对应的负样本置信度,从所述未标记样本集合中选出目标负样本;基于所述目标负样本和目标正样本,构建第一训练样本集。
98.服务器确定出未标记样本集合中各未标记样本各自对应的负样本置信度后,可以根据各未标记样本各自对应的负样本置信度,从该未标记样本集合中选出大概率为负样本的未标记样本作为目标负样本,进而,利用所选出的各目标负样本与已有的各目标正样本,构建第一训练样本集。
99.构建第一训练样本集的原理如图5中(b)所示,在图5中,(a)对应于原始的未标记样本(白色部分)和目标正样本(黑色部分);服务器从未标记样本集合中选出目标负样本,利用该目标负样本和目标正样本构建第一训练样本集,并丢弃未标记样本集合中除目标负样本以外的未标记样本,如图5中(b)所示。
100.在一种可能的实现方式中,若服务器执行步骤201时仅基于一种负样本衡量机制,确定未标记样本集合中各未标记样本各自对应的负样本置信度,则服务器此时可以根据通过步骤201确定的各未标记样本各自对应的负样本置信度,从未标记样本集合中选出目标负样本;例如,假设服务器执行步骤201时,采用1-dnf算法将未标记样本中包括的属于正特
征集的特征的数量,作为该未标记样本对应的负样本置信度,那么,服务器执行步骤202时,可以确定所包括的属于正特征集的特征的数量为0的未标记样本,作为目标负样本。进而,服务器可以直接利用所选出的各目标负样本和各目标正样本,组成第一训练样本集。
101.在另一种可能的实现方式中,若服务器执行步骤201时基于多种负样本衡量机制,确定未标记样本集合中各未标记样本各自在每种负样本衡量机制下的负样本置信度,则服务器此时可以针对每种负样本衡量机制,基于该种负样本衡量机制下的目标负样本和各目标正样本,构建该种负样本衡量机制对应的第一训练样本集;此处该种负样本衡量机制下的目标负样本,是根据未标记样本集合中各未标记样本各自在该种负样本衡量机制下的负样本置信度选出的。
102.具体的,在服务器采用了多种负样本衡量机制,确定出各未标记样本各自在每种负样本衡量机制下的负样本置信度的情况下,服务器需要针对每种负样本衡量机制,构建其对应的第一训练样本集。即,针对每种负样本衡量机制,服务器需要根据各未标记样本各自在该种负样本衡量机制下的负样本置信度,从未标记样本集合中选出基于该种负样本衡量机制衡量出的大概率属于负样本的未标记样本,作为该种负样本衡量机制下的目标负样本;进而,利用该种负样本衡量机制下的目标负样本和已有的各目标正样本,构建该种负样本衡量机制下的第一训练样本集。
103.示例性的,当服务器同时采用半监督学习方法、无监督学习方法和预设的业务规则,作为多种负样本衡量机制时,服务器可以针对半监督学习方法、无监督学习方法和预设的业务规则,分别构建对应的第一训练样本集。
104.例如,假设服务器采用的半监督学习方法包括pu bagging算法和spy算法。服务器通过pu bagging算法确定出各未标记样本各自在第一半监督机制下的负样本置信度后,可以选择在第一半监督机制下的负样本置信度低于预设的第一半监督机制下的目标负样本分类阈值的未标记样本,作为该第一半监督机制下的目标负样本,进而,利用该第一半监督机制下的目标负样本和已有的各目标正样本,组成该第一半监督机制下的第一训练样本集。服务器通过spy算法确定出各未标记样本和各目标正样本各自在第二半监督机制下的负样本置信度后,可以基于各目标正样本各自在第二半监督机制下的负样本置信度,确定第二半监督机制下的目标负样本分类阈值,例如,可以从各目标正样本各自在第二半监督机制下的负样本置信度中选择最小值,作为该第二半监督机制下的目标负样本分类阈值;然后,选择在第二半监督机制下的负样本置信度低于该第二半监督机制下的目标负样本分类阈值的未标记样本,作为该第二半监督机制下的目标负样本,进而,利用该第二半监督机制下的目标负样本和已有的各目标正样本,组成该第二半监督机制下的第一训练样本集。
105.例如,假设服务器采用的无监督学习方法包括kmeans算法和knn算法。服务器通过kmeans算法确定出各未标记样本各自在第一无监督机制下的负样本置信度后,可以选择在第一无监督机制下的负样本置信度低于预设的第一无监督机制下的目标负样本分类阈值的未标记样本,作为该第一无监督机制下的目标负样本,进而,利用该第一无监督机制下的目标负样本和已有的各目标正样本,组成该第一无监督机制下的第一训练样本集。服务器通过knn算法确定出各未标记样本各自在第二无监督机制下的负样本置信度后,可以选择在第二无监督机制下的负样本置信度低于预设的第二无监督机制下的目标负样本分类阈值的未标记样本,作为该第二无监督机制下的目标负样本,进而,利用该第二无监督机制下
的目标负样本和已有的各目标正样本,组成该第二无监督机制下的第一训练样本集。
106.例如,假设本技术实施例提供的方法用于检测目标账号是否存在异常行为,且所使用的参考特征为未标记样本对应的目标账号的历史参考验证次数和历史参考验证通过次数,服务器针对每个未标记样本,计算其对应的目标账号的历史参考验证通过次数与历史参考验证次数的比值,作为该未标记样本在强规则机制下的负样本置信度。则服务器可以预设比例阈值作为强规则机制下的目标负样本分类阈值,对于在强规则机制下的负样本置信度高于该强规则机制下的目标负样本分类阈值的未标记样本,服务器可以将其视为强规则机制下的目标负样本;进而,服务器可以利用该强规则机制下的各目标负样本和已有的各目标正样本,组成该强规则机制下的第一训练样本集。
107.应理解,若服务器在步骤201中采用其它负样本衡量机制,确定各未标记样本在每种负样本衡量机制下的负样本置信度,则此时服务器可以相应地采用其它方式,根据各未标记样本在每种负样本衡量机制下的负样本置信度,选择每种负样本衡量机制下的目标负样本,并据此构建该种负样本衡量机制对应的第一训练样本集。本技术在此不对选择各种负样本衡量机制下的目标负样本的方式做任何限定。
108.如此,通过多种负样本衡量机制,确定各未标记样本各自在每种负样本衡量机制下的负样本置信度,并据此构建每种负样本衡量机制各自对应的第一训练样本集,可以使得所构建的第一训练样本集更多样化,携带更丰富的信息,从而有利于在后续的模型训练过程中,使得所训练的模型基于多种负样本衡量机制各自对应的第一训练样本集学习到更丰富的知识。
109.可选的,为了进一步提高所选出的目标负样本的可靠度,在本技术实施例中,服务器还可以获取未标记样本集合中各未标记样本各自对应的潜分类特征;该潜分类特征可以根据产生未标记样本的业务场景确定;进而,服务器可以未标记样本集合中各未标记样本各自对应的负样本置信度以及潜分类特征,从该未标记样本集合中选出目标负样本。
110.在一些业务场景中,除了可以根据未标记样本自身包括的特征,确定该未标记样本属于正样本、还是属于负样本外,与未标记样本相关的一些特征也可以用于辅助判断该未标记样本是属于正样本、还是属于负样本,这些可用于辅助判断的特征即为潜分类特征。引入潜分类特征筛选目标负样本时,服务器可以综合考虑各未标记样本各自对应的负样本置信度以及潜分类特征,从未标记样本集合中选出目标负样本;例如,服务器可以确定所对应的负样本置信度在特定的置信度阈值区间、和/或所对应的潜分类特征满足预设条件的未标记样本,作为目标负样本。
111.仍以本技术实施例提供的方法用于检测目标账号是否存在异常行为为例,在该场景中,未标记样本为已通过参考验证(如人脸验证)、被识别为使用用户为目标对象的目标账号的特征数据;在该种情况下,针对未标记样本集合中每个未标记样本,服务器可以获取该未标记样本所属的目标账号通过参考验证所耗费的时长,作为该未标记样本对应的潜分类特征;进而,根据各未标记样本各自对应的负样本置信度和潜分类特征,从未标记样本集合中选出目标负样本。
112.在实际业务中发现,对于实际使用用户并非合法使用对象的目标账号、以及实际使用用户为合法使用对象的目标账号,在进行参考验证的过程中所产生的验证行为会存在明显的区别;具体的,以参考验证为人脸验证为例,在被要求进行人脸验证时,实际使用用
户为合法使用对象的目标账号通常可以快速地通过人脸验证,而实际使用用户并非合法使用对象的目标账号,由于需要通过代验行为通过该人脸验证,往往需要耗费较长时间才能通过人脸验证。基于此,在本技术实施例中,服务器可以针对每个未标记样本,获取其所属的目标账号通过人脸验证所耗费的时长,作为该未标记样本对应的潜分类特征;从未标记样本集合中选择目标负样本时,服务器可以选择所对应的负样本置信度在特定的置信度阈值区间、和/或所对应的潜分类特征(即通过人脸验证所耗费的时长)超过预设时长的未标记样本,作为目标负样本。
113.应理解,当本技术实施例提供的方法应用在其它业务场景中时,服务器可以相应地根据该业务场景确定其它类型的特征作为潜分类特征,并在选择目标负样本时,参考各未标记样本各自对应的潜分类特征。本技术在此不对潜分类特征、以及基于潜分类特征选择目标负样本的方式做任何限定。
114.如此,在选择目标负样本的过程中引入潜分类特征,可以辅助通过步骤201确定的各未标记样本各自对应的负样本置信度,更精准从未标记样本集合中选择目标负样本,或者使得所选出的目标负样本更丰富。
115.步骤203:根据参考未标记样本集合中各未标记样本各自对应的负样本置信度,从所述参考未标记样本集合中选出参考正样本和参考负样本,所述参考未标记样本集合包括所述未标记样本集合中除所述目标负样本以外的未标记样本;基于所述目标负样本和所述参考负样本、以及所述目标正样本和所述参考正样本,构建第二训练样本集。
116.服务器从未标记样本集合中选出目标负样本后,可以将未标记样本集合中剩余的未标记样本(即除目标负样本以外的其它未标记样本),组成参考未标记样本集合。然后,根据该参考未标记样本集合中各未标记样本各自对应的负样本置信度,从该参考未标记样本集合中选出对于模型训练有参考价值的参考正样本和参考负样本;进而,利用所选出的参考负样本和通过步骤202选出的目标负样本组成负样本集,利用所选出的参考正样本和已有的各目标正样本组成正样本集,组合该负样本集和该正样本集,即可得到第二训练样本集。
117.构建第二训练样本集的原理如图5中(c)所示。图5中(b)为构建第一训练样本集的实现原理示意图,如图5中(b)所示,其中白色部分对应于目标负样本,黑色部分对应于目标正样本,灰色部分对应于并非目标负样本的未标记样本(即参考未标记样本集合中的未标记样本),构建第一训练样本集时,服务器可以丢弃灰色部分对应的未标记样本。构建第二训练样本集时,服务器可以对灰色部分对应的未标记样本进行有效利用,根据其中各未标记样本各自对应的置信度,将其中各未标记样本确定为参考负样本或者参考正样本;如图5中(c)所示,对于(b)中灰色部分对应的未标记样本,可以进一步被确定为参考负样本或者参考正样本,构建第二训练样本集时,服务器可以将参考负样本和目标负样本均视为负样本(即(c)中的白色部分),将参考正样本和目标正样本均视为正样本(即(c)中的黑色部分)。
118.需要说明的是,参考负样本是未标记样本集合中可能属于负样本的未标记样本;相比目标负样本而言,参考负样本属于负样本的可能性更低,但是由于此类未标记样本对于模型训练来说仍具有较高的参考价值,因此,需要利用此类参考负样本和目标负样本协同构建第二训练样本集中的负样本集。参考正样本是未标记样本集合中可能属于正样本的
未标记样本,相比参考负样本而言,参考正样本属于负样本的可能性更低,也可以理解为参考正样本属于正样本的可能性高于其属于负样本的可能性,因此,可以利用此类参考正样本和目标正样本协同构建第二训练样本集中的正样本集。
119.在一种可能的实现方式中,若服务器执行步骤201时仅基于一种负样本衡量机制,确定未标记样本集合中各未标记样本各自对应的负样本置信度,则服务器此时可以根据参考未标记样本集合中各未标记样本各自对应的负样本置信度,从该参考未标记样本集合中选出参考负样本和参考正样本。例如,假设服务器执行步骤201时,采用1-dnf算法将未标记样本中包括的属于正特征集的特征的数量,作为该未标记样本对应的负样本置信度,那么,服务器执行步骤203时,可以针对参考未标记样本集合中各未标记样本,确定所包括的属于正特征集的特征的数量小于第一预设数量阈值的未标记样本,作为参考负样本,确定所包括的属于正特征集的特征的数量大于第二预设数量阈值的未标记样本,作为参考正样本。
120.在另一种可能的实现方式中,若服务器执行步骤201时基于多种负样本衡量机制,确定未标记样本集合中各未标记样本各自在每种负样本衡量机制下的负样本置信度,则服务器此时可以针对每种负样本衡量机制,基于该种负样本衡量机制下的目标负样本和参考负样本、以及目标正样本和该种负样本衡量机制下的参考正样本,构建该种负样本衡量机制对应的第二训练样本集;此处的该种负样本衡量机制下的参考负样本和参考正样本,均是根据该种负样本衡量机制对应的参考未标记样本集合中各未标记样本各自在该种负样本衡量机制下的负样本置信度选出的,该种负样本衡量机制对应的参考未标记样本集合,包括未标记样本集合中除该种负样本衡量机制下的目标负样本以外的未标记样本。
121.具体的,在服务器采用了多种负样本衡量机制,确定出各未标记样本各自在每种负样本衡量机制下的负样本置信度的情况下,服务器需要针对每种负样本衡量机制,构建其对应的第二训练样本集。即,针对每种负样本衡量机制,服务器需要根据该种负样本衡量机制对应的参考未标记样本集合中各未标记样本在该种负样本衡量机制下的负样本置信度,从该未标记样本集合中选出该种负样本衡量机制下的参考负样本和参考正样本;进而,利用该种负样本衡量机制下的目标负样本和参考负样本、以及目标正样本和该种负样本衡量机制下的参考正样本,构建该种负样本衡量机制对应的第二训练样本集。
122.示例性的,当服务器同时采用半监督学习方法、无监督学习方法和预设的业务规则,作为多种负样本衡量机制时,服务器可以针对半监督学习方法、无监督学习方法和预设的业务规则,分别构建对应的第二训练样本集。应理解,服务器构建各种负样本衡量机制各自对应的第二训练样本集的实现方式,与构建各种负样本衡量机制各自对应的第一训练样本集的实现方式基本类似;区别仅在于,服务器选择每种负样本衡量机制下的参考负样本所依据的选择条件(如参考负样本分类阈值),相比选择该种负样本衡量机制下的目标负样本时所依据的选择条件(如目标负样本分类阈值)更宽松;并且,服务器还需要确定每种负样本衡量机制下的参考正样本的选择条件,并据此选择该种负样本衡量机制下的参考负样本,或者服务器也可以直接将参考未标记样本集合中除参考负样本外的其余未标记负样本均视为参考正样本。
123.如此,通过多种负样本衡量机制,确定各未标记样本各自在每种负样本衡量机制下的负样本置信度,并据此构建每种负样本衡量机制各自对应的第二训练样本集,一方面可以使得未标记样本集合中除目标负样本外的未标记样本得到合理有效的利用,另一方面
也可以使得所构建的第二训练样本集更多样化,携带更丰富的信息,从而有利于在后续的模型训练过程中,使得所训练的模型基于多种负样本衡量机制各自对应的第二训练样本集学习到更丰富的知识。
124.当本技术实施例提供的方法用于检测目标账号是否存在异常行为时,除了可以通过上述步骤202和步骤203构建各第一训练样本集和各第二训练样本集外,还可以进一步结合历史信息补充训练样本集的构建方式,使得所构建的训练样本集更加丰富。
125.具体的,在未标记样本为已通过参考验证(如人脸验证)、被识别为使用用户为目标对象的目标账号的特征数据,目标正样本为未通过参考验证、被识别为使用用户并非目标对象的目标账号的特征数据的情况下,服务器可以获取历史正样本和历史负样本,此处的历史正样本为触发过n(n为大于1的整数)次参考验证、且述n次参考验证中均未通过的目标账号的行为特征数据,此处的历史负样本为从未触发过参考验证的目标账号的特征数据;进而,服务器可以基于目标负样本、参考负样本和历史负样本、以及目标正样本、参考正样本和历史正样本,构建第三训练样本集,并且基于历史负样本和历史正样本,构建第四训练样本集。
126.在检测目标账号是否存在异常行为的场景中,服务器会采用特定的检测机制,检测各目标账号的使用行为,若某目标账号被检测机制所命中,则说明该目标账号的实际使用用户一定程度上可能并非其对应的目标对象,此时需要通过参考验证(如人脸验证)对该目标账号的使用用户做进一步的验证。根据业务经验可以发现,对于被检测机制多次命中要求进行参考验证的目标账号而言,若该目标账号的实际使用用户从未通过任何一次参考验证(包括进行参考验证未通过、以及选择跳过参考验证),则说明该目标账号的实际使用用户极有可能并非目标对象,因此,可以将此类目标账号的特征数据视为历史正样本;对于从未被检测机制命中的目标账号,其大概率从未被非目标对象使用过,因此可以将此类目标账号的特征数据视为历史负样本。
127.服务器获取到历史正样本和历史负样本后,可以利用所获取的历史负样本与第二训练样本集中的目标负样本和参考负样本组成负样本集,以及利用所获取历史正样本与第二训练样本集中的目标正样本和参考正样本组成正样本集,进而,利用该负样本集和该正样本集组成第三训练样本集。应理解,在服务器基于多种负样本衡量机制,构建出多种负样本衡量机制各自对应的第二训练样本集的情况下,此时服务器可以利用历史正样本和历史负样本,与每种负样本衡量机制对应的第二训练样本集组合,得到多种负样本衡量机制各自对应的第三训练样本集。此外,服务器还可以单独利用所获取的历史正样本和历史负样本构建第四训练样本集。
128.当然,在实际应用中,服务器还可以利用所获取的历史正样本和历史负样本,与各种负样本衡量机制各自对应的第一训练样本集,得到各种负样本衡量机制各自对应的第五训练样本集。本技术在此不对历史正样本和历史负样本、与基于负样本衡量机制构建的训练样本集的组合方式做任何限定。
129.如此,在检测目标账号是否存在异常行为的场景中,进一步引入可靠的历史信息辅助构建训练样本集,可以使得所构建的用于模型训练的训练样本集更加多样化,从而有利于在模型训练过程中使模型学习到更丰富的知识,提升所训练的模型的性能。
130.步骤204:基于所述第一训练样本集和所述第二训练样本集,训练目标分类模型。
131.服务器通过步骤202构建出第一训练样本集,通过步骤203构建出第二训练样本集后,可以进一步基于所构建的第一训练样本集和第二训练样本集,训练目标分类模型。该目标分类模型是用于针对输入数据,识别其是属于正样本数据、还是属于负样本数据的模型;以本技术实施例提供的方法应用在检测目标账号是否存在异常行为的场景中为例,目标分类模型是用于针对输入的目标账号的特征数据,识别该目标账号的实际使用用户是否为目标对象的模型。
132.在一种可能的实现方式中,服务器具体可以通过以下方式训练目标分类模型:确定用于训练该目标分类模型的各训练样本集,作为基础训练样本集;针对每个基础训练样本集,基于该基础训练样本集,训练该基础训练样本集对应的子分类模型;完成对于各基础训练样本集各自对应的子分类模型的训练后,服务器可以基于标注训练样本,训练该目标分类模型中的融合结构;此处的标注训练样本中包括样本数据及其对应的标注分类结果;目标分类模型中包括融合结构以及各基础训练样本集各自对应的子分类模型,该融合结构用于融合各基础训练样本集各自对应的子分类模型的分类结果。
133.具体的,服务器可以将各用于训练目标分类模型的训练样本集,均视为基础训练样本集。例如,在服务器仅采用一种负样本衡量机制确定各未标记样本各自对应的负样本置信度的情况下,服务器可以构建一个第一训练样本集和一个第二训练样本集,此时服务器可以将该第一训练样本集和第二训练样本集均视为基础训练样本集。又例如,在服务器采用多种负样本衡量机制,确定各未标记样本各自在每种负样本衡量机制下的负样本置信度的情况下,服务器可以构建出多种负样本衡量机制各自对应的第一训练样本集和第二训练样本集,此时服务器可以将多种负样本衡量机制各自对应的第一训练样本集和第二训练样本集,均视为基础训练样本集。再例如,当本技术实施例提供的方法应用在检测目标账号是否存在异常行为的场景中时,服务器还可以结合历史信息,构建各种负样本衡量机制各自对应的第三训练样本集、以及第四训练样本集,此时,服务器可以将多种负样本衡量机制各自对应的第一训练样本集、第二训练样本集和第三训练样本集、以及第四训练样本集,均视为基础训练样本集。总之,所有被用于训练目标分类模型的训练样本集,均可以为视为基础训练样本集。
134.所要训练的目标分类模型包括各基础训练样本集各自对应的子分类模型、以及融合结构;例如,假设服务器通过步骤202和步骤203构建出p(p为大于1的整数)个用于训练目标分类模型的训练样本集,则目标分类模型中应包括p个子分类模型。每个基础训练样本集对应的子分类模型用于针对输入目标分类模型的数据,确定其对应的子分类结果;示例性的,在本技术实施例中,目标分类模型中的各子分类模型可以均为deep fm模型。融合结构用于对各子分类模型各自输出的子分类结果进行融合处理,以得到该目标分类模型输出的分类结果;示例性的,在本技术实施例中,目标分类模型中的融合结构可以为自注意力融合结构,即基于自注意力机制构建的模型结构。
135.图6为本技术实施例提供的目标分类模型的训练过程的实现架构示意图。如图6所示,具体训练目标分类模型时,可以先训练目标分类模型中各基础训练样本集各自对应的子分类模型。具体的,针对每个子分类模型,服务器可以利用该子分类模型对应的基础训练样本集迭代训练该子分类模型,直至该子分类模型满足预设的子分类模型训练结束条件为止;此处的子分类模型训练结束条件例如可以为子分类模型的模型性能满足预设的性能要
求(如分类准确度达到预设的准确度阈值),又例如可以为对于子分类模型的迭代训练次数达到预设次数,本技术在此不做任何限定。
136.完成对于目标分类模型中各基础训练样本集各自对应的子分类模型的训练后,服务器可以固定该目标分类模型中各子分类模型的模型参数,进一步利用标注训练样本训练该目标分类模型中的融合结构。以目标分类模型中的融合结构为自注意力融合结构为例,服务器训练该融合结构时,可以先通过所述目标分类模型中各子分类模型,分别对标注训练样本中的样本数据进行分类处理,得到该样本数据对应的各子分类结果;然后,通过目标分类模型中的自注意力融合结构,融合该样本数据对应的各子分类结果,得到该样本数据对应的预测分类结果;进而,根据该预测分类结果和标注训练样本中的标注分类结果,构建损失函数;并基于该损失函数,调整该自注意力融合结构的模型参数。
137.需要说明的是,标注训练样本是预先构建的专用于训练目标分类模型中的融合结构的训练样本,该标注训练样本中包括样本数据和该样本数据对应的标注分类结果,该标注分类结果是准确的。由于目标分类模型中的融合结构通常是在已训练完成各子分类模型的情况下训练的,并且融合结构的参数较少,因此训练该融合结构时通常不需要使用过多的标注训练样本。仍以本技术实施例提供的方法应用在检测目标账号是否存在异常行为的场景为例,上述标注训练样本可以包括目标账号的特征数据、以及该特征数据对应的标注结果(即表征该目标账号的实际使用用户是否为该目标账号对应的目标对象),该标注结果例如可以通过问卷调查的方式获得(如针对目标网络平台上的部分目标账号,通过问卷调查的方式确定该目标账号的实际使用用户是否被其它非目标对象的对象使用过)。
138.如图6所示,具体训练融合结构时,服务器可以将标注训练样本中的样本数据输入目标分类模型,相应地,目标分类模型中的各子分类模型可以对该样本数据进行分类处理,得到该样本数据对应的各子分类结果;然后,该目标分类模型中的自注意力融合结构,可以基于自注意力机制融合样本数据对应的各子分类结果,得到该样本数据对应的预测分类结果。进而,服务器可以根据该预测分类结果与标注训练样本中的标注分类结果之间的差异,构建损失函数,并以最小化该损失函数为目标,调整目标分类模型中该自注意力融合结构的模型参数。如此,基于不同的标注训练样本重复执行上述过程,直至该目标分类模型满足预设的模型训练结束条件为止;此处的模型训练结束条件例如可以为目标分类模型的模型性能满足预设的性能要求(如目标分类模型的分类准确度达到预设的准确度阈值),又例如可以为对于目标分类模型的迭代训练次数达到预设次数,本技术在此不做任何限定。
139.上述模型训练方法,采用pu learning基于未标记样本和目标正样本训练目标分类模型时,不仅会根据未标记样本集合中各未标记样本各自对应的负样本置信度,从该未标记样本集合中选出目标负样本,利用所选出的目标负样本和已知的目标正样本构建训练样本集;还会根据未标记样本集合中除目标负样本外的未标记样本对应的负样本置信度,对未标记样本集合中剩余的未标记样本进行二轮筛选,以选出对于模型训练具有参考价值的参考负样本和参考正样本,进而利用所选出的参考负样本和此前选出的目标负样本、以及所选出的参考正样本和已知的目标正样本,构建另一训练样本集;最终,利用所构建的两个训练样本集协同训练目标分类模型。如此,对于未标记样本集合中除目标负样本以外的其它未标记样本,实现了充分合理的利用,使得这些未被选出作为目标负样本的未标记样本也可以参与到目标分类模型的训练过程;相应地,在模型训练过程中,可以使所训练的目
标分类模型学习到此类未标记样本中蕴含的关键信息,从而提升所训练的目标分类模型的模型性能,使该目标分类模型能够更全面准确地识别各种输入数据。
140.为了便于理解本技术实施例提供的模型训练方法,下面以该模型训练方法应用在检测未成年人游戏行为的应用场景为例,结合图7所示的实现架构示意图,对该模型训练方法进行整体示例性介绍。
141.目前,一些游戏平台为了防止未成年用户沉迷于游戏,针对未成年游戏账号(即实名注册游戏账号时注册用户的身份为未成年人)设置了防沉迷管控措施,该防沉迷管控措施可以基于未成年用户的年龄、是否节假日等因素综合限制未成年游戏账号的登录时长以及充值金额。然而,一些未成年用户为了避免受到游戏平台所设置的防沉迷管控措施的限制,会借用成年游戏账号(即实名注册游戏账号时注册用户的身份为成年人)进行游戏。
142.游戏平台为了防止未成年用户通过该种方式躲避防沉迷管控措施,会采用特定的检测机制检测各成年游戏账号,以确定各成年游戏账号的风险等级(能够反映其实际使用用户是否为未成年人)。对于风险等级较高的成年游戏账号,服务器可以触发人脸验证机制,要求该成年游戏账号的使用用户进行人脸验证,以确认该游戏账号的使用用户是否为该游戏账号的实名注册用户。对于没有通过人脸验证的游戏账号,服务器可以确认该游戏账号的使用用户为未成年人,采用防沉迷管控措施对该游戏账号进行管控;并且该游戏账号的特征数据(用于反映该游戏账号的使用行为特征)将会被作为目标正样本。对于通过人脸验证的游戏账号,由于该验证结果很有可能是未成年人找成年人代验产生的,因此服务器无法准确地确定该游戏账号的使用用户是否为未成年人,相应地该游戏账号的特征数据将会被作为未标记样本。
143.如图7所示,服务器通过上述方式确定出检测未成年人游戏行为的场景中的未标记样本和目标正样本后,可以引入多种负样本衡量机制,针对各未标记样本确定出其各自在每种负样本衡量机制下的负样本置信度。示例性的,服务器可以采用pu learning中比较成熟的两种半监督算法pu bagging和spy,确定各未标记样本各自在第一半监督机制下的负样本置信度、以及在第二半监督机制下的负样本置信度;服务器可以采用无监督算法kmeans和knn,确定各未标记样本各自在第一无监督机制下的负样本置信度、以及在第二无监督机制下的负样本置信度;服务器还可以采用该场景中的业务规则,根据各未标记样本各自对应的参考特征,确定各未标记样本各自在强规则机制下的负样本置信度。由于基于业务规则确定未标记样本对应的负样本置信度时依据的特征比较单一,与机器学习使用的多特征存在明显的区别,因此加入业务规则确定未标记样本对应的负样本置信度,可以使得后续选出的目标负样本更丰富。
144.服务器确定出各未标记样本各自在每种负样本衡量机制下的负样本置信度后,即可针对每种负样本衡量机制,根据各未标记样本各自在该种负样本衡量机制下的负样本置信度,从各未标记样本中选出目标负样本。在本技术实施例中,还可以进一步借助潜分类特征辅助选取目标负样本;具体的,在实际业务中发现,对于实际使用用户为未成年人的游戏账号和实际使用用户为成年人的游戏账号,在进行人脸验证的过程中所产生的验证行为会存在明显的区别;具体的,在被要求进行人脸验证时,实际使用用户为成年人的游戏账号通常可以快速地通过人脸验证,而实际使用用户为未成年人的游戏账号,由于未成年人需要找其它成年人进行代验,往往需要耗费较长时间才能通过人脸验证;基于此,服务器选择目
标负样本时,还可以基于未标记样本所属的游戏账号通过人脸验证所耗费的时长进行选择。该潜分类特征的引入有助于使得所选择的目标负样本更精准。
145.进而,针对每种负样本衡量机制,服务器可以利用根据各未标记负样本各自在该负样本衡量机制下的负样本置信度选出的目标负样本、以及各目标正样本,组成该种负样本衡量机制对应的第一训练样本集。此外,针对每种负样本衡量机制,服务器还可以确定该负样本衡量机制对应的参考未标记样本集合(其中包括未标记样本集合中除该负样本衡量机制下的目标负样本外的未标记样本),并根据该参考未标记样本集合中各未标记样本各自在该种负样本衡量机制下的负样本置信度,从该参考未标记样本集合中选出参考负样本和参考正样本;进而,利用本次选出的参考负样本和此前选出的目标负样本、以及本次选出的参考负样本和目标正样本,构建该种负样本衡量机制对应的第二训练样本集。
146.此外,服务器还可以引入历史信息补充训练样本集的构建方式,例如,服务器可以将历史上触发过多次人脸验证、且在这多次人脸验证中均未通过的游戏账号的特征数据作为历史正样本,将历史上从未触发过人脸验证的成年游戏账号的特征数据作为历史负样本。进而,针对每种负样本衡量机制,服务器可以构建其对应的三种训练样本集,第一种是上文介绍的由目标负样本和目标正样本组成的第一训练样本集,第二种是上文介绍的由目标负样本和参考负样本、以及目标正样本和参考正样本组成的第二训练样本集,第三种是在第二训练样本集的基础上引入历史正样本和历史负样本;此外,服务器还可以单独利用历史正样本和历史负样本构建第四训练样本集。
147.进而,服务器可以利用上述多种负样本衡量机制各自对应的第一训练样本集、第二训练样本集和第三训练样本集、以及第四训练样本集,进行对于目标分类模型的训练。具体的,服务器可以将用于训练目标分类模型的各训练样本集均视为基础训练样本集,然后,利用每个基础训练样本集训练目标分类模型中其对应的子分类模型;此处基础训练样本集对应的子分类模型具体可以是deep fm模型。完成对于各基础训练样本集各自对应的子分类模型的训练后,服务器可以进一步基于标注训练样本,训练该目标分类模型中的自注意力融合结构;此处的标注训练样本可以包括游戏账号的特征数据、以及该行为特征数据对应的标注结果,该标注结果用于表征该游戏账号的实际使用用户为成年人、还是未成年人,该标注结果例如可以通过问卷调查的方式获得;由于自注意力融合结构的参数量较少,因此仅使用较少量的标注训练样本对其进行训练即可。
148.经本技术发明人实验发现,将本技术实施例提供的方法应用在检测未成年人游戏行为的应用场景中,对于实际使用用户为未成年人的成年游戏账号的识别精度显著提高。具体的,在所训练的目标分类模型中的各子分类模型采用deep fm的情况下,识别精度相比采用单一的logistic regression分类器而言,提高了70.6%。并且,在所采用的模型结构相同的情况下,通过本技术实施例提供的方法训练得到的目标分类模型相比采用传统的pu learning训练得到的分类器,识别精度提高了17.37%。
149.需要说明的是,本技术实施例提供的模型训练方法除了可以应用在上述检测未成年人游戏行为的应用场景中外,还可以应用于其它应用场景。例如,本技术实施例还可以用于针对社交网络平台或者购物网络平台上的目标账号,检测该目标账号的实际使用用户是否为该目标账号对应的目标对象,该目标对象是指目标账号对应的实名注册的合法使用对象。
150.当本技术实施例应用在检测目标账号的实际使用用户是否为该目标账号对应的目标对象的应用场景中时,目标正样本可以为没有通过参考验证、被识别为实际使用用户并非所对应的目标对象的目标账号的特征数据(用于反映目标账号的使用行为特征),未标记样本可以为通过参考验证、被识别为实际使用用户为所对应的目标对象的目标账号的特征数据。
151.针对包括所有未标记样本的未标记样本集合,服务器可以采用上文图2所示实施例介绍的多种负样本衡量机制,针对各未标记样本确定出其各自在每种负样本衡量机制下的负样本置信度;并且,针对每种负样本衡量机制,根据各未标记样本各自在该种负样本衡量机制下的负样本置信度,从各未标记样本中选出目标负样本。此外,在该应用场景中,服务器可以进一步引入未标记样本对应的目标账号通过参考验证所耗费的时长作为潜分类特征,以结合该潜分类特征选择目标负样本。
152.在该应用场景中,服务器构建各种负样本衡量机制各自对应的第一训练样本集和第二训练样本集的方式,与上文介绍的方式相同。在该应用场景中,服务器也可以引入历史信息补充训练样本集的构建方式,具体的,服务器可以将历史上触发过多次参考验证、且在这多次参考验证中均未通过的目标账号的特征数据作为历史正样本,将历史上从未触发过参考验证的目标账号的特征数据作为历史负样本;相类似地,针对每种负样本衡量机制,服务器也可以采用上种应用场景中的训练样本集构建方式,构建对应的三种训练样本集;并且,单独利用历史正样本和历史负样本构建第四训练样本集。在该种应用场景中对于目标分类模型的训练方式,与上种应用场景中的对于目标分类模型的训练方式相类似,此处不再赘述。
153.应理解,本技术实施例除了可以应用在上述两种应用场景中外,也可以应用在其它应用场景,在此不对本技术实施例提供的模型训练方法适用的应用场景做任何限定。
154.针对上文描述的模型训练方法,本技术还提供了对应的模型训练装置,以使上述模型训练方法在实际中得以应用及实现。
155.参见图8,图8是与上文图2所示的模型训练方法对应的一种模型训练装置800的结构示意图。如图8所示,该模型训练装置800包括:
156.置信度确定模块801,用于基于负样本衡量机制,确定未标记样本集合中各未标记样本各自对应的负样本置信度;
157.第一样本集构建模块802,用于根据所述未标记样本集合中各未标记样本各自对应的负样本置信度,从所述未标记样本集合中选出目标负样本;基于所述目标负样本和目标正样本,构建第一训练样本集;
158.第二样本集构建模块803,用于根据参考未标记样本集合中各未标记样本各自对应的负样本置信度,从所述参考未标记样本集合中选出参考正样本和参考负样本,所述参考未标记样本集合包括所述未标记样本集合中除所述目标负样本以外的未标记样本;基于所述目标负样本和所述参考负样本、以及所述目标正样本和所述参考正样本,构建第二训练样本集;
159.模型训练模块804,用于基于所述第一训练样本集和所述第二训练样本集,训练目标分类模型。
160.可选的,在图8所示的模型训练装置的基础上,所述置信度确定模块801具体用于:
基于多种负样本衡量机制,确定所述未标记样本集合中各未标记样本各自在每种所述负样本衡量机制下的负样本置信度;
161.所述第一样本集构建模块802具体用于:针对每种所述负样本衡量机制,基于所述负样本衡量机制下的目标负样本和所述目标正样本,构建所述第一训练样本集;所述负样本衡量机制下的目标负样本,是根据所述未标记样本集合中各未标记样本各自在所述负样本衡量机制下的负样本置信度选出的;
162.所述第二样本集构建模块803具体用于:针对每种所述负样本衡量机制,基于所述负样本衡量机制下的目标负样本、参考负样本和参考正样本、以及所述目标正样本,构建所述第二训练样本集;所述负样本衡量机制下的参考负样本和参考正样本,均是根据所述负样本衡量机制对应的参考未标记样本集合中各未标记样本各自在所述负样本衡量机制下的负样本置信度选出的;所述负样本衡量机制对应的参考未标记样本集合,包括所述未标记样本集合中除所述负样本衡量机制下的目标负样本以外的未标记样本。
163.可选的,在图8所示的模型训练装置的基础上,所述置信度确定模块801具体用于通过以下至少两种方式,确定所述未标记样本集合中各未标记样本各自在每种所述负样本衡量机制下的负样本置信度:
164.基于所述未标记样本集合中的未标记样本以及所述目标正样本,训练半监督分类模型;通过所述半监督分类模型,确定所述未标记样本集合中各未标记样本各自在半监督机制下的负样本置信度;
165.根据所述未标记样本集合中各未标记样本以及各所述目标正样本在特征空间的分布情况,确定所述未标记样本集合中各未标记样本各自在无监督机制下的负样本置信度;
166.获取所述未标记样本集合中各未标记样本各自对应的参考特征;根据目标业务场景下的业务规则、以及所述未标记样本集合中各未标记样本各自对应的参考特征,确定所述未标记样本集合中各未标记样本各自在强规则机制下的负样本置信度;所述目标业务场景是产生所述未标记样本的业务场景。
167.可选的,所述置信度确定模块801具体用于通过以下至少一种方式,确定所述未标记样本集合中各未标记样本各自在半监督机制下的负样本置信度:
168.将所述未标记样本集合划分为m个未标记样本子集合,所述m为大于1的整数;针对每个所述未标记样本子集合,将所述未标记样本子集合包括的未标记样本作为第一模拟负样本,基于所述目标正样本和所述第一模拟负样本,训练所述未标记样本子集合对应的第一半监督分类模型;通过m个所述第一半监督分类模型,确定所述未标记样本集合中各未标记样本各自在第一半监督机制下的负样本置信度;
169.从各所述目标正样本中选出部分所述目标正样本,将所选出的所述目标正样本、以及所述未标记样本集合中的各未标记样本作为第二模拟负样本;基于未选出的所述目标正样本和所述第二模拟负样本,训练第二半监督分类模型;通过所述第二半监督分类模型,确定所述未标记样本集合中各未标记样本各自在第二半监督机制下的负样本置信度。
170.可选的,所述置信度确定模块801具体用于通过以下至少一种方式,确定所述未标记样本集合中各未标记样本各自在无监督机制下的负样本置信度:
171.对所述未标记样本集合中各未标记样本以及各所述目标正样本进行聚类处理,得
到多个聚类簇;针对所述未标记样本集合中每个未标记样本,根据其所属的聚类簇中包括的所述目标正样本的数量,确定所述未标记样本在第一无监督机制下的负样本置信度;
172.针对所述未标记样本集合中每个未标记样本,在特征空间中确定所述未标记样本对应的多个邻近样本;根据所述多个邻近样本中包括的所述目标正样本的数量,确定所述未标记样本在第二无监督机制下的负样本置信度。
173.可选的,当所述未标记样本为已通过参考验证、被识别为使用用户为目标对象的目标账号的特征数据时,所述置信度确定模块801具体用于通过以下方式,确定所述未标记样本集合中各未标记样本各自在强规则机制下的负样本置信度:
174.获取所述未标记样本集合中各未标记样本各自所属的目标账号的历史参考验证次数、以及历史参考验证通过次数中的至少一种;
175.针对所述未标记样本集合中每个未标记样本,根据所述未标记样本所属的目标账号的历史参考验证次数、以及历史参考验证通过次数中的至少一种,确定所述未标记样本在强规则机制下的负样本置信度。
176.可选的,在图8所示的模型训练装置的基础上,参见图9,图9为本技术实施例提供的另一种模型训练装置900的结构示意图。如图9所示,该装置还包括:
177.潜特征获取模块901,用于获取所述未标记样本集合中各未标记样本各自对应的潜分类特征;所述潜分类特征是根据产生所述未标记样本的业务场景确定的;
178.则所述第一样本集构建模块802具体用于:
179.根据所述未标记样本集合中各未标记样本各自对应的负样本置信度以及潜分类特征,从所述未标记样本集合中选出目标负样本。
180.可选的,在图9所示的模型训练装置的基础上,当所述未标记样本为已通过参考验证、被识别为使用用户为目标对象的目标账号的特征数据时,所述潜特征获取模块901具体用于:
181.针对所述未标记样本集合中每个未标记样本,获取所述未标记样本所属的目标账号通过所述参考验证所耗费的时长,作为所述未标记样本对应的潜分类特征。
182.可选的,在图8所示的模型训练装置的基础上,所述未标记样本为已通过参考验证、被识别为使用用户为目标对象的目标账号的特征数据,所述目标正样本为未通过所述参考验证、被识别为使用用户并非目标对象的目标账号的特征数据;参见图10,图10为本技术实施例提供的另一种模型训练装置1000的结构示意图。如图10所示,该装置还包括:
183.历史样本获取模块1001,用于获取历史正样本和历史负样本;所述历史正样本为触发过n次所述参考验证、且在所述n次参考验证中均未通过的目标账号的行为特征数据,所述n为大于1的整数;所述历史负样本为从未触发过所述参考验证的目标账号的特征数据;
184.第三样本集构建模块1002,用于基于所述目标负样本、所述参考负样本和所述历史负样本、以及所述目标正样本、所述参考正样本和所述历史正样本,构建第三训练样本集;
185.第四样本集构建模块1003,用于基于所述历史负样本和所述历史正样本,构建第四训练样本集;
186.则所述模型训练模块804具体用于:基于所述第一训练样本集、所述第二训练样本
集、所述第三训练样本集、和所述第四训练样本集,训练所述目标分类模型。
187.可选的,在图8所示的模型训练装置的基础上,所述模型训练模块804具体用于:
188.确定用于训练所述目标分类模型的各训练样本集,作为基础训练样本集;
189.针对每个所述基础训练样本集,基于所述基础训练样本集,训练所述基础训练样本集对应的子分类模型;
190.完成对于各所述基础训练样本集各自对应的子分类模型的训练后,基于标注训练样本,训练所述目标分类模型中的融合结构;所述标注训练样本中包括样本数据及其对应的标注分类结果;所述目标分类模型中包括所述融合结构以及各所述基础训练样本集各自对应的子分类模型,所述融合结构用于融合各所述基础训练样本集各自对应的子分类模型的分类结果。
191.可选的,所述模型训练模块804具体用于通过以下方式训练所述融合结构:
192.通过所述目标分类模型中各子分类模型,分别对所述标注训练样本中的样本数据进行分类处理,得到所述样本数据对应的各子分类结果;
193.通过所述目标分类模型中的自注意力融合结构,融合所述样本数据对应的各子分类结果,得到所述样本数据对应的预测分类结果;
194.根据所述预测分类结果以及所述标注训练样本中的标注分类结果,构建损失函数;基于所述损失函数,调整所述自注意力融合结构的模型参数。
195.上述模型训练装置,对于未标记样本集合中除目标负样本以外的其它未标记样本,实现了充分合理的利用,使得这些未被选出作为目标负样本的未标记样本也可以参与到目标分类模型的训练过程;相应地,在模型训练过程中,可以使所训练的目标分类模型学习到此类未标记样本中蕴含的关键信息,从而提升所训练的目标分类模型的模型性能,使该目标分类模型能够更全面准确地识别各种输入数据。
196.本技术实施例还提供了一种用于模型训练的计算机设备,该计算机设备具体可以是终端设备或者服务器,下面将从硬件实体化的角度对本技术实施例提供的终端设备和服务器进行介绍。
197.参见图11,图11是本技术实施例提供的终端设备的结构示意图。如图11所示,为了便于说明,仅示出了与本技术实施例相关的部分,具体技术细节未揭示的,请参照本技术实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理、销售终端(point of sales,pos)、车载电脑等任意终端设备,以终端为计算机为例:
198.图11示出的是与本技术实施例提供的终端相关的计算机的部分结构的框图。参考图11,计算机包括:射频(radio frequency,rf)电路1110、存储器1120、输入单元1130(其中包括触控面板1131和其他输入设备1132)、显示单元1140(其中包括显示面板1141)、传感器1150、音频电路1160(其可以连接扬声器1161和传声器1162)、无线保真(wireless fidelity,wifi)模块1170、处理器1180、以及电源1190等部件。本领域技术人员可以理解,图11中示出的计算机结构并不构成对计算机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
199.存储器1120可用于存储软件程序以及模块,处理器1180通过运行存储在存储器1120的软件程序以及模块,从而执行计算机的各种功能应用以及数据处理。存储器1120可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需
的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
200.处理器1180是计算机的控制中心,利用各种接口和线路连接整个计算机的各个部分,通过运行或执行存储在存储器1120内的软件程序和/或模块,以及调用存储在存储器1120内的数据,执行计算机的各种功能和处理数据。可选的,处理器1180可包括一个或多个处理单元;优选的,处理器1180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1180中。
201.在本技术实施例中,该终端所包括的处理器1180还具有以下功能:
202.基于负样本衡量机制,确定未标记样本集合中各未标记样本各自对应的负样本置信度;
203.根据所述未标记样本集合中各未标记样本各自对应的负样本置信度,从所述未标记样本集合中选出目标负样本;基于所述目标负样本和目标正样本,构建第一训练样本集;
204.根据参考未标记样本集合中各未标记样本各自对应的负样本置信度,从所述参考未标记样本集合中选出参考正样本和参考负样本,所述参考未标记样本集合包括所述未标记样本集合中除所述目标负样本以外的未标记样本;基于所述目标负样本和所述参考负样本、以及所述目标正样本和所述参考正样本,构建第二训练样本集;
205.基于所述第一训练样本集和所述第二训练样本集,训练目标分类模型。
206.可选的,所述处理器1180还用于执行本技术实施例提供的模型训练方法的任意一种实现方式的步骤。
207.参见图12,图12为本技术实施例提供的一种服务器1200的结构示意图。该服务器1200可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,cpu)1222(例如,一个或一个以上处理器)和存储器1232,一个或一个以上存储应用程序1242或数据1244的存储介质1230(例如一个或一个以上海量存储设备)。其中,存储器1232和存储介质1230可以是短暂存储或持久存储。存储在存储介质1230的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1222可以设置为与存储介质1230通信,在服务器1200上执行存储介质1230中的一系列指令操作。
208.服务器1200还可以包括一个或一个以上电源1226,一个或一个以上有线或无线网络接口1250,一个或一个以上输入输出接口1258,和/或,一个或一个以上操作系统,例如windows server
tm
,mac os x
tm
,unix
tm
,linux
tm
,freebsd
tm
等等。
209.上述实施例中由服务器所执行的步骤可以基于该图12所示的服务器结构。
210.其中,cpu 1222用于执行如下步骤:
211.基于负样本衡量机制,确定未标记样本集合中各未标记样本各自对应的负样本置信度;
212.根据所述未标记样本集合中各未标记样本各自对应的负样本置信度,从所述未标记样本集合中选出目标负样本;基于所述目标负样本和目标正样本,构建第一训练样本集;
213.根据参考未标记样本集合中各未标记样本各自对应的负样本置信度,从所述参考未标记样本集合中选出参考正样本和参考负样本,所述参考未标记样本集合包括所述未标记样本集合中除所述目标负样本以外的未标记样本;基于所述目标负样本和所述参考负样本、以及所述目标正样本和所述参考正样本,构建第二训练样本集;
214.基于所述第一训练样本集和所述第二训练样本集,训练目标分类模型。
215.可选的,cpu 1222还可以用于执行本技术实施例提供的模型训练方法的任意一种实现方式的步骤。
216.本技术实施例还提供一种计算机可读存储介质,用于存储计算机程序,该计算机程序用于执行前述各个实施例所述的一种模型训练方法中的任意一种实施方式。
217.本技术实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前述各个实施例所述的一种模型训练方法中的任意一种实施方式。
218.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
219.在本技术所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
220.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
221.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
222.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(英文全称:read-only memory,英文缩写:rom)、随机存取存储器(英文全称:randomaccess memory,英文缩写:ram)、磁碟或者光盘等各种可以存储计算机程序的介质。
223.应当理解,在本技术中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字
符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
224.以上所述,以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献