一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于模型训练的样本的处理方法和装置、电子设备与流程

2022-06-01 02:26:02 来源:中国专利 TAG:


1.本技术涉及数据处理技术领域,尤其涉及一种用于模型训练的样本的处理方法和装置、电子设备及计算机可读存储介质。


背景技术:

2.网销订单中最核心的价值模型预测体系需要一批包含特征和标签结果的样本集对价值预测模型进行训练,进而可以利用训练后的价值预测模型进行价值参数的预测。一个样本事件初始生成后,允许一段时间作为生命周期作为正向结果出现的等待期。比如外呼话务员初次拨打外呼用户,此时网销订单激活,在之后的完整生命周期(如30天或45天等)内,如果订单结果出现正向结果,即订单完成转化或订单成单,则该订单为正样本且样本标签结果为正向,而负向结果(即订单未完成转化或订单未成单)只有当完整生命周期结束后才能真正确定。
3.在现有的样本标签结果定义方案中,具体是:1)统一取订单激活7天内的标签结果进行模型训练。即7天内结果正向即为正样本,未出结果为负样本。7天过后的生命周期内的结果舍弃。2)样本在7天内任一天确定为正向结果均作为一致的正样本,7天过后未出结果均作为一致的负样本。
4.现有的样本标签结果定义方案存在这些不足:1)取7天作为样本结果确定的期限,即价值预测模型只能用7天之前的订单样本数据。最近7天的订单样本往往包含着最新的用户价值走向,却不能被价值模型学习到,极大的影响了模型的快速响应能力。2)如果订单完整生命周期为45天,7天之后的生命周期内也会有部分订单出现正向结果。这部分订单的正样本不能被价值模型学习到,影响模型的泛化能力及准确性。3)7天内任一天出现正向结果的样本均为一致性地正样本,但第1天即确定正向结果的样本与第7天确定正向结果的样本明显是不同的,统一对待会影响模型的准确性。因此,亟需解决这一技术问题。


技术实现要素:

5.鉴于上述问题,提出了本技术以便提供一种克服上述问题或者至少部分地解决上述问题的用于模型训练的样本的处理方法和装置、电子设备及计算机可读存储介质,能够实现网销订单激活后订单完整生命周期内不同时间确定的订单结果,也即标签结果均可引入到模型训练体系中,在保持样本均衡下提升模型对新特征、新结果的响应能力。所述技术方案如下:
6.第一方面,提供了一种用于模型训练的样本的处理方法,包括:
7.获取待用于模型训练的多个原始样本中已激活且已完成完整生命周期的订单数据;
8.根据所述多个原始样本中已激活且已完成完整生命周期的订单数据,统计距离订单激活日不同天数时已确定正向结果的订单数量;
9.基于统计的距离订单激活日不同天数时已确定正向结果的订单数量,确定所述多
个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重;
10.将带权重的正样本和带权重的负样本作为处理后的训练样本对所述模型进行训练。
11.在一种可能的实现方式中,所述基于统计的距离订单激活日不同天数时已确定正向结果的订单数量,确定所述多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重,包括:
12.基于统计的距离订单激活日n天时已确定正向结果的订单数量,拟合出表示距离订单激活日n天时已确定正向结果的订单数量与距离订单激活日n天的关系的成单量增长函数;其中n为大于或等于零的整数;
13.定义前n天总成单量的信息量与完成完整生命周期总成单量的信息量等价,则第n天的成单量的权重与前n天总成单量成反比;
14.定义完整生命周期最后一天的成单的权重为预设值,则第n天的成单的权重为预设值乘以完成完整生命周期总成单量,然后比上前n天总成单量;
15.根据所述成单量增长函数和定义的所述第n天的成单的权重,得到所述第n天的成单的权重数值;
16.根据所述第n天的成单的权重数值随着n的变化情况进行函数拟合,得到正样本的权重拟合函数;
17.利用所述正样本的权重拟合函数,确定所述多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重。
18.在一种可能的实现方式中,根据所述第n天的成单的权重数值随着n的变化情况进行函数拟合,得到正样本的权重拟合函数,包括:
19.利用完整生命周期将天数n进行归一化处理,根据所述第n天的成单的权重数值随着n的变化情况进行函数拟合,得到正样本的权重拟合函数。
20.在一种可能的实现方式中,利用所述正样本的权重拟合函数,确定所述多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重,包括:
21.利用完整生命周期对所述正样本的权重拟合函数进行去归一化处理,得到与正向结果确定日距离订单激活日的天数n相关的正样本的权重拟合函数;
22.利用与正向结果确定日距离订单激活日的天数n相关的正样本的权重拟合函数,确定所述多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重。
23.在一种可能的实现方式中,根据所述第n天的成单的权重数值随着n的变化情况进行函数拟合,得到正样本的权重拟合函数,包括:
24.根据所述第n天的成单的权重数值随着n的变化情况进行对数函数拟合,得到正样本的权重拟合函数。
25.在一种可能的实现方式中,利用所述正样本的权重拟合函数,确定所述多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重,包括:
26.利用所述正样本的权重拟合函数确定所述多个原始样本中已确定正向结果的正样本的权重;
27.利用所述正样本的权重拟合函数的倒数确定所述多个原始样本中已确定负向结
果的负样本的权重。
28.在一种可能的实现方式中,利用所述正样本的权重拟合函数的倒数确定所述多个原始样本中已确定负向结果的负样本的权重,包括:
29.若所述多个原始样本中已确定负向结果的负样本已完成完整生命周期,则确定已完成完整生命周期的负样本的权重为所述预设值。
30.第二方面,提供了一种用于模型训练的样本的处理装置,包括:
31.获取模块,用于获取待用于模型训练的多个原始样本中已激活且已完成完整生命周期的订单数据;
32.统计模块,用于根据所述多个原始样本中已激活且已完成完整生命周期的订单数据,统计距离订单激活日不同天数时已确定正向结果的订单数量;
33.确定模块,用于基于统计的距离订单激活日不同天数时已确定正向结果的订单数量,确定所述多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重;
34.训练模块,用于将带权重的正样本和带权重的负样本作为处理后的训练样本对所述模型进行训练。
35.在一种可能的实现方式中,所述确定模块还用于:
36.基于统计的距离订单激活日n天时已确定正向结果的订单数量,拟合出表示距离订单激活日n天时已确定正向结果的订单数量与距离订单激活日n天的关系的成单量增长函数;其中n为大于或等于零的整数;
37.定义前n天总成单量的信息量与完成完整生命周期总成单量的信息量等价,则第n天的成单量的权重与前n天总成单量成反比;
38.定义完整生命周期最后一天的成单的权重为预设值,则第n天的成单的权重为预设值乘以完成完整生命周期总成单量,然后比上前n天总成单量;
39.根据所述成单量增长函数和定义的所述第n天的成单的权重,得到所述第n天的成单的权重数值;
40.根据所述第n天的成单的权重数值随着n的变化情况进行函数拟合,得到正样本的权重拟合函数;
41.利用所述正样本的权重拟合函数,确定所述多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重。
42.在一种可能的实现方式中,所述确定模块还用于:
43.利用完整生命周期将天数n进行归一化处理,根据所述第n天的成单的权重数值随着n的变化情况进行函数拟合,得到正样本的权重拟合函数。
44.在一种可能的实现方式中,所述确定模块还用于:
45.利用完整生命周期对所述正样本的权重拟合函数进行去归一化处理,得到与正向结果确定日距离订单激活日的天数n相关的正样本的权重拟合函数;
46.利用与正向结果确定日距离订单激活日的天数n相关的正样本的权重拟合函数,确定所述多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重。
47.在一种可能的实现方式中,所述确定模块还用于:
48.根据所述第n天的成单的权重数值随着n的变化情况进行对数函数拟合,得到正样本的权重拟合函数。
49.在一种可能的实现方式中,所述确定模块还用于:
50.利用所述正样本的权重拟合函数确定所述多个原始样本中已确定正向结果的正样本的权重;
51.利用所述正样本的权重拟合函数的倒数确定所述多个原始样本中已确定负向结果的负样本的权重。
52.在一种可能的实现方式中,所述确定模块还用于:
53.若所述多个原始样本中已确定负向结果的负样本已完成完整生命周期,则确定已完成完整生命周期的负样本的权重为所述预设值。
54.第三方面,提供了一种电子设备,该电子设备包括处理器和存储器,其中,所述存储器中存储有计算机程序,所述处理器被配置为运行所述计算机程序以执行上述任一项所述的用于模型训练的样本的处理方法。
55.第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被配置为运行时执行上述任一项所述的用于模型训练的样本的处理方法。
56.借由上述技术方案,本技术实施例提供的用于模型训练的样本的处理方法和装置、电子设备及计算机可读存储介质,可以获取待用于模型训练的多个原始样本中已激活且已完成完整生命周期的订单数据;根据多个原始样本中已激活且已完成完整生命周期的订单数据,统计距离订单激活日不同天数时已确定正向结果的订单数量;随后基于统计的距离订单激活日不同天数时已确定正向结果的订单数量,确定多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重;之后将带权重的正样本和带权重的负样本作为处理后的训练样本对模型进行训练。可以看到,本技术实施例通过对正样本和负样本的权重处理的方法,使得将所有已知样本的标签结果均可应用到模型训练中去,首先扩大了可用样本数量,尤其是最新样本的引入显著提升了模型对新特征的响应能力;其次,对距离订单激活日不同天数的正样本或负样本赋予不同的权重,强化了样本的价值特性。加入上述处理的权重后,训练产生的价值预测模型,可以更新客户关系管理系统用户价值评估模块,在相应的销售模块下,提升了外呼的效率和订单转化率,同时模型生命周期显著延长,降低了维护成本。
附图说明
57.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例描述中所需要使用的附图作简单地介绍。
58.图1示出了根据本技术实施例提供的用于模型训练的样本的处理方法的流程图;
59.图2示出了根据本技术实施例提供的拟合出的成单量增长函数的示意图;
60.图3示出了根据本技术实施例提供的权重拟合函数的示意图;
61.图4示出了根据本技术实施例提供的用于模型训练的样本的处理装置的结构图。
具体实施方式
62.下面将参照附图更详细地描述本技术的示例性实施例。虽然附图中显示了本技术的示例性实施例,然而应当理解,可以以各种形式实现本技术而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本技术,并且能够将本技术的范围完整的传达给本领域的技术人员。
63.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”及其变体要被解读为意味着“包括但不限于”的开放式术语。
64.本技术实施例提供了一种用于模型训练的样本的处理方法,可以应用在服务器或个人电脑等电子设备上。如图1所示,该用于模型训练的样本的处理方法具体可以包括以下步骤s101至s104:
65.步骤s101,获取待用于模型训练的多个原始样本中已激活且已完成完整生命周期的订单数据;
66.步骤s102,根据多个原始样本中已激活且已完成完整生命周期的订单数据,统计距离订单激活日不同天数时已确定正向结果的订单数量;
67.步骤s103,基于统计的距离订单激活日不同天数时已确定正向结果的订单数量,确定多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重;
68.步骤s104,将带权重的正样本和带权重的负样本作为处理后的训练样本对模型进行训练。
69.本技术实施例获取待用于模型训练的多个原始样本中已激活且已完成完整生命周期的订单数据;根据多个原始样本中已激活且已完成完整生命周期的订单数据,统计距离订单激活日不同天数时已确定正向结果的订单数量;随后基于统计的距离订单激活日不同天数时已确定正向结果的订单数量,确定多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重;之后将带权重的正样本和带权重的负样本作为处理后的训练样本对模型进行训练。可以看到,本技术实施例通过对正样本和负样本的权重处理的方法,使得将所有已知样本的标签结果均可应用到模型训练中去,首先扩大了可用样本数量,尤其是最新样本的引入显著提升了模型对新特征的响应能力;其次,对距离订单激活日不同天数的正样本或负样本赋予不同的权重,强化了样本的价值特性。加入上述处理的权重后,训练产生的价值预测模型,可以更新客户关系管理系统用户价值评估模块,在相应的销售模块下,提升了外呼的效率和订单转化率,同时模型生命周期显著延长,降低了维护成本。
70.上文步骤s101提及的多个原始样本中可以包括已激活且已完成完整生命周期的订单数据,还可以包括已激活且未完成完整生命周期的订单数据等。例如外呼话务员初次拨打外呼用户,此时订单激活,从订单激活日到完整生命周期日则完成整个完整生命周期。这里的完整生命周期可以根据实际业务需求来设置,如完整生命周期设置为30天或45天等,本技术实施例对此不作限制。此外,这里的外呼用户可以是对保险服务、房产服务、汽车
服务、课程服务等可能存在需求的用户。
71.如背景技术部分介绍,在之后的完整生命周期内,如果订单结果出现正向结果,即订单完成转化或订单成单,则该订单为正样本且样本标签结果为正向,而负向结果(即订单未完成转化或订单未成单)只有当完整生命周期结束后才能真正确定。本技术实施例对于已激活且未完成完整生命周期的订单数据,如果订单结果是正向结果,则该订单为正样本;如果订单结果不是正向结果,则确定订单结果为负向结果,该订单为负样本。
72.上文步骤s102中提及的已确定正向结果的订单数量,即是完成转化或成单的订单数量。统计距离订单激活日不同天数时已确定正向结果的订单数量,例如统计距离订单激活日0天时已确定正向结果的订单数量,即统计订单激活日当天已确定正向结果的订单数量;又如统计距离订单激活日1天时已确定正向结果的订单数量,即统计订单激活日第二天已确定正向结果的订单数量;再如统计距离订单激活日44天时已确定正向结果的订单数量等等。需要说明的是,此处例举仅是示意性的,并不对本技术实施例进行限制。
73.本技术实施例中提供了一种可能的实现方式,上文步骤s103基于统计的距离订单激活日不同天数时已确定正向结果的订单数量,确定多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重,具体可以包括以下步骤a1至a6:
74.步骤a1,基于统计的距离订单激活日n天时已确定正向结果的订单数量,拟合出表示距离订单激活日n天时已确定正向结果的订单数量与距离订单激活日n天的关系的成单量增长函数;其中n为大于或等于零的整数;
75.步骤a2,定义前n天总成单量的信息量与完成完整生命周期总成单量的信息量等价,则第n天的成单量的权重与前n天总成单量成反比;
76.步骤a3,定义完整生命周期最后一天的成单的权重为预设值,则第n天的成单的权重为预设值乘以完成完整生命周期总成单量,然后比上前n天总成单量;
77.步骤a4,根据成单量增长函数和定义的第n天的成单的权重,得到第n天的成单的权重数值;
78.步骤a5,根据第n天的成单的权重数值随着n的变化情况进行函数拟合,得到正样本的权重拟合函数;
79.步骤a6,利用正样本的权重拟合函数,确定多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重。
80.上面步骤a3提及的预设值可以是1或2等,可以根据实际需求来设置,本技术实施例对此不作限制。
81.本技术实施例可以搜集到适用于模型训练的所有历史样本数据,即已激活而不论是否已完成完整生命周期的订单数据。从已经完成完整生命周期的样本中统计出订单标签产生的时间周期规律,用于计算未完成完整生命周期的订单的负样本的权重,已确定出现正向结果的正样本的权重。这样利用正样本的权重拟合函数,确定多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重,可以提高模型的准确性。
82.本技术实施例中提供了一种可能的实现方式,上文步骤a5根据第n天的成单的权重数值随着n的变化情况进行函数拟合,得到正样本的权重拟合函数,具体可以是利用完整生命周期将天数n进行归一化处理,根据第n天的成单的权重数值随着n的变化情况进行函数拟合,得到正样本的权重拟合函数。这样,得到的正样本的权重拟合函数不会受到具体的
完整生命周期的影响,可以应用到具有一定规律的样本训练的权重设置中,其样本规律表现为样本特征确定后,样本标签会在后续一定时间周期内以一种随时间衰减规律陆续确定。
83.本技术实施例中提供了一种可能的实现方式,上文步骤a6利用正样本的权重拟合函数,确定多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重,具体可以包括以下步骤a6-1至a6-2:
84.步骤a6-1,利用完整生命周期对正样本的权重拟合函数进行去归一化处理,得到与正向结果确定日距离订单激活日的天数n相关的正样本的权重拟合函数;
85.步骤a6-2,利用与正向结果确定日距离订单激活日的天数n相关的正样本的权重拟合函数,确定多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重。
86.在上面的实施例中,利用完整生命周期将天数n进行归一化处理,根据第n天的成单的权重数值随着n的变化情况进行函数拟合,得到的正样本的权重拟合函数不会受到具体的完整生命周期的影响,这样在具体使用时可以利用完整生命周期对正样本的权重拟合函数进行去归一化处理,得到与正向结果确定日距离订单激活日的天数n相关的正样本的权重拟合函数,进而利用与正向结果确定日距离订单激活日的天数n相关的正样本的权重拟合函数,确定多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重。
87.本技术实施例中提供了一种可能的实现方式,上文步骤a5根据第n天的成单的权重数值随着n的变化情况进行函数拟合,得到正样本的权重拟合函数,具体可以是根据第n天的成单的权重数值随着n的变化情况进行对数函数拟合,得到正样本的权重拟合函数。这里,对数函数满足第n天的成单的权重数值随着n的变化的特点,根据第n天的成单的权重数值随着n的变化情况进行对数函数拟合得到正样本的权重拟合函数,可以提高函数拟合的准确性。
88.本技术实施例中提供了一种可能的实现方式,上文步骤a6利用正样本的权重拟合函数,确定多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重,具体可以包括以下步骤a6-3至a6-4:
89.步骤a6-3,利用正样本的权重拟合函数确定多个原始样本中已确定正向结果的正样本的权重;
90.步骤a6-4,利用正样本的权重拟合函数的倒数确定多个原始样本中已确定负向结果的负样本的权重。
91.本技术实施例使用已完成完整生命周期的数据拟合权重衰减系数,进而实现还未完成完整生命周期的样本通过权重衰减系数倒数的形式设为带权重的负向样本进行模型训练,通过对正样本和负样本的权重处理的方法,使得将所有已知样本的标签结果均可应用到模型训练中去,扩大了可用样本数量,尤其是最新样本的引入显著提升了模型对新特征的响应能力。
92.本技术实施例中提供了一种可能的实现方式,上文步骤a6-4利用正样本的权重拟合函数的倒数确定多个原始样本中已确定负向结果的负样本的权重,具体可以是若多个原始样本中已确定负向结果的负样本已完成完整生命周期,则确定已完成完整生命周期的负
0.4lg(day 0.1) 2.6,其中day为正向结果确定日距离该订单激活日的天数n;对于已完成整个完整生命周期的负样本,该负样本的权重为1;对于未完成整个完整生命周期的样本,如果样本结果不是正向结果,则确定样本结果为负向结果,进而确定该样本为负样本,该负样本的权重为w=1/w(day)。
103.本技术实施例中对样本标签权重处理方法的应用,使得可以将所有已知样本的标签均可应用到价值预测模型中去,首先扩大了可用样本数量,尤其是最新样本的引入显著提升了模型对新特征的响应能力;其次,对距离订单激活日不同天数的正向样本赋予不同的权重,强化了样本的价值特性。加入上述处理的权重后,训练产生的价值预测模型,可以更新crm(customer relationship management,客户关系管理)系统用户价值评估模块,在相应的销售模块下,提升了外呼用户的成单率,同时模型生命周期显著延长,降低了维护成本。
104.本技术实施例对于在网销体系中样本特征产生后,标签结果需要一定时间作为生命周期等待的场景,使用已完成生命周期的数据拟合权重衰减系数,进而实现还未完成生命周期的样本通过权重衰减系数倒数的形式设为带权重的负向样本进行模型训练。本技术实施例的技术方案可以应用到具有一定规律的样本训练的权重设置中,其样本规律表现为样本特征确定后,样本标签会在后续一定时间周期内以一种随时间衰减规律陆续确定。其时间衰减函数以及衰减样本数据需根据实际业务场景进行调整。
105.需要说明的是,实际应用中,上述所有可能的实施方式可以采用结合的方式任意组合,形成本技术的可能的实施例,在此不再一一赘述。
106.基于上文各个实施例提供的用于模型训练的样本的处理方法,基于同一发明构思,本技术实施例还提供了一种用于模型训练的样本的处理装置。
107.图4示出了本技术实施例提供的用于模型训练的样本的处理装置的结构图。如图4所示,该用于模型训练的样本的处理装置可以包括获取模块410、统计模块420、确定模块430以及训练模块440。
108.获取模块410,用于获取待用于模型训练的多个原始样本中已激活且已完成完整生命周期的订单数据;
109.统计模块420,用于根据多个原始样本中已激活且已完成完整生命周期的订单数据,统计距离订单激活日不同天数时已确定正向结果的订单数量;
110.确定模块430,用于基于统计的距离订单激活日不同天数时已确定正向结果的订单数量,确定多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重;
111.训练模块440,用于将带权重的正样本和带权重的负样本作为处理后的训练样本对模型进行训练。
112.本技术实施例中提供了一种可能的实现方式,上文图4展示的确定模块430还用于:
113.基于统计的距离订单激活日n天时已确定正向结果的订单数量,拟合出表示距离订单激活日n天时已确定正向结果的订单数量与距离订单激活日n天的关系的成单量增长函数;其中n为大于或等于零的整数;
114.定义前n天总成单量的信息量与完成完整生命周期总成单量的信息量等价,则第n
天的成单量的权重与前n天总成单量成反比;
115.定义完整生命周期最后一天的成单的权重为预设值,则第n天的成单的权重为预设值乘以完成完整生命周期总成单量,然后比上前n天总成单量;
116.根据成单量增长函数和定义的第n天的成单的权重,得到第n天的成单的权重数值;
117.根据第n天的成单的权重数值随着n的变化情况进行函数拟合,得到正样本的权重拟合函数;
118.利用正样本的权重拟合函数,确定多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重。
119.本技术实施例中提供了一种可能的实现方式,上文图4展示的确定模块430还用于:
120.利用完整生命周期将天数n进行归一化处理,根据第n天的成单的权重数值随着n的变化情况进行函数拟合,得到正样本的权重拟合函数。
121.本技术实施例中提供了一种可能的实现方式,上文图4展示的确定模块430还用于:
122.利用完整生命周期对正样本的权重拟合函数进行去归一化处理,得到与正向结果确定日距离订单激活日的天数n相关的正样本的权重拟合函数;
123.利用与正向结果确定日距离订单激活日的天数n相关的正样本的权重拟合函数,确定多个原始样本中已确定正向结果的正样本的权重以及已确定负向结果的负样本的权重。
124.本技术实施例中提供了一种可能的实现方式,上文图4展示的确定模块430还用于:
125.根据第n天的成单的权重数值随着n的变化情况进行对数函数拟合,得到正样本的权重拟合函数。
126.本技术实施例中提供了一种可能的实现方式,上文图4展示的确定模块430还用于:
127.利用正样本的权重拟合函数确定多个原始样本中已确定正向结果的正样本的权重;
128.利用正样本的权重拟合函数的倒数确定多个原始样本中已确定负向结果的负样本的权重。
129.本技术实施例中提供了一种可能的实现方式,上文图4展示的确定模块430还用于:
130.若多个原始样本中已确定负向结果的负样本已完成完整生命周期,则确定已完成完整生命周期的负样本的权重为预设值。
131.基于同一发明构思,本技术实施例还提供了一种电子设备,包括处理器和存储器,存储器中存储有计算机程序,处理器被设置为运行计算机程序以执行上述任意一个实施例的用于模型训练的样本的处理方法。
132.基于同一发明构思,本技术实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述任意一个
实施例的用于模型训练的样本的处理方法。
133.所属领域的技术人员可以清楚地了解到,上述描述的系统、装置、模块的具体工作过程,可以参考前述方法实施例中的对应过程,为简洁起见,在此不另赘述。
134.本领域普通技术人员可以理解:本技术的技术方案本质上或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,其包括若干程序指令,用以使得一电子设备(例如个人计算机,服务器,或者网络设备等)在运行所述程序指令时执行本技术各实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom)、随机存取存储器(ram)、磁碟或者光盘等各种可以存储程序代码的介质。
135.或者,实现前述方法实施例的全部或部分步骤可以通过程序指令相关的硬件(诸如个人计算机,服务器,或者网络设备等的电子设备)来完成,所述程序指令可以存储于一计算机可读取存储介质中,当所述程序指令被电子设备的处理器执行时,所述电子设备执行本技术各实施例所述方法的全部或部分步骤。
136.以上各实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述各实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:在本技术的精神和原则之内,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案脱离本技术的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献