模型训练方法、装置、存储介质及终端与流程

2022-11-24 12:15:04 来源：中国专利 TAG：

1.本技术涉及人工智能技术领域，具体涉及一种模型训练方法、装置、存储介质及终端。

背景技术：

2.在互联网时代，随着信息的爆炸性增长以及电子商务规模的逐渐扩大，信息和商品的个数和种类快速增长，用户需要花费大量的时间才能找到自己想要查阅的信息以及想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。推荐系统可以根据用户的相关信息以及用户的历史行为向用户推荐用户感兴趣的信息和商品，大大提升了用户查找到需要的信息或商品的效率。
3.然而，目前对推荐系统中推荐模型进行训练的样本数据的分布存在着长尾现象，低活跃度的用户和低活跃度的对象占比较大。同时基于离散化身份标识符(identity document，id)(包括用户id以及对象id)构建特征的范式成为主流，id之间的交叉特征使得模型空间巨大且高度稀疏，进而导致模型容易过拟合，即记忆能力过剩和泛化能力不足，使得训练得到的推荐模型在实际场景中使用时的准确性较低。

技术实现要素：

4.本技术提供了一种模型训练方法、装置、存储介质及终端，该方法能够提升推荐系统中推荐模型的准确性。
5.第一方面，本技术提供一种模型训练方法，方法包括：
6.获取训练样本数据集合，所述训练样本数据集合中的训练样本数据包括用户数据、对象数据以及对应的标签数据；
7.在模型训练过程中，基于计数损失函数，对训练样本数据中的用户数据以及对象数据进行实时计数；
8.基于对所述用户数据以及所述对象数据的实时计数数值计算正则损失；
9.根据所述正则损失调整所述模型的训练过程中的损失函数，并基于调整后的损失函数对所述模型进行训练。
10.相应地，本技术第二方面提供一种模型训练装置，装置包括：
11.获取模块，用于获取训练样本数据集合，所述训练样本数据集合中的训练样本数据包括用户数据、对象数据以及对应的标签数据；
12.计数模块，用于在模型训练过程中，基于计数损失函数，对训练样本数据中的用户数据以及对象数据进行实时计数；
13.计算模块，用于基于对所述用户数据以及所述对象数据的实时计数数值计算正则损失；
14.训练模块，用于根据所述正则损失调整所述模型的训练过程中的损失函数，并基于调整后的损失函数对所述模型进行训练。
15.第三方面，本技术提供了一种存储介质，其上存储有计算机程序，当该计算机程序被电子设备的处理器加载时执行如本技术提供的任一模型训练方法中的步骤。
16.第四方面，本技术还提供了一种电子设备，该电子设备包括处理器和存储器，存储器储存有计算机程序，处理器通过加载存储器储存的计算机程序执行如本技术提供的任一模型训练方法中的步骤。
17.采用本技术所提供的技术方案，即获取训练样本数据集合，训练样本数据集合中的训练样本数据包括用户数据、对象数据以及对应的标签数据；在模型训练过程中，基于计数损失函数，对训练样本数据中的用户数据以及对象数据进行实时计数；基于对用户数据以及对象数据的实时计数数值计算正则损失；根据正则损失调整模型的训练过程中的损失函数，并基于调整后的损失函数对模型进行训练。以此，通过设计计数损失函数将对用户数据和对象数据进行频次统计集成到模型中，实现对用户数据和对象数据的流式计数。然后基于计数数值确定正则损失并基于正则损失对模型损失函数进行调整，可以有效避免模型训练过程中的过拟合现象，进而提升了训练得到的模型的准确性。
附图说明
18.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
19.图1是本技术实施例提供的模型训练方法的一流程示意图。
20.图2是本技术实施例提供的模型训练方法的另一流程示意图。
21.图3是本技术实施例提供的模型训练装置的结构框图。
22.图4是本技术实施例提供的终端的结构框图。
具体实施方式
23.应当说明的是，本技术中的术语“第一”、“第二”和“第三”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块，而是某些实施例还包括没有列出的步骤或模块，或某些实施例还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
24.在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。
25.本技术实施例提供一种模型训练方法、装置、存储介质及终端，其中模型训练方法的执行主体可以是本技术实施例提供的模型训练装置，或者集成了该模型训练装置的电子设备，其中该模型训练装置可以采用硬件或者软件的方式实现。其中，电子设备可以是终端或服务器。其中，该终端可以为智能手机、平板、车载终端、智能穿戴式设备或者个人电脑等。服务器可以为实体服务器也可以为云服务器。
26.请参照图1，图1为本技术实施例提供的模型训练方法的流程示意图，如图1所示，本技术实施例提供的模型训练方法的流程可以如下：
27.在110中，获取训练样本数据集合，训练样本数据集合中的训练样本数据包括用户数据、对象数据以及对应的标签数据。
28.其中，本技术提供的模型训练方法具体可以应用于对推荐系统中的推荐模型进行训练的过程，以提高推荐模型对用户点击情况预测的准确性。
29.在相关技术中，推荐系统领域的数据分布往往处于高度长尾的状态，不同的用户产生的行为数据(包括曝光数据和点击数据)的数据量方差极大。同时，模型引入了用户id以及对象(商品或信息)id等离散化id，导致模型空间进一步膨胀。基于上述背景中训练数据的分布情况以及特征的处理方式，会导致模型在训练的过程中容易出现过拟合的情况。即导致训练得到的模型的记忆能力过剩且泛化能力不足，进而导致模型的预测准确性下降。
30.为了缓解模型训练过程中出现的过拟合问题，业界提出了几种解决方案，例如按照一定概率随机隐藏部分网络的激活来缓解过拟合的dropout方案、通过对模型训练时的损失函数增加l1/l2正则项来抑制网络即嵌入层的参数学习来达到缓解过拟合效果的l1/l2正则方案、通过预先对每个id出现的频次进行预先统计，然后通过频次的倒数对每个id特征l1/l2正则项的强弱控制来缓解过拟合问题的自适应正则(adaptive regularization)方案。上述方案虽然可以在一定程度上缓解模型训练过程中的过拟合问题，然而各自也都存在其对应的技术缺陷，例如dropout方案、l1/l2正则方案缺少对id的频次建模，没有考虑训练样本数据原始的长尾分布特点，对于不同的训练样本数据使用了统一的正则系数，如此对于高频的id特征会抑制其学习能力，使得训练得到的模型对高频id的预测结果准确性下降。自适应正则虽然考虑了每个id的出现频次，但其对训练样本数据中id的频次统计是在模型训练前进行的离线统计，该过程会额外增加模型训练前的预处理耗时。而且在具体实践中，模型训练的实时性对模型训练的效果也至关重要，如何提高模型训练的实时性，缩短从数据处理到模型最终上限的时间也是目前业界的重点研究方向。自适应正则的离线统计训练样本数据中id的频次显然也会降低模型训练的实时性。此外，离线统计的id频次在模型训练的过程中始终固定不变，使得计算得到的自适应正则系数在模型训练过程中也保持不变，如此便使得模型无法感知某段时间id频次可能发生的变更。
31.为解决上述自适应正则方案在模型训练前进行离线统计id频次，使得模型训练的实时性下降且无法感知模型训练过程中可能发生的id频次变更导致训练得到的模型的准确性不足的问题，本技术提供了一种模型训练方法，以期能够提升推荐系统中的推荐模型对用户点击率预测的预测准确性。下面对本技术提供的模型训练方法进行详细的介绍。
32.首先，获取训练样本数据集，训练样本数据集为用于对推荐系统中的推荐模型进行训练的训练样本数据的集合。对于该集合中的每一个元素，即一组训练样本数据，都包含了用户数据、对象数据以及标签数据。其中用户数据具体为该训练样本数据对应的用户的相关数据，例如用户的身份标识号(identity document，id)、用户名等数据。对象数据包括向用户推荐的对象的相关数据，此处对象可以为商品、视频、图片或者资讯等，对象数据可以为对象的id、对象类型、对象内容等具体的数据。其中，在本技术实施例中，用户id和对象id可以理解为用户和对象在推荐系统中的唯一标识。例如，在一组训练样本数据中，可以包
括一个用户的用户数据以及一个对象的对象数据。此处的用户id和对象id只是两个示例，在其他的一些实施例中，训练样本数据中也可以包含其他类别的id。其中，标签数据可以为0或者1，该标签数据具体可以指示用户对某一对象的行为数据，例如用户对某一对象具有点击行为、观看行为或者购买行为等行为信息，则可以确定该训练样本数据的标签数据为1，如果用户对某一对象只有曝光行为而没有点击行为，则可以确定其标签数据为0。当训练样本数据的标签数据为1时，则可以确定其为正样本；当训练样本数据的标签数据为0时，则可以确定其为负样本。即训练样本数据集合中既包含了正样本也包含了负样本。
33.一般情况下，采用获取到的上述包含正样本以及负样本的训练样本数据集合对推荐系统中的推荐模型进行训练，具体可以为以训练样本数据中包含的用户数据和对象数据为模型训练的输入，以标签数据为模型训练的标签对模型进行训练。具体地，模型在接收到输入的用户数据和对象数据后，对用户数据和对象数据进行特征编码，得到用户特征和对象特征，然后对得到的用户特征和对象特征进行特征拼接得到拼接特征。进一步地，将拼接特征经过多层全连接层进行全连接映射处理，得到模型输出。然后基于模型输出和标签数据之间的差异来构建损失函数，具体可以采用两者的交叉熵来构建损失函数，计算得到损失函数值，以及基于该损失函数值进行梯度反传处理，实现对模型的参数的调整。而本技术实施例提供的模型训练方法中，在计算模型输出和标签数据之间的交叉熵得到损失函数值后，可以进一步对损失函数值进行调整，并基于调整后的损失函数值进行梯度反传处理。下面详细介绍对损失函数值进行调整的过程。
34.在120中，在模型训练过程中，基于计数损失函数，对训练样本数据中的用户数据以及对象数据进行实时计数。
35.其中，此处模型为前述推荐系统中的推荐模型，此处也可以称为点击率预测模型，该模型具体可以为具有多层神经网络的分类模型。在本技术提供的模型训练方法中，还提供了一种在模型训练过程中对训练样本数据中的id(包括用户id和对象id)出现频次进行实时流式计数的方法。具体地，可以设置一个对id在训练样本数据中出现频次进行实时计数的计数模块，然后利用该计数模块在模型训练的过程中进行实时的计数。其中，对用户数据和对象数据的计数，为单独对每一用户数据和每一对象数据进行计数。举例如下：先将训练样本数据1输入模型进行训练，如果训练样本数据1中包含了用户数据a以及对象数据a，那么此时计数模块便可以计用户a的次数为1，对象a的次数为1；然后继续将训练样本数据2输入模型进行训练，如果训练样本数据2中包含了用户数据a以及对象数据b，那么此时计数模块便可以计用户a的次数为2，对象a的次数为1，对象b的次数为1；接着继续将训练样本数据3输入模型进行训练，如果训练样本数据3中包含了用户数据b以及对象数据c，那么此时计数模块便可以计用户a的次数为2，用户b的次数为1，对象a的次数为1，对象b的次数为1以及对象c的次数为1。即在模型训练的过程中的任何时刻，每一用户数据和每一对象数据都有其对应的计数数据，不同用户数据对应的计数数据可以相同也可以不同，不同对象数据对应的计数数据可以相同也可以不同。通过上述方法，可以实现对训练样本数据中id出现频次进行实时计数。
36.其中，在一些实施例中，基于计数损失函数，对训练样本数据中的用户数据以及对象数据进行实时计数，包括：
37.1、确定用户数据对应的用户计数特征以及对象数据对应的对象计数特征；
38.2、构建关于用户数据和对象数据的计数损失函数；
39.3、基于预设学习率的梯度下降优化器以及计数损失函数，对用户计数特征以及对象计数特征进行更新，以实现对训练样本数据中用户数据以及对象数据进行实时计数。
40.其中，在本技术实施例中，在模型训练过程中对用户数据(用户id)以及对象数据(对象id)进行实时计数的具体过程，可以为先构建表征用户id的计数信息的用户计数特征(user_id)以及构建表征对象id的计数信息的对象计数特征(doc_id)。其中，以doc_id为例进行介绍，该doc_id为一个标量，类似于哈希表。其中哈希表中的键数据为id的值，例如对象id为00001；值数据是计数次数，例如5次。即该哈希表中的一个键值(key-value)对代表了一个对象的id值和计数次数信息组合。键值对中的key值是确定的，每个key值对应的value值在模型训练过程中是可以不断发生变化的。
41.然后，可以构建用于对用户id和对象id进行持续计数的计数损失函数来控制在模型的运行过程中对用户id和对象id进行实时计数，即控制哈希表中的值数据进行不断的更新。
42.具体地，可以设置如下的计数损失函数：
[0043][0044]
其中，b为训练样本数据的数据条数，k为需要计次的id个数(如包括user_id和doc_id，则k＝2；可以设置j＝1时对应对象计次，j＝2时对应用户计次)，count
mj
为第m条样本第j个计次的变量，例如count
12
表示对第一条样本中的用户数据进行计次。
[0045]
设置loss_count对count
mj
求偏导：
[0046][0047]
通过梯度下降法对count
mj
进行梯度更新：
[0048][0049]
其中，λ为学习率，可以设置为1。即可以设置学习率λ＝1的随机梯度下降(stochastic gradient descent，sgd)优化器实现对用户数据和对象数据的动态计次，即：
[0050][0051]
以此，可以通过设置的计数损失函数和学习率为1的sgd优化器来对用户计数特征和对象计数特征进行不断地更新，从而实现对用户数据和对象数据的实时计数。
[0052]
在130中，基于对用户数据以及对象数据的实时计数数值计算正则损失。
[0053]
其中，在本技术实施例中，在将一个训练样本数据(可以是正样本也可以是负样本)输入到模型中对模型进行训练时，可以根据该训练样本数据中的用户id和对象id的当前计数次数来计算该训练样本数据对模型进行训练时的正则损失，即正则损失函数值。然后可以基于该正则损失函数值来对模型的分类损失进行正则化约束以缓解模型训练过程中的过拟合问题。由于本技术提供的模型训练方法中的正则损失是根据流式统计的id频次进行计算得到的，相对于在模型训练前进行的离线id频次统计，计算得到的正则损失更能
表征模型训练过程中的实时id频次分布，使得训练得到的模型的实时性更强，进而使得训练得到的模型在进行点击率预测时的准确性更高。
[0054]
具体地，在一些实施例中，基于对用户数据以及对象数据的实时计数数值计算正则损失，包括：
[0055]
1、获取用户数据以及对象数据的正则强度数据；
[0056]
2、根据正则强度数据，以及用户数据和对象数据的实时计数数值计算正则损失。
[0057]
其中，在本技术实施例中，可以基于预先构建的每个id的正则强度数据来具体计算正则损失，其中正则强度数据可以为手工配置的超参数。
[0058]
在一些实施例中，根据正则强度数据，以及用户数据和对象数据的实时计数数值计算正则损失，包括：
[0059]
2.1、提取用户数据的用户特征以及对象数据的对象特征；
[0060]
2.2、根据用户特征、对象特征、正则强度数据以及以及用户数据和对象数据的实时计数数值计算正则损失。
[0061]
具体地，在本技术实施例中，可以基于id(包括用户id和对象id)的特征、id的正则强度数据以及id的实时频次统计数值计算正则损失，具体公式如下：
[0062][0063]
其中，l
adaptive
为正则损失，也可以称为自治应正则损失函数值。k为训练样本数据中id的数量，当训练样本数据中只包含一个用户id和一个对象id时，则k＝2，j为训练样本数据中包含的k个id中第j个id。aj为第j个id的正则强度数据，countj为训练样本数据中第j个id频次的实时统计数据。其中，可以理解的是，每个id(x)都有一个对应的频次统计数据(count_x)。ωj为第j个id的特征数据，例如当第j个id为用户id时，ωj便是该用户id对应的用户特征。该用户特征具体可以对用户数据进行编码得到的特征。
[0064]
在140中，根据正则损失调整模型的训练过程中的损失函数，并基于调整后的损失函数对模型进行训练。
[0065]
其中，在本技术实施例中，在计算得到正则损失后，便可以基于该正则损失对模型本身的分类损失进行正则化处理，以缓解模型训练过程中的过拟合问题，进而提升训练得到的模型的准确性。其中，本技术实施例中，具体可以将正则损失和模型的分类损失进行相加得到目标损失，再基于目标损失对模型进行训练。
[0066]
其中，在一些实施例中，根据正则损失调整模型的训练过程中的损失函数，并基于调整后的损失函数对模型进行训练，包括：
[0067]
1、基于模型对训练样本数据的预测结果，以及训练样本数据的标签数据计算分类损失函数值；
[0068]
2、根据分类损失函数值和正则损失计算目标损失函数值；
[0069]
3、根据目标损失函数值进行梯度反传处理，以对模型的模型参数进行更新。
[0070]
其中，在模型训练过程中，使用训练样本数据对模型进行训练，可以为先基于模型对训练样本数据中的用户数据以及对象数据进行点击率预测，得到预测结果(logits)，然后根据预测结果和该训练样本数据对应的标签数据计算分类损失函数值。在相关技术中，
是直接基于分类损失函数值进行梯度反传以对模型的参数进行调整。而本技术实施例中，在计算得到分类损失函数值后，可以进一步根据训练样本数据对应的正则损失对分类损失函数值进行调整，得到目标损失函数值，然后根据目标损失函数值进行梯度反传处理，以对模型的参数进行更新。
[0071]
其中，在一些实施例中，基于模型对训练样本数据预测结果和训练样本的标签数据计算分类损失函数值，包括：
[0072]
1.1、基于模型对训练样本数据进行点击率预测，得到预测结果；
[0073]
1.2、计算预测结果与标签数据之间的交叉熵，得到分类损失函数值。
[0074]
其中，在本技术实施例中，预测结果和标签数据之间的分类损失函数值，可以采用交叉熵的方法计算得到。
[0075]
在一些实施例中，根据分类损失函数值和正则损失计算目标损失函数值，包括：
[0076]
2.1、获取分类损失函数值和正则损失的权重系数；
[0077]
2.2、基于权重系数对分类损失函数值和正则损失进行加权计算，得到目标损失函数值。
[0078]
在本技术实施例中，基于正则损失对分类损失函数值进行调整的具体方法可以为计算分类损失函数值和正则损失函数值的和，得到目标损失函数值。也可以对分类损失和正则损失分别设置一个合适的权重系数，然后基于该权重系数对分类损失和正则损失进行加权求和，得到目标损失函数值。
[0079]
如图2所示，为本技术提供的模型训练方法的另一流程示意图。可以基于该图对本技术提供的模型训练方法进行详细介绍。
[0080]
当基于一个训练样本数据对模型进行训练时，可以先采用模型右侧的计数模块对训练样本数据中的用户数据以及对象数据进行计数。具体可以为根据预先构建的用户计数特征、对象计数特征以及计数损失对当前训练样本数据的标签数据、用户数据以及对象数据进行计数。其中，计数1为对特征1的计数，计数2为对计数2的计数，即计数数值和特征一一对应。此处特征1至特征n为该训练样本数据中包含的id的特征，当训练样本数据中包含5个id时，则可以对这5个id的数据分别进行编码得到5个特征，然后对这5个特征分别都进行计数。计数完成后，基于该训练样本数据中多个id的当前的计数数值计算该训练样本数据对应的正则损失。另一方面，模型还可以对该训练样本数据中的多个id(例如用户id和对象id)进行特征编码，得到多个id特征，然后经模型中的特征拼接层、全连接层对多个id特征进行处理，得到模型的输出值logits，然后基于模型的输出值logits和该训练样本数据的标签来计算分类损失。进一步地，可以根据分类损失和正则损失计算目标损失，再根据目标损失进行梯度反传以更新模型中各个模块的参数。其中图2中的虚线箭头指示此处梯度不返传。
[0081]
其中，本技术还可以提供一种对象推荐方法，具体可以包括：
[0082]
获取待评估的用户数据以及多个候选对象的对象数据；
[0083]
将用户数据和多个候选对象的对象数据分别组成数据组输入至本技术提供的模型训练方法训练得到的模型中进行点击率预测，得到用户对每一候选对象的点击率预测值；
[0084]
根据点击率预测值确定向用户推荐的目标候选对象，并按照点击率预测值的高低
顺序向用户推荐目标候选对象。
[0085]
根据上述描述可知，本技术提供的模型训练方法，获取训练样本数据集合，训练样本数据集合中的训练样本数据包括用户数据、对象数据以及对应的标签数据；在模型训练过程中，基于计数损失函数，对训练样本数据中的用户数据以及对象数据进行实时计数；基于对用户数据以及对象数据的实时计数数值计算正则损失；根据正则损失调整模型的训练过程中的损失函数，并基于调整后的损失函数对模型进行训练。以此，通过设计计数损失函数将对用户数据和对象数据进行频次统计集成到模型中，实现对用户数据和对象数据的流式计数。然后基于计数数值确定正则损失并基于正则损失对模型损失函数进行调整，可以有效避免模型训练过程中的过拟合现象，进而提升了训练得到的模型的准确性。
[0086]
请参照图3，图3为本技术实施例提供的模型训练装置200的一结构示意图。该模型训练装置200应用于本技术提供的电子设备。如图3所示，该模型训练装置200可以包括：
[0087]
获取模块210，用于获取训练样本数据集合，所述训练样本数据集合中的训练样本数据包括用户数据、对象数据以及对应的标签数据；
[0088]
计数模块220，用于在模型训练过程中，基于计数损失函数，对训练样本数据中的用户数据以及对象数据进行实时计数；
[0089]
计算模块230，用于基于对所述用户数据以及所述对象数据的实时计数数值计算正则损失；
[0090]
训练模块240，用于根据所述正则损失调整所述模型的训练过程中的损失函数，并基于调整后的损失函数对所述模型进行训练。
[0091]
可选地，在一些实施例中，计数模块，包括：
[0092]
确定子模块，用于确定用户数据对应的用户计数特征以及对象数据对应的对象计数特征；
[0093]
构建子模块，用于构建关于用户数据和对象数据的计数损失函数；
[0094]
第一更新子模块，用于基于预设学习率的梯度下降优化器以及所述计数损失函数，对所述用户计数特征以及所述对象计数特征进行更新，以实现对所述训练样本数据中用户数据以及对象数据进行实时计数。
[0095]
可选地，在一些实施例中，计算模块，包括：
[0096]
获取子模块，用于获取所述用户数据以及所述对象数据的正则强度数据；
[0097]
第一计算子模块，用于根据所述正则强度数据，以及所述用户数据和所述对象数据的实时计数数值计算正则损失。
[0098]
可选地，在一些实施例中，计算子模块，包括：
[0099]
提取单元，用于提取所述用户数据的用户特征以及所述对象数据的对象特征；
[0100]
第一计算单元，用于根据所述用户特征、所述对象特征、所述正则强度数据以及以及所述用户数据和所述对象数据的实时计数数值计算正则损失。
[0101]
可选地，在一些实施例中，训练模块，包括：
[0102]
第二计算子模块，用于基于所述模型对训练样本数据的预测结果，以及所述训练样本数据的标签数据计算分类损失函数值；
[0103]
第三计算子模块，用于根据所述分类损失函数值和所述正则损失计算目标损失函数值；
[0104]
第二更新子模块，用于根据所述目标损失函数值进行梯度反传处理，以对所述模型的模型参数进行更新。
[0105]
可选地，在一些实施例中，第二计算子模块，包括：
[0106]
预测单元，用于基于所述模型对训练样本数据进行点击率预测，得到预测结果；
[0107]
第二计算单元，用于计算所述预测结果与所述标签数据之间的交叉熵，得到分类损失函数值。
[0108]
可选地，在一些实施例中，第三计算子模块，包括：
[0109]
获取单元，用于获取所述分类损失函数值和所述正则损失的权重系数；
[0110]
第三计算单元，用于基于所述权重系数对所述分类损失函数值和所述正则损失进行加权计算，得到目标损失函数值。
[0111]
应当说明的是，本技术实施例提供的模型训练装置200与上文实施例中图1所示的模型训练方法属于同一构思，其具体实现过程详见以上相关实施例，此处不再赘述。
[0112]
根据上述描述可知，本技术提供的模型训练装置，通过获取模块210获取训练样本数据集合，训练样本数据集合中的训练样本数据包括用户数据、对象数据以及对应的标签数据；在模型训练过程中，计数模块220基于计数损失函数，对训练样本数据中的用户数据以及对象数据进行实时计数；计算模块230基于对用户数据以及对象数据的实时计数数值计算正则损失；训练模块240根据正则损失调整模型的训练过程中的损失函数，并基于调整后的损失函数对模型进行训练。以此，通过设计计数损失函数将对用户数据和对象数据进行频次统计集成到模型中，实现对用户数据和对象数据的流式计数。然后基于计数数值确定正则损失并基于正则损失对模型损失函数进行调整，可以有效避免模型训练过程中的过拟合现象，进而提升了训练得到的模型的准确性。
[0113]
本技术实施例还提供一种存储介质，其上存储有计算机程序，当其存储的计算机程序在本技术实施例提供的电子设备的处理器上执行时，使得电子设备的处理器执行以上任一适于电子设备的模型训练方法中的步骤。其中，存储介质可以是磁碟、光盘、只读存储器(read only memory，rom)或者随机存取器(random access memory，ram)等。
[0114]
本技术还提供一种终端，请参照图4，终端300包括处理器310和存储器320。
[0115]
本技术实施例中的处理器310可以是通用处理器，比如arm架构的处理器。存储器320中存储有计算机程序，其可以为高速随机存取存储器，还可以为非易失性存储器，比如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件等。相应地，存储器320还可以包括存储器控制器，以提供处理器301对存储器320的访问。处理器310通过执行存储器320中的计算机程序，用于执行以上任一模型训练方法，比如：
[0116]
获取训练样本数据集合，训练样本数据集合中的训练样本数据包括用户数据、对象数据以及对应的标签数据；在模型训练过程中，基于计数损失函数，对训练样本数据中的用户数据以及对象数据进行实时计数；基于对用户数据以及对象数据的实时计数数值计算正则损失；根据正则损失调整模型的训练过程中的损失函数，并基于调整后的损失函数对模型进行训练。
[0117]
以上对本技术所提供的一种模型训练方法、装置、存储介质及终端进行了详细介绍，本文中应用了具体个例对本技术的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本技术的方法及其核心思想；同时，对于本领域的技术人员，依据本技术的
思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本技术的限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：信息推荐方法、装置、电子设备及存储介质与流程

模型训练方法、装置、存储介质及终端与流程

相关文献

最热文献