一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

分类模型训练方法、装置、情绪数据分类方法及相关设备与流程

2022-02-21 03:51:41 来源:中国专利 TAG:


1.本公开涉及人工智能领域,尤其涉及一种分类模型训练方法、装置、 情绪数据分类方法、电子设备及计算机可读介质。


背景技术:

2.随着人工智能技术的不断发展与进步,机器已经能辅助人类完成越来 越多的任务。通过人类语言判断人类情绪也成为工业、学术界都大力研究 的重点方向。具体到电商领域,消费者在评价系统中对所购商品的使用感 受进行评测,这些评价能够反映出其多方面的情绪,例如对商品满意会体 现出正面情绪,对商品不满意则会体现出负面情绪。如何准确通过文字判 断情绪类别就成为了人工智能系统的一个重要应用场景,能否训练出一个 性能更加好的分类模型,就是影响该系统性能的重要因素。
3.随着预训练语言模型的飞速发展,各种自然语言处理任务性能也随之 水涨船高,模型架构也随之越来越复杂。这些模型凭借复杂的网络结构和 庞杂的参数在情感分类任务中取得了较好的成绩,但在计算损失函数时, 仍旧使用交叉熵损失函数,无形中降低了模型的预测效果。
4.因此,需要一种新的分类模型训练方法、装置、情绪数据分类方法、 电子设备及计算机可读介质。
5.在所述背景技术部分公开的上述信息仅用于加强对本公开的背景的 理解。


技术实现要素:

6.有鉴于此,本公开实施例提供一种分类模型训练方法、装置、情绪 数据分类方法、电子设备及计算机可读介质,能够在不改变模型结构的前 提下提高分类模型的分类效果。
7.本公开的其他特性和优点将通过下面的详细描述变得显然,或部分 地通过本公开的实践而习得。
8.根据本公开实施例的第一方面,提出一种分类模型训练方法,该方 法包括:获取当前批次训练样本和所述当前批次训练样本的标签;通过 待训练模型对所述当前批次训练样本进行处理,获得当前批次训练样本 的预测向量;根据所述当前批次训练样本的预测向量和所述当前批次训 练样本的标签生成第一损失函数;根据所述当前批次训练样本中具有相 同的标签的训练样本的预测向量生成第二损失函数;根据所述第一损失函 数和所述第二损失函数调整所述待训练模型的参数,将训练完成的所述待 训练模型确定为目标分类模型。
9.在本公开的一种示例性实施例中,根据所述当前批次训练样本中具 有相同的标签的训练样本的预测向量生成第二损失函数包括:确定所述当 前批次训练样本中的第i个训练样本,i为大于0且小于n的整数,n为 当前批次训练样本的数量,n为大于0的整数;在所述当前批次训练样本 中确定与所述第i个训练样本具有相同标签的ai个训练样本,ai为大于0 的整数;根据所述ai个训练样本的预测向量、所述第i个训练样本的预测 向量以及所
述当前批次训练样本的预测向量确定第i个训练样本的对比分 数;根据i个训练样本的对比分数的平均值确定所述第二损失函数。
10.在本公开的一种示例性实施例中,根据所述ai个训练样本的预测向 量、所述第i个训练样本的预测向量以及所述当前批次训练样本的预测向 量确定第i个训练样本的对比分数包括:确定所述ai个训练样本中的第j 个训练样本,j为大于0且小于或等于ai的整数;根据所述ai个训练样本 中第j个训练样本的预测向量和所述第i个训练样本的预测向量确定所述 第i个训练样本的第j个同类别样本相似分数;根据所述当前批次训练样 本中n个训练样本的预测向量和所述第i个训练样本的预测向量确定所述 第i个训练样本的整体相似分数;根据所述第i个训练样本的第j个同类 别样本相似分数和所述第i个训练样本的整体样本相似分数的比值的对数 运算结果确定所述第i个训练样本的第j个对比分数;根据所述第i个训 练样本的ai个对比分数的平均值确定所述第i个训练样本的对比分数。
11.在本公开的一种示例性实施例中,根据所述ai个训练样本中第j个训 练样本的预测向量和所述第i个训练样本的预测向量确定所述第i个训练 样本的第j个同类别样本相似分数包括:计算所述第i个训练样本的预测 向量和所述ai个训练样本中第j个训练样本的预测向量的内积,获得所述 第i个训练样本的第j个第一内积;根据所述i个训练样本的第j个第一内 积的指数运算结果确定所述第i个训练样本的第j个同类别样本相似分数。
12.在本公开的一种示例性实施例中,根据所述当前批次训练样本中n 个训练样本的预测向量和所述第i个训练样本的预测向量确定所述第i个 训练样本的整体相似分数包括:计算所述第i个训练样本的预测向量和所 述n个训练样本中每个训练样本的预测向量的内积,获得所述第i个训练 样本的n个第二内积;将所述第i个训练样本的n个第二内积的指数运 算结果的和值确定为所述第i个训练样本的整体相似分数。
13.在本公开的一种示例性实施例中,根据所述第一损失函数和所述第 二损失函数调整所述待训练模型的参数,将训练完成的所述待训练模型确 定为目标分类模型包括:根据所述第一损失函数和所述第二损失函数的加 权和值确定目标损失函数;根据所述目标损失函数调整所述待训练模型的 参数,将训练完成的所述待训练模型确定为目标分类模型。
14.根据本公开实施例的第二方面,提出一种情绪数据分类方法,所述方 法包括:获取待处理情绪数据,所述待处理情绪数据包括情感特征;将所 述情感特征输入如上述任一项所处所述的目标分类模型中,得到所述待处 理情绪数据的分类结果。
15.根据本公开实施例的第三方面,提出一种分类模型训练装置,该装 置包括:样本获取模块,配置为获取当前批次训练样本和所述当前批次训 练样本的标签;向量预测模块,配置为通过待训练模型对所述当前批次训 练样本进行处理,获得当前批次训练样本的预测向量;第一损失模块,配 置为根据所述当前批次训练样本的预测向量和所述当前批次训练样本的 标签生成第一损失函数;第二损失模块,配置为根据所述当前批次训练样 本中具有相同的标签的训练样本的预测向量生成第二损失函数;模型训练 模块,配置为根据所述第一损失函数和所述第二损失函数调整所述待训练 模型的参数,将训练完成的所述待训练模型确定为目标分类模型。
16.根据本公开实施例的第四方面,提出一种电子设备,该电子设备包 括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述 一个或多个程序被所述一个或多
法、装置、实现或者操作以避免模糊本发明的各方面。
32.附图仅为本发明的示意性图解,图中相同的附图标记表示相同或类 似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图不 一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现 这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实 体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实 体。
33.附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和 步骤,也不是必须按所描述的顺序执行。例如,有的步骤还可以分解, 而有的步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际 情况改变。
34.现有分类模型,无论使用预训练与否,几乎使用的是同一个损失 函数,即交叉熵。交叉熵被广泛的应用于分类模型的损失函数
35.此种损失函数应用十分广泛,其目的是使模型更加置信的完成分 类任务,将样本分到正确的类别,这种方式只考虑了单个样本的影响, 并未考虑不同类别样本间的相似与否。
36.因此,需要一种新的分类模型训练方法、装置、情绪数据分类方法、 电子设备及计算机可读介质。
37.下面结合附图对本发明示例实施方式进行详细说明。
38.图1是根据一示例性实施例示出的一种分类模型训练方法及装置的 系统框图。
39.在分类模型训练方法及装置的系统100中,服务器105可以是提供各 种服务的服务器,例如通过网络104对用户利用终端设备101、102、103 所进行操作的分类模型训练系统提供支持的后台管理服务器(仅为示例)。 后台管理服务器可以对接收到的分类模型的训练请求等数据进行分析等 处理,并将处理结果(例如目标分类模型
‑‑
仅为示例)反馈给终端设备。
40.服务器105可以是一个实体的服务器,还可例如为多个服务器组成, 服务器105中的一部分可例如作为本公开中的分类模型的训练任务提交 系统,用于获取将要执行分类模型的训练命令的任务;以及服务器105 中的一部分还可例如作为本公开中的分类模型的训练系统,用于获取当 前批次训练样本和所述当前批次训练样本的标签;通过待训练模型对所 述当前批次训练样本进行处理,获得当前批次训练样本的预测向量;根 据所述当前批次训练样本的预测向量和所述当前批次训练样本的标签生 成第一损失函数;根据所述当前批次训练样本中具有相同的标签的训练 样本的预测向量生成第二损失函数;根据所述第一损失函数和所述第二损 失函数调整所述待训练模型的参数,将训练完成的所述待训练模型确定为 目标分类模型。
41.图2是根据一示例性实施例示出的一种分类模型训练方法的流程图。 本公开实施例提供的分类模型训练方法可以由任意具备计算处理能力的 电子设备执行,例如终端设备101、102、103和/或服务器105,在下面 的实施例中,以服务器执行所述方法为例进行举例说明,但本公开并不 限定于此。本公开实施例提供的分类模型训练方法可以包括步骤s202至 s210。
42.如图2所示,在步骤s202中,获取当前批次训练样本和所述当前批 次训练样本的标签。
43.本公开实施例中,可例如从全量的训练样本中抽取获得当前批次训练 样本。当前批次训练样本的标签可例如为独热(one-hot)形式,即一维向 量,该一维向量中每个元素的元素值用于指示对应的当前批次训练样本属 于每个类别的概率值。当前批次训练样本可例如为文本数据、图像数据、 参数组合等等。当为文本数据时,标签可为对情感的分类结果;当为图像 数据时,标签可为对图像的分类结果;当为参数组合时,标签可为对故障 类别的分类结果。下面以文本数据以及对情感进行分类的标签为例。
44.在步骤s204中,通过待训练模型对当前批次训练样本进行处理,获 得当前批次训练样本的预测向量。
45.本公开实施例中,可通过待训练模型可例如为卷积神经网络模型 (cnn)、循环神经网络模型(rnn),又例如为bert模型,本公开 对此并不作特殊限定。当前批次训练样本的预测向量可为由模型预测获得 的该当前批次训练样本在各个类别下的得分(即概率值)。
46.在步骤s206中,根据当前批次训练样本的预测向量和当前批次训练 样本的标签生成第一损失函数。
47.本公开实施例中,可例如根据当前批次训练样本的预测向量和当前批 次训练样本的标签计算交叉熵损失函数,以将获得的交叉熵损失函数作为 第一损失函数。第一损失函数loss
ce
的计算方式例如式(1)所示。
[0048][0049]
是待训练模型对当前批次训练样本i计算求得的预测向量,即在每种 类别下的实际得分,yi是当前批次训练样本i的标签,即在各类别下的 one-hot向量,n代表一个批次(batch)中的样本数量。
[0050]
在步骤s208中,根据当前批次训练样本中具有相同的标签的训练样 本的预测向量确定生成第二损失函数。
[0051]
本公开实施例中,可计算当前批次训练样本与具有相同标签的训练样 本的预测向量的相似度,以根据相似度生成第二损失函数。两个当前批次 训练样本的相似度用于表征该两个当前批次训练样本的距离,相似度越小, 距离越大。相似度可例如根据预测向量的内积计算结果获得。
[0052]
在步骤s210中,根据第一损失函数和第二损失函数调整待训练模型 的参数,将训练完成的待训练模型确定为目标分类模型。
[0053]
在示例性实施例中,可根据第一损失函数和第二损失函数的加权和值 确定目标损失函数;根据目标损失函数调整待训练模型的参数,将训练完 成的待训练模型确定为目标分类模型。
[0054]
根据本公开实施例提供的分类模型训练方法,在利用当前批次训练 样本和标签对待训练模型进行训练时,在基于预测向量与标签生成第一损 失函数的基础上,还利用与当前批次训练样本具有相同标签的训练样本的 预测向量生成第二损失函数,使得该第二损失函数能够表征具有相同类别 的样本之间的相似度,进而在利用第一损失函数和第二损失函数调整待训 练模型的参数时,不仅能够考虑预测向量与标签之间的距离,还能够考虑 同类样本之间的距离,提升模型的泛化能力与分类效果。
[0055]
图3是根据一示例性实施例示出的另一种分类模型训练方法的流程 图。如图3所
示,图2实施例的步骤s208可进一步包括步骤s302至s308。
[0056]
在步骤s302中,确定当前批次训练样本中的第i个训练样本,i为大 于0且小于n的整数,n为当前批次训练样本的数量,n为大于0的整数。
[0057]
在步骤s304中,在当前批次训练样本中确定与第i个训练样本具有 相同标签的ai个训练样本,ai为大于0的整数。
[0058]
在步骤s306中,根据ai个训练样本的预测向量、第i个训练样本的 预测向量以及当前批次训练样本的预测向量确定第i个训练样本的对比分 数。
[0059]
本公开实施例中,可计算第i个训练样本的预测向量与ai个训练样本 的预测向量中每个预测向量的相似度,并计算第i个训练样本的预测向量 与所有的当前批次训练样本的预测向量中每个预测向量的相似度,并根据 上述两种相似度确定第i个训练样本的对比分数。
[0060]
在步骤s308中,根据n个训练样本的对比分数的平均值确定第二损 失函数。
[0061]
图4是根据一示例性实施例示出的又一种分类模型训练方法的流程 图。如图4所示,图3实施例的步骤s306可进一步包括步骤s402至s410。
[0062]
在步骤s402中,确定ai个训练样本中的第j个训练样本,j为大于0 且小于或等于ai的整数。
[0063]
在步骤s404中,根据ai个训练样本中第j个训练样本的预测向量和 第i个训练样本的预测向量确定第i个训练样本的第j个同类别样本相似 分数。
[0064]
在示例性实施例中,可计算第i个训练样本的预测向量和ai个训练样 本中第j个训练样本的预测向量的内积,获得第i个训练样本的第j个第 一内积;根据i个训练样本的第j个第一内积的指数运算结果确定第i个 训练样本的第j个同类别样本相似分数。
[0065]
其中,第i个训练样本的第j个同类别样本相似分数可如式(2)所示。
[0066]
exp(φ(xi)
·
φ(xj)
ꢀꢀꢀ
(2)
[0067]
xi表示第i个训练样本,xj表示ai个训练样本中的第j个训练样本。φ函 数表示待训练模型的函数,φ(xi)表示第i个训练样本的预测向量,φ(xj)表 示ai个训练样本中第j个训练样本的预测向量。
[0068]
在步骤s406中,根据当前批次训练样本中n个训练样本的预测向量 和第i个训练样本的预测向量确定第i个训练样本的整体相似分数。
[0069]
在示例性实施例中,可计算第i个训练样本的预测向量和n个训练样 本中每个训练样本的预测向量的内积,获得第i个训练样本的n个第二内 积;将第i个训练样本的n个第二内积的指数运算结果的和值确定为第i 个训练样本的整体相似分数。
[0070]
其中,第i个训练样本的整体相似分数可如式(3)所示。
[0071][0072]
φ(xk)表示n个训练样本中第k个训练样本的预测向量,k为大于0且 小于或等于n的整数。
[0073]
在步骤s408中,根据第i个训练样本的第j个同类别样本相似分数和 第i个训练样本的整体样本相似分数的比值的对数运算结果确定第i个训 练样本的第j个对比分数。
[0074]
第i个训练样本的第j个对比分数可如式(4)所示。
[0075][0076]
在步骤s410中,根据第i个训练样本的ai个对比分数的平均值确定 第i个训练样本的对比分数。
[0077]
其中,第i个训练样本的对比分数可如式(5)所示。
[0078][0079]
基于公式(5),在图3实施例的步骤s308中,根据i个训练样本的 对比分数的平均值确定第二损失函数可包括:
[0080][0081]
式(6)的分子部分表示,计算与xi具有相同类别的训练样本的相似 分数,分母部分表示当前batch中所有训练样本与xi的相似分数累加和, 两部分的比值即表示当前batch中,xi与相同类别的其他训练样本的距离 越小,同时与不同类别的训练样本距离越远则比值越大,损失值越小,对 模型惩罚也越小。反之则对模型惩罚越大,模型会加速向损失函数变小的 方向优化。具体计算流程可参考图5。
[0082]
假设当前批次中的训练样本的数量为4,正情感标签的训练样本2例 (图5中样本1、2),负情感标签的训练样本2例(图5中样本3、4), 经过待训练模型的前馈流程后获得当前batch中的每个训练样本的预测向 量,用图5中左侧的矩形条表示,其中阴影矩形条表示具有正情感标签的 训练样本的预测向量,无填充矩形条表示具有负情感标签的训练样本的预 测向量,例如1号训练样本的预测向量为(0.8,0.2),随后图5右侧分别 表示每个训练样本与其他训练样本计算相似度(即相似分数)的流程。黑 色箭头代表与具有相同标签的训练样本的预测向量计算内积,无填充的箭 头代表与不同标签的训练样本的预测向量计算内积,在图5中右侧的每一 个矩形框内,会求得对应的训练样本(例如图5中右侧的第1个矩形框对 应第1个训练样本)与其相同标签的样本相似度占该训练样本与其他所有 样本相似度的比例,随后将4个矩形框求得分数进行平均,即可得到第二 损失函数。
[0083]
图6是根据一示例性实施例示出的一种分类模型训练方法的流程图。 图7是根据现有技术示出的一种分类模型训练方法的流程图。在图7所示 现有技术中,情感分类模型训练可以用四个纵向环节概括,首先在s702 中收集到情感分类的训练数据,对应图7右侧图示中由无填充圆圈表示正 向情感标签的文本样本,以及由阴影填充圆圈表示负向情感标签的文本样 本。第二步s704从全体训练样本中批次抽取若干训练样本进行训练,对 应右侧表示本批次抽取出正向情感样本和负向情感样本各2个作为本批 次训练数据。第三步s706使用待训练模型进行前馈流程,比如使用较新 的bert作为模型,或者使用传统cnn/rnn作为模型。第四步s708根据 获得的分类得分与真实的标签(label)计算交叉熵获得损失函数,效果在 右侧展示,交叉熵的作用是使得模型可以找到一个超平面将正负向样本分 开。
[0084]
从图6与图7可知,本技术在处理情感分类任务的流程时,相较于现 有技术,在最后一个环节即计算损失函数上存在区别,增加了一个第二损 失函数的计算流程,第二损失函数会使得不同类别的样本距离更加远,从 而大大提升了模型的泛化能力。最终将两个交
叉熵与对比损失函数相加构 成最终的目标损失函数loss=loss
ce
loss
contrast

[0085]
例如,对于样本1:“快递小哥的送货速度真快”,其标签为正情感 标签。对于样本2,其标签为负情感标签。对于样本3:“新手机颜值杠 杠的”,其标签为正情感标签。对于样本1与样本2,随着分类模型的迭 代训练,第二损失函数会使得样本1与样本2的距离逐渐变大。对于样本 1与样本3,随着分类模型的迭代训练,第二损失函数会使得样本1与样 本2的距离逐渐变小。
[0086]
根据本公开实施例提供的分类模型训练方法,从分类任务的损失函数 设计上进行优化改进,增加对比损失函数,旨在拉近相同类别样本的相似 度距离,拉远不同类别样本的相似度距离,从而在不改变模型结构的基础 上提高分类效果。
[0087]
进一步地,本公开还提出一种情感数据分类方法,包括如下步骤(1) 与(2)。
[0088]
在步骤(1)中,获取待处理情绪数据,待处理情绪数据包括情感特 征。
[0089]
本公开实施例中,待处理情绪数据例如为消费者在评价系统中对所购 商品的使用感受进行评测的文字数据、图片数据、语音数据等。其中,可 对待处理情绪数据进行特征提取,获得情感特征。
[0090]
在步骤(2)中,将所述情感特征输入如上述图2或图3或图4或图 5或图6所述的目标分类模型中,得到待处理情绪数据的分类结果。
[0091]
其中,待处理情绪数据的分类结果可例如包括正情感标签和负情感标 签。
[0092]
其中,还可根据待处理情绪数据的分类结果,生成该待处理情绪数据 的决策信息。决策信息例如对待处理情绪数据的回复信息等。在该实施例 中,基于目标分类模型对待处理情绪数据进行准确的分类,能够获得较高 准确率的决策信息,实现对待处理情绪数据的准确回应。
[0093]
应清楚地理解,本公开描述了如何形成和使用特定示例,但本公开 的原理不限于这些示例的任何细节。相反,基于本公开公开的内容的教 导,这些原理能够应用于许多其它实施例。
[0094]
本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现 为由中央处理器(central processing unit,cpu)执行的计算机程序。在 该计算机程序被中央处理器cpu执行时,执行本公开提供的上述方法所 限定的上述功能。该程序可以存储于一种计算机可读存储介质中,该存 储介质可以是只读存储器、磁盘或光盘等。
[0095]
此外,需要注意的是,上述附图仅是根据本公开示例性实施例的方 法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图 所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解, 这些处理可以是例如在多个模块中同步或异步执行的。
[0096]
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于 本公开装置实施例中未披露的细节,请参照本公开方法实施例。
[0097]
图8是根据一示例性实施例示出的一种分类模型训练装置的框图。 参照图8,本公开实施例提供的分类模型训练装置80可以包括:样本获 取模块802、向量预测模块804、第一损失模块806、第二损失模块808 以及模型训练模块810。
[0098]
在分类模型训练装置80中,样本获取模块802可配置为获取当前批 次训练样本和所述当前批次训练样本的标签。
[0099]
向量预测模块804可配置为通过待训练模型对所述当前批次训练样 本进行处理,获得当前批次训练样本的预测向量。
[0100]
第一损失模块806可配置为根据所述当前批次训练样本的预测向量 和所述当前批次训练样本的标签生成第一损失函数。
[0101]
第二损失模块808可配置为根据所述当前批次训练样本中具有相同 的标签的训练样本的预测向量生成第二损失函数。
[0102]
模型训练模块810可配置为根据所述第一损失函数和所述第二损失 函数调整所述待训练模型的参数,将训练完成的所述待训练模型确定为 目标分类模型。
[0103]
根据本公开实施例提供的分类模型训练装置,在利用当前批次训练 样本和标签对待训练模型进行训练时,在基于预测向量与标签生成第一损 失函数的基础上,还利用与当前批次训练样本具有相同标签的训练样本的 预测向量生成第二损失函数,使得该第二损失函数能够表征具有相同类别 的样本之间的相似度,进而在利用第一损失函数和第二损失函数调整待训 练模型的参数时,不仅能够考虑预测向量与标签之间的距离,还能够考虑 同类样本之间的距离,提升模型的泛化能力与分类效果。
[0104]
在示例性实施例中,第二损失模块808可包括:第一训练样本确认子 模块,可配置为确定所述当前批次训练样本中的第i个训练样本,i为大 于0且小于n的整数,n为当前批次训练样本的数量,n为大于0的整数; 同类样本聚合子模块,可配置为在所述当前批次训练样本中确定与所述第 i个训练样本具有相同标签的ai个训练样本,ai为大于0的整数;对比分 数计算子模块,可配置为根据所述ai个训练样本的预测向量、所述第i个 训练样本的预测向量以及所述当前批次训练样本的预测向量确定第i个训 练样本的对比分数;第二损失子模块,可配置为根据i个训练样本的对比 分数的平均值确定所述第二损失函数。
[0105]
在示例性实施例中,对比分数计算子模块可包括:第二训练样本确认 单元,可配置为确定所述ai个训练样本中的第j个训练样本,j为大于0 且小于或等于ai的整数;第一分数计算单元,可配置为根据所述ai个训练 样本中第j个训练样本的预测向量和所述第i个训练样本的预测向量确定 所述第i个训练样本的第j个同类别样本相似分数;第二分数计算单元, 可配置为根据所述当前批次训练样本中n个训练样本的预测向量和所述 第i个训练样本的预测向量确定所述第i个训练样本的整体相似分数;第 三分数计算单元,可配置为根据所述第i个训练样本的第j个同类别样本 相似分数和所述第i个训练样本的整体样本相似分数的比值的对数运算结 果确定所述第i个训练样本的第j个对比分数;对比分数计算单元,可配 置为根据所述第i个训练样本的ai个对比分数的平均值确定所述第i个训 练样本的对比分数。
[0106]
在示例性实施例中,第一分数计算单元可包括:第一内积计算子单元, 可配置为计算所述第i个训练样本的预测向量和所述ai个训练样本中第j 个训练样本的预测向量的内积,获得所述第i个训练样本的第j个第一内 积;第一分数计算子单元,可配置为根据所述i个训练样本的第j个第一 内积的指数运算结果确定所述第i个训练样本的第j个同类别样本相似分 数。
[0107]
在示例性实施例中,第二分数计算单元可包括:第二内积计算子单元, 可配置为计算所述第i个训练样本的预测向量和所述n个训练样本中每个 训练样本的预测向量的内积,获得所述第i个训练样本的n个第二内积; 第二分数计算子单元,可配置为将所述第i个
训练样本的n个第二内积的 指数运算结果的和值确定为所述第i个训练样本的整体相似分数。
[0108]
在示例性实施例中,模型训练模块810可包括:目标损失计算子模块, 可配置为根据所述第一损失函数和所述第二损失函数的加权和值确定目 标损失函数;参数调整子模块,可配置为根据所述目标损失函数调整所述 待训练模型的参数,将训练完成的所述待训练模型确定为目标分类模型。
[0109]
下面参照图9来描述根据本发明的这种实施方式的电子设备900。图 9显示的电子设备900仅仅是一个示例,不应对本发明实施例的功能和使 用范围带来任何限制。
[0110]
如图9所示,电子设备900以通用计算设备的形式表现。电子设备 900的组件可以包括但不限于:上述至少一个处理单元910、上述至少一 个存储单元920、连接不同系统组件(包括存储单元920和处理单元910) 的总线930。
[0111]
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处 理单元910执行,使得所述处理单元910执行本说明书上述“示例性方法
”ꢀ
部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理 单元910可以执行如图2或图3或图4或图6中所示的步骤。
[0112]
存储单元920可以包括易失性存储单元形式的可读介质,例如随机 存取存储单元(ram)9201和/或高速缓存存储单元9202,还可以进一步 包括只读存储单元(rom)9203。
[0113]
存储单元920还可以包括具有一组(至少一个)程序模块9205的程 序/实用工具9204,这样的程序模块9205包括但不限于:操作系统、一 个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一 个或某种组合中可能包括网络环境的实现。
[0114]
总线930可以为表示几类总线结构中的一种或多种,包括存储单元 总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使 用多种总线结构中的任意总线结构的局域总线。
[0115]
电子设备900也可以与一个或多个外部设备1000(例如键盘、指向 设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备 900交互的设备通信,和/或与使得该电子设备900能与一个或多个其它 计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这 种通信可以通过输入/输出(i/o)接口950进行。并且,电子设备900还 可以通过网络适配器960与一个或者多个网络(例如局域网(lan),广 域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配 器960通过总线930与电子设备900的其它模块通信。应当明白,尽管图 中未示出,可以结合电子设备900使用其它硬件和/或软件模块,包括但 不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、 raid系统、磁带驱动器以及数据备份存储系统等。
[0116]
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描 述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件 的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品 的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是 cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计 算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行 根据本公开实施方式的方法。
[0117]
在本公开的示例性实施例中,还提供了一种计算机可读存储介质, 其上存储有能
够实现本说明书上述方法的程序产品。在一些可能的实施 方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括 程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使 所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发 明各种示例性实施方式的步骤。
[0118]
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质 可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不 限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者 任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括: 具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器 (ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或 闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存 储器件、或者上述的任意合适的组合。
[0119]
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的 数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多 种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可 读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可 以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与 其结合使用的程序。
[0120]
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不 限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
[0121]
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明 操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸 如java、c 等,还包括常规的过程式程序设计语言—诸如“c”语言或 类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部 分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算 设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器 上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种 类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设 备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过 因特网连接)。
[0122]
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理 的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不 表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是 例如在多个模块中同步或异步执行的。
[0123]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想 到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或 者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原 理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说 明书和实施例仅被视为示例性的,本公开的真正范围和构思由权利要求 指出。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献