数据分类方法、装置及电子设备与流程

2021-11-26 21:44:00 来源：中国专利 TAG：

1.本技术涉及人工智能技术领域，具体而言，本技术涉及一种数据分类方法、装置及电子设备。

背景技术：

2.神经网络(neural networks，nn)模型是由大量的处理单元广泛地互相连接而形成的复杂网络系统，是通过模拟人脑功能的许多基本特征进行数据处理的复杂的数学模型。神经网络模型可以应用到数据处理的各领域中，例如，文本分类、图像分类等。
3.在使用神经网络模型进行数据处理之前，需要采用大量训练样本对神经网络模型进行迭代训练，在训练过程中不断调整模型参数，直到满足训练结束条件，得到训练好的神经网络模型。在进行神经网络模型训练时，可以通过带有样本标签的训练样本进行模型训练。然而，当训练样本中包含类别标注错误的样本(也可以称为噪声样本)时，神经网络模型的学习效果会偏离分类任务的期望，导致训练好的神经网络模型在应用时无法给出准确的判断，影响神经网络模型的使用效果。因此，在训练神经网络模型的过程中，如何对噪声样本进行处理，以提升神经网络模型的学习效果，成为需要解决的问题。

技术实现要素：

4.本技术实施例提供了一种数据分类方法、装置及电子设备，基于该方案，能够提升分类模型的学习效果，从而提升训练好的分类模型的分类准确性。
5.为实现上述目的，本技术实施例提供的具体技术方案如下：
6.一方面，本技术实施例提供了一种数据分类方法，该方法包括：
7.获取待分类数据；待分类数据包括图像数据或者文本数据；
8.将待分类数据输入训练好的分类模型，得到待分类数据对应的分类结果；
9.其中，训练好的分类模型是通过训练样本集对分类模型训练得到的，分类模型的训练损失值是基于训练样本集中的各训练样本各自对应的训练损失值的权重确定的，各训练样本各自对应的训练损失值的权重是基于各训练样本的样本类型确定的，样本类型为噪声样本或非噪声样本。
10.另一方面，本技术实施例还提供了一种数据分类装置，该装置包括：
11.获取模块，用于获取待分类数据；待分类数据包括图像数据或者文本数据；
12.分类模块，用于将待分类数据输入训练好的分类模型，得到待分类数据对应的分类结果；
13.其中，训练好的分类模型是通过训练样本集对分类模型训练得到的，分类模型的训练损失值是基于训练样本集中的各训练样本各自对应的训练损失值的权重确定的，各训练样本各自对应的训练损失值的权重是基于各训练样本的样本类型确定的，样本类型为噪声样本或非噪声样本。
14.本技术实施例还提供了一种电子设备，该电子设备包括一个或多个处理器；存储
器；一个或多个计算机程序，其中一个或多个计算机程序被存储在存储器中并被配置为由一个或多个处理器执行，一个或多个计算机程序被配置用于执行上述数据分类方法或数据分类方法的各种可选实现方式中提供的方法。
15.本技术实施例还提供了一种计算机可读存储介质，计算机可读存储介质用于存储计算机程序，当计算机程序在处理器上运行时，使得处理器可以执行上述数据分类方法或数据分类方法的各种可选实现方式中提供的方法。
16.本技术实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述数据分类方法或数据分类方法的各种可选实现方式中提供的方法。
17.本技术提供的技术方案带来的有益效果是：
18.本技术提供了一种数据分类方法、装置及电子设备，采用训练好的分类模型进行数据分类，分类模型的训练损失值是基于训练样本集中的各训练样本各自对应的训练损失值的权重确定的，各训练样本各自对应的训练损失值的权重是基于各训练样本的样本类型确定的，根据各训练样本的样本类型确定分类模型的训练损失值，可以提高分类模型对噪声样本的处理能力，提升模型的学习效果，从而提升训练好的分类模型的分类准确性。
附图说明
19.为了更清楚地说明本技术实施例中的技术方案，下面将对本技术实施例描述中所需要使用的附图作简单地介绍。
20.图1为本技术实施例提供的数据分类方法的流程图；
21.图2为本技术实施例提供的卷积块的结构示意图；
22.图3为本技术实施例提供的分类模型的训练方法的数据处理过程的示意图；
23.图4为本技术实施例提供的记忆单元的更新过程示意图；
24.图5为本技术实施例提供的分类模型的应用过程示意图；
25.图6为本技术实施例提供的数据分类装置的结构示意图；
26.图7为本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
27.下面详细描述本技术的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本技术，而不能解释为对本技术的限制。
28.本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
29.本技术实施例是针对分类模型进行模型训练时，训练样本中包含噪声样本，使得分类模型的学习效果会偏离分类任务的期望，导致训练好的分类模型在应用时无法给出准确的判断，影响分类模型的使用效果的问题，提供的一种数据分类方法，采用训练好的分类模型进行数据分类，在训练分类模型时，不需要针对噪声样本进行额外的人工标注，不会增加人工成本。根据训练样本的样本类型，确定分类模型的训练损失值，可以提高分类模型对噪声样本的处理能力，提升模型的学习效果，从而提升训练好的分类模型的分类准确性。
30.本技术实施例提供的方案涉及计算机技术中的云技术、大数据及人工智能等领域。
31.本技术实施例中所涉及的数据处理可以通过云技术来实现，其中所涉及的数据计算可以通过云技术中的云计算实现。
32.云计算(cloud computing)是一种计算模式，它将计算任务分布在大量计算机构成的资源池上，使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的，并且可以随时获取，按需使用，随时扩展，按使用付费。
33.作为云计算的基础能力提供商，会建立云计算资源池(简称云平台，一般称为iaas(infrastructure as a service，基础设施即服务)平台，在资源池中部署多种类型的虚拟资源，供外部客户选择使用。云计算资源池中主要包括：计算设备(为虚拟化机器，包含操作系统)、存储设备、网络设备。
34.按照逻辑功能划分,在iaas(infrastructure as a service，基础设施即服务)层上可以部署paas(platform as a service,平台即服务)层，paas层之上再部署saas(software as a service,软件即服务)层，也可以直接将saas部署在iaas上。paas为软件运行的平台，如数据库、web容器等。saas为各式各样的业务软件，如web门户网站、短信群发器等。一般来说，saas和paas相对于iaas是上层。
35.云计算(cloud computing)指it基础设施的交付和使用模式，指通过网络以按需、易扩展的方式获得所需资源；广义云计算指服务的交付和使用模式，指通过网络以按需、易扩展的方式获得所需服务。这种服务可以是it和软件、互联网相关，也可是其他服务。云计算是网格计算(grid computing)、分布式计算(distributedcomputing)、并行计算(parallel computing)、效用计算(utility computing)、网络存储(network storage technologies)、虚拟化(virtualization)、负载均衡(load balance)等传统计算机和网络技术发展融合的产物。
36.随着互联网、实时数据流、连接设备多样化的发展，以及搜索服务、社会网络、移动商务和开放协作等需求的推动，云计算迅速发展起来。不同于以往的并行分布式计算，云计算的产生从理念上将推动整个互联网模式、企业管理模式发生革命性的变革。
37.本技术实施例中所涉及的分类模型的训练可以通过人工智能技术中的机器学习来实现。
38.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能
也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。
39.人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大图像处理技术、操作/交互系统、机电一体化等技术。本技术实施例涉及的人工智能技术主要包括机器学习/深度学习等几大方向。
40.机器学习(machine learning,ml)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
41.本技术实施例中所涉及的数据分类所需要的训练样本可以为从互联网中获取到的大数据。
42.大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着云时代的来临，大数据也吸引了越来越多的关注，大数据需要特殊的技术，以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术，包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
43.本技术技术方案的执行主体为计算机设备，包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。计算机设备包括用户设备与网络设备。其中，用户设备包括但不限于电脑、智能手机、pad等；网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或于云计算的由大量计算机或网络服务器构成的云，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中，计算机设备可单独运行来实现本技术，也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本技术。其中，计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、vpn网络等。
44.下面以具体地实施例对本技术的技术方案以及本技术的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本技术的实施例进行描述。
45.本技术实施例提供了一种数据分类方法，该方法的执行主体可以为任一电子设备，例如，该方法可以由服务器执行，如图1所示，该方法可以包括：
46.步骤s101，获取待分类数据；
47.其中，待分类数据包括图像数据或者文本数据，待分类数据还可以是通过一定的处理方式可以转化成图像数据或文本数据的其他类型的数据，包括但不限于视频数据、音频数据、视音频数据。
48.步骤s102，将待分类数据输入训练好的分类模型，得到待分类数据对应的分类结果；
49.其中，训练好的分类模型是通过训练样本集对分类模型训练得到的，分类模型的
训练损失值是基于训练样本集中的各训练样本各自对应的训练损失值的权重确定的，各训练样本各自对应的训练损失值的权重是基于各训练样本的样本类型确定的，样本类型为噪声样本或非噪声样本。
50.其中，待分类数据对应的分类结果可以是待分类数据属于分类模型对应的某一分类类别的指示信息，也可以是待分类数据属于分类模型对应的各分类类别的概率，也可以是任何其他类型的能够表征待分类数据的分类类别的信息，本技术对此不做限定。
51.本技术技术方案中的分类模型可以是提取待分类数据的数据特征之后，根据数据特征将待分类数据分为不同类别的任意的数学模型。
52.可选的，本技术技术方案中的分类模型可以是应用到不同分类场景中的神经网络模型。例如，应用到图像识别场景中的图像分类模型，图像分类模型对图像进行类别级别的识别，不考虑对象的特定实例，仅考虑对象的类别(如人、狗、猫、鸟等)进行的识别，并给出对象所属类别。一个典型的例子是大型通用物体识别开源数据集imagenet中的识别任务，识别出某个物体是1000个类别中的哪一个。
53.可选的，图像分类模型还可以是进行图像多标签识别的模型，通过计算机识别出图像是否具有指定属性标签的组合。例如，一张图像可能具有多个属性，多标签识别任务是判断某张图具有哪些预设的属性标签。
54.可选的，分类模型还可以是根据文本特征进行文本分类的的文本分类模型。
55.可选的，分类模型的初始模型可以是基于imagenet数据集训练得到该模型的参数权重的一个深度学习网络模型，即imagenet预训练模型。
56.其中，训练样本集中的训练样本包括带有真实类别标签的样本，带有真实类别标签的样本即进行了人工标注或机器标注的样本，真实类别标签即标注标签。训练样本集可以是包括噪声样本的样本数据，噪声样本包括标注失误造成错误类别标注、概念不清晰造成样本与对应类别标签不一致的样本。
57.例如，对于场景类间图像识别，图像中的场景容易混淆，使得标注错误率比正常分类数据的标注要高，如咖啡厅和图书馆都是桌椅集合，两者标注的时候可能会把图书馆一角标注成了咖啡厅(没有咖啡相关的标志物)，即标注中存在噪声标签的样本。
58.可以理解的是，非噪声样本即为类别标注准确的样本，也可称为干净样本。
59.本技术实施例中，采用训练好的分类模型进行数据分类，分类模型的训练损失值是基于训练样本集中的各训练样本各自对应的训练损失值的权重确定的，各训练样本各自对应的训练损失值的权重是基于各训练样本的样本类型确定的，根据各训练样本的样本类型确定分类模型的训练损失值，可以提高分类模型对噪声样本的处理能力，提升模型的学习效果，从而提升训练好的分类模型的分类准确性。
60.在一种可能的实现方式中，分类模型是通过以下方式训练得到的：
61.获取训练样本集，训练样本集包括各批次的训练样本，每一批次的训练样本包括带有真实类别标签的各训练样本；
62.对于每一批次的训练样本，通过重复执行以下训练操作直至分类模型的训练损失值满足预设的训练结束条件，得到训练好的分类模型：
63.对于当前批次的每一训练样本，将训练样本输入至分类模型中，提取训练样本的样本特征向量，并基于样本特征向量，得到训练样本的类别预测结果；
64.获取分类模型对应的各分类类别的类别特征向量；
65.对于每一训练样本，基于训练样本的样本特征向量和各类别特征向量的相似度，确定训练样本对应的推荐类别标签，并基于训练样本的真实类别标签和推荐类别标签，确定训练样本的样本类型；
66.对于每一训练样本，基于该训练样本的样本类型，确定该训练样本对应的训练损失值的权重；
67.基于各训练样本对应的训练损失值的权重、各训练样本的类别预测结果、以及各训练样本的真实类别标签，确定分类模型的训练损失值，其中，若训练损失值不满足训练结束条件，则调整分类模型的模型参数，并在训练样本集中获取下一批次的训练样本，执行下次训练操作。
68.其中，训练样本集可以是与分类模型的应用场景相关的样本数据，包括但不限于图像数据、文本数据、视频数据、音频数据、视音频数据。训练样本集中包括各批次的训练样本，每次进行训练操作时，选择一个批次的训练样本进行模型训练，若本次训练操作的训练损失值不满足训练结束条件，则调整分类模型的模型参数，并在训练样本集中获取下一批次的训练样本再次进行训练操作。
69.在对分类模型进行训练时，将训练样本输入分类模型中，通过分类模型的特征提取模块提取训练样本的样本特征向量，通过分类模型中的分类模块，基于样本特征向量对训练样本进行类别预测，得到各训练样本的类别预测结果。按照各训练样本各自对应的真实类别标签，可以将具有相同真实类别标签的训练样本划分为同一个分类类别，从而得到多个分类类别，也就是分类模型对应的各分类类别。
70.可选的，对于每一分类类别，可以根据该分类类别中的各训练样本的样本特征向量，确定该分类类别的类别特征向量。每个分类类别，可以具有至少一个类别特征向量。在分类模型迭代训练的某个时刻，每个分类类别的类别特征向量也称为该时刻下该分类类别的记忆单元memory bank。
71.对于每一训练样本，计算该训练样本的样本特征向量和各类别特征向量的相似度，根据各相似度计算结果，确定训练样本对应的推荐类别标签。可选的，可以将相似度满足预设条件的相似度对应的分类类别的类别标签作为该训练样本对应的推荐类别标签。每个训练样本可以对应至少一个推荐类别标签。
72.基于训练样本的真实类别标签和推荐类别标签，可以确定训练样本的样本类型为噪声样本或非噪声样本。对于每个训练样本，若该训练样本为噪声样本，则可以为该训练样本的训练损失值配置比较小的权重；若该训练样本为非噪声样本，则可以为该训练样本的训练损失值配置比较大的权重。对于每个训练样本，根据该训练样本的类别预测结果、以及该训练样本的真实类别标签，可以计算得到该训练样本对应的训练损失值。根据各训练样本对应的训练损失值，以及各训练样本对应的训练损失值的权重，确定分类模型的训练损失值。
73.可选的，对于任一训练样本，类别预测结果包括该训练样本属于每一分类类别的预测概率。若分类模型的训练损失值不满足预设的训练结束条件，则调整分类模型的模型参数，并获取下一批次的训练样本集，再次对分类模型进行训练。若分类模型的训练损失值满足预设的训练结束条件，则训练结束，得到训练好的分类模型。
74.其中，预设的训练结束条件可以是分类模型的训练损失值稳定不再下降，也可以是分类模型对测试样本集进行分类时，分类的效果达到预设的目标时，分类模型的训练损失值。训练结束条件可以根据具体需要进行配置，本技术对此不做限定。
75.在一示例中，对于每个训练样本，可以通过以下公式(1)计算该训练样本对应的损失函数的值：
[0076][0077]
其中，l
class
表示训练样本对应的训练损失值，y表示训练样本的真实类别标签，表示训练样本的类别预测结果，类别预测结果可以是训练样本对应于各分类类别的预测概率。
[0078]
根据以下公式(2)确定分类模型的训练损失值：
[0079][0080]
其中，l
n
表示分类模型的训练损失值；w
i
表示第i个训练样本对应的训练损失值的权重；表示第i个训练样本对应的训练损失值，可以根据公式(1)计算得到。
[0081]
在一示例中，以图像分类为例，初始分类模型的conv1层
‑
conv5层采用在imagenet数据集上预训练的resnet101模型的参数，并添加全连接层，全连接层采用方差为0.01，均值为0的高斯分布进行初始化。本实施例采用基于随机梯度下降(stochastic gradient descent，sgd)的梯度下降法求解分类模型的参数w和偏置参数b，在每次迭代过程中，反向传播到分类模型，计算梯度并更新分类模型的参数。具体过程为：把初始分类模型的所有参数都设为需要学习状态，训练分类模型时，分类模型对输入的每个训练样本进行前向计算，得到该训练样本的类别预测结果；根据分类预测结果与真实类别标签计算该训练样本对应的训练损失值，根据每个训练样本的训练损失值，确定分类模型的分类损失值。若分类模型的训练损失值满足训练结束条件，则结束训练，若分类模型的训练损失值不满足训练结束条件，则调整分类模型的模型参数，获取下一批次的训练样本，并重复执行训练操作。
[0082]
其中，resnet
‑
101模型包括特征模块和分类模块。
[0083]
在一示例中，特征模块结构如表1所示：
表示第二个卷积层的卷积核尺寸,512表示第二个卷积层的通道数；1
×
1表示第三个卷积层的卷积核尺寸,2048表示第三个卷积层的通道数。
[0088]
其中，conv2_x层的每个卷积块的结构如图2所示。通道数为256的训练样本经过第一个卷积层进行卷积处理，第一个卷积层的卷积核尺寸是1
×
1，通道数是64，第一个卷积层输出的样本特征经过线性整流函数(rectified linear unit,relu)进行非线性处理，得到处理后的样本特征，进行第二个卷积层的卷积处理，第二个卷积层的卷积核尺寸是3
×
3，通道数是64，第二个卷积层输出的样本特征经过relu进行非线性处理，得到处理后的样本特征，进行第三个卷积层的卷积处理，第三个卷积层的卷积核尺寸是1
×
1，通道数是256，第三个卷积层输出的样本特征经过relu进行非线性处理，得到处理后的样本特征。当前卷积块处理完成之后，进行下一个卷积块的处理。
[0089]
分类模块结构如表2所示：
[0090]
层名称layer name输出尺寸output size功能层layerpool_cr1
×
2048max poolfc_cr1
×
nfull connection
[0091]
表2
[0092]
其中，pool_cr表示分类模块的第一个层的层名称，1
×
2048表示该层的训练样本的输出尺寸，max pool表示该层的功能是进行最大池化操作；fc_cr表示分类模块的第二个层的层名称，1
×
n表示该层的训练样本的输出尺寸，其中，n表示分类模型的分类类别的数量，full connection表示该层的功能是进行全连接操作。
[0093]
本技术实施例中，不需要对噪声样本进行额外的人工标注，也就是说，不需要预先知道训练样本中哪些是噪声样本，而是将所有训练样本纳入到模型训练中，基于各训练样本的样本类型，确定各训练样本对应的训练损失值的权重，进而确定分类模型的训练损失值，可以提高分类模型对噪声样本的处理能力，以提升样本数据的利用效率，从而实现分类模型对类别的自我感知与自监督校验数据的迭代式学习，避免了离线学习噪声样本确定权重或更新样本标签造成的单次偏差导致分类模型陷入局部最优，影响训练好的分类模型的分类准确性的问题。
[0094]
另外，分类模型的各分类类别的类别特征向量可以不断更新，具体见如下实施例：
[0095]
在一种可能的实现方式中，对于每一次训练操作，若当前次训练操作所对应的训练损失值不满足训练结束条件，在进行下一次训练操作前，方法还包括：
[0096]
通过以下方式更新各分类类别的类别特征向量：
[0097]
对于每一训练样本，基于该训练样本的真实类别标签，确定该训练样本的分类类别；
[0098]
对于每一分类类别，基于该分类类别的各训练样本的样本特征向量进行聚类处理，得到该分类类别对应的n个聚类类别，n≥1；
[0099]
对于每一聚类类别，基于属于该聚类类别的各训练样本的样本特征向量，得到该聚类类别对应的特征向量；
[0100]
对于每一分类类别，基于当前次训练操作所对应的各聚类类别的特征向量，对该分类类别的类别特征向量进行更新，其中，每一分类类别的类别特征向量包括n个特征向量。
[0101]
在实际应用中，对于每一次训练操作，若当前次训练操作所对应的训练损失值不满足训练结束条件，在进行下一次训练操作前，可以利用当前次训练的训练样本集对各分类类别的类别特征向量进行更新。具体的，根据各训练样本的真实类别标签，将训练样本划分到不同的分类类别，将每个分类类别的训练样本的样本特征向量进行聚类，得到每个分类类别对应的至少一个聚类类别，基于属于每个聚类类别的训练样本的样本特征向量，得到该聚类类别对应的特征向量。可选的，确定每个聚类类别的类别中心，将与该类别中心距离最近的训练样本的样本特征向量作为该聚类类别对应的特征向量。
[0102]
其中，两个向量之间的距离可以通过任意距离公式来计算，包括但不限于：欧几里得距离(euclidean distance)、切比雪夫距离(chebyshev distance)、曼哈顿距离(manhattan distance)、马氏距离(mahalanobis distance)。
[0103]
在对每个分类类别的类别特征向量进行更新时，可以根据每个分类类别对应的各聚类类别的特征向量，对该分类类别的类别特征向量进行更新。可选的，对于每个分类类别，可以根据该分类类别对应的各聚类类别的特征向量确定该分类类别的类别特征向量，从而得到该分类类别对应的n个特征向量。
[0104]
可选的，每个分类类别可以对应多个类别特征向量。以图像分类为例，由于每个分类类别可能有多重风格样式的场景图像，例如，公园类别可能会包含儿童游乐公园、湖景公园、公园绿道等多种样式，如果一个分类类别只对应一个类别特征向量，不足以表征这些样式，为了更好的表征每个分类类别，可以通过聚类的方式，得到多个聚类类别的特征向量，分类类别对应的类别特征向量包括分类类别对应的多个聚类类别的特征向量。
[0105]
本实施例中，通过对各分类类别的类别特征向量不断更新，可以使分类模型的训练不断优化，提升分类模型的训练效果。
[0106]
其中，对分类类别的类别特征向量进行更新的具体实现方式见如下实施例：
[0107]
在一种可能的实现方式中，对于每一分类类别，基于当前次训练操作所对应的各聚类类别的特征向量，对分类类别的类别特征向量进行更新，包括：
[0108]
对于每一聚类类别，确定当前次训练操作所对应的聚类类别的类别中心与当前次训练操作之前的各聚类类别的类别中心之间的相似度；
[0109]
对于每一聚类类别，基于当前次训练操作所对应的聚类类别的类别中心和各相似度中最高相似度所对应的当前次训练操作之前的聚类类别的类别中心，确定该聚类类别的新的类别中心；
[0110]
对于每一聚类类别，基于新的类别中心，确定该聚类类别的新的特征向量；
[0111]
其中，更新后的分类类别的类别特征向量包括新的特征向量。
[0112]
在实际应用中，对于每一分类类别，基于当前次训练操作所对应的各聚类类别的特征向量，对分类类别的类别特征向量进行更新时，可以首先对当前次训练操作所对应的聚类类别的类别中心进行更新，得到当前次训练操作所对应的聚类类别的新的类比中心。具体的，计算当前次训练操作所对应的聚类类别的类别中心与当前次训练操作之前的各聚类类别的类别中心之间的相似度，可选的，类别中心对应的向量可以是该聚类类别的各训练样本的样本特征向量的平均值。其中，向量之间的相似度可以通过任意的相似度计算方式进行计算。可选的，向量之间的相似度可以通过计算余弦相似度的方式进行计算。
[0113]
对于每一聚类类别，基于当前次训练操作所对应的聚类类别的类别中心和该聚类
类别对应的各相似度中最高相似度所对应的当前次训练操作之前的聚类类别的类别中心，确定该聚类类别对应的新的类别中心。对于每一聚类类别，可以基于新的类别中心，确定聚类类别的新的特征向量。可选的，可以将距离新的类别中心最近的训练样本的样本特征向量作为该聚类类别的新的特征向量。每一分类类别的类别特征向量包括该分类类别对应的各聚类类别的特征向量，因此，分类类别的类别特征向量随着聚类类别的特征向量的更新而进行更新，则更新后的分类类别的类别特征向量包括该分类类别对应的聚类类别新的特征向量。
[0114]
可选的，对于每一聚类类别，还可以预先配置当前次训练操作对应的聚类类别的类别中心与当前次训练操作之前的类别中心的相似度阈值，根据相似度超过该相似度阈值的当前次训练操作之前的聚类类别的类别中心，以及当前次训练操作所对应的聚类类别的类别中心，确定该聚类类别的新的类别中心。
[0115]
在一示例中，可以通过以下公式(3)确定聚类类别i对应的新的类别中心：
[0116]
c
i
‑
new
＝a1c
j
a2c
i
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0117]
其中，c
i
‑
new
表示聚类类别i对应的新的类别中心；c
i
表示本次训练操作所对应的聚类类别i的类别中心；c
j
表示与c
i
相似度最高的本次训练操作之前的类别中心；a1、a2为预设参数，可以根据具体需要进行配置。
[0118]
其中，对于每个分类类别，该分类类别的类别特征向量可以用于确定该分类类别的训练样本对应的推荐类别标签，具体见如下实施例：
[0119]
在一种可能的实现方式中，基于训练样本的样本特征向量和各类别特征向量的相似度，确定训练样本对应的推荐类别标签，包括：
[0120]
对于每一训练样本，确定该训练样本的样本特征向量与各类别特征向量的相似度；
[0121]
获取各分类类别各自对应的相似度阈值；
[0122]
对于每一训练样本，将该训练样本的样本特征向量与各类别特征向量的相似度中大于或等于相似度阈值的相似度对应的分类类别的类别标签作为该训练样本对应的推荐类别标签。
[0123]
在实际应用中，对于每一训练样本，确定该训练样本的样本特征向量与各类别特征向量的相似度。其中，特征向量之间的相似度可以通过任意的相似度计算方式进行计算。可选的，特征向量之间的相似度可以通过计算余弦相似度的方式进行计算。得到该训练样本的样本特征向量与各类别特征向量的相似度之后，获取各分类类别各自对应的相似度阈值，其中，分类类别各自对应的相似度阈值可以预先配置，也可以根据每个分类类别的训练样本的类别预测结果来确定。对于每一训练样本，计算该训练样本的样本特征向量与各类别特征向量的相似度，其中，相似度大于或等于相似度阈值的相似度对应的分类类别为该训练样本的相关分类类别，将该训练样本的相关分类类别的类别标签作为该训练样本对应的推荐类别标签。推荐类别标签用于标识该训练样本的推荐分类类别。
[0124]
其中，确定该训练样本的样本特征向量与各类别特征向量的相似度，和获取各分类类别各自对应的相似度阈值，两个步骤的执行顺序也可以是先获取各分类类别各自对应的相似度阈值，再确定该训练样本的样本特征向量与各类别特征向量的相似度。
[0125]
本实施例中，根据训练样本的样本特征向量与类别特征向量的相似度来确定训练
样本的类别推荐标签，可以使得训练样本的类别推荐标签更加准确。
[0126]
其中，各分类类别各自对应的相似度阈值可以通过以下方式进行更新：
[0127]
在一种可能的实现方式中，对于每一次训练操作，若当前次训练操作所对应的分类模型的训练损失值不满足训练结束条件，在进行下一次训练操作前，该方法还包括：
[0128]
通过以下方式更新各分类类别各自对应的相似度阈值：
[0129]
基于各训练样本的真实类别标签，确定训练样本集中属于每一分类类别的训练样本的数量；
[0130]
对于每一分类类别，基于属于该分类类别的训练样本的数量，以及训练样本集中各训练样本的类别预测结果中对应于该分类类别的预测概率，确定分类类别对应的新的相似度阈值。
[0131]
在实际应用中，若当前次训练操作所对应的训练损失值不满足训练结束条件，则进行更新各分类类别各自对应的相似度阈值。具体的，对于每一分类类别，根据该分类类别的各训练样本的真实类别标签，可以得到每个分类类别的训练样本的数量。根据当前次训练操作可以得到的各训练样本的类别预测结果，对于每一训练样本，类别预测结果可以是该训练样本对应于各分类类别的预测概率。在对每个分类类别对应的相似度阈值进行更新时，对于每个分类类别，根据各训练样本对应于该分类类别的预测概率，和该分类类别的训练样本的数量，确定该分类类别对应的新的相似度阈值。对于每个分类类别对应的相似度阈值的初始值，可以根据具体需要进行配置。
[0132]
可选的，在确定分类类别对应的新的相似度阈值时，对于每一分类类别，可以利用该分类类别中的全部训练样本的样本数量和该分类类别中的全部训练样本对应于该分类类别的预测概率来确定该分类类别对应的新的相似度阈值；或者，还可以确定该分类类别中的非噪声样本，利用该分类类别中的非噪声样本的样本数量和各非噪声样本对应于该分类类别的预测概率来确定该分类类别对应的新的相似度阈值。
[0133]
在一示例中，可以通过以下公式(4)对每个分类类别对应的相似度阈值进行更新：
[0134][0135]
其中，thr
i
表示分类类别i对应的更新后的相似度阈值；c
i
表示分类类别i的训练样本的样本集合；|c
i
|表示类别为i的分类类别的训练样本的数量；p
ji
表示样本j对应于分类类别i的预测概率。
[0136]
在一种可能的实现方式中，对于任一训练样本，基于该训练样本的真实类别标签和推荐类别标签，确定该训练样本的样本类型，包括：
[0137]
若推荐类别标签不包括真实类别标签，则该训练样本为噪声样本。
[0138]
在实际应用中，对于任一训练样本，该训练样本的样本特征向量与各类别特征向量的相似度中大于或等于相似度阈值的相似度对应的分类类别可能是一个，也可能为多个，每个分类类别对应一个类别标签，则每个训练样本对应的推荐类别标签可能是一个，也可能是多个。对于每个训练样本，若该训练样本的推荐类别标签不包括该训练样本的真实类别标签，则该训练样本为噪声样本。
[0139]
在一种可能的实现方式中，对于每一训练样本，基于该训练样本的样本类型，确定
训练样本对应的训练损失值的权重，包括：
[0140]
若训练样本为非噪声样本，则确定训练样本的真实类别标签在训练样本对应的推荐类别标签中的数量占比，基于数量占比，确定训练样本对应的训练损失值的权重。
[0141]
在实际应用中，若训练样本为噪声样本，则可以将该训练样本对应的训练损失值的权重配置为小于非噪声样本对应的训练损失值的权重，例如，可以为零，相当于过滤掉噪声样本，避免噪声样本对数据分类所产生的影响。若训练样本为非噪声样本，则根据该训练样本的真实类别标签在该训练样本对应的推荐类别标签中的数量占比确定该训练样本对应的训练损失值的权重。
[0142]
本实施例中，根据训练样本的样本类型，确定各训练样本对模型训练的影响程度，对于噪声样本对应的训练损失值，可以配置较小的权重，以实现抑制噪声样本的影响，对于非噪声样本，可以根据训练样本的真实类别标签在推荐类别标签中的数量占比，确定该训练样本的训练损失值的权重，也就是说，根据真实类别标签在推荐类别标签中的数量占比确定非噪声样本的影响程度，实现了利用分类模型学习到的知识自监督对噪声样本进行抑制，避免分类模型对噪声样本过拟合造成识别性能差的问题，提升训练好的分类模型的分类准确性。
[0143]
下面通过一个具体的实施例对本技术技术方案中的分类模型的训练方法的数据处理过程进行详细说明。本实施例只是本技术技术方案的一个实施例，并不代表本技术技术方案的全部实现方式。
[0144]
本实施例中，分类模型对应20个分类类别，训练样本集中包括多个批次(也可称为batch)的训练样本，每次进行模型训练时，利用一个批次的训练样本进行训练，每个批次的训练样本的数量是2048，每个训练样本带有真实类别标签。
[0145]
每次进行训练操作时，将训练样本输入分类模型，通过分类模型的特征模块提取每个训练样本的样本特征向量，对每个分类类别的训练样本的样本特征向量进行聚类，得到5个聚类类别，确定每个聚类类别的类别中心，若本次训练操作为首次训练操作，则将与类别中心距离最近的样本特征向量作为聚类类别对应的特征向量。若本次训练操作为不是首次训练操作，对于每一聚类类别，根据本次训练操作的该聚类类别对应的类别中心，以及与本次训练操作的该聚类类别对应的类别中心相似度最高的本次训练操作之前各次训练操作的聚类类别的类别中心，确定该聚类类别的新的类别中心，根据新的类别中心确定该聚类类别的新的特征向量。
[0146]
对于每个分类类别，本次训练操作的类别特征向量包括该分类类别对应的各聚类类别的特征向量，则每个分类类别的类别特征向量包括5个聚类类别的特征向量，则20个分类类别的类别特征向量共包括20
×
5＝100个聚类类别的特征向量，该批次共2048个训练样本，则得到100
×
2048的矩阵。对于每个分类类别，计算该分类类别对应的训练样本的样本特征向量与100个特征向量的相似度，对于每个训练样本，将相似度大于相似度阈值的分类类别的类别标签作为该训练样本的推荐类别标签。
[0147]
根据上述相似度计算，以3个训练样本为例进行说明，得到训练样本1的推荐类别标签为1、1、2，而训练样本1的真实类别标签为4；训练样本2的推荐类别标签为1、5、5、6、7，而训练样本2的真实类别标签为5；训练样本3无推荐类别标签，训练样本3的真实类别标签为6。其中，由于每个分类类别包括5个聚类类别的特征向量，则训练样本的推荐类别标签可
能会出现5个相同的类别标签。
[0148]
对于每个训练样本，当推荐类别标签中不含有真实类别标签时，表示该训练样本是噪声样本，将训练样本对应的训练损失值的权重设置为0，如上述训练样本1和训练样本3；当推荐类别标签中含有真实类别标签时，若推荐类别标签中有1/2或1/2以上与真实类别标签相同，则将该训练样本对应的训练损失值的权重设置为1；当推荐类别标签1/2以下与真实类别标签相同，则将该训练样本对应的训练损失值的权重设置为m/n，其中m为推荐类别标签中与真实类别标签相同的类别标签的数量，n为该训练样本的推荐类别标签的总数量，如上述训练样本2，共有5个推荐类别标签：1、5、5、6、7，其中与真实类别标签相同的有2个，则将训练样本2对应的训练损失值的权重设置为2/5。
[0149]
确定了各训练样本的训练损失值的权重之后，根据各训练样本的类别预测结果以及真实类别标签，确定各训练样本的训练损失值，根据各训练样本的训练损失值的权重、各训练样本的训练损失值，确定分类模型的训练损失值，若分类模型的训练损失值不满足训练结束条件，则调整分类模型的模型参数，并利用另一个批次的训练样本再次进行分类模型的训练操作，直到分类模型的训练损失值满足训练结束条件，得到训练好的分类模型。
[0150]
下面通过一个具体的实施例对本技术技术方案中的分类模型的训练方法的数据处理过程进行详细说明。
[0151]
如图3所示，获取训练样本集，训练样本集中包括带有真实类别标签的各训练样本(如图中所示的“数据”)；将各训练样本输入分类模型(如图中所示的“卷积神经网络模型”)，神经网络模型的特征模块提取各训练样本的样本特征向量，将分类模型对应的每一分类类别的训练样本的样本特征向量进行聚类，得到每个分类类别对应的多个聚类类别，确定每个聚类类别对应的特征向量，每次训练操作之后，更新各聚类类别的特征向量，得到各聚类类别的新的特征向量。利用各聚类类别的新的特征向量，更新分类类别的类别特征向量，也就是更新该分类类别的记忆单元。将每个训练样本的样本特征向量与各个分类类别的类别特征向量(如图中所示的“类别记忆单元”)进行类别匹配，得到每个训练样本的类别推荐标签，根据训练样本的类别推荐标签和真实类别标签，确定训练样本的样本类型，也就是是否为噪声样本(如图中所示的“噪声确定”)，根据训练样本的样本类型，确定训练样本的训练损失值的权重，卷积神经网络模型的分类模块根据训练样本的样本特征向量得到训练样本的类别预测结果，根据训练样本的真实类别标签和类别预测结果，可以得到训练样本的训练损失值，根据各训练样本的训练损失值以及训练损失值的权重，得到分类模型的训练损失值。若分类模型的训练损失值不满足训练结束条件，则调整分类模型的模型参数，并获取新的训练样本集继续进行训练，直至分类模型的训练损失值满足预设的训练结束条件，得到训练好的分类模型。
[0152]
下面通过一个具体的实施例对本技术技术方案中的记忆单元的更新过程进行详细说明。
[0153]
如图4所示，执行步骤s401，获取各训练样本的样本特征向量。
[0154]
具体的，通过分类模型的特征模块提取各训练样本的样本特征向量。
[0155]
执行步骤s402，各分类类别的聚类。
[0156]
具体的，将各分类类别的训练样本的样本特征向量进行聚类，得到各分类类别对应的多个聚类类别。
[0157]
执行步骤s403，确定聚类类别的类别中心。
[0158]
具体的，计算每个聚类类别的训练样本的样本特征向量的均值，作为聚类类别的类别中心。
[0159]
执行步骤s404，获取记忆单元中的聚类类别的历史特征向量。
[0160]
具体的，每个分类类别的类别特征向量(记忆单元)中包括该分类类别对应的聚类类别的类别中心，获取本次训练操作之前的训练操作对应的各聚类类别的类别中心，也就是历史类别中心。
[0161]
执行步骤s405，更新聚类类别的类别中心。
[0162]
具体的，对于每个聚类类别，根据该聚类类别对应的历史类别中心和本次训练操作的类别中心，确定该聚类类别对应的新的类别中心，利用更新后的新的类别中心，确定新的特征向量更新该聚类类别对应的分类类别的类别特征向量，也就是更新该分类类别的记忆单元，并记录更新后的记忆单元，方便下次迭代使用。
[0163]
下面通过一个具体的实施例对本技术技术方案中的分类模型的应用过程进行介绍。
[0164]
如图5所示，本实施例中，分类模型为图像识别模型。用户终端(如图中所示的“前端a”)接收到数据(如图中所示的“用户输入的图片”)，将数据上传到服务器(如图中所示的“后端”)，服务器利用通过本技术方案中的分类模型训练方法进行训练得到的训练好的图像识别模型，对图片进行识别处理，将识别结果输出到用户终端(如图中所示的“前端b”)。前端a和前端b可以是不同的显示界面。
[0165]
另外，通过本技术技术方案中的分类模型训练方法训练好的图像识别模型，除了支持用户调用外，还支持其他业务调用，例如，播放器在播放电视剧时，需要展示当前剧情是什么场景，则播放器将当前播放时刻对应的视频的前后图像帧输入图像识别模型，通过图像识别模型得到识别结果，输出当前剧情的场景信息，返回给播放器进行展示。
[0166]
本技术提供了一种数据分类方法，采用训练好的分类模型进行数据分类，分类模型的训练损失值是基于训练样本集中的各训练样本各自对应的训练损失值的权重确定的，各训练样本各自对应的训练损失值的权重是基于各训练样本的样本类型确定的，根据各训练样本的样本类型确定分类模型的训练损失值，可以提高分类模型对噪声样本的处理能力，提升模型的学习效果，从而提升训练好的分类模型的分类准确性。
[0167]
与图1中所示方法相同的原理，本技术的实施例中还提供了一种数据分类装置60，如图6所示，该数据分类装置60包括：
[0168]
获取模块61，用于获取待分类数据；待分类数据包括图像数据或者文本数据；
[0169]
分类模块62，用于将待分类数据输入训练好的分类模型，得到待分类数据对应的分类结果；
[0170]
其中，训练好的分类模型是通过训练样本集对分类模型训练得到的，分类模型的训练损失值是基于训练样本集中的各训练样本各自对应的训练损失值的权重确定的，各训练样本各自对应的训练损失值的权重是基于各训练样本的样本类型确定的，样本类型为噪声样本或非噪声样本。
[0171]
在一种可能的实现方式中，分类模块62还用于通过以下方式训练分类模型：
[0172]
获取训练样本集，训练样本集包括各批次的训练样本，每一批次的训练样本包括
带有真实类别标签的各训练样本；
[0173]
对于每一批次的训练样本，通过重复执行以下训练操作直至分类模型的训练损失值满足预设的训练结束条件，得到训练好的分类模型：
[0174]
对于当前批次的每一训练样本，将训练样本输入至分类模型中，提取训练样本的样本特征向量，并基于样本特征向量，得到训练样本的类别预测结果；
[0175]
获取分类模型对应的各分类类别的类别特征向量；
[0176]
对于每一训练样本，基于训练样本的样本特征向量和各类别特征向量的相似度，确定训练样本对应的推荐类别标签，并基于训练样本的真实类别标签和推荐类别标签，确定训练样本的样本类型；
[0177]
对于每一训练样本，基于训练样本的样本类型，确定训练样本对应的训练损失值的权重；
[0178]
基于各训练样本对应的训练损失值的权重、各训练样本的类别预测结果、以及各训练样本的真实类别标签，确定分类模型的训练损失值，其中，若训练损失值不满足训练结束条件，则调整分类模型的模型参数，并在训练样本集中获取下一批次的训练样本，执行下次训练操作。
[0179]
在一种可能的实现方式中，分类模块62包括第一更新单元，用于：
[0180]
对于每一次训练操作，若当前次训练操作所对应的训练损失值不满足训练结束条件，在进行下一次训练操作前，通过以下方式更新各分类类别的类别特征向量：
[0181]
对于每一训练样本，基于训练样本的真实类别标签，确定训练样本的分类类别；
[0182]
对于每一分类类别，基于分类类别的各训练样本的样本特征向量进行聚类处理，得到分类类别对应的n个聚类类别，n≥1；
[0183]
对于每一聚类类别，基于属于聚类类别的各训练样本的样本特征向量，得到聚类类别对应的特征向量；
[0184]
对于每一分类类别，基于当前次训练操作所对应的各聚类类别的特征向量，对分类类别的类别特征向量进行更新，其中，每一分类类别的类别特征向量包括n个特征向量。
[0185]
在一种可能的实现方式中，分类模块62在对于每一分类类别，基于当前次训练操作所对应的各聚类类别的特征向量，对分类类别的类别特征向量进行更新时，用于：
[0186]
对于每一聚类类别，确定当前次训练操作所对应的聚类类别的类别中心与当前次训练操作之前的各聚类类别的类别中心之间的相似度；
[0187]
对于每一聚类类别，基于当前次训练操作所对应的该聚类类别的类别中心和各相似度中最高相似度所对应的当前次训练操作之前的聚类类别的类别中心，确定该聚类类别的新的类别中心；
[0188]
对于每一聚类类别，基于新的类别中心，确定该聚类类别的新的特征向量；
[0189]
其中，更新后的分类类别的类别特征向量包括新的特征向量。
[0190]
在一种可能的实现方式中，分类模块62在基于训练样本的样本特征向量和各类别特征向量的相似度，确定训练样本对应的推荐类别标签时，用于：
[0191]
对于每一训练样本，确定训练样本的样本特征向量与各类别特征向量的相似度；
[0192]
获取各分类类别各自对应的相似度阈值；
[0193]
对于每一训练样本，将训练样本的样本特征向量与各类别特征向量的相似度中大
于或等于相似度阈值的相似度对应的分类类别的类别标签作为训练样本对应的推荐类别标签。
[0194]
在一种可能的实现方式中，分类模块62还包括第二更新单元，用于：
[0195]
对于每一次训练操作，若当前次训练操作所对应的分类模型的训练损失值不满足训练结束条件，在进行下一次训练操作前，通过以下方式更新各分类类别各自对应的相似度阈值：
[0196]
基于各训练样本的真实类别标签，确定训练样本集中属于每一分类类别的训练样本的数量；
[0197]
对于每一分类类别，基于属于分类类别的训练样本的数量，以及训练样本集中各训练样本的类别预测结果中对应于分类类别的预测概率，确定分类类别对应的新的相似度阈值。
[0198]
在一种可能的实现方式中，对于任一训练样本，分类模块62在基于训练样本的真实类别标签和推荐类别标签，确定训练样本的样本类型时，用于：
[0199]
若推荐类别标签不包括真实类别标签，则训练样本为噪声样本。
[0200]
在一种可能的实现方式中，对于每一训练样本，分类模块62在基于训练样本的样本类型，确定训练样本对应的训练损失值的权重时，用于：
[0201]
若训练样本为非噪声样本，则确定训练样本的真实类别标签在训练样本对应的推荐类别标签中的数量占比，基于数量占比，确定训练样本对应的训练损失值的权重。
[0202]
本技术实施例的数据分类装置可执行本技术的实施例所提供的与图1对应的数据分类方法，其实现原理相类似，本技术实施例中的数据分类装置中的各模块所执行的动作是与本技术实施例中的数据分类方法中的步骤相对应的，对于数据分类装置的各模块的详细功能描述具体可以参见前文中所示的对应的数据分类方法中的描述，此处不再赘述。
[0203]
本技术实施例提供的数据分类装置，采用训练好的分类模型进行数据分类，分类模型的训练损失值是基于训练样本集中的各训练样本各自对应的训练损失值的权重确定的，各训练样本各自对应的训练损失值的权重是基于各训练样本的样本类型确定的，根据各训练样本的样本类型确定分类模型的训练损失值，可以提高分类模型对噪声样本的处理能力，提升模型的学习效果，从而提升训练好的分类模型的分类准确性。
[0204]
其中，数据分类装置可以是运行于计算机设备中的一个计算机程序(包括程序代码)，例如该数据分类装置为一个应用软件；该装置可以用于执行本技术实施例提供的方法中的相应步骤。
[0205]
在一些实施例中，本技术实施例提供的数据分类装置可以采用软硬件结合的方式实现，作为示例，本技术实施例提供的数据分类装置可以是采用硬件译码处理器形式的处理器，其被编程以执行本技术实施例提供的数据分类方法，例如，硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(asic，application specific integrated circuit)、dsp、可编程逻辑器件(pld，programmable logic device)、复杂可编程逻辑器件(cpld，complex programmable logic device)、现场可编程门阵列(fpga，field
‑
programmable gate array)或其他电子元件。
[0206]
在另一些实施例中，本技术实施例提供的数据分类装置可以采用软件方式实现，图6示出了存储在存储器中的数据分类装置，其可以是程序和插件等形式的软件，并包括一
系列的模块，包括获取模块61和模块62，用于实现本技术实施例提供的数据分类方法。
[0207]
上述实施例从虚拟模块的角度介绍了数据分类装置，下述从实体模块的角度介绍一种电子设备，具体如下所示：
[0208]
本技术实施例提供了一种电子设备，如图7所示，图7所示的电子设备7000包括：处理器7001和存储器7003。其中，处理器7001和存储器7003相连，如通过总线7002相连。可选地，电子设备7000还可以包括收发器7004。需要说明的是，实际应用中收发器7004不限于一个，该电子设备7000的结构并不构成对本技术实施例的限定。
[0209]
处理器7001可以是cpu，通用处理器，gpu，dsp，asic，fpga或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本技术公开内容所描述的各种示例性的逻辑方框，模块和电路。处理器7001也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，dsp和微处理器的组合等。
[0210]
总线7002可包括一通路，在上述组件之间传送信息。总线7002可以是pci总线或eisa总线等。总线7002可以分为地址总线、数据总线、控制总线等。为便于表示，图7中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。
[0211]
存储器7003可以是rom或可存储静态信息和指令的其他类型的静态存储设备，ram或者可存储信息和指令的其他类型的动态存储设备，也可以是eeprom、cd
‑
rom或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。
[0212]
存储器7003用于存储执行本技术方案的应用程序代码，并由处理器7001来控制执行。处理器7001用于执行存储器7003中存储的应用程序代码，以实现前述任一方法实施例所示的内容。
[0213]
本技术实施例提供了一种电子设备，本技术实施例中的电子设备包括：一个或多个处理器；存储器；一个或多个计算机程序，其中一个或多个计算机程序被存储在存储器中并被配置为由一个或多个处理器执行，一个或多个程序被处理器执行时，获取待分类数据；待分类数据包括图像数据或者文本数据；将待分类数据输入训练好的分类模型，得到待分类数据对应的分类结果；其中，训练好的分类模型是通过训练样本集对分类模型训练得到的，分类模型的训练损失值是基于训练样本集中的各训练样本各自对应的训练损失值的权重确定的，各训练样本各自对应的训练损失值的权重是基于各训练样本的样本类型确定的，样本类型为噪声样本或非噪声样本。
[0214]
本技术实施例提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，当计算机程序在处理器上运行时，使得处理器可以执行前述方法实施例中相应内容。
[0215]
根据本技术的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述数据分类方法的各种可选实现方式中提供的方法。
[0216]
应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤
的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0217]
以上所述仅是本技术的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本技术原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本技术的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种异常检测方法、问题诊断方法和相关产品与流程

数据分类方法、装置及电子设备与流程

相关文献

最热文献