一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

聚类模型的训练方法、聚类方法、装置、设备及存储介质与流程

2022-05-11 13:48:38 来源:中国专利 TAG:


1.本技术实施例涉及人工智能技术领域,特别涉及一种聚类模型的训练方法、聚类方法、装置、设备及存储介质。


背景技术:

2.随着人工智能技术的发展,神经网络模型的应用也越来越广泛。神经网络模型可以对多个对象数据进行聚类处理,得到各个对象数据的聚类结果,这种用于聚类处理的神经网络模型也称为聚类模型。
3.相关技术在训练得到聚类模型时,获取多个样本对象数据。将多个样本对象数据输入神经网络模型,由神经网络模型输出各个样本对象数据的预测聚类结果。基于各个样本对象数据的预测聚类结果对神经网络模型进行调整,得到聚类模型。
4.上述技术仅是基于各个样本对象数据的预测聚类结果对神经网络模型进行调整,导致聚类模型的准确性较差,从而降低了聚类结果的准确性。


技术实现要素:

5.本技术实施例提供了一种聚类模型的训练方法、聚类方法、装置、设备及存储介质,可用于解决聚类模型的准确性较差,聚类结果的准确性较低的问题,所述技术方案包括如下内容。
6.一方面,本技术实施例提供了一种聚类模型的训练方法,所述方法包括:
7.获取多个第一对象数据、多个第二对象数据以及各个第一对象数据的标注聚类结果;
8.根据第一网络模型获取各个第一对象数据的第一预测聚类结果和各个第二对象数据的第一预测聚类结果;
9.基于所述各个第一对象数据的标注聚类结果、第一预测聚类结果以及所述各个第二对象数据的第一预测聚类结果对所述第一网络模型进行调整,得到聚类模型。
10.另一方面,本技术实施例提供了一种聚类方法,所述方法包括:
11.获取多个目标对象数据;
12.根据聚类模型确定各个目标对象数据的聚类结果,所述聚类模型是根据上述任一项所述的聚类模型的训练方法训练得到的。
13.另一方面,本技术实施例提供了一种聚类模型的训练装置,所述装置包括:
14.获取模块,用于获取多个第一对象数据、多个第二对象数据以及各个第一对象数据的标注聚类结果;
15.所述获取模块,还用于根据第一网络模型获取各个第一对象数据的第一预测聚类结果和各个第二对象数据的第一预测聚类结果;
16.调整模块,用于基于所述各个第一对象数据的标注聚类结果、第一预测聚类结果以及所述各个第二对象数据的第一预测聚类结果对所述第一网络模型进行调整,得到聚类
模型。
17.在一种可能的实现方式中,所述获取模块,用于获取各个样本对象数据所属的聚类簇;基于所述各个样本对象数据所属的聚类簇,将所述各个样本对象数据划分为所述多个第一对象数据和所述多个第二对象数据;将所述各个第一对象数据所属的聚类簇确定为所述各个第一对象数据的标注聚类结果。
18.在一种可能的实现方式中,所述获取模块,用于对于任一个样本对象数据,从所述各个样本对象数据所属的聚类簇中确定所述任一个样本对象数据的参考聚类簇;响应于所述任一个样本对象数据所属的聚类簇与所述参考聚类簇一致,则将所述任一个样本对象数据作为所述第一对象数据;响应于所述任一个样本对象数据所属的聚类簇与所述参考聚类簇不一致,则将所述任一个样本对象数据作为所述第二对象数据。
19.在一种可能的实现方式中,所述获取模块,用于确定所述任一个样本对象数据与各个其他对象数据之间的距离,所述其他对象数据为所述各个样本对象数据中除所述任一个样本对象数据之外的样本对象数据;基于所述任一个样本对象数据与所述各个其他对象数据之间的距离,从所述各个其他对象数据中确定不大于参考距离的各个其他对象数据;从所述不大于参考距离的各个其他对象数据所属的聚类簇中,确定包含所述不大于参考距离的其他对象数据的数量最多的聚类簇为所述任一个样本对象数据的参考聚类簇。
20.在一种可能的实现方式中,所述获取模块,用于获取所述各个样本对象数据所属聚类簇的概率;基于所述各个样本对象数据所属聚类簇的概率,将所述各个样本对象数据划分为所述多个第一对象数据和所述多个第二对象数据。
21.在一种可能的实现方式中,所述获取模块,用于对于任一个样本对象数据,基于所述任一个样本对象数据所属的聚类簇中的各个样本对象数据,确定聚类中心数据,所述聚类中心数据用于表征所述任一个样本对象数据所属的聚类簇的中心;确定所述任一个样本对象数据与所述聚类中心数据之间的距离;对所述任一个样本对象数据与所述聚类中心数据之间的距离进行归一化处理,得到所述任一个样本对象数据所属聚类簇的概率。
22.在一种可能的实现方式中,所述获取模块,用于对于任一个样本对象数据,响应于所述任一个样本对象数据所属聚类簇的概率不小于概率阈值,则将所述任一个样本对象数据作为所述第一对象数据;响应于所述任一个样本对象数据所属聚类簇的概率小于所述概率阈值,则将所述任一个样本对象数据作为所述第二对象数据。
23.在一种可能的实现方式中,所述调整模块,用于根据第二网络模型获取各个第一对象数据的第二预测聚类结果;基于所述各个第一对象数据的标注聚类结果、第一预测聚类结果、第二预测聚类结果以及所述各个第二对象数据的第一预测聚类结果,对所述第二网络模型进行调整,得到调整后的第二网络模型;基于所述调整后的第二网络模型对所述第一网络模型进行调整,得到聚类模型。
24.在一种可能的实现方式中,所述调整模块,用于对所述各个第一对象数据进行数据增强处理,得到各个数据增强后的第一对象数据;将所述各个数据增强后的第一对象数据输入所述第二网络模型,由所述第二网络模型输出所述各个第一对象数据的第二预测聚类结果。
25.在一种可能的实现方式中,所述调整模块,用于基于所述各个第一对象数据的标注聚类结果、第二预测聚类结果确定第一损失值;基于所述各个第一对象数据的第一预测
聚类结果、第二预测聚类结果以及所述各个第二对象数据的第一预测聚类结果确定第二损失值;基于所述第一损失值和所述第二损失值,对所述第二网络模型进行调整,得到调整后的第二网络模型。
26.在一种可能的实现方式中,所述调整模块,用于根据所述第二网络模型获取各个第二对象数据的第二预测聚类结果;基于所述各个第一对象数据的标注聚类结果、第一预测聚类结果、第二预测聚类结果以及所述各个第二对象数据的第一预测聚类结果、第二预测聚类结果,对所述第二网络模型进行调整,得到调整后的第二网络模型。
27.在一种可能的实现方式中,所述调整模块,用于对所述各个第二对象数据进行数据增强处理,得到各个数据增强后的第二对象数据;将所述各个数据增强后的第二对象数据输入所述第二网络模型,由所述第二网络模型输出所述各个第二对象数据的第二预测聚类结果。
28.在一种可能的实现方式中,所述获取模块,用于对于任一个第一对象数据,根据所述第一网络模型中的各个特征提取网络,分别获取所述任一个第一对象数据的各个对象特征,所述第一网络模型中的任两个特征提取网络是不同结构的神经网络,所述任一个第一对象数据的任一个对象特征用于描述所述任一个第一对象数据;将所述任一个第一对象数据的各个对象特征进行融合,得到所述任一个第一对象数据的融合特征;基于所述各个第一对象数据的融合特征,确定所述各个第一对象数据的第一预测聚类结果。
29.另一方面,本技术实施例提供了一种聚类装置,所述装置包括:
30.获取模块,用于获取多个目标对象数据;
31.确定模块,用于根据聚类模型确定各个目标对象数据的聚类结果,所述聚类模型是根据上述任一项所述的聚类模型的训练方法训练得到的。
32.在一种可能的实现方式中,所述确定模块,用于对于任一个目标对象数据,根据所述聚类模型中的各个特征提取网络,分别获取所述任一个目标对象数据的各个对象特征,所述聚类模型中的任两个特征提取网络是不同结构的神经网络,所述任一个目标对象数据的任一个对象特征用于描述所述任一个目标对象数据;将所述任一个目标对象数据的各个对象特征进行融合,得到所述任一个目标对象数据的融合特征;基于所述各个目标对象数据的融合特征,确定所述各个目标对象数据的聚类结果。
33.另一方面,本技术实施例提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以使所述电子设备实现上述任一所述的聚类模型的训练方法或者上述任一所述的聚类方法。
34.另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以使计算机实现上述任一所述的聚类模型的训练方法或者上述任一所述的聚类方法。
35.另一方面,还提供了一种计算机程序或计算机程序产品,所述计算机程序或计算机程序产品中存储有至少一条计算机指令,所述至少一条计算机指令由处理器加载并执行,以使计算机实现上述任一所述的聚类模型的训练方法或者上述任一所述的聚类方法。
36.本技术实施例提供的技术方案至少带来如下有益效果:
37.本技术实施例提供的技术方案是基于各个第一对象数据的标注聚类结果、第一预
intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
56.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
57.随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服、车联网、自动驾驶、智慧交通等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
58.基于上述实施环境,本技术实施例提供了一种聚类模型的训练方法,以图2所示的本技术实施例提供的一种聚类模型的训练方法的流程图为例,该方法可由图1中的电子设备11执行。如图2所示,该方法包括下述步骤:
59.步骤201,获取多个第一对象数据、多个第二对象数据以及各个第一对象数据的标注聚类结果。
60.本技术实施例不对第一对象数据、第二对象数据做限定,示例性的,第一对象数据和第二对象数据均是细胞的基因表达数据,或者第一对象数据和第二对象数据均是细胞的图像数据。本技术实施例中,可以获取多个样本对象数据的聚类结果,基于各个样本对象数据的聚类结果确定多个第一对象数据、多个第二对象数据以及各个第一对象数据的标注聚类结果。
61.在一种可能的实现方式中,任一个样本对象的聚类结果包括任一个样本对象所属的聚类簇。此时,获取多个第一对象数据、多个第二对象数据以及各个第一对象数据的标注聚类结果,包括:获取各个样本对象数据所属的聚类簇;基于各个样本对象数据所属的聚类簇,将各个样本对象数据划分为多个第一对象数据和多个第二对象数据;将各个第一对象数据所属的聚类簇确定为各个第一对象数据的标注聚类结果。
62.本技术实施例中,可以使用任意的聚类算法对各个样本对象数据进行聚类处理,以获取各个样本对象数据的聚类结果。本技术实施例不对聚类算法做限定,示例性的,聚类算法可以是莱顿(leiden)算法、鲁汶(louvain)算法等传统的聚类算法,也可以是深度嵌入单细胞聚类(deep embedding for single-cell clustering,desc)算法等基于深度学习的聚类算法。
63.使用不同的聚类算法进行聚类处理时,任一个样本对象数据的聚类结果也存在差异。可以理解的是,使用任意的聚类算法进行聚类处理时,任一个样本对象数据的聚类结果包括任一个样本对象数据所属的聚类簇。使用某些聚类算法如desc算法进行聚类处理时,任一个样本对象数据的聚类结果除包括任一个样本对象数据所属的聚类簇之外,还包括任一个样本对象数据所属聚类簇的概率。
64.下面详细介绍本技术实施例使用desc算法获取各个样本对象数据所属的聚类簇和各个样本对象数据所属聚类簇的概率。
65.本技术实施例可以使用desc算法利用神经网络模型实现对多个样本对象数据进行聚类处理。desc算法利用自编码实现提取各个样本对象数据的对象特征,以利用任一个样本对象数据的对象特征来描述任一个样本对象数据。基于各个样本对象数据的对象特征,利用louvain算法对各个样本对象数据进行聚类处理,得到各个样本对象数据的初始聚类结果,也就是说,神经网络模型输出各个样本对象数据的初始聚类结果。之后,基于各个样本对象数据的初始聚类结果,利用卷积神经网络和损失函数实现对各个样本对象数据的迭代聚类,直至神经网络模型得到并输出各个样本对象数据的最终聚类结果。
66.其中,一个样本对象数据的聚类结果包括该样本对象数据所属的聚类簇、各个样本对象数据属于其所属聚类簇的概率和各个样本对象数据的批次号。其中,desc算法是通过确定一个样本对象数据属于各个聚类簇的概率,从而确定该样本对象数据所属的聚类簇为最大概率所对应的聚类簇,该样本对象数据属于其所属聚类簇的概率记为这个最大概率,样本对象数据的批次号是该样本对象数据的采样批次。
67.请参见图3,图3是本技术实施例提供的一种desc算法的聚类示意图。在本技术实施例中,样本对象数据为细胞数据,细胞数据可以为细胞的基因表达矩阵。首先,将细胞数据作为输入信息输入至神经网络模型中的自动编码器,由自动编码器对各个细胞数据进行编码,得到细胞特征,细胞特征用于描述细胞数据,其中,细胞数据为多个。之后,神经网络模型对各个细胞数据进行聚类初始化(即聚类处理),得到各个细胞数据的聚类结果,该聚类结果为初始聚类结果。
68.接下来,基于各个细胞数据的初始聚类结果利用神经网络模型和损失函数实现对各个细胞数据的迭代聚类,直至神经网络模型得到并输出各个细胞数据的最终聚类结果。
69.在迭代聚类时,利用神经网络模型的输出信息确定损失函数的损失值,利用该损失值更新神经网络模型。通过这种方式,实现迭代更新神经网络模型,从而实现迭代更新神经网络模型的输出信息。其中,神经网络模型是通过自动编码器确定细胞特征,并基于细胞特征确定并输出各个细胞数据的聚类结果。基于各个细胞数据的聚类结果和损失函数确定神经网络模型的损失值,以利用该损失值调整神经网络模型的参数,以更新神经网络模型。
70.可选地,损失函数为图3所示的loss=kl(p||q),loss为损失函数,kl表示kl散度(kullback-leibler divergence),也叫相对熵(relative entropy),p为真实的概率分布(即细胞数据属于各个聚类簇的概率),q为p的拟态分布。
71.需要说明的是,如图3所示,神经网络模型的输出信息包括三个部分。其中,第一个部分为簇(即聚类簇),簇中标号0-5表示6个簇,每个簇中包括至少一个细胞数据,也就是说,簇为各个细胞数据所属的聚类簇。第二个部分为细胞数据的概率,通过确定一个细胞数据属于各个簇的概率,确定这个细胞数据的最大概率,从而确定簇中细胞数据的概率为这个最大概率。第三部分为细胞数据的批次,同一个簇中包括至少一个批次的细胞数据。
72.本技术实施例中,使用聚类算法对各个样本对象数据进行聚类处理时,可以直接获取到各个样本对象数据所属的聚类簇。之后,可以基于各个样本对象数据所属的聚类簇,将各个样本对象数据划分为多个第一对象数据和多个第二对象数据。
73.在一种可能的实现方式中,基于各个样本对象数据所属的聚类簇,将各个样本对
象数据划分为多个第一对象数据和多个第二对象数据,包括:对于任一个样本对象数据,从各个样本对象数据所属的聚类簇中确定任一个样本对象数据的参考聚类簇;响应于任一个样本对象数据所属的聚类簇与参考聚类簇一致,则将任一个样本对象数据作为第一对象数据;响应于任一个样本对象数据所属的聚类簇与参考聚类簇不一致,则将任一个样本对象数据作为第二对象数据。
74.本技术实施例是根据基于度量的采样策略(metric-based sampling strategy),从各个样本对象数据所属的聚类簇中确定任一个样本对象数据的参考聚类簇,以基于任一个样本对象数据的参考聚类簇,确定任一个样本对象数据为第一对象数据还是第二对象数据,从而实现将各个样本对象数据划分为多个第一对象数据和多个第二对象数据。
75.可选的,从各个样本对象数据所属的聚类簇中确定任一个样本对象数据的参考聚类簇,包括:确定任一个样本对象数据与各个其他对象数据之间的距离,其他对象数据为各个样本对象数据中除任一个样本对象数据之外的样本对象数据;基于任一个样本对象数据与各个其他对象数据之间的距离,从各个其他对象数据中确定不大于参考距离的各个其他对象数据;从不大于参考距离的各个其他对象数据所属的聚类簇中,确定包含不大于参考距离的其他对象数据的数量最多的聚类簇为任一个样本对象数据的参考聚类簇。
76.本技术实施例可以采用k最近邻(k-nearest neighbor,knn)算法,从各个样本对象数据所属的聚类簇中确定任一个样本对象数据的参考聚类簇。
77.首先,可以直接利用任一个样本对象数据与任一个其他对象数据,计算任一个样本对象数据与任一个其他对象数据之间的距离。也可以先对各个样本对象数据进行降维处理,得到降维后的各个样本对象数据,利用降维后的任一个样本对象数据与降维后的任一个其他对象数据,计算任一个样本对象数据与任一个其他对象数据之间的距离。其中,本技术实施例不对降维处理做限定,示例性的,降维处理可以是主成分分析(principal component analysis,pca)降维处理,pca降维处理后的任一个样本对象数据的维度可以为1*50。
78.还可以先提取各个样本对象数据的对象特征,利用样本对象数据的对象特征来描述样本对象数据,利用任一个样本对象数据的样本对象特征与任一个其他对象数据的样本对象特征,计算任一个样本对象数据与任一个其他对象数据之间的距离。其中,可以采用desc算法提取各个样本对象数据的对象特征,任一个样本对象数据的对象特征的维度可以是1*32。
79.当任一个样本对象数据与任一个其他对象数据之间的距离不大于参考距离时,可以将该任一个其他对象数据作为该任一个样本对象数据的近邻对象数据。当任一个样本对象数据与任一个其他对象数据之间的距离大于参考距离时,可以将该任一个其他对象数据作为该任一个样本对象数据的非近邻对象数据。其中,任一个样本对象数据的近邻对象数据的数量记为k,且为不大于参考距离的其他对象数据,k为正整数。
80.需要说明的是,上文提及的参考距离为任一个样本对象数据的参考距离,任两个样本对象数据的参考距离可以相同,也可以不同。本技术实施例不限定参考距离的确定方式。示例性的,根据人工经验,确定参考距离为0.75,或者,将任一个样本对象数据与各个其他对象数据之间的距离按照从小到大进行排序,将排序后的第k个距离作为参考距离,k为正整数。
81.按照上述方式,可以确定出任一个样本对象数据对应的不大于参考距离的各个其他对象数据。由于使用任意的聚类算法可以确定各个样本对象数据所属的聚类簇,因此,可以确定不大于参考距离的各个其他对象数据所属的聚类簇。之后,按照投票原则,确定包含不大于参考距离的其他对象数据的数量最多的聚类簇,作为任一个样本对象的参考聚类簇。
82.例如,任一个样本对象数据对应的不大于参考距离的各个其他对象数据分别为其他对象数据1至5。其中,其他对象数据1所属聚类簇a,其他对象数据2所属聚类簇a,其他对象数据3所属聚类簇b,其他对象数据4所属聚类簇c,其他对象数据5所属聚类簇a。由于聚类簇a中包含三个不大于参考距离的其他对象数据,而聚类簇b和c中均只包含一个不大于参考距离的其他对象数据,因此,聚类簇a为任一个样本对象数据的参考聚类簇。
83.在确定出任一个样本对象的参考聚类簇之后,若任一个样本对象数据所属的聚类簇与参考聚类簇一致,则将任一个样本对象数据作为第一对象数据,将该第一对象数据所属的聚类簇确定为该第一对象数据的标注聚类结果。若任一个样本对象数据所属的聚类簇与参考聚类簇不一致,则将任一个样本对象数据作为第二对象数据。
84.本技术实施例中,各个样本对象数据所组成的集合可以记为{fi,i=1,

,n},fi为第i个样本对象数据,n为样本对象数据的数量。利用聚类算法可以确定各个样本对象数据所属的聚类簇{yi,i=1,

,n},yi为第i个样本对象数据所属的聚类簇。通过确定出任一个样本对象数据f的参考距离,从而确定出任一个样本对象数据f对应的不大于参考距离的k个其他对象数据,这k个其他对象数据所组成的集合记为nk。按照投票原则,利用确定出任一个样本对象f的参考聚类簇vote为投票原则所对应的函数符号。若任一个样本对象数据f所属的聚类簇y与参考聚类簇一致,则任一个样本对象数据f为第一对象数据。若任一个样本对象数据f所属的聚类簇y与参考聚类簇不一致,则任一个样本对象数据f为第二对象数据。
85.需要说明的是,利用上述方式确定任一个样本对象数据的参考聚类簇时,参考聚类簇的准确性与不大于参考距离的其他对象数据的数量(即k)息息相关。不大于参考距离的其他对象数据的数量越多,参考聚类簇的准确性越高,不大于参考距离的其他对象数据的数量越少,参考聚类簇的准确性越低。
86.通过上述方式,可以确定出各个样本对象数据的参考聚类簇,并通过确定各个样本对象数据所属的聚类簇与各个样本对象数据的参考聚类簇是否一致,将多个样本对象数据划分为多个第一对象数据和多个第二对象数据,并得到各个第一对象数据的标注聚类结果。
87.本技术实施例还提供了另一种样本对象数据的划分方式,可选地,获取基于各个样本对象数据所属的聚类簇,将各个样本对象数据划分为多个第一对象数据和多个第二对象数据,包括:获取各个样本对象数据所属聚类簇的概率;基于各个样本对象数据所属聚类簇的概率,将各个样本对象数据划分为多个第一对象数据和多个第二对象数据。
88.本技术实施例中,在使用某些聚类算法对各个样本对象数据进行聚类处理时,可以获取到任一个样本对象属于各个聚类簇的概率。此时,从任一个样本对象属于各个聚类簇的概率中确定最大概率,将最大概率所对应的聚类簇作为任一个样本对象所属的聚类
簇,并将最大概率作为任一个样本对象所属聚类簇的概率。通过这种方式,可以确定各个样本对象所属的聚类簇和各个样本对象所属聚类簇的概率。
89.在使用某些聚类算法如desc算法对各个样本对象数据进行聚类处理时,可以直接获取到各个样本对象数据所属的聚类簇和各个样本对象数据所属聚类簇的概率。而在使用某些聚类算法如leiden算法对各个样本对象数据进行聚类处理时,可以直接获取到各个样本对象数据所属的聚类簇,此时,可以基于各个样本对象数据所属的聚类簇,确定各个样本对象数据所属聚类簇的概率。
90.可选地,获取各个样本对象数据所属聚类簇的概率,包括:对于任一个样本对象数据,基于任一个样本对象数据所属的聚类簇中的各个样本对象数据,确定聚类中心数据,聚类中心数据用于表征任一个样本对象数据所属的聚类簇的中心;确定任一个样本对象数据与聚类中心数据之间的距离;对任一个样本对象数据与聚类中心数据之间的距离进行归一化处理,得到任一个样本对象数据所属聚类簇的概率。
91.本技术实施例中,可以确定出各个样本对象数据所属的聚类簇。任两个样本对象数据所属的聚类簇可以相同,也可以不同,因此,任一个聚类簇中包括至少一个样本对象数据,也就是说,任一个样本对象数据所属聚类簇中包括至少一个样本对象数据。
92.基于任一个样本对象数据所属聚类簇中的各个样本对象数据,确定用于表征任一个样本对象数据所属聚类簇的中心的聚类中心数据。本技术实施例不对聚类中心数据的确定方式做限定。
93.例如,样本对象数据1所属的聚类簇为聚类簇a,而聚类簇a中包括样本对象数据1至20,则可以基于样本对象数据1至20确定聚类中心数据,该聚类中心数据用于表征聚类簇a的中心。
94.在确定出聚类中心数据之后,基于任一个样本对象数据与聚类中心数据,计算任一个样本对象数据与聚类中心数据之间的距离,并对该距离进行归一化处理,使该距离归一化至[0,1],得到归一化后的距离。归一化后的距离可以作为任一个样本对象数据所属聚类簇的概率。
[0095]
可以理解的是,本技术实施例除可以用归一化后的距离来表征任一个样本对象数据所属聚类簇的概率之外,还可以使用除归一化后的距离之外的其他指标来表示。
[0096]
按照上述的方式,可以确定出各个样本对象数据所属聚类簇的概率。之后,基于各个样本对象数据所属聚类簇的概率,将各个样本对象数据划分为多个第一对象数据和多个第二对象数据。
[0097]
可选的,基于各个样本对象数据所属聚类簇的概率,将各个样本对象数据划分为多个第一对象数据和多个第二对象数据,包括:对于任一个样本对象数据,响应于任一个样本对象数据所属聚类簇的概率大于或者等于概率阈值,则将任一个样本对象数据作为第一对象数据;响应于任一个样本对象数据所属聚类簇的概率小于概率阈值,则将任一个样本对象数据作为第二对象数据。
[0098]
本技术实施例是根据基于置信度的采样策略(confidence-based sampling strategy),基于任一个样本对象数据所属聚类簇的概率,确定任一个样本对象数据为第一对象数据还是第二对象数据,从而实现将各个样本对象数据划分为多个第一对象数据和多个第二对象数据。
[0099]
其中,本技术实施例不对概率阈值的数值大小做限定,示例性的,根据人工经验确定概率阈值为0.5,或者根据各个样本对象数据所属聚类簇的概率确定概率平均值,将概率平均值作为概率阈值。
[0100]
对于任一个样本对象数据,若任一个样本对象数据所属聚类簇的概率大于或者等于概率阈值,则将任一个样本对象数据作为第一对象数据,同时,将该第一对象数据所属的聚类簇确定为该一对象数据的标注聚类结果。若任一个样本对象数据所属聚类簇的概率小于概率阈值,则将任一个样本对象数据作为第二对象数据。
[0101]
通过上述方式,可以确定每一个样本对象数据为第一对象数据还是第二对象数据,从而实现将各个样本对象数据划分为各个第一对象数据和各个第二对象数据,同时,可以将各个第一对象数据所属的聚类簇分别确定为该第一对象数据的标注聚类结果。
[0102]
本技术实施例还可以结合基于置信度的采样策略与基于度量的采样策略,实现基于混合的采样策略(hybrid-based sampling strategy),将各个样本对象数据划分为多个第一对象数据和多个第二对象数据。
[0103]
可选地,若任一个样本对象数据所属聚类簇的概率不小于概率阈值且任一个样本对象数据所属的聚类簇与参考聚类簇一致,则将任一个样本对象数据作为第一对象数据。若任一个样本对象数据所属聚类簇的概率小于概率阈值和/或任一个样本对象数据所属的聚类簇与参考聚类簇不一致,则将任一个样本对象数据作为第二对象数据。
[0104]
基于混合的采样策略确定第一对象数据时,是求出基于置信度的采样策略所确定的第一对象数据和基于度量的采样策略所确定的第一对象数据的交集。通过基于混合的采样策略确定第一对象数据、第二对象数据,可以使第一对象数据和第二对象数据的划分更加准确。由于提高了第一对象数据的准确性,因此提高了第一对象数据的标注聚类结果的准确性。再利用第一对象数据的标注聚类结果获取聚类模型时,由于聚类模型的准确性依赖于第一对象数据的标注聚类结果的准确性,因此,可以提高聚类模型的准确性,从而提高了聚类结果的准确性。
[0105]
本技术实施例中,第一对象数据可以称为高置信度数据(clean data)、有标签数据(labeled data),第二对象数据可以称为低置信度数据(unclean data)、无标签数据(unlabeled data)。在基于各个样本对象数据所属的聚类簇,将各个样本对象数据划分为多个第一对象数据和多个第二对象数据时,第一对象数据所属的聚类簇可能是准确性的,也可能是不准确的,同样的,第二对象数据所属的聚类簇也是准确性的或者不准确的。由于第一对象数据为高置信度数据,因此,本技术实施例将第一对象数据所属的聚类簇确定为各个第一对象数据的标注聚类结果,并基于各个第一对象数据的标注聚类结果训练得到聚类模型,使得聚类模型可以学习到任意聚类算法对高置信度数据的处理能力,以提高聚类模型的聚类准确性。
[0106]
步骤202,根据第一网络模型获取各个第一对象数据的第一预测聚类结果和各个第二对象数据的第一预测聚类结果。
[0107]
本技术实施例中,将各个第一对象数据和各个第二对象数据分别输入第一网络模型,由第一网络模型确定并输出各个第一对象数据的第一预测聚类结果和各个第二对象数据的第一预测聚类结果。其中,本技术实施例不限定第一网络模型的结构、大小等,示例性的,第一网络模型可以为多层感知机(multi-layer perceptron,mlp)。
[0108]
mlp包含三个隐藏层。第一个隐藏层的维度为128维,表示这个隐藏层可以提取128维的对象特征。第二个隐藏层的维度为64维,表示这个隐藏层可以提取64维的对象特征。第三个隐藏层的维度为n维,表示这个隐藏层可以输出n个聚类簇,n为正整数。mlp使用的激活函数为线性整流函数(rectified linear unit,relu),relu也称修正线性单元,是一种神经网络中常用的激活函数。
[0109]
在一种可能的实现方式中,根据第一网络模型获取各个第一对象数据的第一预测聚类结果,包括:对于任一个第一对象数据,根据第一网络模型中的各个特征提取网络,分别获取任一个第一对象数据的各个对象特征,第一网络模型中的任两个特征提取网络是不同结构的神经网络,任一个第一对象数据的任一个对象特征用于描述任一个第一对象数据;将任一个第一对象数据的各个对象特征进行融合,得到任一个第一对象数据的融合特征;基于各个第一对象数据的融合特征,确定各个第一对象数据的第一预测聚类结果。
[0110]
第一网络模型可以包括至少一个特征提取网络,任一个特征提取网络用于提取输入第一网络模型的对象数据的对象特征,以利用对象数据的对象特征来表达对象数据。其中,第一网络模型的任两个特征提取网络是不同结构的神经网络,例如,这两个特征提取网络可以分别是mlp和图卷积网络(graph convolution network,gcn)中的至少一项。
[0111]
本技术实施例中,将任一个第一对象数据输入第一网络模型,由第一网络模型的各个特征提取网络分别对该任一个第一对象数据进行特征提取,得到任一个第一对象数据的各个对象特征。然后,将任一个第一对象数据的各个对象特征进行融合,得到任一个第一对象数据的融合特征,以利用任一个第一对象数据的融合特征来描述任一个第一对象数据,提高了准确性。通过这种方式,可以确定各个第一对象数据的融合特征。接下来,利用第一网络模型的全连接层对各个第一对象数据的融合特征进行聚类处理,得到各个第一对象数据的第一预测聚类结果。由于第一对象数据的融合特征的准确性较高,因此,第一对象数据的第一预测聚类结果的准确性也较高,从而可以提高聚类模型的准确性,进而提高聚类结果的准确性。
[0112]
请参见图4,图4是本技术实施例提供的一种第一网络模型的示意图,该第一网络模型包括多层感知机、图卷积网络和全连接层。将第一对象数据输入第一网络模型,由第一网络模型中的多层感知机对第一对象数据进行特征提取,得到对象特征1,且由第一网络模型中的图卷积网络对第一对象数据进行特征提取,得到对象特征2。然后,将对象特征1和对象特征2进行融合,得到融合特征。
[0113]
本技术实施例中,第一对象数据为多个,每一个第一对象数据对应一个融合特征。将各个第一对象数据的融合特征输入第一网络模型的全连接层,由第一网络模型的全连接层对各个第一对象数据进行聚类处理,得到各个第一对象数据的第一预测聚类结果。
[0114]
需要说明的是,第一网络模型确定第二对象数据的第一预测聚类结果的方式,可以见上文中第一网络模型确定第一对象数据的第一预测聚类结果的描述,在此不再赘述。也就是说,对于任一个第二对象数据,可以根据第一网络模型中的各个特征提取网络,分别获取任一个第二对象数据的各个对象特征,任一个第二对象数据的任一个对象特征用于描述任一个第二对象数据。然后,将任一个第二对象数据的各个对象特征进行融合,得到任一个第二对象数据的融合特征。通过这种方式,可以确定各个第二对象数据的融合特征。之后,基于各个第二对象数据的融合特征,确定各个第二对象数据的第一预测聚类结果。
[0115]
步骤203,基于各个第一对象数据的标注聚类结果、第一预测聚类结果以及各个第二对象数据的第一预测聚类结果对第一网络模型进行调整,得到聚类模型。
[0116]
本技术实施例中,可以基于各个第一对象数据的标注聚类结果、第一预测聚类结果以及各个第二对象数据的第一预测聚类结果,确定第一网络模型的损失值,并基于第一网络模型的损失值对第一网络模型进行调整,得到调整后的第一网络模型。
[0117]
若调整后的第一网络模型满足训练结束条件(如达到训练次数500),则将调整后的第一网络模型作为聚类模型。若调整后的第一网络模型不满足训练结束条件,则按照步骤201-203的方式,对调整后的第一网络模型再进行调整,直至满足训练结束条件,得到聚类模型。
[0118]
在一种可能的实现方式中,基于各个第一对象数据的标注聚类结果、第一预测聚类结果以及各个第二对象数据的第一预测聚类结果对第一网络模型进行调整,得到聚类模型,包括:根据第二网络模型获取各个第一对象数据的第二预测聚类结果;基于各个第一对象数据的标注聚类结果、第一预测聚类结果、第二预测聚类结果以及各个第二对象数据的第一预测聚类结果,对第二网络模型进行调整,得到调整后的第二网络模型;基于所述调整后的第二网络模型对所述第一网络模型进行调整,得到聚类模型。
[0119]
本技术实施例中,可以将各个第一对象数据直接输入第二网络模型,由第二网络模型对各个第一对象数据进行聚类处理,得到各个第一对象数据的第二预测聚类结果。其中,本技术实施例不限定第二网络模型的结构、大小等,示例性的,第二网络模型可以为mlp。
[0120]
可选地,根据第二网络模型获取各个第一对象数据的第二预测聚类结果,包括:对各个第一对象数据进行数据增强处理,得到各个数据增强后的第一对象数据;将各个数据增强后的第一对象数据输入第二网络模型,由第二网络模型输出各个第一对象数据的第二预测聚类结果。
[0121]
本技术实施例中,可以对各个第一对象数据进行数据增强处理,得到各个数据增强后的第一对象数据。其中,本技术实施例不限定数据增强的方式,示例性的,数据增强的方式包括但不限于裁剪数据、添加噪声(如高斯加噪)、数据插值等。
[0122]
之后,将各个数据增强后的第一对象数据输入第二网络模型,由第二网络模型对各个数据增强后的第一对象数据进行聚类处理,得到各个数据增强后的第一对象数据的第二预测聚类结果,任一个数据增强后的第一对象数据的第二预测聚类结果即为任一个第一对象数据的第二预测聚类结果。
[0123]
通过对第一对象数据进行数据增强处理,以将噪声引入第一对象数据中。利用第二网络模型对各个数据增强后的第一对象数据进行聚类处理,可以提高第二网络模型的聚类能力,提高模型的鲁棒性和泛化能力。
[0124]
需要说明的是,第二网络模型可以包括至少一个特征提取网络,任一个特征提取网络用于提取输入第二网络模型的对象数据的对象特征,以利用对象数据的对象特征来表达对象数据。其中,第二网络模型的任两个特征提取网络是不同结构的神经网络,例如,这两个特征提取网络可以分别是mlp和图卷积网络(graph convolution network,gcn)中的至少一项。
[0125]
本技术实施例中,对于任一个第一对象数据,根据第二网络模型中的各个特征提
取网络,分别获取任一个第一对象数据的各个对象特征,任一个第一对象数据的任一个对象特征用于描述任一个第一对象数据。根据第二网络模型将任一个第一对象数据的各个对象特征进行融合,得到任一个第一对象数据的融合特征。基于各个第一对象数据的融合特征,根据第二网络模型确定各个第一对象数据的第二预测聚类结果。其中,任一个第一对象数据可以为数据增强后的第一对象数据。根据第二网络模型确定各个第一对象数据的第二预测聚类结果的方式,可以见上文有关根据第一网络模型获取各个第一对象数据的第一预测聚类结果的描述,二者实现原理相类似,在此不再赘述。
[0126]
在确定出各个第一对象数据的第二预测聚类结果之后,基于各个第一对象数据的标注聚类结果、第一预测聚类结果、第二预测聚类结果以及各个第二对象数据的第一预测聚类结果,对第二网络模型进行调整,得到调整后的第二网络模型。
[0127]
可选地,基于各个第一对象数据的标注聚类结果、第一预测聚类结果、第二预测聚类结果以及各个第二对象数据的第一预测聚类结果,对第二网络模型进行调整,得到调整后的第二网络模型,包括:基于各个第一对象数据的标注聚类结果、第二预测聚类结果确定第一损失值;基于各个第一对象数据的第一预测聚类结果、第二预测聚类结果以及各个第二对象数据的第一预测聚类结果确定第二损失值;基于第一损失值和第二损失值,对第二网络模型进行调整,得到调整后的第二网络模型。
[0128]
本技术实施例中,根据第一损失函数、各个第一对象数据的标注聚类结果、各个第一对象数据第二预测聚类结果,确定第一损失值。其中,第一损失函数是有监督损失函数,本技术实施例不限定第一损失函数的函数类型,示例性的,第一损失函数为交叉熵函数。第一损失值可以表示为其中,为第一损失函数的函数符号,为各个第一对象数据第二预测聚类结果,y为各个第一对象数据的标注聚类结果。
[0129]
根据第二损失函数、各个第一对象数据的第一预测聚类结果、各个第一对象数据的第二预测聚类结果、各个第二对象数据的第一预测聚类结果,确定第二损失值。其中,第二损失函数是无监督损失函数,本技术实施例不限定第二损失函数的函数类型,示例性的,第二损失函数为互信息函数。第二损失值可以表示为其中,为第二损失函数的函数符号,为各个第一对象数据第二预测聚类结果,pc为各个第一对象数据第一预测聚类结果,pu为各个第二对象数据的第一预测聚类结果。
[0130]
接下来,基于第一损失值、第二损失值以及第二损失值的权重,确定第二网络模型的损失值。第二网络模型的损失值可以表示为的损失值。第二网络模型的损失值可以表示为其中,为第二网络模型的损失值,α为第二损失值的权重。
[0131]
本技术实施例不限定第二损失值的权重的大小。示例性的,α∈[0.2,0.99]。可选地,第二损失值的权重与训练次数成正比,随着训练次数的增加,第二损失值的取值从0.2逐渐增大至0.99。
[0132]
可选地,基于各个第一对象数据的标注聚类结果、第一预测聚类结果、第二预测聚类结果以及各个第二对象数据的第一预测聚类结果,对第二网络模型进行调整,得到调整后的第二网络模型,包括:根据第二网络模型获取各个第二对象数据的第二预测聚类结果;基于各个第一对象数据的标注聚类结果、第一预测聚类结果、第二预测聚类结果以及各个第二对象数据的第一预测聚类结果、第二预测聚类结果,对第二网络模型进行调整,得到调
整后的第二网络模型。
[0133]
本技术实施例中,可以将各个第二对象数据直接输入第二网络模型,由第二网络模型对各个第二对象数据进行聚类处理,得到各个第二对象数据的第二预测聚类结果。
[0134]
可选地,根据第二网络模型获取各个第二对象数据的第二预测聚类结果,包括:对各个第二对象数据进行数据增强处理,得到各个数据增强后的第二对象数据;将各个数据增强后的第二对象数据输入第二网络模型,由第二网络模型输出各个第二对象数据的第二预测聚类结果。
[0135]
本技术实施例中,可以对各个第二对象数据进行数据增强处理,得到各个数据增强后的第二对象数据。其中,本技术实施例不限定数据增强的方式,示例性的,数据增强的方式包括但不限于裁剪数据、添加噪声(如高斯加噪)、数据插值等。
[0136]
之后,将各个数据增强后的第二对象数据输入第二网络模型,由第二网络模型对各个数据增强后的第二对象数据进行聚类处理,得到各个数据增强后的第二对象数据的第二预测聚类结果,任一个数据增强后的第二对象数据的第二预测聚类结果即为任一个第二对象数据的第二预测聚类结果。
[0137]
通过对第二对象数据进行数据增强处理,以将噪声引入第二对象数据中。利用第二网络模型对各个数据增强后的第二对象数据进行聚类处理,可以提高第二网络模型的聚类能力,提高模型的鲁棒性和泛化能力。
[0138]
本技术实施例中,对于任一个第二对象数据,根据第二网络模型中的各个特征提取网络,分别获取任一个第二对象数据的各个对象特征,任一个第二对象数据的任一个对象特征用于描述任一个第二对象数据。根据第二网络模型将任一个第二对象数据的各个对象特征进行融合,得到任一个第二对象数据的融合特征。基于各个第二对象数据的融合特征,根据第二网络模型确定各个第二对象数据的第二预测聚类结果。其中,任一个第二对象数据可以为数据增强后的第二对象数据。根据第二网络模型确定各个第二对象数据的第二预测聚类结果的方式,可以见上文有关根据第一网络模型获取各个第一对象数据的第一预测聚类结果的描述,二者实现原理相类似,在此不再赘述。
[0139]
在确定出各个第二对象数据的第二预测聚类结果之后,基于各个第一对象数据的标注聚类结果、第二预测聚类结果确定第一损失值,基于各个第一对象数据的第一预测聚类结果、第二预测聚类结果以及各个第二对象数据的第一预测聚类结果、第二预测聚类结果确定第三损失值。之后,基于第一损失值和第三损失值,对第二网络模型进行调整,得到调整后的第二网络模型。
[0140]
本技术实施例中,可以根据第一损失函数、各个第一对象数据的标注聚类结果y、各个第一对象数据第二预测聚类结果确定第一损失值其中,为第一损失函数的函数符号。
[0141]
根据第二损失函数、各个第一对象数据的第一预测聚类结果、各个第一对象数据的第二预测聚类结果、各个第二对象数据的第一预测聚类结果、各个第二对象数据的第二预测聚类结果,确定第三损失值。其中,第三损失函数是无监督损失函数,本技术实施例不限定第三损失函数的函数类型,示例性的,第三损失函数为互信息函数。第三损失值可以表示为其中,为第三损失函数的函数符号,为各个第一对象数据第
二预测聚类结果,为各个第二对象数据第二预测聚类结果,pc为各个第一对象数据第一预测聚类结果,pu为各个第二对象数据的第一预测聚类结果。
[0142]
接下来,基于第一损失值、第三损失值以及第三损失值的权重,确定第二网络模型的损失值。第二网络模型的损失值可以表示为的损失值。第二网络模型的损失值可以表示为其中,为第二网络模型的损失值,β为第三损失值的权重。
[0143]
本技术实施例不限定第三损失值的权重的大小。示例性的,β∈[0.2,0.99]。可选地,第三损失值的权重与训练次数成正比,随着训练次数的增加,第三损失值的取值从0.2逐渐增大至0.99。
[0144]
在确定出第二网络模型的损失值之后,利用第二网络模型的损失值对第二网络模型进行调整,得到调整后的第二网络模型。之后,基于调整后的第二网络模型对第一网络模型进行调整,得到聚类模型。
[0145]
本技术实施例中,第一网络模型的预测结果和第二网络模型的预测结果均用于确定无监督损失函数的损失值,而该损失值用于梯度反向传播更新第二网络模型,而第二网络模型又用于更新第一网络模型。
[0146]
可以理解的是,得到聚类模型的过程是多次训练的过程。每一次训练(即每一个epoch)均是按照步骤201至步骤203的方式,确定第二网络模型的损失值,基于第二网络模型的损失值对第二网络模型进行调整,并基于调整后的第二网络模型对第一网络模型进行调整,得到调整后的第一网络模型。
[0147]
可以将第t(t为正整数或者0)次训练时第一网络模型的模型参数记为θ

t-1
,将第t次训练时调整后的第二网络模型的模型参数记为θ
t
,按照公式θ

t
=αθ

t-1
(1-α)θ
t
计算得到第t次训练时调整后的第一网络模型的模型参数θ

t
,其中,α为第一网络模型的模型参数权重,且在开始训练即t=0时,θ

t
=θ
t
。本技术实施例不限定α的取值,示例性的,根据人工经验,取α=0.99。
[0148]
可以理解的是,为了提高训练速度,可以在多次训练的每一次训练中仅对第二网络模型进行调整,利用多次训练中每次训练得到的调整后的第二网络模型的模型参数,调整第一网络模型的模型参数。通过这种方式,每隔多次训练调整一次第一网络模型的模型参数,降低第一网络模型的更新频率,提高训练速度。
[0149]
需要说明的是,本技术实施例可以采用指数移动平均(exponential moving average,ema)的方式,基于调整后的第二网络模型对第一网络模型进行调整,该第一网络模型也称为ema模型。在ema方式中,第一网络模型和第二网络模型的模型结构一致,二者仅存在模型参数上的区别。ema方式需要计算调整后的第二网络模型的模型参数平均值,利用调整后的第二网络模型的模型参数平均值,对第一网络模型进行调整。通过ema的方式,可以将第二网络模型的模型性能迁移至第一网络模型,提高第一网络模型的鲁棒性。
[0150]
上述方法是基于各个第一对象数据的标注聚类结果、第一预测聚类结果以及各个第二对象数据的第一预测聚类结果对第一网络模型进行调整,得到聚类模型。能通过少量数据的标注聚类结果引导模型进行准确聚类,提升聚类模型的准确性,从而提升聚类结果的准确性。
[0151]
基于上述实施环境,本技术实施例提供了一种聚类方法,以图5所示的本技术实施例提供的一种聚类方法的流程图为例,该方法可由图1中的电子设备11执行。如图5所示,该
方法包括下述步骤:
[0152]
步骤501,获取多个目标对象数据。
[0153]
本技术实施例不对目标对象数据做限定,示例性的,目标对象数据是细胞的基因表达数据,或者目标对象数据是细胞的图像数据。本技术实施例也不对任一目标对象数据的获取方式做限定。示例性的,通过对细胞切片进行基因测序得到细胞的基因表达数据,或者通过拍摄细胞切片在显微镜下所呈现的图像得到细胞的图像数据。
[0154]
步骤502,根据聚类模型确定各个目标对象数据的聚类结果。
[0155]
其中,聚类模型是根据上述各可选实施例提供的聚类模型的训练方法训练得到的。
[0156]
本技术实施例中,将各个目标对象数据输入聚类模型,由聚类模型确定并输出各个目标对象数据的聚类结果。其中,聚类模型的结构与第一网络模型的结构相同,可以见上文有关第一网络模型的描述,在此再赘述。
[0157]
在一种可能的实现方式,根据聚类模型确定各个目标对象数据的聚类结果,包括:对于任一个目标对象数据,根据聚类模型中的各个特征提取网络,分别获取任一个目标对象数据的各个对象特征,聚类模型中的任两个特征提取网络是不同结构的神经网络,任一个目标对象数据的任一个对象特征用于描述任一个目标对象数据;将任一个目标对象数据的各个对象特征进行融合,得到任一个目标对象数据的融合特征;基于各个目标对象数据的融合特征,确定各个目标对象数据的聚类结果。
[0158]
聚类模型可以包括至少一个特征提取网络,任一个特征提取网络用于提取输入聚类模型的对象数据的对象特征,以利用对象数据的对象特征来表达对象数据。其中,聚类模型的任两个特征提取网络是不同结构的神经网络,例如,这两个特征提取网络可以分别是mlp和gcn中的至少一项。
[0159]
本技术实施例中,将任一个目标对象数据输入聚类模型,由聚类模型的各个特征提取网络分别对该任一个目标对象数据进行特征提取,得到任一个目标对象数据的各个对象特征。然后,将任一个目标对象数据的各个对象特征进行融合,得到任一个目标对象数据的融合特征,以利用任一个目标对象数据的融合特征来描述任一个目标对象数据,提高了准确性。通过这种方式,可以确定各个目标对象数据的融合特征。接下来,利用聚类模型的全连接层对各个目标对象数据的融合特征进行聚类处理,得到各个目标对象数据的聚类结果。由于目标对象数据的融合特征的准确性较高,因此,目标对象数据的聚类结果的准确性也较高。
[0160]
本技术实施例中,可以将本技术实施例提供的聚类方法作为一个算法模块,将该算法模块嵌入在任意软件中,如将该算法模块嵌入在单细胞分析聚类软件中。
[0161]
上述方法中的聚类模型是基于各个第一对象数据的标注聚类结果、第一预测聚类结果以及各个第二对象数据的第一预测聚类结果对第一网络模型进行调整得到的,能通过少量数据的标注聚类结果引导模型进行准确聚类,提升聚类模型的准确性,从而提升聚类结果的准确性。
[0162]
上述从方法步骤的角度阐述了本技术实施例的聚类模型的训练方法和聚类方法,下面结合场景进行详细说明。在本技术实施例的场景中,对象数据为细胞数据,第一网络模型为指数移动平均模型,第二网络模型为多层感知机。
[0163]
请参见图6,图6是本技术实施例提供的一种聚类模型的训练示意图。本技术实施例中,对于多个样本细胞数据x,利用基于深度嵌入单细胞聚类算法进行聚类处理,得到各个样本细胞数据x所属的聚类簇,其中,上文已详细描述了基于深度嵌入单细胞聚类算法进行聚类处理的方式,在此不再赘述。
[0164]
之后,基于各个样本细胞数据x所属的聚类簇进行采样处理,得到多个第一细胞数据xc、多个第二细胞数据xu以及各个第一细胞数据xc的标注聚类结果y。利用多个第一细胞数据xc、多个第二细胞数据xu以及各个第一细胞数据xc的标注聚类结果y获取聚类模型。其中,采样处理的方式可以见上文有关“获取多个第一对象数据、多个第二对象数据以及各个第一对象数据的标注聚类结果”的描述,在此不再赘述。
[0165]
在利用多个第一细胞数据xc、多个第二细胞数据xu以及各个第一细胞数据xc的标注聚类结果y获取聚类模型时,一方面,将多个第一细胞数据xc、多个第二细胞数据xu输入指数移动平均模型,由指数移动平均模型输出各个第一细胞数据xc的第一预测聚类结果pc以及各个第二细胞数据xu的第一预测聚类结果pu。另一方面,先对多个第一细胞数据xc进行数据增强得到数据增强后的各个第一细胞数据对多个第二细胞数据xu进行数据增强得到数据增强后的各个第二细胞数据接着,将数据增强后的各个第一细胞数据和数据增强后的各个第二细胞数据输入多层感知机,由多层感知机输出数据增强后的各个第一细胞数据的第二预测聚类结果以及数据增强后的各个第二细胞数据的第二预测聚类结果
[0166]
之后,利用各个第一细胞数据xc的第一预测聚类结果pc、各个第二细胞数据xu的第一预测聚类结果pu、数据增强后的各个第一细胞数据的第二预测聚类结果数据增强后的各个第二细胞数据的第二预测聚类结果确定多层感知机的损失值。利用多层感知机的损失值更新多层感知机,利用更新后的多层感知机更新指数移动平均模型。其中,确定多层感知机的损失值的方式可以见上文有关确定第二网络模型的损失值的描述,利用更新后的多层感知机更新指数移动平均模型的方式可以见上文有关基于调整后的第二网络模型对第一网络模型进行调整的描述,在此不再赘述。
[0167]
通过上述方式,迭代更新多层感知机和指数移动平均模型,直至满足训练结束条件。将满足训练结束条件时的指数移动平均模型作为聚类模型。该聚类模型为按照本技术实施例提供的聚类模型的训练方法所训练得到的聚类模型,在下文简称为本方法的聚类模型。
[0168]
本技术实施例使用了三个细胞数据集,这三个细胞数据集总共包括约六万个细胞数据。这三个细胞数据集包括猕猴细胞数据集、单核细胞数据集和胰岛细胞数据集,这三个细胞数据集的相关信息见如下所示的表1。
[0169]
表1
[0170]
数据集细胞类型细胞数量聚类结果猕猴细胞数据集猕猴视网膜双极细胞3030212单核细胞数据集人类外周血单个核细胞246798胰岛细胞数据集人类胰腺癌胰岛细胞632113
[0171]
由表1可以看出,猕猴细胞数据集包括30302个猕猴视网膜双极细胞的数据,其实
际聚类结果为12个聚类簇。单核细胞数据集包括24679个人类外周血单个核细胞的数据,其实际聚类结果为8个聚类簇。胰岛细胞数据集包括6321个人类胰腺癌胰岛细胞的数据,其实际聚类结果为13个聚类簇。
[0172]
在获取到猕猴细胞数据集、单核细胞数据集和胰岛细胞数据集之后,采用desc算法分别对猕猴细胞数据集、单核细胞数据集和胰岛细胞数据集进行聚类处理,得到各个数据集所对应的聚类结果。同时,还采用本方法的聚类模型分别对猕猴细胞数据集、单核细胞数据集和胰岛细胞数据集进行聚类处理,得到各个数据集的聚类结果。
[0173]
请参见图7,图7是本技术实施例提供的一种采用desc算法对胰岛细胞数据集进行聚类处理所得到的聚类结果示意图,该聚类结果示意图中包括标号分别为0至12的聚类簇,其中,虚线椭圆中包括标号分别为0和4的两个聚类簇。请参见图8,图8是本技术实施例提供的一种采用聚类模型对胰岛细胞数据集进行聚类处理所得到的聚类结果示意图,该聚类结果示意图中包括标号分别为1至3、5至6、8至12的聚类簇,其中,虚线椭圆中包括标号为6的一个聚类簇。请参见图9,图9是本技术实施例提供的一种胰岛细胞数据集的实际聚类结果示意图,该聚类结果示意图中包括标号分别为1至13的聚类簇,其中,虚线椭圆中包括标号为2的一个聚类簇。
[0174]
对比图7至图9的虚线椭圆可知,desc算法对应的聚类结果与实际聚类结果不符,而聚类模型对应的聚类结果与实际聚类结果相符,因此,按照本技术实施例提供的聚类模型的训练方法所训练得到的聚类模型(即本方法的聚类模型)的准确性更高。
[0175]
需要说明的是,图7中的标号0至12仅用于区分图7中的不同聚类簇,不能用于表示聚类簇中细胞的名称。同理,图8中的标号1至3、5至6、8至12仅用于区分图8中的不同聚类簇,不能用于表示聚类簇中细胞的名称。图9中的标号1至13仅用于区分图9中的不同聚类簇,不能用于表示聚类簇中细胞的名称。对于图7、图8和图9中的任两个示意图,这两个示意图中的同一个标号可能指向包含相同细胞名称的聚类簇,也可能指向包含不同细胞名称的聚类簇。
[0176]
本技术实施例还采用两种聚类评价指标来评价采用desc算法和本方法的聚类模型对不同数据集进行聚类处理得到的聚类结果的准确性。这两种聚类评价指标分别为调整兰德系数(adjusted random index,ari)和归一化互信息(normalized mutual information,nmi),结果如下表2所示。
[0177]
表2
[0178][0179]
由表2可知,本方法对应的ari均高于desc算法对应的ari,通过进一步的数据处理,可以确定在ari方面,本方法相较于desc算法大约提升了13%。本方法对应的nmi普遍高于desc算法对应的nmi,通过进一步的数据处理,可以确定在nmi方面,本方法相较于desc算
法大约提升了1%。由于ari越大,表明聚类结果越准确,且nmi越大,表明聚类结果越准确,因此,本方法对应的聚类结果更准确,也就是说,申请实施例的聚类模型能更准确的对细胞数据进行聚类处理。
[0180]
图10所示为本技术实施例提供的一种聚类模型的训练装置的结构示意图,如图10所示,该装置包括:
[0181]
获取模块1001,用于获取多个第一对象数据、多个第二对象数据以及各个第一对象数据的标注聚类结果;
[0182]
获取模块1001,还用于根据第一网络模型获取各个第一对象数据的第一预测聚类结果和各个第二对象数据的第一预测聚类结果;
[0183]
调整模块1002,用于基于各个第一对象数据的标注聚类结果、第一预测聚类结果以及各个第二对象数据的第一预测聚类结果对第一网络模型进行调整,得到聚类模型。
[0184]
在一种可能的实现方式中,获取模块1001,用于获取各个样本对象数据所属的聚类簇;基于各个样本对象数据所属的聚类簇,将各个样本对象数据划分为多个第一对象数据和多个第二对象数据;将各个第一对象数据所属的聚类簇确定为各个第一对象数据的标注聚类结果。
[0185]
在一种可能的实现方式中,获取模块1001,用于对于任一个样本对象数据,从各个样本对象数据所属的聚类簇中确定任一个样本对象数据的参考聚类簇;响应于任一个样本对象数据所属的聚类簇与参考聚类簇一致,则将任一个样本对象数据作为第一对象数据;响应于任一个样本对象数据所属的聚类簇与参考聚类簇不一致,则将任一个样本对象数据作为第二对象数据。
[0186]
在一种可能的实现方式中,获取模块1001,用于确定任一个样本对象数据与各个其他对象数据之间的距离,其他对象数据为各个样本对象数据中除任一个样本对象数据之外的样本对象数据;基于任一个样本对象数据与各个其他对象数据之间的距离,从各个其他对象数据中确定不大于参考距离的各个其他对象数据;从不大于参考距离的各个其他对象数据所属的聚类簇中,确定包含不大于参考距离的其他对象数据的数量最多的聚类簇为任一个样本对象数据的参考聚类簇。
[0187]
在一种可能的实现方式中,获取模块1001,用于获取各个样本对象数据所属聚类簇的概率;基于各个样本对象数据所属聚类簇的概率,将各个样本对象数据划分为多个第一对象数据和多个第二对象数据。
[0188]
在一种可能的实现方式中,获取模块1001,用于对于任一个样本对象数据,基于任一个样本对象数据所属的聚类簇中的各个样本对象数据,确定聚类中心数据,聚类中心数据用于表征任一个样本对象数据所属的聚类簇的中心;确定任一个样本对象数据与聚类中心数据之间的距离;对任一个样本对象数据与聚类中心数据之间的距离进行归一化处理,得到任一个样本对象数据所属聚类簇的概率。
[0189]
在一种可能的实现方式中,获取模块1001,用于对于任一个样本对象数据,响应于任一个样本对象数据所属聚类簇的概率不小于概率阈值,则将任一个样本对象数据作为第一对象数据;响应于任一个样本对象数据所属聚类簇的概率小于概率阈值,则将任一个样本对象数据作为第二对象数据。
[0190]
在一种可能的实现方式中,调整模块1002,用于根据第二网络模型获取各个第一
对象数据的第二预测聚类结果;基于各个第一对象数据的标注聚类结果、第一预测聚类结果、第二预测聚类结果以及各个第二对象数据的第一预测聚类结果,对第二网络模型进行调整,得到调整后的第二网络模型;基于调整后的第二网络模型对第一网络模型进行调整,得到聚类模型。
[0191]
在一种可能的实现方式中,调整模块1002,用于对各个第一对象数据进行数据增强处理,得到各个数据增强后的第一对象数据;将各个数据增强后的第一对象数据输入第二网络模型,由第二网络模型输出各个第一对象数据的第二预测聚类结果。
[0192]
在一种可能的实现方式中,调整模块1002,用于基于各个第一对象数据的标注聚类结果、第二预测聚类结果确定第一损失值;基于各个第一对象数据的第一预测聚类结果、第二预测聚类结果以及各个第二对象数据的第一预测聚类结果确定第二损失值;基于第一损失值和第二损失值,对第二网络模型进行调整,得到调整后的第二网络模型。
[0193]
在一种可能的实现方式中,调整模块1002,用于根据第二网络模型获取各个第二对象数据的第二预测聚类结果;基于各个第一对象数据的标注聚类结果、第一预测聚类结果、第二预测聚类结果以及各个第二对象数据的第一预测聚类结果、第二预测聚类结果,对第二网络模型进行调整,得到调整后的第二网络模型。
[0194]
在一种可能的实现方式中,调整模块1002,用于对各个第二对象数据进行数据增强处理,得到各个数据增强后的第二对象数据;将各个数据增强后的第二对象数据输入第二网络模型,由第二网络模型输出各个第二对象数据的第二预测聚类结果。
[0195]
在一种可能的实现方式中,获取模块1001,用于对于任一个第一对象数据,根据第一网络模型中的各个特征提取网络,分别获取任一个第一对象数据的各个对象特征,第一网络模型中的任两个特征提取网络是不同结构的神经网络,任一个第一对象数据的任一个对象特征用于描述任一个第一对象数据;将任一个第一对象数据的各个对象特征进行融合,得到任一个第一对象数据的融合特征;基于各个第一对象数据的融合特征,确定各个第一对象数据的第一预测聚类结果。
[0196]
上述装置是基于各个第一对象数据的标注聚类结果、第一预测聚类结果以及各个第二对象数据的第一预测聚类结果对第一网络模型进行调整,得到聚类模型。能通过少量数据的标注聚类结果引导模型进行准确聚类,提升聚类模型的准确性,从而提升聚类结果的准确性。
[0197]
图11所示为本技术实施例提供的一种聚类装置的结构示意图,如图11所示,该装置包括:
[0198]
获取模块1101,用于获取多个目标对象数据;
[0199]
确定模块1102,用于根据聚类模型确定各个目标对象数据的聚类结果,聚类模型是根据上述任一项的聚类模型的训练方法训练得到的。
[0200]
在一种可能的实现方式中,确定模块1102,用于对于任一个目标对象数据,根据聚类模型中的各个特征提取网络,分别获取任一个目标对象数据的各个对象特征,聚类模型中的任两个特征提取网络是不同结构的神经网络,任一个目标对象数据的任一个对象特征用于描述任一个目标对象数据;将任一个目标对象数据的各个对象特征进行融合,得到任一个目标对象数据的融合特征;基于各个目标对象数据的融合特征,确定各个目标对象数据的聚类结果。
[0201]
上述装置中的聚类模型是基于各个第一对象数据的标注聚类结果、第一预测聚类结果以及各个第二对象数据的第一预测聚类结果对第一网络模型进行调整得到的。能通过少量数据的标注聚类结果引导模型进行准确聚类,提升聚类模型的准确性,从而提升聚类结果的准确性。
[0202]
应理解的是,上述图10和图11提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
[0203]
图12示出了本技术一个示例性实施例提供的终端设备1200的结构框图。该终端设备1200可以是便携式移动终端,比如:智能手机、平板电脑、mp3(moving picture experts group audio layer iii,动态影像专家压缩标准音频层面3)播放器、mp4(moving picture experts group audio layer iv,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端设备1200还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
[0204]
通常,终端设备1200包括有:处理器1201和存储器1202。
[0205]
处理器1201可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1201可以采用dsp(digital signal processing,数字信号处理)、fpga(field-programmable gate array,现场可编程门阵列)、pla(programmable logic array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1201也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu(central processing unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1201可以集成有gpu(graphics processing unit,图像处理器),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1201还可以包括ai(artificial intelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。
[0206]
存储器1202可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1202还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1202中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1201所执行以实现本技术中方法实施例提供的聚类模型的训练方法或聚类方法。
[0207]
在一些实施例中,终端设备1200还可选包括有:外围设备接口1203和至少一个外围设备。处理器1201、存储器1202和外围设备接口1203之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1203相连。具体地,外围设备包括:射频电路1204、显示屏1205、摄像头组件1206、音频电路1207和电源1208中的至少一种。
[0208]
外围设备接口1203可被用于将i/o(input/output,输入/输出)相关的至少一个外围设备连接到处理器1201和存储器1202。在一些实施例中,处理器1201、存储器1202和外围设备接口1203被集成在同一芯片或电路板上;在一些其他实施例中,处理器1201、存储器1202和外围设备接口1203中的任意一个或两个可以在单独的芯片或电路板上实现,本实施
例对此不加以限定。
[0209]
射频电路1204用于接收和发射rf(radio frequency,射频)信号,也称电磁信号。射频电路1204通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1204将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1204包括:天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1204可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2g、3g、4g及5g)、无线局域网和/或wifi(wireless fidelity,无线保真)网络。在一些实施例中,射频电路1204还可以包括nfc(near field communication,近距离无线通信)有关的电路,本技术对此不加以限定。
[0210]
显示屏1205用于显示ui(user interface,用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1205是触摸显示屏时,显示屏1205还具有采集在显示屏1205的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1201进行处理。此时,显示屏1205还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1205可以为一个,设置在终端设备1200的前面板;在另一些实施例中,显示屏1205可以为至少两个,分别设置在终端设备1200的不同表面或呈折叠设计;在另一些实施例中,显示屏1205可以是柔性显示屏,设置在终端设备1200的弯曲表面上或折叠面上。甚至,显示屏1205还可以设置成非矩形的不规则图形,也即异形屏。显示屏1205可以采用lcd(liquid crystal display,液晶显示屏)、oled(organic light-emitting diode,有机发光二极管)等材质制备。
[0211]
摄像头组件1206用于采集图像或视频。可选地,摄像头组件1206包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及vr(virtual reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1206还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
[0212]
音频电路1207可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1201进行处理,或者输入至射频电路1204以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端设备1200的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1201或射频电路1204的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1207还可以包括耳机插孔。
[0213]
电源1208用于为终端设备1200中的各个组件进行供电。电源1208可以是交流电、直流电、一次性电池或可充电电池。当电源1208包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是
通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
[0214]
在一些实施例中,终端设备1200还包括有一个或多个传感器1210。该一个或多个传感器1210包括但不限于:加速度传感器1211、陀螺仪传感器1212、压力传感器1213、光学传感器1214以及接近传感器1215。
[0215]
加速度传感器1211可以检测以终端设备1200建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1211可以用于检测重力加速度在三个坐标轴上的分量。处理器1201可以根据加速度传感器1211采集的重力加速度信号,控制显示屏1205以横向视图或纵向视图进行用户界面的显示。加速度传感器1211还可以用于游戏或者用户的运动数据的采集。
[0216]
陀螺仪传感器1212可以检测终端设备1200的机体方向及转动角度,陀螺仪传感器1212可以与加速度传感器1211协同采集用户对终端设备1200的3d动作。处理器1201根据陀螺仪传感器1212采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变ui)、拍摄时的图像稳定、游戏控制以及惯性导航。
[0217]
压力传感器1213可以设置在终端设备1200的侧边框和/或显示屏1205的下层。当压力传感器1213设置在终端设备1200的侧边框时,可以检测用户对终端设备1200的握持信号,由处理器1201根据压力传感器1213采集的握持信号进行左右手识别或快捷操作。当压力传感器1213设置在显示屏1205的下层时,由处理器1201根据用户对显示屏1205的压力操作,实现对ui界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
[0218]
光学传感器1214用于采集环境光强度。在一个实施例中,处理器1201可以根据光学传感器1214采集的环境光强度,控制显示屏1205的显示亮度。具体地,当环境光强度较高时,调高显示屏1205的显示亮度;当环境光强度较低时,调低显示屏1205的显示亮度。在另一个实施例中,处理器1201还可以根据光学传感器1214采集的环境光强度,动态调整摄像头组件1206的拍摄参数。
[0219]
接近传感器1215,也称距离传感器,通常设置在终端设备1200的前面板。接近传感器1215用于采集用户与终端设备1200的正面之间的距离。在一个实施例中,当接近传感器1215检测到用户与终端设备1200的正面之间的距离逐渐变小时,由处理器1201控制显示屏1205从亮屏状态切换为息屏状态;当接近传感器1215检测到用户与终端设备1200的正面之间的距离逐渐变大时,由处理器1201控制显示屏1205从息屏状态切换为亮屏状态。
[0220]
本领域技术人员可以理解,图12中示出的结构并不构成对终端设备1200的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
[0221]
图13为本技术实施例提供的服务器的结构示意图,该服务器1300可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器1301和一个或多个的存储器1302,其中,该一个或多个存储器1302中存储有至少一条程序代码,该至少一条程序代码由该一个或多个处理器1301加载并执行以实现上述各个方法实施例提供的聚类模型的训练方法或者聚类方法,示例性的,处理器1301为cpu。当然,该服务器1300还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器1300还可以包括其他用于实现设备功能的部件,在此不做赘述。
[0222]
在示例性实施例中,还提供了一种计算机可读存储介质,该存储介质中存储有至
少一条程序代码,该至少一条程序代码由处理器加载并执行,以使电子设备实现上述任一种聚类模型的训练方法或者聚类方法。
[0223]
可选地,上述计算机可读存储介质可以是只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、只读光盘(compact disc read-only memory,cd-rom)、磁带、软盘和光数据存储设备等。
[0224]
在示例性实施例中,还提供了一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品中存储有至少一条计算机指令,该至少一条计算机指令由处理器加载并执行,以使计算机实现上述任一种聚类模型的训练方法或者聚类方法。
[0225]
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
[0226]
上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
[0227]
以上所述仅为本技术的示例性实施例,并不用以限制本技术,凡在本技术的原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献