一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

图像回归模型的训练方法、图像回归分析方法、介质及终端

2022-10-26 13:54:39 来源:中国专利 TAG:


1.本发明涉及深度学习技术领域,特别涉及一种图像回归模型的训练方法、图像回归分析方法、介质及终端。


背景技术:

2.回归是一种统计学方法,其目标是确定一个因变量与另一个因变量之间的连续映射关系。而回归分析则是基于深度学习的图像分析领域的一项重要分支。对图像进行回归分析主要是指利用预先创建的深度学习模型,得到图像的待测指标的预测值。
3.例如,脑部mr图像的关键解剖点预测就是对图像的回归分析的一种应用,关键解剖点就是需要预测的待测指标,利用预先构建的深度学习模型处理图像,可以确定出脑部mr图像的关键解剖点的预测值。一般的,用于实现回归分析任务的深度学习模型可以称为图像回归模型。
4.目前,构建图像回归模型的现有回归方法主要可以分为两大类:1)基于学习单样本映射关系的回归方法;2)基于学习样本相关性的回归方法。其中,基于学习单样本映射关系的回归方法主要采用单个样本(如均方误差)作为优化目标,缺乏对样本之间结构化关系的学习,导致图像回归模型在实际使用过程中最终预测结果误差较大,准确度低。而基于学习样本相关性的回归方法虽然关注到了样本相关性,但考虑不够全面,对图像回归模型的提升效果有限,其回归分析的准确度也不高。
5.基于此,亟需一种能够提高图像回归模型的预测准确度的方法。


技术实现要素:

6.本发明旨在提供一种图像回归模型的训练方法、图像回归分析方法、介质及终端,用于解决现有技术中图像回归分析的回归性能差,准确度低的技术问题。
7.本发明所采用的技术方案如下:
8.一种图像回归模型的训练方法,该方法包括:
9.获取训练样本集;其中,所述训练样本集包括:多个训练样本,每个训练样本包括:样本图像、以及预先标注的所述样本图像的待测指标的真实值;
10.通过预设网络模型对所述样本图像进行识别,得到各样本图像的待测指标的预测值;
11.根据各所述样本图像的真实值以及预测值,确定第一样本集;其中,所述第一样本集由所述训练样本集中的异常样本组成,所述异常样本的样本图像的真实值与预测值的差值符合第一预设条件;以及
12.确定所述训练样本集中任意两个样本图像之间的图像相似度以及相应的第一参考值;所述第一参考值为两个样本图像的真实值的比值;
13.根据所述样本图像的图像相似度与相应的第一参考值,确定所述训练样本集中的第一待排序样本并确定第二样本集;其中,所述第二样本集由所述训练样本集中的第一待
排序样本组成;第一待排序样本为图像相似度与相应的第一参考值的差值大于第一预设阈值的训练样本;
14.通过第一损失函数分别对第一样本集、对第二样本集进行损失计算,得到所述预设网络模型的第一损失值、第二损失值;基于所述第一损失值和第二损失值,对所述预设网络模型的模型参数进行修正;
15.返回执行所述通过预设网络模型对所述样本图像进行识别,得到各样本图像的预测值的步骤,直至修正后的所述预设网络模型满足第二预设条件,得到已训练的图像回归模型。
16.可选地,所述方法还包括:根据所述图像相似度与相应的第一参考值确定第二待排序样本并组成第三样本集;其中,所述第三样本集由所述训练样本集中的第二待排序样本组成,所述第二待排序样本的图像相似度与相应的第一参考值的差值小于或等于第一预设阈值的训练样本;
17.从第三样本集中选取训练样本,组成多个样本元组;其中,所述样本元组至少包括所述第三样本集中的三个第二待排序样本,且所述样本元组之间的三个第二待排序样本不完全相同;
18.在所述样本元组中任两个样本图像的图像相似度以及对应的第一参考值不符合预设要求的情况下,确定所述样本元组为待排序元组;
19.通过第二损失函数,对所述待排序元组进行损失计算,得到所述预设网络模型的第三损失值;
20.基于所述第三损失值,对所述预设网络模型的模型参数进行修正,并返回执行所述通过预设网络模型对所述样本图像进行识别,得到各样本图像的预测值的步骤,直至修正后的所述预设网络模型满足第三预设条件,得到已训练的图像回归模型。
21.可选地,在所述根据所述样本元组中任两个样本图像的图像相似度以及对应的第一参考值不符合预设要求的情况下,确定所述样本元组为待排序元组,具体包括:
22.确定所述样本元组中的图像相似度之间的相似度差值,以及对应的第一参考值的差值,并将第一参考值的差值作为第二参考值;
23.在所述相似度差值与第二参考值的差值大于第二预设阈值的情况下,将其对应的样本元组作为待排序元组。
24.可选地,所述确定所述训练样本集中任意两个样本图像之间的图像相似度,具体包括:
25.通过所述预设网络模型对所述训练样本集中的各样本图像进行特征提取,以得到各样本图像的待测指标的特征向量;
26.根据所述样本图像的特征向量,确定所述两个样本图像之间的图像相似度。
27.可选地,所述方法还包括:根据各所述样本图像的真实值以及预测值,确定第四样本集;其中,所述第四样本集由所述训练样本集中的正常样本组成,所述正常样本的样本图像的真实值与预测值的差值不符合第一预设条件;
28.通过第三损失函数对所述第四样本集进行损失计算,以得到所述预设网络模型的第四损失值;
29.基于所述第四损失值,对所述预设网络模型的模型参数进行修正;
30.返回执行所述通过预设网络模型对所述样本图像进行识别,得到各样本图像的预测值的步骤,直至修正后的所述预设网络模型满足第四预设条件,以得到已训练的图像回归模型。
31.可选地,所述方法还包括:针对所述训练样本集中的每个样本图像,进行归一化处理和数据增强处理,得到预处理图像,并将所述预处理图像作为样本图像。
32.可选地,所述样本图像为医学图像。
33.一种图像回归分析方法,应用上任一所述的图像回归模型的训练方法得到的已训练的图像回归模型,所述图像回归分析方法包括:
34.获取待识别图像,并将所述待识别图像输入至所述已训练的图像回归模型;
35.通过已训练的图像回归模型对所述待识别图像进行识别,得到所述待识别图像的待测指标的预测值。
36.可选地,在将所述待识别图像输入值已训练的图像回归模型之前,所述方法还包括:
37.对所述待识别图像进行归一化、数据增强处理,得到所述待识别图像的预处理图像,并将所述预处理图像作为待识别图像。
38.一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上任一所述的图像回归模型的训练方法中的步骤,或者如上任一所述的图像回归分析方法中的步骤。
39.一种终端,其包括:处理器和存储器;所述存储器上存储有可被所述处理器执行的计算机可读程序;所述处理器执行所述计算机可读程序时实现如上任一所述的图像回归模型的训练方法中的步骤,或者如上任一所述的图像回归分析方法中的步骤。
40.与现有技术相比,本技术实施例提供了一种图像回归模型的训练方法、图像回归分析方法、介质及终端,图像回归模型的训练方法通过将训练样本集中的样本图像输入预设网络模型以得到样本图像的待测指标的预测值,通过样本图像的真实值以及预测值,确定训练样本集中的异常样本并组成第一样本集,并通过图像相似度与相应的第一参考值(样本图像的真实值的比值)确定第二样本集,通过第一损失函数分别对第一样本集以及第二样本集进行损失计算,以得到相应的第一损失值和第二损失值;再基于第一损失值和第二损失值对预设网络模型的模型参数进行修正,以得到已训练的图像回归模型。由此可知,本技术实施例通过计算异常样本的损失函数,从而提高了预设网络模型训练的稳定性;然后通过样本图像的真实值的比值作为参考值与图像相似度比较,从而计算出相应的损失值实现了样本间的秩序排序,有效地提升图像回归模型的回归性能,提高模型预设的准确度。
附图说明
41.图1为本实施例提供的一种图像回归模型的训练方法的应用场景示图。
42.图2为本实施例提供的一种图像回归模型的训练方法的流程图;
43.图3为本实施例提供的一种图像回归模型的训练方法的流程示意图;
44.图4为本实施例提供的一种图像回归模型的训练方法的一示例图;
45.图5为本实施例提供的一种图像处理模型的训练方法的另一流程图;
46.图6为本实施例提供的一种图像处理模型的训练方法的另一流程图;
47.图7为本实施例提供的一种图像回归分析方法的流程图;
48.图8为本实施例提供的一种终端的结构原理图。
具体实施方式
49.本发明提供图像回归模型的训练方法、图像回归分析方法、介质及终端,为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
50.本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
51.本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
52.回归分析是基于深度学习的图像分析领域的一项重要分支,被应用在例如图像质量评估、关键点定位、目标检测、分析、生物学特征测量和配准等图像分析领域。图像回归分析是指利用预先创建的深度学习模型对待识别图像进行识别,得到该待识别图像的待测指标的预测值。目前的图像回归分析主要聚焦于学习单个样本的输入和输出之间的映射,而忽略了对数据集中样本之间结构化的学习,包括线性相关性、排名等级顺序关系等,这可能会导致基于深度学习的图像回归模型的回归性能差,造成实际预测结果的准确率低。此外,虽然现有技术中也提出了关于学习样本相关性的回归方法,但是对样本间相关性的学习不够全面,无法较好的提高图像回归模型的回归性能,提高图像回归模型的准确率。
53.为了解决上述问题,在本发明实施例中,将样本图像输入预设网络模型,通过预设网络模型输出样本图像的待测指标的预测值,根据样本图像的真实值和预测值确定异常样本,并将异常样本组成第一样本集;然后确定两个样本图像的图像相似度以及对应的第一参考值,以确定第一待排序样本,并将第一待排序样本组成第二样本集,随后通过损失计算得到第一样本集、第二样本集分别对应的第一损失值和第二损失值,对预设网络模型的模型参数进行修正,以得到已训练的图像回归模型。可见,本发明实施例中,通过对预设网络模型进行深度学习来得到图像回归模型,使得训练得到的图像回归模型的预测值与真实值更加接近,进而可以提高图像回归模型的回归性能以及预测结果的准确率。
54.举例说明,本发明实施例可以应用到如图1所示的场景。在图1所示的场景中,首先,终端设备1可以采集训练样本集,并将训练样本集输入至服务器2,以使得服务器2根据所述训练样本对预设网络模型进行训练。服务器2可以预先存储有预设网络模型,并响应终端设备1的输入的训练样本集,将训练样本集中的样本图像作为输入项输入预设网络模型,
然后,获得所述预设网络模型输出的样本图像的待测指标的预测值,并根据样本图像的真实值以及预测值确定异常样本以及第一待排序样本,然后分别对异常样本组成的第一样本集、第一待排序样本组成的第二样本集进行损失计算,以分别得到预设网络模型的第一损失值和第二损失值,通过所述第一损失值和第二损失值对所述预设网络模型的模型参数进行修正,并继续执行将训练样本集的样本图像输入预设网络模型的操作,直至预设网络模型满足第二预设条件,得到已训练的图像回归模型。
55.可以理解的是,在上述应用场景中,虽然将本发明实施方式的动作描述为部分有终端设备2执行、部分由服务器1执行,但是这些动作也可以完全由终端设备2执行,或者完全由服务器1执行。本发明在执行主体方面不受限制,只要执行了本发明实时方式所公开的动作即可。
56.进一步的,在获得已训练的图像回归模型后,可以将已训练的图像处理模型用于处理待识别图像的图像回归分析,以得到待识别图像的待测指标的预测值。例如,终端设备通过拍摄获得人体的脑部mr图像,该脑部mr识别图像的待测指标为人体脑部的关键解剖点位置,将该脑部mr图像作为待识别图像输入至上述已训练的图像回归模型,通过已训练的图像回归模型对该待识别图像进行识别,以得到预测的该脑部mr图像的关键解剖点位置,从而可以实现对脑部mr图像的关键解剖点位置的回归分析。在实际应用中,所述已训练的图像回归模型可以作为一个图像回归分析模块配置于终端设备,当具有图像拍摄功能的终端设备拍摄到图像时,启动图像回归分析模块,通过该图像回归分析模块进行回归分析,使得该终端设备可以输出所述图像的待测指标的回归值(即预测值)。
57.可以理解的是,上述应用场景仅是为了便于理解本发明而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。
58.下面结合附图,通过对实施例的描述,对发明内容作进一步地说明。
59.本实施例提供了一种图像回归模型的训练方法,如图2、3所示,该图像回归模型的训练方法可以包括:
60.s201,获取训练样本集。
61.其中,训练样本集包括:多个训练样本,每个训练样本包括:样本图像、以及预先标注的样本图像的待测指标的真实值。
62.上述训练样本的样本图像可以是相应的终端设备通过拍摄得到的。例如,核磁共振设备拍摄的人体的脑部mr图像作为样本图像,该脑部mr图像的待测指标为关键解剖点位置,则每个训练样本包括:脑部mr图像、以及预先标注的该脑部mr图像的关键解剖点位置的真实值。再例如,样本图像为电子眼拍摄的道路图像,该道路图像的待测指标为图像显示的车辆的数量,则每个训练样本包括:道路图像、以及预先标注的道路图像的显示车辆数量的真实值。
63.在本实施例中,如图3所示,针对训练样本集中的每个样本图像,可以先进行归一化处理和数据增强处理,得到预处理图像,并将预处理图像作为所述样本图像。通过对每个样本图像进行归一化处理和数据增强处理,并将进行过归一化处理和数据增强处理的图像作为样本图像,输入至预设网络模型进行模型训练,更有利于深度学习模型的学习及收敛,防止深度学习模型过拟合,提高图像回归模型的鲁棒性。
64.例如,在获取训练样本集之后,可以先对训练样本集中的每个脑部mr图像进行归
一化处理,归一化处理后脑部mr图像的像素分布会从0到255变成0到1,这样的分布区间更有利于深度学习模型的学习及收敛。然后,再对每个进行过归一化处理的脑部mr图像进行数据增强处理,该数据增强处理至少可以包括:随机选准和随机缩放,例如:样本图像的输入尺寸为320
×
320,缩放后通过padding生成固定尺寸。通过数据增强处理可以扩展数据集的分布,可以降低深度学习模型过拟合的可能性,提高鲁棒性。
65.可以理解的是,本技术实施例中也可以先对每个样本图像进行数据增强处理,再进行归一化处理,在此不做具体限制。
66.s202,通过预设网络模型对样本图像进行识别,得到各样本图像的待测指标的预测值。
67.具体地,上述预设网络模型为深度学习模型,并且,由本实施例提出的方法所训练的图像回归模型,可以表示任意一种用于对图像进行回归分析的深度学习模型。
68.进一步地,如图3所示,可以先将训练样本的样本图像作为输入项输入至预设网络模型的特征提取网络进行特征提取,输出提取到的每个样本图像的特征张量;然后,通过预设网络模型对样本图像的特征张量进行回归分析,以确定该样本图像的待测指标的预测值。也就是说,通过预设网络模型由样本图像的特征张量映射到样本图像的预测值。
69.举例说明:预测图像中显示的人眼部图像的年龄,针对这一问题,待测指标为图像显示的眼部对应的人的年龄,利用预设网络模型的特征提取网络提取的人眼部图像的特征张量,即为年龄特征张量,年龄特征张量用于指示样本眼部图像中显示的眼部对应的人的年龄预测值,通过预设网络模型对年龄特征张量进行回归分析,以得到人眼部图像的年龄预测值。
70.s203,根据各所述样本图像的真实值以及预测值,确定第一样本集。
71.其中,第一样本集由训练样本集中的异常样本组成,异常样本的样本图像的真实值与预测值的差值符合第一预设条件。
72.具体地,在得到每个样本图像的真实值以及预测值之后,可以计算每个样本图像的真实值与预测值的差值,并将样本图像的真实值与预测值的差值作为第一差值。然后,按照第一差值从大到小的顺序对第一差值进行排序,可以得到第一差值序列。在第一差值序列中从小到大选择第一差值序列中相应预设数量的第一差值,并将被选择的第一差值对应的训练样本作为异常样本,而其他的训练样本作为正常样本。需要说明的是,也可以按照从小到大的顺序对第一差值进行排序,得到相应的第一差值序列,并在第一差值序列中还是按照从小到大的循序选择相应预设数量的第一差值,并将被选择的第一差值对应的训练样本作为异常样本,而其他的训练样本作为正常样本。
73.并且,上述预设数量可以根据当前的训练样本集中训练样本的数量确定,例如,预设数量为当前的训练样本集中训练样本的10%。也就是说,样本图像的预测结果(即预测值)和真实结果(即真实值)的差值(即第一差值)是否处于当前批量结果(即当前的训练样本集中的所有的第一差值)最差的前10%,如图3所示。若当前的训练样本集中训练样本的数量为1000,则将第一差值处于当前批量结果最差的10%,即结果最差的100个训练样本作为异常样本,该训练样本集中的其他900个训练样本作为正常样本。
74.可以理解的是,也可以设定相应的预设阈值,在样本图像的真实值与预测值的差值(即第一差值)大于相应的预设阈值的情况下,将该第一差值对应的训练样本作为异常样
本;在样本图像的真实值与预测值的差值小于或等于预设阈值的情况下,将该第一差值对应的训练样本作为正常样本。需要说明的是,该预设阈值可以根据当前的训练样本集进行适时的调整,每个训练样本集对应的预设阈值有可能不同。
75.因此,上述第一预设条件可以是样本图像的第一差值(即样本图像的真实值与预测值的差值)处于当前的训练样本集的差值排序中的相应位次,也可以是样本图像的第一差值大于相应的预设阈值。
76.s204,确定训练样本集中任意两个样本图像之间的图像相似度以及相应的第一参考值。
77.其中,第一参考值为两个样本图像的待测指标的真实值的比值。
78.具体地,可以通过对提取的样本图像的特征张量进行降维,得到各样本图像的待测指标的特征向量;然后再根据样本图像的特征向量,确定两个样本图像之间的图像相似度。也就是说,特征张量是样本图像的高维的特征表示,而特征向量是相较于特征张量的样本图像的低维的特征表示。需要说明的是,提取样本的特征张量的方式已进行阐述,再次不再加以赘述。
79.进一步地,可以将两个样本图像的特征向量间的余弦距离s(xi,xj),作为两个样本图像之间的图像相似度。其中,xi表示样本图像i的特征向量,xj表示样本图像j的特征向量。
80.可以理解的是,也可以计算两个样本图像的特征向量间的欧式距离,作为两个样本图像的图像相似度。
81.需要说明的是,本实施例中,还可以通过其他方式去评估样本图像之间的图像相似度,例如评估两个样本图像之间的互相关和互信息,在图像层面而不是特征层面进行图像相似度的计算,在此不做具体限定。
82.由于样本图像的特征向量是由预设网络模型的特征提取网络提取到的特征张量,经过降维操作后得到的,并且样本图像的预测值是预设网络模型对特征张量进行回归分析得到的。因此,可以用通过预设网络模型获得的样本图像间的特征向量的比值,表征预设网络模型对样本图像回归分析后得到的预测值的比值。
83.进一步地,假设具有相似真实值的样本图像,也应具有一定程度的相似的特征表示(该特征表示可以为特征向量),而具有不同真实值的样本图像应该具有较少相似的特征表示。因此,在本实施例中采用预先标注的样本图像的待测指标的真实值的比值,作为图像相似度的参考值(即上述第一参考值),具体定义为:其中,表示样本图像i的待测指标的真实值,表示样本图像j的待测指标的真实值,[
·
]表示大于1.0时的倒数运算。也就是说,第一参考值p(xi,xj)的取值范围为(0,1]。
[0084]
s205,根据图像相似度与相应的第一参考值,确定训练样本集中的第一待排序样本并确定第二样本集。
[0085]
其中,第二样本集由训练样本集中的第一待排序样本组成,第一待排序样本为图像相似度与相应的第一参考值的差值大于第一预设阈值的训练样本。也就是说,可以计算两个样本图像的图像相似度与相应的第一参考值之间的差值,将该差值大于第一预设阈值
的训练样本,作为第一待排序样本,从而得到第二样本集。
[0086]
在本技术实施例中,训练样本集中的两个样本图像的图像相似度,都会存在相应的第一参考值,例如,训练样本中样本图像a、b的图像相似度为s(xa,xb),则样本图像a、b的第一参考值为其中,xa为样本图像a的特征向量,xb为样本图像b的特征向量,表示样本图像a的待测指标的真实值,表示样本图像b的待测指标的真实值。
[0087]
可以理解的是,在两个样本图像的真实值相似的情况下,说明两个样本图像的特征向量也相似,也就是说两个样本图像的特征向量的比值(即图像相似度)与第一参考值也相似。由于样本图像的特征向量是由预设网络模型识别得到的,在两个样本图像的图像相似度与相应的第一参考值的差值较大的情况下,说明目前的预设网络模型的输出结果不够准确,准确度较低。也就是说,第一待排序样本可以只是将样本图像作为输入项输入预设网络模型所输出的预测值与真实值相差较大,超出可误差的范围。
[0088]
s206,通过第一损失函数分别对第一样本集、第二样本集进行损失计算,得到预设网络模型的第一损失值、第二损失值。
[0089]
其中,第二样本集由训练样本集中的第一待排序样本组成。
[0090]
上述可知,第一样本集由训练样本集中的异常样本组成。在本技术实施例中,上述第一损失函数可以是l2损失函数。通过l2损失函数对第一样本集进行损失计算,即可得到第一损失值。具体地,计算第一样本集的损失函数的公式定义如下所示:
[0091][0092]
其中,表示第一样本集中训练样本(即异常样本)的真实值,yi表示第一样本集中训练样本(即异常样本)的预测值,l
outlier
即为预设网络模型的第一损失值。
[0093]
进一步地,通过l2损失函数对第二样本集进行损失计算,得到第二损失值。具体地,计算第二样本的损失函数的公式定义如下所示:
[0094][0095]
其中,xi表示样本图像i的特征向量,xj表示样本图像j的特征向量,s(xi,xj)表示样本图像i与样本图像j的图像相似度,p(xi,xj)表示样本图像i与样本图像j的第一参考值,loss
src
表示第二损失值。
[0096]
也就是说,在样本间全局等级排序的条件如下所示:
[0097]
r(xi,xj):p(xi,xj)≤|s(xi,xj)|or|s(xi,xj)|≥p(xi,xj) α,
[0098]
其中,参数α为控制边界,在本技术实施例中α可以设定为0.25。
[0099]
也就是说,在样本图像满足上述条件r(xi,xj)的情况下,计算第二损失值以实现训练样本集的规范化全局等级排序。
[0100]
需要说明的是,可以先执行用于确定第一样本集的步骤s203,再执行用于确定第二样本集的步骤s204-s205;或者先执行用于确定第二样本集的步骤s204-s205,再执行用于确定第一样本集的步骤s203,亦或者用于确定第一样本集的步骤s203以及用于确定第二样本集的步骤s204-s205,可以同步执行,在本技术实施例中不做具体限定。
[0101]
s207,基于第一损失值和第二损失值,对预设网络模型的模型参数进行修正。
[0102]
s208,返回执行通过预设网络模型对样本图像进行识别,得到各样本图像的待测指标的预测值的步骤,直至修正后的预设网络模型满足第二预设条件,得到已训练的图像回归模型。
[0103]
由于损失函数是用于衡量模型输出的预测值与真实值之间的偏离程度,因此可以通过梯度下降算法优化预设网络模型的参数,在将第一损失值和第二损失值是否满足相应的预设值作为条件,使得预设网络模型的预测值逼近真实值。
[0104]
具体地,上述第二预设条件可以是第一损失值满足第一预设值,第二损失值满足第二预设值。所述第一预设值和第二预设值均可以根据图像回归模型的精度来确定,在这里不做详细说明。由此,预设网络模型输出样本图像的预测值,根据样本图像的预测值以及样本图像的真实值,以及样本图像之间的样本相似度,计算当前的预设网络模型的第一损失值、第二损失值。在计算得到第一损失值与第二损失值后,判断得到的第一损失值与第二损失值是否满足相应的预设值;在第一损失值与第二损失值均满足相应的预设值的情况下,结束预设网络模型的训练,得到已训练的图像回归模型。
[0105]
进一步地,由于对预设网络模型的模型参数进行修正是在预设网络模型的模型参数未满足第二预设条件的情况下进行的,因此在根据第一损失值、第二损失值对预设网络模型的模型参数进行修正后,需要继续对修正后的预设网络模型再进行训练,继续执行通过预设网络模型对样本图像进行识别,得到各样本图像的待测指标的预设值的步骤。其中,继续执行通过对预设网络模型的样本图像进行识别中,输入预设网络模型的样本图像可以是未作为输入项输入过的其他训练样本集中的样本图像。但是可以理解的是,在实际操作过程中由于训练样本集的数量有限,因此在训练样本集已经使用过的情况下,可以继续执行通过预设网络模型对该训练样本集中的样本图像进行识别的步骤,以使得训练样本集按照循环输入预设网络模型,以提高图像回归模型的训练效果。
[0106]
在本技术实施例中,通过l2损失函数对第一样本集的训练样本(即异常样本)进行损失计算,得到第一损失值,并将第一损失值作为预设网络模型的训练条件,可以使得预设网络模型的训练更稳定,增强预设网络模型预测的鲁棒性。而现有技术中仅基于皮尔逊相关系数(pearson linear correlation,plc)的损失函数在全局水平上进行回归,并没有考虑异常值对模型学习的影响。plc对于异常值非常敏感,因此如果数据样本集中存在极端的异常值的情况下,就会导致皮尔逊相关系数估计失去其可信度,也就会基于plc损失函数所训练的预设网络模型的稳定性低,影响预设网络模型预测的鲁棒性。
[0107]
另外,通过样本图像的真实值的比值作为第一参考值,将第一参考值作为监督信息对样本图像的图像相似度(即特征相似度)的排序进行约束,如图4所示,通过l2损失函数对第二样本集进行损失计算,通过第二损失值对预设网络模型的模型参数进行修正,使得样本图像间的图像相似度接近第一参考值,以得到已训练的图像回归模型。
[0108]
也就是说,本实施例中通过第一损失值和第二损失值,引入了相关性准则,预设网络模型能够充分学习训练样本集中样本图像之间的结构化关系,使得训练的图像回归模型的回归性能得到很大程度的提升,进一步提高图像回归模型的预测准确度。
[0109]
由于在训练样本集中存在不满足上述条件r(xi,xj)的训练样本,因此,为了进一步提高图像回归模型的回归分析性能,对于不满足r(xi,xj)的训练样本进行局部等级排序。
[0110]
具体地,如图5所示,在本技术实施例提供的图像回归模型的训练方法中,还可以包括:
[0111]
s501,根据样本图像的图像相似度与相应的第一参考值,确定第二待排序图像并组成第三样本集。
[0112]
其中,第三样本集由训练样本集中的第二待排序样本组成,第二待排序样本的图像相似度与相应的第一参考值的差值小于或等于第一预设阈值。在图像相似度与相应的第一参考值的差值小于或等于第一预设阈值的情况下,将其对应的两个训练样本作为第二待排序样本。
[0113]
s502,从第三样本集中选取训练样本,组成多个样本元组。
[0114]
其中,每个样本元组中至少包括第三样本集中的三个第二待排序样本,且样本元组之间的三个第二排序样本不完全相同。
[0115]
举例说明,第三样本集包括:a1、a2、a3、a4、a5、a6,其中,a1、a2、a3、a4、a5、a6均为第二待排序样本,从第三样本集中选取训练样本,组成的样本元组可以包括如下所示:
[0116]
(a1,a2,a3),(a1,a2,a4),(a1,a2,a5),(a1,a2,a6),(a1,a3,a4),(a1,a3,a5),(a1,a3,a6),(a1,a4,a5),(a1,a4,a6),(a1,a5,a6),(a2,a3,a4),(a2,a3,a5),(a2,a3,a6),(a2,a4,a5),(a2,a5,a6),(a3,a4,a5),(a3,a4,a6),(a3,a5,a6),(a4,a5,a6)。
[0117]
s503,在样本元组中任两个样本图像的相似度与对应的第一参考值不符合预设要求的情况下,确定该样本元组为待排序元组。
[0118]
具体地,可以先确定样本元组中的图像相似度之间的相似度差值,以及对应的第一参考值的差值,并将第一参考值的差值作为作为第二参考值;在相似度差值与对应的第二参考值的差值大于第二预设阈值的情况下,将其对应的训练元组作为待排序元组。
[0119]
例如,一样本元组为(a1,a2,a3),则a1与a2的图像相似度为s(x
a1
,x
a2
),a1与a2的第一参考值为p(x
a1
,x
a2
);a1与a3的图像相似度为s(x
a1
,x
a3
),a1与a2的第一参考值为p(x
a1
,x
a3
)-p(x
a2
,x
a3
);a2与a3的图像相似度为s(x
a2
,x
a3
),a1与a2的第一参考值为p(x
a2
,x
a3
)。从而计算的相似度差值分别为:|s(x
a1
,x
a2
)|-|s(x
a1
,x
a3
)|、|s(x
a1
,x
a2
)|-|s(x
a2
,x
a3
)|、|s(x
a1
,x
a3
)|-|s(x
a2
,x
a3
)|,其分别对应的第二参考值为p(x
a1
,x
a2
)-p(x
a1
,x
a3
)、p(x
a1
,x
a2
)-p(x
a2
,x
a3
)、p(x
a1
,x
a3
)-p(x
a2
,x
a3
)。
[0120]
s504,通过第二损失函数,对待排序元组进行损失计算,得到预设网络模型的第三损失值。
[0121]
具体地,计算第三损失值的第二损失函数如下所示:
[0122]
其中:
[0123]
l
ascent
=max{0,(p(xi,xj)-p(xi,xk))-(|s(xi,xj)|-|s(xi,xk)|)},
[0124]
l
descent
=max{0,(p(xj,xk)-p(xi,xk))-(|s(xj,xk)|-|s(xi,xk)|)}。
[0125]
上述loss
src
为预设网络模型的第三损失值,l
ascent
为正向排序损失,即在r(xi)》r(xj)》r(xk)的条件下,计算r(xi,xj)与r(xi,xk)之间的损失,l
descent
为逆向排序损失,即在r(xi)》r(xj)》r(xk)的条件下,计算r(xj,xk)与r(xi,xk)之间的损失.。
[0126]
s505,基于第三损失值,对预设网络模型的模型参数进行修正,并返回执行通过预设网络模型对样本图像进行识别,得到各样本图像的预测值的步骤,直至修正后的预设网
络模型满足第三预设条件,得到已训练的图像回归模型。
[0127]
具体地,上述第三预设条件可以是第三损失值满足第三预设值,该第三预设值可以根据图像回归模型的精度来确定,在此不做详细说明。在计算得到第三损失值后,判断第三损失值是否满足相应的预设值。在第三损失值满足第三预设值的情况下,结束预设网络模型的训练,得到已训练的图像回归模型。
[0128]
也就是说,对于不满足条件r(xi,xj)的训练样本,本技术提出通过特向向量(xi,xj,xj)的样本元组进行精细地局部排序规范化处理,如图4所示的三角关系。可以理解的是,如果样本元组的真实值的等级排序关系表示为:r(xi)》r(xj)》r(xk),则样本元组中的图像相似度关系应满足如下关系:s(xi,xj)》s(xj,xk),s(xj,xk)》s(xi,xk)。此外,图像相似度之间的差异应大于一个边界值才能更好的区分相似的样本图像之间的关系以优化局部排序。因此,在本技术实施例中,通过样本图像的第一参考值的差值作为动态的边界值(即第二参考值),可以更好地适应回归分析中不同的样本图像间的相似性关系。因此,通过上述步骤s501-s505可以对相似的样本图像之间的关系进行进一步的排序,并通过第三损失值对预设网络模型的模型参数再次进行修正,以使训练的图像回归模型的回归性能进一步提高,预测准确度也进一步提升。
[0129]
由于现有技术中,常规的斯皮尔曼秩相关系数(spearman's rank correlation coefficient,src)被定义为衡量两个排序变量的关联强度如下所示:
[0130]
src(x,y)=1-(6||rk(x)-rk(y)||)/(n(n
2-1)),
[0131]
其中,x,y分别表示两个变量,rk(
·
)表述排序运算符,n表示变量的样本数。
[0132]
然而上述的src公式是不可微分的,也就是说离散排序所涉及的损失函数很难最小化。因此,本技术实施例提出将样本间等等级排序相关的学习转化为样本的图像相似度的排序问题。本技术实施例提出的图像相似度与真实值的比值作为排序条件,为损失函数提供了一种可微分的近似,为样本间等级排序的表示提供了一种新的途径。
[0133]
由上述可知,本技术实施例提出的新的src损失函数可以表示为如下所示:
[0134]
当满足条件r(xi,xj)时,否则,
[0135]
也就是说,在本技术实施例中,通过上述方案不仅可以优化图像相似度之间的绝对秩序,还可以约束图像相似度之间的距离,以更好的完成样本图像间的秩序排序。
[0136]
进一步地,如图6所示,在本实施例提供的图像回归模型的训练方法中,还可以包括:
[0137]
s601,根据各样本图像的真实值和预测值,确定第四样本集。
[0138]
其中,第四样本集有训练样本集中的正常样本组成,正常样本的样本图像的真实值与预测值的差值不符合第一预设条件。
[0139]
需要说明的是,本实施例中通过样本图像的真实值和预测值确定训练样本集中的正常样本的具体实现步骤,在上文中已进行阐述,在此不再加以赘述。
[0140]
s602,通过第三损失函数,对第四样本集进行损失计算,以得到预设网络模型的第四损失值。
[0141]
其中,上述第三损失函数可以是皮尔逊相关系数的损失函数。
[0142]
具体地,上述第四损失值的计算公式如下所示:
[0143][0144]
其中,表示第四样本集的样本图像的真实值,y表示第四样本集的样本图像的特征向量,μ,σ分别表示变量的均差和方差。
[0145]
s603,基于第四损失值,对预设网络模型的模型参数进行修正。
[0146]
s604,返回执行上述通过预设网络模型对样本图像进行识别,得到各样本图像的预测值的步骤,直至修正后的预设网络模型满足第三预设条件,以得到已训练的回归模型。
[0147]
具体地,上述第三预设条件可以是第四损失值满足第四预设值。所述第四预设值可以根据图像回归模型的精度来确定,在此不做详细说明。在计算得到第四损失值后,判断得到的第四损失值是否满足第四预设值,在第四损失值满足第四预设值的情况下,结束预设网络模型的训练,得到已训练的图像回归模型。
[0148]
皮尔逊相关系数用于衡量两个变量之间线性关系的强度。因此,对于正常样本,本技术实施例引入皮尔逊相关系数作为损失函数,对正常样本组成的的第四样本集进行损失极端,得到第四损失值,从而在整体数据集的水平上强化预测样本与真实样本的相关性,并减少分布差异。
[0149]
在本技术实施例中,所述训练样本集中的样本图像为医学图像,例如:脑部mr图像、肺组织图像等。由于医学图像的图像之间的相关性对于诊断有着重要的影响,因此,本技术实施例提出的图像回归模型的训练方法所训练的图像回归模型,对医学图像具有重要的意义。
[0150]
基于上述图像回归模型的训练方法,本发明还提供了一种图像回归分析方法,所述方法应用如上述实施例所述的图像回归模型的训练方法训练得到图像回归模型,如图7所示,所述图像回归分析方法包括:
[0151]
s701,获取待识别图像,并将所述待识别图像输入至所述图像回归模型。
[0152]
具体地,所述待处理图像可以是通过拍摄设备拍摄得到的图像,也可以是预先设置的图像,还可以是根据接收到的选取操作而确定的图像。
[0153]
在本技术的一些实施例中,在将待识别图像输入值图像回归模型之前,可以先对待识别图像进行归一化、数据增强处理,得到待识别图像的预处理图像,并将该预处理图像作为待识别图像输入值图像回归模型。通过对待识别图像进行归一化、数据增强处理,使得图像回归模型的回归分析结果更加精确。
[0154]
s702,通过所述图像回归模型对所述待识别图像进行回归分析,以得到所述待识别图像的待测指标的预测值。
[0155]
具体地,将待识别图像作为图像回归模型的输入项输入至图像回归模型中,通过图像回归模型对待识别图像进行回归分析,以得到待识别图像的待测指标的预测值。
[0156]
基于上述图像回归模型的训练方法以及图像回归分析方法,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述实施例所述的图像回归模型的训练方法中的步骤,或者图像回归分析方法中的步骤。
[0157]
基于上述图像回归模型的训练方法以及图像回归分析方法,本发明还提供了一种终端,如图8所示,其包括至少一个处理器(processor)80;显示屏81;以及存储器(memory)
82,还可以包括通信接口(communications interface)83和总线84。其中,处理器80、显示屏81、存储器82和通信接口83可以通过总线84完成相互间的通信。显示屏81设置为显示初始设置模式中预设的用户引导界面。通信接口83可以传输信息。处理器80可以调用存储器82中的逻辑指令,以执行上述实施例中的方法。
[0158]
此外,上述的存储器82中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
[0159]
存储器82作为一种计算机可读存储介质,可设置为存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令或模块。处理器80通过运行存储在存储器82中的软件程序、指令或模块,从而执行功能应用以及数据处理,即实现上述实施例中的方法。
[0160]
存储器82可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器82可以包括高速随机存取存储器,还可以包括非易失性存储器。例如,u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
[0161]
此外,上述存储介质以及终端中的多条指令处理器加载并执行的具体过程在上述方法中已经详细说明,在这里就不再一一陈述。
[0162]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献