基于弥散张量成像及卷积神经网络的脑龄预测方法及系统

2022-11-19 12:50:20 来源：中国专利 TAG：

1.本发明属于深度学习技术领域，具体涉及一种基于弥散张量成像及卷积神经网络的脑龄预测方法及系统。

背景技术：

2.弥散张量成像(diffusion tensor imaging，dti)技术的兴起改变了白质纤维结构研究的传统手段，实现了无创的非侵入式活体研究。在dti图像的特征参数中，部分各向异性分数(fractional anisotropy，fa)代表某个体素在某方向上的扩散程度。已有研究表明，大脑的白质纤维在脑成熟及脑老化过程中伴随着fa值的变化，表明了fa值对于检测人脑结构随脑发育、脑成熟及脑老化的变化具有一定的灵敏度。
3.现有的基于核磁共振成像的脑龄预测模型大多采用传统的机器学习方法，这些方法需要经过特征提取、特征选择，模型训练等前期复杂的处理过程，过程中的每一步都需要人为干预，模型预测精度很大程度上受特征提取过程的影响，且仍然无法满足临床应用实际需求。

技术实现要素：

4.本发明所要解决的技术问题在于针对上述现有技术中的不足，提供一种基于弥散张量成像及卷积神经网络的脑龄预测方法及系统，利用平均绝对误差作为模型精确度的衡量指标，以解决传统脑龄预测方法需要人工干预，预测精度不高的技术问题。
5.本发明采用以下技术方案：
6.基于弥散张量成像及卷积神经网络的脑龄预测方法，包括以下步骤：
7.s1、利用公开数据集中的弥散张量成像数据及对应测试者的实际年龄形成初始样本集；
8.s2、对步骤s1得到的初始样本集中的弥散张量成像数据进行数据预处理，得到处理后的图像；
9.s3、将步骤s2处理后的图像按对应测试者的实际年龄划分为年龄分布均匀的训练样本集及测试样本集；
10.s4、将步骤s3得到的训练样本集及对应测试者的实际年龄作为输入训练三维卷积神经网络，构建脑龄预测模型；
11.s5、将步骤s3得到的测试样本集输入步骤s4构建的脑龄预测模型中，实现脑龄预测。
12.具体的，步骤s2具体为：
13.s201、对初始样本集中的弥散张量成像数据进行格式转换；
14.s202、对步骤s201格式转换后的图像进行提取b0图像，剥脑，涡流校正和计算弥散张量成像指标处理，得到所有被试个体空间下的fa图像；
15.s203、对步骤s202得到的fa图像进行tbss处理，得到每个被试在标准mni152空间
下的3d fa图像。
16.进一步的，步骤s202中，弥散张量成像指标处理包括各向异性分数fa和平均弥散率md。
17.进一步的，步骤s203中，tbss处理包括数据准备、非线性配准及创建平均fa图像和骨架。
18.具体的，步骤s4具体为：
19.s401、将训练样本集中的弥散张量成像图像数据输入三维卷积神经网络模型；
20.s402、使用relu函数作为激活函数，均方误差作为损失函数，使用adam算法对步骤s401生成的脑龄预测模型参数进行优化；
21.s403、选择步骤s402优化后平均绝对误差mae最低的脑龄预测模型作为最终的脑龄预测模型；
22.s404、依据构建的脑龄预测模型，生成训练样本集预测脑龄。
23.进一步的，步骤s401中，三维卷积神经网络模型包括五个特征提取模块及三个全连接层，每个特征提取模块包含两个卷积核大小为3
×3×
3，步长为1
×1×
1的三维卷积层、一个大小为2
×2×
2，步长为2
×2×
2的最大池化层、批归一化层及relu激活函数。
24.更进一步的，第一个特征提取模块中使用了8个特征图，第二个特征提取模块中的特征图数量为16，第三个特征提取模块中特征图数量为32，第四个特征提取模块中特征图数量为64，第五个特征提取模块中特征图数量为128。
25.再进一步的，五个特征提取模块的参数总数分别为1992、10,464、41,664、166,272及663,808，最后一个全连接层具有5760个参数，三维卷积神经网络模型的总参数为889,960。
26.更进一步的，三个全连接层的输出通道数分别为128，64，1。
27.第二方面，本发明实施例提供了一种基于弥散张量成像及卷积神经网络的脑龄预测系统，包括：
28.数据模块，利用公开数据集中的弥散张量成像数据及对应测试者的实际年龄形成初始样本集；
29.处理模块，对步数据模块得到的初始样本集中的弥散张量成像数据进行数据预处理，得到处理后的图像；
30.划分模块，将处理模块处理后的图像按对应测试者的实际年龄划分为年龄分布均匀的训练样本集及测试样本集；
31.训练模块，将划分模块得到的训练样本集及对应测试者的实际年龄作为输入训练三维卷积神经网络，构建脑龄预测模型；
32.预测模块，将划分模块得到的测试样本集输入训练模块构建的脑龄预测模型中，实现脑龄预测。
33.与现有技术相比，本发明至少具有以下有益效果：
34.基于弥散张量成像及卷积神经网络的脑龄预测方法，首先利用公开数据集中的弥散张量成像数据及对应测试者的实际年龄形成初始样本集，对其中的弥散张量成像数据进行预处理得到处理后的图像，而后将处理后的图像划分年龄分布均匀的训练样本集及测试样本集，利用训练样本集对构建的脑龄模型进行训练，选择平均绝对误差最小的模型作为
最终的脑龄预测模型，最后用测试样本集对模型进行验证。该方法流程完整，能够略去特征提取这一步骤，降低时间复杂度及参数规模，并在提升训练效率的同时得到准确性较高的脑龄预测结果，泛化能力较强，能够适用于不同分布的数据集。
35.进一步的，由于初始样本集中的弥散张量成像数据来源于不同中心，且不同个体数据之间存在差异，个体头动对数据造成的伪影等无法统一的因素和不良影响，需要对原始数据进行统一的预处理，具体步骤包括图像格式转换、提取b0图像、剥脑、涡流校正、计算弥散张量成像指标、tbss处理。该数据预处理方法在不损失原始数据信息的同时，能节省大量空间，去除大脑以外其他的部分，消除头动造成的伪影，将所有图像进行对齐并配准到标准空间，方便后续分析。
36.进一步的，弥散张量成像数据最常用的测量指标是各向异性分数(fa)和平均弥散率(md)。其中fa可以量化局部区域结构的定向强度，许多影像学研究都使用fa图像来定位与发育、退化和疾病相关的大脑变化。
37.进一步的，由于多被试fa图像配准较难，使用标准的配准算法会影响优化分析。如何配准多被试的fa图像使得后续的分析能够得到有效结果以及空间平滑程度选择的随意性问题还没有解决。tbss(基于纤维束的空间统计)处理通过数据准备，仔细调整的非线性配准，然后投影到对齐不变的纤维束表示(即创建“平均fa骨架”)来等步骤解决这些问题，旨在提高多被试弥散张量成像研究的敏感性、客观性和可解释性。
38.进一步的，将训练样本集中的弥散张量成像图像数据输入三维卷积神经网络模型，对构建的脑龄预测模型进行训练。使用relu函数作为激活函数，均方误差mse作为损失函数，使用adam算法对脑龄预测模型参数进行优化，最后选择优化后平均绝对误差mae最低的脑龄预测模型作为最终的脑龄预测模型，生成训练样本集的脑龄预测结果。采用sigmoid等其他激活函数时，计算量大，反向传播求误差梯度时，求导涉及除法，计算量相对大，而采用relu激活函数，整个过程的计算量节省很多。此外，relu激活函数会使一部分神经元的输出为0，这样就造成了网络的稀疏性，并且减少了参数的相互依存关系，缓解了过拟合问题的发生。均方误差mse的函数曲线光滑、连续，处处可导，便于使用梯度下降算法，是一种常用的损失函数，且随着误差的减小，梯度也在减小，这有利于收敛，即使使用固定的学习速率，也能较快的收敛到最小值。adam算法是一种可以替代传统随机梯度下降(sgd)过程的一阶优化算法，它能基于训练数据迭代地更新神经网络权重，便于实现、计算高效且所需的内存更小。基于此方法构建的脑龄预测模型在降低时间复杂度的同时，也能够保证预测结果的准确性。
39.进一步的，三维卷积神经网络模型包括五个特征提取模块及三个全连接层，每个特征提取模块包含两个卷积核大小为3
×3×
3，步长为1
×1×
1的三维卷积层、一个大小为2
×2×
2，步长为2
×2×
2的最大池化层、批归一化层及relu激活函数。特征提取模块用于提取输入图像的特征，其中卷积层(convolution layer)是卷积神经网络的核心组件，它的作用是对输入数据进行特征提取，通过卷积核矩阵对原始数据中隐含关联性进行抽象，有助于减少参数量。其中，卷积核的数量越多，卷积层的特征提取能力越强。最大池化层将特征图下采样，作用是对特征进行筛选，提取区域内最具代表性的特征，能够有效地降低输出特征尺度，进而减少模型所需要的参数量，同时也能有效地防止过拟合的发生。批归一化层的使用可以加速模型训练，甚至提升模型精度的作用。全连接层起到特征整合的作用，将多维
特征映射成一维的特征输出，提升模型鲁棒性。
40.进一步的，一般网络越深的地方特征图数量越多，因为随着网络的深入，特征图的长宽尺寸缩小，每个特征图提取的特征越具有代表性，所以后一层卷积层需要增加特征图的数量，才能更充分的提取出前一层的特征，一般是成倍增加。每个特征提取模块中特征图数量的设置主要用于保证提取足够丰富的大脑特征。
41.进一步的，每个特征提取模块的参数数量由模型结构决定，相较于传统人工神经网络，卷积神经网络通过感受野和权值共享减少参数数量，降低模型的训练难度，同时也能避免参数过多引起过拟合的问题。
42.进一步的，全连接层的输出通道数分别设置为128、64、1，目的在于将最后一个特征提取模块所得的多维特征进行三次线性变换，提升模型的学习能力，并使模型最后的输出为所需的单个输出值，以该输出值表示预测脑龄。
43.可以理解的是，上述第二方面的有益效果可以参见上述第一方面中的相关描述，在此不再赘述。
44.综上所述，本发明搭建了基于弥散张量成像及三维卷积神经网络的脑龄预测模型，通过脑龄预测模型实现准确的脑龄预测，预测模型时间复杂度低且预测结果准确可靠。
45.下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。
附图说明
46.图1为本发明流程图；
47.图2为本发明数据预处理方法流程图；
48.图3为本发明脑龄预测模型网络架构示意图；
49.图4为本发明训练样本集及测试样本集脑龄预测结果散点图，其中，(a)为训练样本集脑龄预测结果，(b)为测试样本集脑龄预测结果。
具体实施方式
50.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
51.在本发明的描述中，需要理解的是，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
52.还应当理解，在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。
53.还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。
54.应当理解，尽管在本发明实施例中可能采用术语第一、第二、第三等来描述预设范围等，但这些预设范围不应限于这些术语。这些术语仅用来将预设范围彼此区分开。例如，在不脱离本发明实施例范围的情况下，第一预设范围也可以被称为第二预设范围，类似地，第二预设范围也可以被称为第一预设范围。
55.取决于语境，如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
56.在附图中示出了根据本发明公开实施例的各种结构示意图。这些图并非是按比例绘制的，其中为了清楚表达的目的，放大了某些细节，并且可能省略了某些细节。图中所示出的各种区域、层的形状及它们之间的相对大小、位置关系仅是示例性的，实际中可能由于制造公差或技术限制而有所偏差，并且本领域技术人员根据实际所需可以另外设计具有不同形状、大小、相对位置的区域/层。
57.本发明提供了一种基于弥散张量成像及卷积神经网络的脑龄预测方法，利用公开数据集中健康人群的弥散张量成像数据及对应被试的实际年龄形成初始样本集；对初始样本集中的弥散张量成像数据进行数据预处理，得到对应的处理后图像；将所述处理后图像划分为训练样本集及测试样本集；将训练样本集的处理后图像及对应测试者的实际年龄作为输入对三维卷积神经网络进行训练，构建脑龄预测回归模型；根据所述脑龄预测回归模型对测试样本集进行脑龄预测。
58.请参阅图1，本发明一种基于弥散张量成像及卷积神经网络的脑龄预测方法，包括以下步骤：
59.s1、利用公开数据集中健康人群的弥散张量成像数据及对应测试者的实际年龄形成初始样本集；
60.s2、对初始样本集中的弥散张量成像数据进行数据预处理，得到对应的处理后图像；
61.s201、对初始样本集中的弥散张量成像(dti)数据进行格式转换；
62.s202、对转换后的图像进行包括提取b0图像，剥脑，涡流校正，计算dti指标(包括各向异性分数fa，平均弥散率md等)等预处理步骤，得到所有被试个体空间下的fa图像；
63.s203、对步骤s202所得fa图像进行包括数据准备、非线性配准及创建平均fa图像和骨架三个步骤的tbss处理，得到每个被试在标准mni152空间下的3d fa图像。
64.s3、将所述处理后图像按对应测试者的实际年龄划分为年龄分布均匀的训练样本集及测试样本集；
65.s4、将训练样本集的处理后图像及对应测试者的实际年龄作为输入对三维卷积神经网络进行训练，构建脑龄预测模型；
66.s401、将训练样本集中的dti预处理后图像数据输入三维卷积神经网络模型；
67.s402、依据构建的脑龄预测模型，生成训练样本集预测脑龄；
68.s403、使用relu函数作为激活函数，均方误差(mse)作为损失函数，使用adam算法对所述脑龄预测模型的参数进行优化；
69.s404、选择平均绝对误差mae最低的模型作为最终的脑龄预测模型。
70.s5、根据脑龄预测模型对测试样本集进行脑龄预测。
71.本发明再一个实施例中，提供一种基于弥散张量成像及卷积神经网络的脑龄预测系统，该系统能够用于实现上述基于弥散张量成像及卷积神经网络的脑龄预测方法，具体的，该基于弥散张量成像及卷积神经网络的脑龄预测系统包括数据模块、处理模块、划分模块、训练模块以及预测模块。
72.其中，数据模块，利用公开数据集中的弥散张量成像数据及对应测试者的实际年龄形成初始样本集；
73.处理模块，对步数据模块得到的初始样本集中的弥散张量成像数据进行数据预处理，得到处理后的图像；
74.划分模块，将处理模块处理后的图像按对应测试者的实际年龄划分为年龄分布均匀的训练样本集及测试样本集；
75.训练模块，将划分模块得到的训练样本集及对应测试者的实际年龄作为输入训练三维卷积神经网络，构建脑龄预测模型；
76.预测模块，将划分模块得到的测试样本集输入训练模块构建的脑龄预测模型中，实现脑龄预测。
77.为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中的描述和所示的本发明实施例的组件可以通过各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
78.构建一个年龄范围为19～96岁的初始样本集，包括弥散张量成像数据及对应测试者的实际年龄，样本分别来自三个可公开访问的数据库，包括ixi(information extraction from images)数据集、corr(consortium for reliability and reproducibility)数据集中的bnu1(beijing normal university)数据集以及来自nitrc数据库的stark cross-section aging(scsa)数据集。
79.其中，训练样本集包括358例样本，其中的270例来自ixi，15例来自corr-bnu1，73例来自scsa。
80.测试集有153例样本，其中的113例来自ixi，3例来自corr，37例来自scsa。
81.用于训练集的样本年龄范围为19～87岁，平均年龄为51.21
±
17.08，用于测试集的样本年龄范围为20～86岁，平均年龄为51.39
±
17.32。
82.请参阅图2，在模型训练之前，采用micron和fsl(fmrib software library v6.0，http://www.fmrib.ox.ac.uk/fsl)软件对数据进行预处理。对于收集到的所有被试的dti数据，数据的预处理操作包括：
83.(1)数据格式转换
84.将原始的医学数字成像和通信digital imaging and communications in medicine数据(dicom格式)转化为需要的61*73*61的三维图像数据(nifti格式)，同时获得dti图像处理所需的b值文件及梯度信息文件，这一过程可用micron软件所带的
dcm2nii.exe实现。
85.(2)提取b0图像
86.利用fsl命令fslroi完成。
87.(3)剥脑
88.把非脑的组织从图像中去除，获得大脑mask，利用fsl命令bet完成。
89.(4)涡流校正
90.去除涡流和头部运动引起的畸变及图像伪影，利用fsl命令eddy_correct完成。
91.(5)计算dti指标
92.计算各向异性分数fa，平均弥散率md等dti指标，得到被试个体空间下的fa图像，利用fsl命令dtifit完成。
93.(6)tbss处理
94.包括数据准备、非线性配准、创建平均fa图像和骨架三个步骤，数据准备具体指：
95.首先将所有被试个体空间下的fa图像(data_fa.nii.gz)整理到同一个文件夹中，利用tbss_1_preproc*命令完成数据准备；
96.随后运用非线性配准将所有被试的fa图像对齐，利用tbss_2_reg命令及fsl自带的fmrib58模板完成，创建平均fa图像和骨架利用tbss_3_postreg命令完成，将所有被试个体空间下的fa图像配准到蒙特利尔神经学研究所标准空间(mni152)中，得到维度为182x218x182，体素大小为1mm的预处理后图像(data_fa_fa_to_target.nii.gz)。
97.在数据处理好后，采用三维卷积神经网络(3d cnn)搭建脑龄预测模型，脑龄预测模型的输入是维度为182x218x182的3d fa图像，输出则为1个数字，代表对应测试者的预测脑龄。
98.请参阅图3，三维卷积神经网络模型包括卷积层、归一化层、relu激活函数、全连接层和最大池化层。
99.模型隐藏层分为五个特征提取模块，每个模块包含两个卷积核大小为3
×3×
3，步长为1
×1×
1的三维卷积层以及一个大小为2
×2×
2，步长为2
×2×
2的最大池化层。模块1中使用了8个特征图，随着网络深入，卷积层的特征图数量翻倍，5个模块的参数总数分别为1992、10,464、41,664、166,272及663,808，最后一个全连接层具有5760个参数，模型总参数为889,960；最后使用三个全连接层得到预测脑龄，三个全连接层输出通道数分别为128，64，1。
100.在具体的预测方法中，使用pytorch训练模型；在训练过程中，使用mse作为损失函数，使用adam算法对模型进行优化。将batch大小设置为5，学习率设置为0.001，epoch数设置为100。在模型的评估中，可选择真实年龄和预测年龄之间平均绝对误差mae最低的模型作为最佳模型。在随后的测试阶段，通过在测试样本集上计算平均绝对误差(mae)、皮尔逊相关系数(r值)及决定系数(r2)来评估模型的泛化能力和效果。
101.在训练样本集中，最优的cnn模型实现了平均绝对误差mae＝1.42年，皮尔逊相关系数r＝0.99，决定系数r2＝0.99。
102.而在样本年龄分布与训练样本集相似的测试样本集上，模型实现了mae＝5.33年，r＝0.91，r2＝0.83。训练样本集及测试样本集中预测年龄与实足年龄的关系如图4所示。
103.因此，在本技术中，根据实验需要收集一定数量的弥散张量成像数据，完成数据的
采集；之后使用预处理技术对数据进行初步处理得到符合标准的数据，并将数据集按照7:3的比例分为训练样本集和测试样本集；接下来根据算法设计逐步搭建脑龄预测模型，在模型搭建好后，使用训练集对模型进行训练，并使用测试集对模型效果进行评估。
104.综上所述，本发明一种基于弥散张量成像及卷积神经网络的脑龄预测方法及系统，利用三维卷积神经网络来搭建脑龄预测模型，利用弥散张量成像数据的预处理后图像作为模型输入，输出结果为对应测试者的脑龄指标。相较于传统的机器学习方法，本技术提出的脑龄预测方法省略了特征提取这一过程，节省了大量的时间，并减少了脑龄预测的误差，利用平均绝对误差作为模型精确度的衡量指标，结果具有一定的可靠性，为脑龄在大脑健康评估以及疾病预防的临床应用上做出贡献。
105.本领域内的技术人员应明白，本技术的实施例可提供为方法、系统、或计算机程序产品。因此，本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
106.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
107.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
108.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
109.以上内容仅为说明本发明的技术思想，不能以此限定本发明的保护范围，凡是按照本发明提出的技术思想，在技术方案基础上所做的任何改动，均落入本发明权利要求书的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：用于PostgreSQL的自定义大对象数据备份方法及恢复方法与流程

基于弥散张量成像及卷积神经网络的脑龄预测方法及系统

相关文献

最热文献