一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于影像组学和神经网络的肺结节倍增时间预测方法与流程

2022-11-28 10:29:32 来源:中国专利 TAG:


1.本发明涉及医学影像领域和神经网络技术领域,具体涉及一种基于影像组学和神经网络的肺结节倍增时间预测方法。


背景技术:

2.胸部ct筛查偶然发现的肺结节根据病理结果可大致分为以肿瘤为代表的恶性病灶和以炎症为代表的良性病灶两种。肺结节定性诊断是放射科医师临床工作的主要内容。一般来说,发现肺结节后根据结节的大小、形态、边缘、内部结构(ggo、钙化、脂肪、空泡征和支气管气象征等)、ct值以及周边肺组织等情况进行综合分析,多数结节可作出定性诊断。然而对于直径≤5mm的微小结节,初次诊断是放射科医师面临的重大挑战,多需进行追踪观察。影像学追踪涉及到观察间隔时间的选择,一方面,如果随访间隔过长,则有可能疾病进展,错过最佳治疗时间窗;另一方面,如果随访间隔过短,则病灶体积形态变化不大,仍不能作出定性诊断,后续仍需接受ct检查,增加了病人的经济负担及x线辐射剂量。倍增时间是指病灶体积增加一倍所需要的时间,通过两次影像学检查可以确定病灶的体积变化,从而计算结节的生长速度。因此,基于肿瘤倍增时间来决定追踪复查时间是较科学的方法。
3.目前,中国专利文献cn108629803a中公开了一种基于球体积结节倍增时间的确定方法及装置,采用基于卷积神经网络的图像自动分割方法,确定所述目标结节的长短径的长度,代入球体积公式计算结节体积,再次重复此过程,获得目标结节两次ct检查的体积,从而确定其体积倍增时间。由于该方法基于病灶长短径计算结节体积,对不规则形病灶体积计算误差不可忽略,由此得出的倍增时间所能提供的临床价值有限。同时,该方法需要病人至少进行两次影像学检查才可初步估算病灶的倍增时间,不能为病灶偶然发现后首次随访时间的确定提供参考指导,增加了患者所接受的辐射剂量及检查花销。
4.影像组学是从医学影像中提取并量化海量特征数据,这些特征数据不能被肉眼所识别,却可能蕴含着患者基因遗传、组织形态、细胞分子等各个层次临床信息,最终用于指导临床决策,实现精准医学。神经网络是是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络由大量的人工神经元联结进行计算,具有很髙的运算速度,很强的联想能力,很强的适应性,很强的容错能力和自组织能力。这些特点和能力构成了人工神经网络模拟智能活动的技术基础,并在广阔的领域获得了重要的应用。本技术人基于上述技术问题,选择运用影像组学结合神经网络的方法预测肺结节倍增时间,进而指导临床医生选择合适的随访间隔。


技术实现要素:

5.本发明的目的在于针对现有技术的不足和缺陷,提供一种基于影像组学和神经网络的肺结节体积倍增时间预测方法,实现基于患者初次发现肺结节的单次胸部ct图像预测病灶体积倍增时间,为目标结节的后续ct随访提供较为可靠的时间参考。
6.本发明所解决的技术问题可以采用以下技术方案来实现:
7.一种基于影像组学和神经网络的肺结节体积倍增时间预测方法,包括如下步骤:
8.步骤(1)在数据库中收集胸部ct图像;
9.步骤(2)逐层手工勾画肺部病灶边缘;
10.步骤(3)对步骤(2)的图像进行预处理;
11.步骤(4)提取步骤(3)中图像的影像组学特征,并基于首次和末次胸部ct计算各结节的体积倍增时间;
12.步骤(5)将患者按比例随机分为训练集和测试集,所述训练集用于训练预测模型,所述测试集用于测试预测模型的性能;
13.步骤(6)对步骤(5)提取的组学特征进行标准化处理;
14.步骤(7)采用机器学习算法对步骤(6)中的训练集样本进行特征选择,选出与体积倍增时间相关的组学特征;
15.步骤(8)建立神经网络模型,并将训练集数据输入模型并训练;
16.步骤(9)将调整后的模型应用于测试集,观察模型预测性能,根据验证分数结果选择最佳参数;
17.步骤(10)利用步骤(9)得到的模型进行新病灶倍增时间预测。
18.在本发明的一个优选实施例中,所述步骤(1)中所收集的样本患者的入选标准:进行过两次及以上胸部ct检查、图像质量良好无伪影。
19.在本发明的一个优选实施例中,所述步骤(1)对不同机器厂家的ct图像统一化处理。
20.在本发明的一个优选实施例中,所述步骤(2)中勾画时尽量避免肺内正常组织。
21.在本发明的一个优选实施例中,所述步骤(3)预处理措施包括1)将所有图像重采样为(1,1,1)体素;2)灰度等级离散化,bin width=25;3)图像归一化处理。
22.在本发明的一个优选实施例中,所述步骤(4)影像组学特征包括:形状特征、一阶特征、灰度共生矩阵特征、灰度区域大小矩阵特征、灰度行程矩阵特征、邻域灰度差矩阵特征、灰度相关矩阵、小波特征,体积计算公式v=x*y*z*n,其中x是单位体素长,y是单位体素宽,z是单位体素高,n是感兴趣区内体素数量,倍增时间计算公式为vdt=

t
·
ln 2/ln(v1/v0),其中

t为两次胸部ct检查的间隔天数,v1为最后一次ct检查时病灶体积,v0为首次ct检查时病灶体积。
23.在本发明的一个优选实施例中,所述步骤(5)中训练集:测试集=7:3。
24.在本发明的一个优选实施例中,所述步骤(6)中标准化处理:其中x
*
为标准化后的值,x为标准化前的值,μ为样本的均值,σ为样本的标准差。
25.在本发明的一个优选实施例中,所述步骤(7)中特征选择过程包括:1)采用方差过滤法去除方差为0的特征;2)采用方差齐性检验去除与倍增时间不存在显著线性关系即p<0.05的特征;3)继续采用lasso回归实现模型中的特征降维,将不重要的特征的参数压缩为0,从而获得稀疏解。
26.在本发明的一个优选实施例中,所述步骤(8)中神经网络模型包含三层,其中两个隐蔽层,每层有64个单元,激活函数为“relu”,最后一层为线性层,只有1个单元,没有激活,编译网络选用均方误差作为损失函数,在模型训练过程中选用平均绝对误差作为监测指
标,采用5折交叉验证进行训练,训练轮次设置为500,并绘制验证分数图。
27.在本发明的一个优选实施例中,所述步骤(9)中根据验证分数结果选择最佳参数,并使用最佳参数在所有训练数据上训练最终的生产模型,然后观察模型在测试集上的性能,性能指标包括:
28.均方误差,均方误差为预测值与目标值之差的平方;
29.平均绝对误差,平均绝对误差为预测值与目标值之差的绝对值;
30.标准误差,标准误差为均方误差的算术平方根,开方后,误差的结果与数据是一个级别的,标准误差对测量中的离群点反映非常敏感,标准误差可以反映出测量的精密度;
31.r2,r2介于0和1之间,越接近于1,回归拟合效果越好。
32.在本发明的一个优选实施例中,所述步骤(10)中,包括如下步骤:
33.步骤(10.1)收集患者首次发现肺结节的胸部ct图像;
34.步骤(10.2)逐层勾画目标肺部病灶;
35.步骤(10.3)将勾画好的感兴趣区图像输入上述预测模型;
36.步骤(10.4)模型自动计算目标结节的体积、平均ct值等信息,并预测该结节的体积倍增时间。
37.本发明提供了一种利用影像组学和神经网络的肺结节体积时间预测方法,其整合了医学影像学、数学、人工智能等领域技术,与现有技术相比,本发明不依赖于病灶的长短径估算结节体积,而是利用勾画的roi中体素的数量乘以单位体素的体积计算结节体积,结果更为准确。同时,实现了基于首次发现结节的单次ct图像预测病灶体积倍增时间,为后续随访复查的时间间隔选择及病灶良恶性初步判断提供可靠参考,有利于减轻患者的经济负担和焦虑情绪,具有一定的经济价值和社会效益。
附图说明
38.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
39.图1是本发明所提供预测方法的流程图。
40.图2是本发明预测效果示意图。
具体实施方式
41.为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面进一步阐述本发明。
42.参见图1所示,一种基于影像组学和神经网络的肺结节体积倍增时间预测方法,包括如下步骤:
43.步骤(1)在数据库中收集胸部ct图像。该步骤中,所收集的样本患者的入选标准:进行过两次及以上胸部ct检查、图像质量良好无伪影,而且对于不同机器厂家的ct图像统一化处理,进一步提高样本质量。
44.步骤(2)由放射科医师逐层手工勾画肺部病灶边缘。该步骤中,勾画时尽量避免血
管、气管等肺内正常组织。另外,进行该步骤的人选也不一定是放射科医师,只要是具备胸部ct诊断基础知识的人选都可以进行该步骤。
45.步骤(3)对步骤(2)的图像进行预处理。该步骤中,预处理措施包括1)将所有图像重采样为(1,1,1)体素;2)灰度等级离散化,bin width=25;3)图像归一化处理。
46.步骤(4)提取步骤(3)中图像的影像组学特征,并基于首次和末次胸部ct计算各结节的体积倍增时间。该步骤中,采用影像组学(pyradiomics)包对已勾画的感兴趣区进行组学特征提取,影像组学特征包括:形状特征、一阶特征、灰度共生矩阵特征、灰度区域大小矩阵特征、灰度行程矩阵特征、邻域灰度差矩阵特征、灰度相关矩阵、小波特征,体积计算公式v=x*y*z*n,其中x是单位体素长,y是单位体素宽,z是单位体素高,n是感兴趣区内体素数量,倍增时间计算公式为vdt=

t
·
ln 2/ln(v1/v0),其中

t为两次胸部ct检查的间隔天数,v1为最后一次ct检查时病灶体积,v0为首次ct检查时病灶体积。
47.步骤(5)将患者按比例随机分为训练集和测试集,训练集用于训练预测模型,测试集用于测试预测模型的性能。该步骤中,训练集:测试集=7:3。
48.步骤(6)对步骤(5)提取的组学特征进行标准化处理。该步骤中,标准化处理:其中x*为标准化后的值,x为标准化前的值,μ为样本的均值,σ为样本的标准差。
49.步骤(7)采用机器学习算法对步骤(6)中的训练集样本进行特征选择,选出与体积倍增时间相关的组学特征。该步骤中,特征选择过程包括:1)采用方差过滤法去除方差为0的特征;2)采用方差齐性检验去除与倍增时间不存在显著线性关系即p<0.05的特征;3)继续采用lasso回归实现模型中的特征降维,将不重要的特征的参数压缩为0,从而获得稀疏解。
50.步骤(8)建立神经网络模型,并将训练集数据输入模型并训练。该步骤中,神经网络模型包含三层,其中两个隐蔽层,每层有64个单元,激活函数为“relu”,最后一层为线性层,只有1个单元,没有激活,编译网络选用均方误差(即“mse”,mean squared error)作为损失函数,在模型训练过程中选用平均绝对误差(即“mae”,mean absolute error)作为监测指标,采用5折交叉验证进行训练,训练轮次设置为500,并绘制验证分数图。
51.步骤(9)将调整后的模型应用于测试集,观察模型预测性能,根据验证分数结果选择最佳参数。该步骤中,根据验证分数结果选择最佳参数,并使用最佳参数在所有训练数据上训练最终的生产模型,然后观察模型在测试集上的性能,性能指标包括:
52.均方误差(即mse),均方误差为预测值与目标值之差的平方;
53.平均绝对误差(即mae,mean absolute error),平均绝对误差为预测值与目标值之差的绝对值;
54.标准误差(即rmse,root-mean-square error),标准误差为均方误差的算术平方根,开方后,误差的结果与数据是一个级别的,标准误差对测量中的离群点反映非常敏感,标准误差可以反映出测量的精密度;
55.r2,r2介于0和1之间,越接近于1,回归拟合效果越好。
56.步骤(10)利用步骤(9)得到的模型进行新病灶倍增时间预测。该步骤中,包括如下步骤:
57.步骤(10.1)收集患者首次发现肺结节的胸部ct图像;
58.步骤(10.2)逐层勾画目标肺部病灶;
59.步骤(10.3)将勾画好的感兴趣区图像输入上述预测模型;
60.步骤(10.4)模型自动计算目标结节的体积、平均ct值等信息,并预测该结节的体积倍增时间(如图2所示)。
61.本发明基于影像组学技术和神经网络模型,先使用患者两次胸部ct图像计算出结节体积倍增时间并提取其影像组学特征,采用过滤法和机器学习算法相结合的特征选择方法,筛选出对于预测倍增时间有价值的组学特征输入神经网络模型并训练,建立一个肺结节体积倍增时间预测模型,实现基于患者单次胸部ct图像预测目标病灶体积倍增时间,从而为后续ct复查时间间隔的选择提供参考。
62.以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献