一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

脑卒中预测值获取方法、装置及存储介质与流程

2021-12-17 18:07:00 来源:中国专利 TAG:


1.本技术涉及机器学习领域,具体而言,涉及一种脑卒中预测值获取方法、装置及存储介质。


背景技术:

2.在2010年,全球大约有1700万人罹患脑卒中,并且有3.3亿人曾有脑卒中病史且仍然存活。在2013年,脑卒中是全球第二常见的死因,仅次于冠状动脉疾病(coronary artery disease),约占了死亡总数的12%,其中,约有330万人死于缺血性脑卒中。而在我国该情况则愈发严重,脑卒中乃是我国成年人致死和致残的首位原因,每5位死亡者中就至少有1人死于脑卒中。随着社会老龄化和城市化进程加速,居民不健康生活方式流行,心血管病危险因素普遍暴露,我国脑卒中疾病负担有爆发式增长的态势,并呈现出低收入群体快速增长、性别和地域差异明显以及年轻化趋势。缺血性脑卒中是指由于脑部供血不足导致的脑组织功能障碍及坏死。有四个原因可导致缺血性脑卒中:血栓(脑部形成阻塞血块),栓塞(栓塞从其他地方形成),系统性供血不足(一般性系统性供血不足,如休克)和大脑静脉窦血栓。大概有一半脑卒中过的人,平均余命不超过一年。因此,缺血性卒中患者的长期预后预测会对治疗决策产生相当积极的作用。
3.在进行缺血性卒中患者发作的评估时,现行临床医学界公认使用的金标准是以非增强ct(noncontrast ct,ncct)为基准的艾伯塔省卒中计划早期ct评分(alberta stroke program early ct score,aspects)。而机器学习技术由于具有很高的准确性,正越来越适合在医学领域中使用。近年来,越来越多的证据表明,基于机器学习的自动aspects评分方法可与aspects的专家读片相媲美。aspects是一种简单的方法,但根据各项指标对早期缺血变化进行评分仍然是一个挑战,特别是对于经验较少的使用者而言。各项技术因素,例如x射线能量峰值图像处理和显示程序;患者因素,例如陈旧性脑梗塞,脑萎缩和白质软化病;以及诸如经验,培训和专业等因素,都可能影响aspects的参数。
4.因此,现临床迫切需要一种操作简单,并且能够提高aspects评分的精细度的评分方法,以进一步帮助和支持医生解释急性缺血性卒中患者的脑部扫描。


技术实现要素:

5.本发明实施例提供一种脑卒中预测值获取方法、装置及存储介质,用以解决现有技术中的aspects评分操作复杂,精细度较低的问题。
6.本发明实施例的第一方面,提供一种脑卒中预测值获取方法,包括:
7.从针对脑部扫描获得的平扫计算机断层扫描图像中划分出多个评估区域;
8.针对每个评估区域分别提取纹理特征,获得纹理特征样本集;
9.对所述纹理特征样本集进行训练,并在训练过程中五重交叉验证训练结果;
10.基于训练后的随机森林模型计算脑卒中患病风险高低的预测值。
11.可选地,在第一方面的一种可能实现方式中,在所述针对每个评估区域分别提取
纹理特征,获得纹理特征样本集之前,还包括:
12.对所述平扫计算机断层扫描图像中的每个评估区域的区域图像进行中值滤波处理。
13.可选地,在第一方面的一种可能实现方式中,所述对所述纹理特征样本集进行训练,并在训练过程中五重交叉验证训练结果,包括:
14.将所述纹理特征分为五个测试集,并使用各自测试集中未包含的数据进行训练和验证;
15.对训练和验证后得到的五个随机森林分类器分别选择不同的变量;
16.对不同变量的平均准确性降低值进行从小到大的排序,并选择排序最靠前的变量作为预测变量。
17.可选地,在第一方面的一种可能实现方式中,所述针对每个评估区域分别提取纹理特征,获得纹理特征样本集,包括:
18.根据影像学和临床参数来确定缺血性脑半球;
19.通过从正常脑半球的区域值中减去缺血性脑半球的区域值来获得区域特征差异值。
20.可选地,在第一方面的一种可能实现方式中,所述对所述纹理特征样本集进行训练,并在训练过程中五重交叉验证训练结果,包括:
21.基于线性判别分析对所述纹理特征进行排序;
22.将排序的纹理特征输入随机森林模型中;
23.使用五重交叉验证选择训练参数,所述训练参数包括:每个区域的森林中的树数量、树的最大深度、以及在排序预设名次之内的纹理特征的数量;
24.根据训练数据中异常数据和正常数据的比例来设置不同的训练权重;
25.通过随机森林模型对训练参数进行训练。
26.可选地,在第一方面的一种可能实现方式中,所述基于训练后的随机森林模型计算脑卒中患病风险高低的预测值,包括:使用训练后的随机森林模型计算每个评估区域的aspects分数,将所有评估区域的aspects分数进行加权计算得到最终预测值,权重值是预先设置的。
27.本发明实施例的第二方面,提供一种脑卒中预测值获取装置,包括:
28.划分模块,用于从针对脑部扫描获得的平扫计算机断层扫描图像中划分出多个评估区域;
29.特征提取模块,用于针对每个评估区域分别提取纹理特征,获得纹理特征样本集;
30.模型训练模块,用于对所述纹理特征样本集进行训练,并在训练过程中五重交叉验证训练结果;
31.预测模块,用于基于训练后的随机森林模型计算脑卒中患病风险高低的预测值。
32.可选地,在第二方面的一种可能实现方式中,所述特征提取模块还用于执行以下步骤,包括:
33.对所述平扫计算机断层扫描图像中的每个评估区域的区域图像进行中值滤波处理。
34.可选地,在第二方面的一种可能实现方式中,所述模型训练模块还用于执行以下
步骤,包括:将所述纹理特征分为五个测试集,并使用各自测试集中未包含的数据进行训练和验证;对训练和验证后得到的五个随机森林分类器分别选择不同的变量;对不同变量的平均准确性降低值进行从小到大的排序,并选择排序最靠前的变量作为预测变量。
35.可选地,在第二方面的一种可能实现方式中,还包括差异值计算模块,所述差异值计算模块,用于执行以下步骤,包括:
36.根据影像学和临床参数来确定缺血性脑半球;通过从正常脑半球的区域值中减去缺血性脑半球的区域值来获得区域特征差异值。
37.可选地,在第二方面的一种可能实现方式中,所述模型训练模块还用于执行以下步骤,包括:
38.基于线性判别分析对所述纹理特征进行排序;
39.将排序的纹理特征输入随机森林模型中;
40.使用五重交叉验证选择训练参数,所述训练参数包括:每个区域的森林中的树数量、树的最大深度、以及在排序预设名次之内的纹理特征的数量;
41.根据训练数据中异常数据和正常数据的比例来设置不同的训练权重;
42.通过随机森林模型对训练参数进行训练。
43.可选地,在第二方面的一种可能实现方式中,所述预测模块还用于执行以下步骤,包括:
44.使用训练后的随机森林模型计算每个评估区域的aspects分数,将所有评估区域的aspects分数进行加权计算得到最终预测值,权重值是预先设置的。
45.本发明实施例的第三方面,提供一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现本发明第一方面及第一方面各种可能设计的所述方法。
46.本发明提供的脑卒中预测值获取方法、装置及存储介质,能够,利用计算机断层造影技术预测脑卒中患病风险,使用特征工程和随机森林技术对脑卒中进行自动评估和预判,准确可靠地确定aspects分数。进一步帮助和支持医生解释急性缺血性卒中患者的脑部扫描。
附图说明
47.图1为脑卒中预测值获取方法的第一种实施方式的流程图;
48.图2为脑卒中预测值获取方法的第一种实施方式的流程图;
49.图3为aspects区域标注图;
50.图4为aspects导出对比图
51.图5为脑卒中预测值获取装置的第一种实施方式的结构图。
具体实施方式
52.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
53.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
54.应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
55.应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
56.应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含a、b和c”、“包含a、b、c”是指a、b、c三者都包含,“包含a、b或c”是指包含a、b、c三者之一,“包含a、b和/或c”是指包含a、b、c三者中任1个或任2个或3个。
57.应当理解,在本发明中,“与a对应的b”、“与a相对应的b”、“a与b相对应”或者“b与a相对应”,表示b与a相关联,根据a可以确定b。根据a确定b并不意味着仅仅根据a确定b,还可以根据a和/或其他信息确定b。a与b的匹配,是a与b的相似度大于或等于预设的阈值。
58.取决于语境,如在此所使用的“若”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”或“响应于检测”。
59.下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
60.本发明的aspects评分方法是基于特征工程和随机森林开发的。作为最新,最流行的增强方法之一,与其他分类器相比,随机森林已在许多医学图像分析应用中证明了针对难题的分类性能。随机森林是一种综合学习方法,它结合了多个弱分类器(决策树),并让这些决策树为最受欢迎的类别投票。森林中的每棵树都依赖于独立采样的随机向量,森林中的所有树都具有相同的分布。树的生长由随机矢量控制。训练中引入了一种随机性度量,可以防止训练分类器陷入局部最小值,从而提高准确性并减少过度拟合的几率。
61.本发明提供一种脑卒中预测值获取方法,如图1和图2所示其流程图,包括:
62.步骤s110、从针对脑部扫描获得的平扫计算机断层扫描图像中划分出多个评估区域。其中平扫计算机断层扫描图像又称ct平扫、ncct,它是急性中风工作流程中一种有用的筛查工具;ncct还用于测量缺血性脑内早期缺血性改变(eic)的程度。阿尔伯塔中风项目早期ct评分(aspects)是评估ncct大脑中动脉区域内eic的一种简单而系统的方法。在本步骤中,将ncct图像中某一区域的20%以上都被扩散占据,则将其视为受影响的区域。
63.步骤s120、针对每个评估区域分别提取纹理特征,获得纹理特征样本集。
64.在步骤s120中,在进行特征提取之前需要先对受影响的区域经过中值滤波,在中值滤波后可从每个患者图像的每个aspects区域中提取376个纹理特征,例如高阶统计量和图像纹理特征,图像纹理的粗细、稠密等特征。常见的纹理特征有灰度共生矩阵、自回归纹
理模型、tamura纹理特征、小波变换等。每个aspects区域的特征提取和分类都是以3d方式进行的。
65.步骤s130、对所述纹理特征样本集进行训练,并在训练过程中五重交叉验证训练结果。在该步骤中,交叉验证是把在某种意义下将原始数据进行分组,一部分做为训练集,另一部分做为验证集,首先用训练集对分类器进行训练,再利用验证集来测试训练得到的模型,以此来做为评价分类器的性能指标,而在本发明中使用的是五重交叉验证,即将初始数据集分成五份,轮流将其中4份做训练,1份做验证,5次的结果的均值作为对算法精度的估计,一般还需要进行多次5重交叉验证求均值。
66.步骤s140、基于训练后的随机森林模型计算脑卒中患病风险高低的预测值。
67.在一个实施例中,在所述针对每个评估区域分别提取纹理特征,获得纹理特征样本集之前,还包括:对所述平扫计算机断层扫描图像中的每个评估区域的区域图像进行中值滤波处理。在本步骤中,采取的中值滤波处理,是将图像的像素点邻域值取平均的滤波方法;提取的纹理的体征是图像本身的特征,比如区域的ct值平均值、最大值、中位值等;不同ct值的频率分布;高阶的特征比如经过某种矩阵算子处理过后的图像再提取上述信息,提取的方式就是对分割的图像做数学和矩阵运算。
68.在一个实施例中,所述对所述纹理特征样本集进行训练,并在训练过程中五重交叉验证训练结果,包括:将所述纹理特征分为五个测试集,并使用各自测试集中未包含的数据进行训练和验证;对训练和验证后得到的五个随机森林分类器分别选择不同的变量;对不同变量的平均准确性降低值进行从小到大的排序,并选择排序最靠前的变量作为预测变量。在步骤中,通过对变量的平均准确性降低进行排序并随后选择最重要的预测变量进行结局预测,来评估变量的重要性。
69.在一个实施例中,所述针对每个评估区域分别提取纹理特征,获得纹理特征样本集,包括:根据影像学和临床参数来确定缺血性脑半球;通过从正常脑半球的区域值中减去缺血性脑半球的区域值来获得区域特征差异值。
70.在一个实施例中,所述对所述纹理特征样本集进行训练,并在训练过程中五重交叉验证训练结果,包括:基于线性判别分析对所述纹理特征进行排序;将排序的纹理特征输入随机森林模型中;使用五重交叉验证选择训练参数,所述训练参数包括:每个区域的森林中的树数量、树的最大深度、以及在排序预设名次之内的纹理特征的数量;根据训练数据中异常数据和正常数据的比例来设置不同的训练权重;通过随机森林模型对训练参数进行训练。在本步骤中在计算出纹理特征后,会使用线性判别分析(lda)对纹理特征进行排序,并将经过排序的特征输纹理入到随机森林模型中进行训练,另外,还有使用五重交叉验证来训练参数,其中训练参数还包括使用专家在核磁dwi图像上做的aspects评分为标签,共同作为训练数据。
71.在一个实施例中,所述基于训练后的随机森林模型计算脑卒中患病风险高低的预测值,包括:使用训练后的随机森林模型计算每个评估区域的aspects分数,将所有评估区域的aspects分数进行加权计算得到最终预测值,权重值是预先设置的。在该步骤中,使用通过纹理特征样本集训练得到随机森林模型,分别对各个评估区域进行计算aspects分数,评估区域包括:豆状核l、脑岛i、尾状核c、内囊ic、大脑中动脉m,其中大脑中动脉又分为:m1、m2、m3、m4、m5、m6;共10个评估区域;然后将每个评估区域计算得到的aspects分数设置
对应的权重值,并将各个区域的初始分数分别乘以各自的权重值;然后将这10个评估区域的aspects分数求和得到最终的分数。考虑到不同的评估区域对于脑卒中患病风险高低的影响是不同的,因此按照不同评估区域影响脑卒中患病风险的大小设置相应的权重值,使得加权求和计算得到的分数值更加精确。
72.另外,aspects评分方法:满分为10分;在分割出来的10个区域中,如果一个区域受影响(20%以上被扩散占据),则扣1分。评分越低,早期缺血性病变越大。评分小于等于4时,认为缺血性脑卒中的风险高。
73.本发明提供的技术方案,基于机器学习的发明被开发用于检测ct早期缺血性损伤的迹象。它将aspects数值作为输出。本发明可以选择不同的参数或算法配置,即工作点(operation point,op),从而确定患者缺血性脑卒中的发作概率。该发明得出的指标简单,可靠,是溶栓治疗后功能结局和症状性脑出血的有力人工智能预测指标。现有的aspects自动化方法普遍使用一阶图像特征,例如亨氏单位(housfield unit,hu),或缺血侧和对侧的密度和hu差异作为其算法的特征,但这些一阶图像特征在缺血性变化较小的患者以及图像的信噪比较低和运动伪影较明显的患者中具有局限性;而本自动aspects方法中,将多个更高阶的计算纹理特征作为机器学习算法的一部分,可以帮助提高技术的有效性,如图3所示,使用本发明自动标注每个aspects区域的示例,l代表豆状核,i代表脑岛,c代表尾状核,ic代表内囊,m代表大脑中动脉。
74.本发明通过使用不同的配置运行来模拟不同医师的行为。研究表明,本发明可以调整到一个合适的工作点,使得在正确识别单个缺血性aspects区域方面,其性能(包括敏感性和评分)要明显优于所有受训者和部分专家。特异性差异很小(<5%),但是很重要,因为大多数数据是未受影响的区域,这些区域在计算特异性时占主导地位。灵敏度差异很大(均值差异为23.6%),这说明了受训者和专家的不同行为,即相对于专家,本发明以特异性的较小降低为代价换取了相对较大的灵敏度提高。本技术使用了两种更先进的测算方法来描述本发明,与专家和受训人员相比,aspects与dwi地面真实数据的一致性最佳。与人工测算相比,本发明的马修斯相关系数(matthews correlation coefficient,mcc)为0.44,也显示了最接近1的值。用不同的方法学方法获得的这些结果的一致性进一步增强了本技术发现的稳健性。
75.实施例验证:
76.为了验证,本发明对100名患者进行测算,自动aspects测算方法与dwi aspects专家读数得分之间的组内相关系数为0.76(95%置信区间,0.67

0.83),而一致性评价图的平均aspects差异值是0.3(一致限,

3.3,2.6)。单独的aspects区域级分析显示,对于100
×
10(每位患者进行了10次分别测算)aspects区域,本方法得出线性加权κ=0.60,灵敏度为66.2%,特异性为91.8%,曲线下面积为0.79。此外,当将aspects按照给定阈值(>4或≤4)二分时,κ=0.78,该方法与dwi的专家读数相比,具有97.8%的灵敏度,80%的特异性和0.89的曲线下面积。专家评级的ncct与自动ct aspects之间的总aspects的icc(组内相关系数,intraclass correlation coefficient)为0.61(95%置信区间,0.47

0.72)。专家评级的ct aspects与自动ct aspects之间的相抵触是适度的(κ=0.48;95%置信区间,0.28

0.68),二等分的aspects阈值为>4≤。应用示例如图4所示,左图为使用本发明进行的aspects自动导出,右图为影像学专家人工进行的aspects导出。
77.因此,本发明的自动aspects方法得出的参数与专家阅读的区域范围内的dwi aspects以及总aspects都非常吻合。此外,自动方法与专家阅读的dwi aspects的aspects切点二分阈值(>4对或≤4)之间的良好一致性有助于评估患者基线时是否存在大面积梗塞。这些结果还表明,自动aspects方法并不逊于ncct上专家阅读的aspects。
78.本发明在急性缺血性卒中患者的ct评分中应用aspects表现出更好的表现。这些发现得到了数种不同分析的支持,这些评估使用基础事实dwi数据评估了本发明与医生之间的一致性。本发明是用于临床实践和临床决策的有前途的工具,尤其是在因血管内卒中治疗的有限资源而对患者进行分类的即将到来的情况下。根据测试结果表明,可以成功选择ct上aspects>5的患者进行血栓切除术。这种软件的目的不是取代专家对扫描的评估,而是协助医生进行临床决策和研究。其优势在于采用相对公正标准化的方法进行潜在的时间效率提高,对神经放射科医生或经验丰富的卒中临床医生进行分流。由此可得出结论,本技术已经可以与aspects专家得出的人工阅读参数相媲美。
79.本发明的实施例还提供一种脑卒中预测值获取装置,如图5所示,包括:
80.划分模块,用于从针对脑部扫描获得的平扫计算机断层扫描图像中划分出多个评估区域;
81.特征提取模块,用于针对每个评估区域分别提取纹理特征,获得纹理特征样本集;
82.模型训练模块,用于对所述纹理特征样本集进行训练,并在训练过程中五重交叉验证训练结果;
83.预测模块,用于基于训练后的随机森林模型计算脑卒中患病风险高低的预测值。
84.在一个实施例中,所述特征提取模块还用于执行以下步骤,包括:对所述平扫计算机断层扫描图像中的每个评估区域的区域图像进行中值滤波处理。
85.在一个实施例中,还包括差异值计算模块,所述差异值计算模块,用于执行以下步骤,包括:根据影像学和临床参数来确定缺血性脑半球;通过从正常脑半球的区域值中减去缺血性脑半球的区域值来获得区域特征差异值。
86.在一个实施例中,所述模型训练模块还用于执行以下步骤,包括:基于线性判别分析对所述纹理特征进行排序;将排序的纹理特征输入随机森林模型中;使用五重交叉验证选择训练参数,所述训练参数包括:每个区域的森林中的树数量、树的最大深度、以及在排序预设名次之内的纹理特征的数量;根据训练数据中异常数据和正常数据的比例来设置不同的训练权重;通过随机森林模型对训练参数进行训练。
87.在一个实施例中,所述预测模块还用于执行以下步骤,包括:使用训练后的随机森林模型计算每个评估区域的aspects分数,将所有评估区域的aspects分数进行加权计算得到最终预测值,权重值是预先设置的,不同评估区域的权重值是不同的。
88.其中,可读存储介质可以是计算机存储介质,也可以是通信介质。通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质可以是通用或专用计算机能够存取的任何可用介质。例如,可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(application specific integrated circuits,asic)中。另外,该asic可以位于用户设备中。当然,处理器和可读存储介质也可以作为分立组件存在于通信设备中。可读存储介质可以是只读存储
器(rom)、随机存取存储器(ram)、cd

rom、磁带、软盘和光数据存储设备等。
89.本发明还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在可读存储介质中。设备的至少一个处理器可以从可读存储介质读取该执行指令,至少一个处理器执行该执行指令使得设备实施上述的各种实施方式提供的方法。
90.在上述终端或者服务器的实施例中,应理解,处理器可以是中央处理单元(英文:central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(英文:digital signal processor,dsp)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
91.最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献