一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于层级锥体型特征融合的心电图分类方法及系统

2022-11-16 15:12:29 来源:中国专利 TAG:


1.本发明属于心电图分类相关技术领域,尤其涉及一种基于层级锥体型特征融合的心电图分类方法及系统。


背景技术:

2.本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
3.经典的机器学习算法分为两部分,一部分为提取特征,另一部分为训练分类,所以特征的选择对于最终的分类结果有着决定性作用。datta等人使用了多种房颤特征,包括形态特征、hrv特征、频率特征、统计学特征等训练了多层级联的二值分类器,他们提取多个特征,并使用了多个分类器,其方法的缺陷在于特征数量多导致提取过程复杂,而多个分类器的使用导致分类代价过大。bin等人提出了一种基于心电图记录的30个特征的决策树集合,通过qrs波得到30个人工特征进行机器学习分类,其方法提取的特征只针对于qrs波,不能全面地反映信号特征。cao等人利用qrs波群起止点克服了信号长度不平衡问题,并且使用2层lstm对数据进行了分类,他们使用的是数据都是一维信号,但却忽略了一维时间序列本身的时域等特征。
4.可以看出经典的机器学习算法依赖特征的选择,而特征的选择依赖先验知识。因此机器学习方法对特征要求极高,如果提取的特征更适合数据库,无论用什么分类器,可能最终的结果差距也不会很大。这样的方法不能很好地应用到心律失常分类的临床诊断中。
5.深度学习算法涉及各个领域的研究,它不像机器学习那样提取特征,直接将处理后的数据输入到神经网络中,神经网络通过不断的训练数据,最后得到模型进行分类。
6.fan等人设计了一种双流cnn架构,他们使用相同的模型,改变了其中的参数后提取了两类不同的抽象特征向量融合进行心电信号的分类,该网络的两类特征向量都是来自一维的ecg信号,这些特征也都是深层肉眼无法观察的,其方法没能加入信号原始特征,而且无法准确评估两类抽象特征的性能。jiang等人提出了一种特殊结构的卷积神经网络,能够从原始ecg信号中提取到多尺度特征,整合不同尺度信息后使用cnn实现分类,其方法使用多尺度抽象特征作为训练样本,依然没有考虑到原始信号的传统特征。


技术实现要素:

7.为克服上述现有技术的不足,本发明提供一种基于层级锥体型特征融合的心电图分类方法及系统,将先验知识特征和抽象特征基于层级锥体型进行特征融合,将两类特征的优点充分发挥,提高分类精度。
8.为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:一种基于层级锥体型特征融合的心电图分类方法,包括以下步骤:
9.获取待识别的心电图数据进行预处理,得到一维心电信号;
10.基于一维卷积神经网络对一维心电信号进行抽象特征提取;
11.对心电图数据提取先验知识特征;
12.构建多层级锥体将提取的抽象特征和先验知识特征进行特征融合,得到层级锥体每一层的特征融合向量;
13.将层级锥体每一层的特征融合向量输入至训练好的随机森林分类器进行分类,得到分类结果。
14.进一步的,所述一维卷积神经网络包括卷积层、池化层和全连接成,卷积核尺寸由第一层卷积层至最后一层卷积层呈上升趋势。
15.进一步的,所述先验知识特征包括但不限于时域特征、间期特征、频域特征、非线性特征。
16.进一步的,所述非线性特征为排列比例熵,所述排列比例熵通过构建相邻元素的关系矩阵来保留信号振幅信息。
17.进一步的,构建多层级锥体将提取的抽象特征和先验知识特征进行特征融合,得到层级锥体特征融合向量,具体包括:
18.将提取的抽象特征作为多层级锥体每一层的特征;
19.将提取的先验知识特征按照所构建的多层级锥体的层数减1后进行划分,得到多个等数量的先验知识特征组;
20.从多层级锥体的第二层开始依次加入与上一层不同的先验知识特征组,得到层级锥体每一层的特征融合向量。
21.进一步的,将层级锥体每一层的特征融合向量进行权值分配,然后按照上到下将每一层的特征融合向量依次输入到训练好的随机森林分类器中,得到最终的分类结果。
22.本发明的第二个方面提供一种基于层级锥体型特征融合的心电图分类系统,包括:
23.获取模块,其被配置为获取待识别的心电图数据进行预处理,得到一维心电信号;
24.第一特征提取模块,其被配置为基于一维卷积神经网络对一维心电信号进行抽象特征提取;
25.第二特征提取模块,其被配置为对心电图数据提取先验知识特征;
26.特征融合模块,其被配置为构建多层级锥体将提取的抽象特征和先验知识特征进行特征融合,得到层级锥体每一层的特征融合向量;
27.分类模块,其被配置为将层级锥体每一层的特征融合向量输入至随机森林分类器进行分类,得到分类结果。
28.进一步的,所述特征融合模块包括:将提取的抽象特征作为多层级锥体每一层的特征;
29.将提取的先验知识特征按照所构建的多层级锥体的层数进行划分,得到多个等数量的先验知识特征组;
30.从多层级锥体的第二层开始依次加入与上一层不同的先验知识特征组,得到层级锥体每一层的特征融合向量。
31.本发明的第三个方面提供一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成上述方法所述的步骤。
32.本发明的第四个方面提供一种电子设备,包括存储器和处理器以及存储在存储器
上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述方法所述的步骤。
33.以上一个或多个技术方案存在以下有益效果:
34.在本发明中,人工特征大多来自先验知识,很多研究都证明了它们的有效性;抽象特征是通过深度学习提取到的,有着良好的泛化能力,能够学习到隐含的数据特征。考虑到两类特征的优点,将他们融合为一个特征矩阵作为分类器输入,能够将两类特征的优点充分发挥。
35.本发明在提取人工特征时,参照了机器学习相关方法,特别注意到了特征的类别对分类结果的影响,在引入时域特征后,加入了间期特征提升分类精度,因为该数据库是低信噪比环境下采集到的,因此加入了非线性特征排列比例熵对噪声进行分类,以至于提高单一分类的分类精度。通过三类人工特征,不仅能够提升总体的分类精度,更能提高噪声类别的分类精度。
36.本发明在分类时考虑到不同特征组合以及特征数量对分类性能的影响,在构建特征矩阵时,将抽象特征单独视为一个整体,作为层级锥体型的塔尖,向下依次加入人工特征输入到随机森林算法,得到了4个不同或相同结果,按照一定比例计算权值得到最终分类结果,这样做更能充分发挥所有特征组合的优势,平衡最终结果。
37.本发明为了在低信噪比环境下得到更好的分类效果,引入了熵的概念,并在排列熵的基础上改进得到排列比例熵,它可以保留信号振幅信息,能够分析相邻点的差异性,在更复杂的环境下分析信号质量。
38.本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
39.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
40.图1为本发明实施例一中心电图分类流程示意图;
41.图2是本发明实施例一中心电图数据波形图;
42.图3是本发明实施例一中层级锥体特征融合示意图;
43.图4是本发明实施例一中一维卷积神经网络结构示意图;
44.图5是本发明实施例一中分类各项指标示意图;
45.图6是本发明实施例一中熵值对比示意图。
具体实施方式
46.应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
47.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。
48.在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
49.实施例一
50.如图1-图6所示,本实施例公开了一种基于层级锥体型特征融合的心电图分类方法,其特征在于,包括以下步骤:
51.步骤1:获取待识别的心电图数据进行预处理,得到一维心电信号;
52.步骤2:基于一维卷积神经网络对一维心电信号进行抽象特征提取;
53.步骤3:对心电图数据提取先验知识特征;
54.步骤4:构建多层级锥体将提取的抽象特征和先验知识特征进行特征融合,得到层级锥体每一层的特征融合向量;
55.步骤5:将层级锥体每一层的特征融合向量输入至训练好的随机森林分类器进行分类,得到分类结果。
56.如图2所示,在本实施例中所采用physionet/cinc challenge 2017提供的公开房颤数据集作为实验对象,该房颤数据集包含了四种类型的ecg数据:正常心率,房颤(af),其他心律和噪声。
57.训练集中包含了8528个单导联心电图记录,持续时间从9s到60s多一点之间,心电记录采样率为300hz。由于本次比赛含有隐藏的测试集,并没有对外公开,因此我们的实验是在公开的训练集上进行的。
58.该数据集经人工标注修改,最终有5076条数据(59.5%)标注为正常心律,758条数据(8.89%)标注为房颤,2415条数据(28.3%)标注为其他心律,279条数据(3.27%)标注为噪声。
59.在本实施例步骤1中,将所有的心电图信号记录的长度统一到30s,其中,把长度大于30s的记录进行随机取段处理,而长度小于30s的记录,利用pan-tompkins检测器定位到qrs波群,qrs波群中的初始向下偏转确定为波群起点,截取出第一个qrs波群的起点到最后一个qrs波群的起点这段记录,不断地复制直到记录长度为30s。
60.在本实施例步骤2中,采用一维心电信号作为一维卷积神经网络的输入进行抽象特征的提取,本实施采用的一维卷积神经网络共13层,将信号输入到该网络中后,信号会经过6对卷积池化层,为了得到抽象特征,在最后的全连接层改变输出的维度,输出1
×
38的特征矩阵,得到该时间序列的隐含抽象特征。本实施提取了38个抽象特征。
61.如图2所示,包括卷积、层池化层和全连接层。之所以没有使用复杂的神经网络,是因为当时间序列输入进卷积神经网络中以后,经过卷积层的不断增加,得到的特征向量就越能描述时间序列的某个隐含特征,虽然这对于研究时间序列更深层次的特点有所帮助,但是这种过于深层的特征向量会使用过多的内存与计算资源。基于一维信号的长度,以及提取抽象特征的数量,发现当卷积层数为6层时,得到的特征数量是合适的。
62.具体的,本实施例采用的一维卷积神经网络,由6对卷积层和池化层,在第一层卷积层上使用较大的卷积核尺寸,随着层数的增多,卷积核的尺寸也逐步上升。卷积层-1和卷积层-2的卷积核尺寸为5,卷积层-3和卷积层-4的卷积核尺寸为7,卷积层-5的卷积核尺寸为9,卷积层-6的卷积核尺寸为11。
63.在本实施的步骤3中,人工提取了包括时域特征、间期特征、频域特征和非线性特征等24个先验知识特征。
64.1、波形特征
65.利用pan-tompkins算法来定位心电信号中的r波,根据r波定位计算出每条心电数据r波数量与所有r波的振幅,其中r波数量将作为特征之一,然后计算出r波振幅最大值、最小值、平均值和中值作为特征。
66.标准偏差是统计学领域经常使用的变量,它可以度量数据分布的离散程度,现在大量的研究将标准偏差应用于时间序列上。很多时间序列分布不规律,但是它们的均值分布却呈现出一定的规律性,这就要求必须要有某个指标可以衡量时间序列中每个点与均值的关系,于是使用标准偏差等统计学变量来区分这种分布伪规律的情况,本发明中计算r波振幅的标准偏差并作为波形特征之一。假设时间序列有n个点,定义为[x1,x2,x3……
xn],它们的均值为
[0067]
标准偏差s计算为下列公式:
[0068][0069]
在标准偏差基础上,计算心电记录的偏度(sk)和峰度(ku)。它们计算方式如下:
[0070][0071][0072]
2、间期特征
[0073]
rr间期指的是ecg中相邻两个r波之间的时长,它能够反映心脏收缩一次的时长,人们的心率就是依靠这个来计算的。房颤病人或者其他心脏不正常的人心率可能会不规律,他们心电信号的rr区间会出现过大、过小或者不稳定的情况,因此,本发明在定位r波后,计算出了rr间期的相关参数,即rr间期最大值、最小值、平均值、中值、标准差和心率特征,这些特征能够从侧面反映出一个人的心率是否正常。
[0074]
pr间期指的是心电信号上从p波起点至qrs波群起点的时间间隔,pr间期过长、过短或者变化不定都代表患者不同的情况。考虑到针对本数据库其他类的分离,可能有着不同的情况,为了能够最大限度地定位这些情况,引入了pr间期的相关参数即pr间期的最大值、最小值中值和标准差,通过对pr间期的测量,发现对于某些患者而言,pr间期能够很好地反映患者的状态。
[0075]
3、频域特征
[0076]
在大多数机器学习方法中,频域特征通常被用来反映心电记录中的频率和能量信息。通过傅立叶变换得到心电节段的频谱,提取心电节段的频率重心(fc)、均方根频率(msf)、均方根频率(rmsf)和频率方差(fv)四个频域特征,并将其应用于本发明。假设频率函数为s(f),s表示频谱,f表示分段的频率。它们的计算方式如下:
[0077]
[0078][0079][0080][0081]
4、非线性特征
[0082]
在本实施例中,使用的非线性特征为排列比例熵。这是一种基于排列熵改进的新的熵值,它用来评价时间序列的复杂性。这种方法可以反映出某段时间序列中相邻两个数据点之间的振幅差异。传统的排列熵因为对信号突变和各种变化非常敏感,所以常用于衡量生理信号序列的复杂性。但是,排列熵并不是对原始的时间序列进行度量,因此会丢失掉时间序列中的部分细节,并且排列熵是基于数据点之间的排序,这也说明排列熵忽略了相邻数据点之间的差异。结合以上几点,排列熵会丢失很多振幅信息,在某些场合使用会降低测试准确度。排列比例熵可以通过构造相邻元素的关系矩阵解决这一问题,更好地体现出时间序列的混乱程度。
[0083]
pre首先构建新的关系矩阵b表示相邻元素之间的关系,紧接着计算新模式c的数量,设b(i)为矩阵b的第i行向量,c(i)为第i个模式的编号。对于b(i)来讲,当矩阵b的另一向量b(j)与b(i)具有相同模式时,则c(i)增加1,此时两者具有极高的相关性;当矩阵b的每个向量代表新模式时,模式c的最大总数为n-m-1,n代表时间序列的点,m代表矩阵的嵌入维度。最后,可以得到矩阵b中包含的模式总数c。
[0084]
其中,pi为模式c(i)的概率,它的定义如下:
[0085][0086]
pre的定义如下:
[0087][0088]
其中,k是模式c的总数,j仅代表序号。
[0089]
如图6所示,为了证明低信噪比环境下对噪声分类的影响,本实施例对比了去掉非线性的熵值特征后的结果,可以看出无论是总体的分类性能还是对噪声分类的性能,在加入熵值特征后分类效果显著提升。在去除熵值特征分类时,总体的准确率为0.832,f1分数为0.807,而对噪声一类的f1分数仅为0.668;在加入了所有特征后,总体的准确率达到了0.862,f1分数也是达到了0.815,变化最明显的就是针对噪声一类的f1分数,证明了熵对噪声识别是有效的。
[0090]
在本实施例中,也可以利用深度学习算法或统计学特征将噪声分离出来。
[0091]
在本实施例步骤4中,得到层级锥体特征融合向量,具体包括:
[0092]
步骤4-1:将提取的抽象特征作为多层级锥体每一层的特征;
[0093]
步骤4-2:将提取的先验知识特征按照所构建的多层级锥体的层数减1后进行划分,得到多个等数量的先验知识特征组;
[0094]
步骤4-3:从多层级锥体的第二层开始依次加入与上一层不同的先验知识特征组,得到层级锥体每一层的特征融合向量。
[0095]
在本实施例中,以构建4层层级锥体为例进行说明,将一维卷积神经网络提取的38个抽象特征作为层级锥体塔尖部分,向下的每一层依次加入8个先验知识特征。
[0096]
如公式(10)所示,定义s为抽象特征,其中包含了38个提取特征。定义r为先验知识特征,其中r1代表第1个到第8个先验知识特征向量,r2代表第9个到第16个先验知识特征向量,r3代表第17个到第24个先验知识特征向量。
[0097][0098]
如图3所示,经过层级锥体特征融合后,得到第一层融合特征为s,第二层的融合特征为s r1,第三层的融合特征为s r1 r2,第四层的融合特征为s r1 r2 r3。
[0099]
在本实施例步骤5中,使用随机森林算法对数据进行训练并分类,随机森林由若干决策树继承在一起,每个决策树都是一个很小的分类器,随机森林综合所有的分类结果确定最终的输出类别。
[0100]
使用随机森林,使用了由300棵决策树组成的随机森林,其中每个节点在生成过程中随机选择特征。使用bootstrap训练每棵树,每次分割时随机选择的特征子集中的特征个数是特征总数的平方根。
[0101]
在步骤4得到层级锥体每一层的融合特征后,从上到下每一层依次输入到随机森林分类器中,对于同一数据得到



相同或不同的结果,最终按照1:2:3:4的比例计算分类权值,得到某条数据的最终分类结果。
[0102]
为了证明层级锥体型特征结构对分类性能提升的有效性,将每一层特征向量单独测试。将



层特征向量输入到随机森林分类器,发现每条数据最终的分类结果都不稳定,但总体上来讲,特征数量越多分类结果越准确,但是也有特殊情况。将层级锥体型特征结构得到的结果按照比例计算权值后,结果是最优的,证明本发明对分类效果有效。
[0103]
在本实施例中,不仅采用广泛使用的准确性、敏感性和特异性作为评价指标,并且还按照physionet/cinc challenge 2017的比赛规则,使用f1成绩作为评价指标。
[0104]
精确度的计算如下:
[0105][0106]
其中,tp代表正类别分类正确的样本数量,fp代表负类别分类错误的样本数量,tn代表负类别分类正确的样本数量,fn代表正类别分类错误的样本数量。
[0107]
精确率的计算如下:
[0108][0109]
召回率的计算如下:
[0110]
[0111]
f1成绩定义如下:
[0112]
正常心率:
[0113]
房颤:
[0114]
其他心律:
[0115]
噪声:
[0116]
式中,f
1n
、f
1a
、f
1o
和f
1p
分别定义为n、a、o和p类别的f1分数,nn,aa,oo,pp中的大写字母表示参考分类的记录数,小写字母表示预测分类的记录数。∑n表示参考分类为n的记录数,∑n表示预测分类为n的记录数,∑a表示参考分类为a的记录数,∑a表示预测分类为a的记录数,∑o表示参考分类为o的记录数,∑o表示预测分类为o的记录数,∑p表示参考分类为的记录数,∑p表示预测分类为的记录数。大写字母表示数据的类别,小写字母表示模型分类的类别。
[0117]
在f1基础上提出了新的评价方式,该评价方式不计算噪声的分类结果,将正常心率、房颤心率和其他类型心率分别计算f1分数,取三者的宏平均值得到最终的f1分数。我们按照clifford的方法,计算最终的f1成绩,它的定义为:
[0118][0119]
如图5所示,在本实施例中,采用1684条测试集对模型进行评估,使用了召回率、精确率、各类别的f1分数、总体准确率以及平均成绩评价本文所使用的模型架构,通过计算平均值,可以看出召回率、精确率以及f1分数都超过了0.8,值得注意的是,我们在噪声分类上,f1分数达到了0.732。
[0120]
实施例二
[0121]
本实施例的目的是提供一种基于层级锥体型特征融合的心电图分类系统,包括:
[0122]
获取模块,其被配置为获取待识别的心电图数据进行预处理,得到一维心电信号;
[0123]
第一特征提取模块,其被配置为基于一维卷积神经网络对一维心电信号进行抽象特征提取;
[0124]
第二特征提取模块,其被配置为对心电图数据提取先验知识特征;
[0125]
特征融合模块,其被配置为构建多层级锥体将提取的抽象特征和先验知识特征进行特征融合,得到层级锥体每一层的特征融合向量;
[0126]
分类模块,其被配置为将层级锥体每一层的特征融合向量输入至随机森林分类器进行分类,得到分类结果。
[0127]
实施例三
[0128]
本实施例的目的是提供一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法的步骤。
[0129]
实施例四
[0130]
本实施例的目的是提供一种计算机可读存储介质。
[0131]
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行上述方法的步骤。
[0132]
以上实施例二、三和四的装置中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
[0133]
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
[0134]
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献