一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种针对脑电信号的自适应联合模型半监督学习分类方法与流程

2021-11-29 11:46:00 来源:中国专利 TAG:


1.本发明属于生物信号处理领域,涉及一种针对运动想象脑电信号的半监督学习分类方法。
技术背景
2.脑机接口(brain computer interface,bci)是脑科学的一个新的研究领域。它可以代替人体或语言器官来实现人与外界的交流。为了实现这样一个交流的功能,需要对信号的特征进行分类和识别,以区分引起脑电(electroencephalogram,eeg)变化的动作意图。目前,支持向量机、最近邻分类器、朴素贝叶斯分类等机器学习方法为脑电信号分类提供了一条途径,并取得了较好的效果。这些分类方法大多是有监督的,但在现实的情况中,往往很难获得数据的标签和大量的真实信息,因此有监督分类方法应用具有局限性。半监督学习同时使用有标签样本和无标签样本提供了一种解决问题的思路,具有更好的实际应用效果。半监督学习的发展也使bci脑电信号识别即使在少量标注样本的情况下也具有更好的适应性和鲁棒性。
3.形成式半监督学习(formative semi

supervised learning,fssl)算法是一种安全的半监督学习方法。它通过发现隐藏特征并将无标签样本连接到有标签样本来捕获有标签样本和无标签样本之间的相关性。然后将具有隐藏特征的有标签样本作为训练集进行分类。在该方法中引发的属性错误比分类标签错误的危害性要小。从fssl可以看出,后续的隐藏特征提取是基于有标签样本和无标签样本之间的关系模型进行的。而eeg信号通常是非平稳和非线性的,基本模型的不完善可能会直接限制后续eeg信号特征提取的有效性。一个优秀的基础模型可以更好地进行后续的隐藏特征提取。因此,我们提出建立一个自适应联合模型,并在算法迭代过程中设计权值更新策略,以调整模型的权值,来构建一个更好的基础模型提升信息提取的有效性。


技术实现要素:

4.针对脑电信号的特征,设计了一个自适应联合模型的半监督学习方法进行分类。对于脑电信号等高维数据,为了弥补基于欧氏距离的亲和矩阵空间特征信息的不足,在高维特征中引入黎曼度量。它可以利用样本之间的协方差矩阵计算得到样本之间更多的信息。另外将权值更新策略嵌入到fssl的算法求解过程中,不断平衡联合模型的权值。最后使用联合模型提取的隐藏特征进行分类。结合上述内容,本发明提出了一种针对脑电信号的基于自适应联合模型半监督学习(combined model formative semi

supervised learning,cmfssl)分类方法。采用构建基于欧式模型和黎曼模型的联合模型的方式来更好地拟合数据关系。并根据设计的权重更新策略平衡两种模型的权重。然后在联合模型的基础上提隐藏特征,将隐藏特征和有标签样本的特征相连接。最后,利用宽度学习系统(broadlearning system,bls)对样本进行训练和分类。它继承了原fssl的安全优势,在数据模型的构建上具有更好的优势,提高了分类实验结果。
5.本发明提供了一种针对脑电信号的自适应联合模型半监督学习分类方法,主要包括以下步骤:
6.步骤一:设有标签样本l和无标签样本u都是从一个生成模型中生成的;设在可观察样本包含了隐藏特征z,隐藏特征z确定了整个可观察样本的生成过程;所述的可观察样本包括:有标签样本l和无标签样本u;
7.即存在概率p(z)生成隐藏特征,隐藏特征以p(l|z)的条件概率确定了有标签样本的生成,隐藏特征以p(u|z)的条件概率确定了无标签样本的生成;
8.给定训练样本集{x,y}={{x
l
,y
l
},x
u
},其中x
l
代表有标签样本,y
l
为其对应的标签,x
u
={x1,x2,...x
u
}是无标签样本;
9.步骤二:利用训练样本集中的有标签样本和无标签样本构建基于欧氏距离的样本相关矩阵,所述的样本相关矩阵为亲和矩阵;计算每个有标签和无标签样本之间的欧式距离,两两样本间的距离组成它们之间的亲和矩阵;
10.令e为有标签样本和无标签样本之间的亲和矩阵:
11.e=e
ij
ꢀꢀꢀ
(1)
12.其中e
ij
表示有标签样本i和无标签样本j之间的欧式距离,i=1,2...l;j=1,2...u.;
13.步骤三:使用训练样本集构建基于黎曼度量的样本相关矩阵;
14.在黎曼空间中,两点之间的距离定义为沿流形表面最近的距离,即测地距离;黎曼度量计算两样本之间的协方差矩阵,这包含了嵌入在eeg信号中的空间信息,它将有助于构建另一个合适的模型;
15.具体来说,计算有标签样本和无标签样本间之间的仿射不变黎曼度量(airm);反映了黎曼流形中两点之间真实测地距离的黎曼测度,其具体形式如下:
16.δ
g
(x,y)=||log(x

1/2
yx

1/2
)||
f
ꢀꢀꢀ
(2)
17.其中‖
·

f
表示矩阵的f范数,x,y是黎曼流形上的两点;
18.计算每个样本的协方差矩阵,进一步计算仿射不变黎曼度量,得到黎曼流形下有标签样本和无标签样本的度量;
19.基于黎曼测度的样本相关矩阵用r来表示两个样本之间的黎曼距离:
20.r=r
ij
ꢀꢀꢀ
(3)
21.其中r
ij
表示两个样本之间的黎曼距离;
22.步骤四:在上述两个模型的基础上,通过最大期望算法(expectation

maximization algorithm,em algorithm)挖掘数据的隐藏特征;最大期望算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐性变量;在最大期望算法中,设计了一个权重融合策略来平衡上述两个模型,使构建的模型能够更好地表达原始数据分布;。
23.新的联合模型使用下式构成:
24.m
new
=we (1

w)r
ꢀꢀꢀ
(4)
25.其中,w为权重系数,在新的叠加后的联合模型下,通过发现无标签样本背后的隐藏特征其对应的后验概率来形成新的特征,并将其连接到有标记样本的特征之后,形成新的样本;
26.对于该联合模型形成的对数似然概率公式为:
[0027][0028]
其中p(l
i
,u
j
,z
k
)为l,u,z的联合概率,为有标签样本l
i
和无标签样本u
j
在新的联合模型下的样本相关值,k为隐藏特征个数;
[0029]
要极大化该对数似然概率,可以使用最大期望算法迭代求解;最大期望算法分为e步骤和m步骤,在本模型下,e步骤利用可观测样本l和u来估计隐藏特征p(z|l,u):
[0030][0031]
其中p(
·
)均为样本间对应的概率,m步骤使用p(z|l,u)计算条件概率p(l|z)和p(u|z),使用拉格朗日乘子算法求解:
[0032][0033][0034][0035]
通过上述求得的解,利用贝叶斯公式转换,计算每个隐藏特征对应的后验概率,用于训练:
[0036][0037]
步骤五:两个模型的比例不同会影响模型的质量;
[0038]
因此设计了一种自适应搜索适合当前训练样本的最优模型的方法,通过调整权重,来优化最大的效果,即评估e和r模型对其的贡献;
[0039]
l
o
(m

1)表示欧式模型下的权重因子,l
r
(m

1)表示黎曼模型下的权重因子:
[0040][0041]
f(x
i
)表示当前权重下联合模型生成的隐藏特征值,y
i
是对应欧式/黎曼模型的隐藏特征值;根据两个模型的贡献来确定权重变化;利用log函数的特性来调整变化率并抑制其突变;更新公式如下:
[0042][0043]
在本联合模型下,k=2,k=1,2,分别对应上述的欧式模型和黎曼模型。λ
k
(m)表示在第m次迭代中得到的更新后的权重参数,下一次迭代中,会使用λ
k
(m)的值作为w来平衡模型。
[0044]
本发明与已有的诸多情绪刺激eeg信号分类方法相比,具有如下特点:
[0045]
第一,在fssl中设计了一个联合模型,相比较原有模型,可以更好地拟合有标签样本和无标签样本之间的关系;
[0046]
第二,针对不同模型在算法中的情况,设计了一个方法对联合模型中的单个模型的贡献度进行评估,方便后续根据贡献度来平衡模型;
[0047]
第三,根据不同模型的贡献度设计了一个权重更新策略,在权重更新策略的影响下,模型不断平衡以适应当前数据;
[0048]
第四,利用宽度学习系统对与隐藏特征相关联的样本进行分类,可以以一个简单的网络对样本快速分类,并在实验中取得了较好的效果。
附图说明
[0049]
图1表示生成模型示意图。
具体实施方式
[0050]
为了更好的对脑电信号进行半监督分类,本发明主要在形成式半监督学习的基础模型上改进。下面结合附图和表对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程。
[0051]
一种针对脑电信号的基于自适应联合模型特半监督学习分类方法,整体算法流程如算法cmfssl所示,其具体实施方式包括如下步骤:
[0052]
算法cmfssl:
[0053]
输入:训练集{x,y}={{x,y},x};
[0054]
输出:每个隐藏特征对应的后验概率z
k

[0055]
s1,使用公式(1)和公式(3)计算样本间关系;
[0056]
s2,while n<iterative threshold do;
[0057]
s3,e步骤;使用公式(6)估计p(z|l,u);
[0058]
s4,m步骤:使用公式(7),公式(8)和公式(9)更新p(z),p(l|z),p(u|z);
[0059]
s5,更新权重:使用公式(11)和公式(12);
[0060]
s6,结束while循环
[0061]
s7,计算后验概率并且拼接特征。
[0062]
步骤一,使用eeg工具箱eeglab对所有运动想象eeg信号进行预处理。所有原始脑电信号都使用五阶巴特沃斯滤波器在8至30hz之间进行带通滤波,该滤波器去除了肌肉伪影和直线漂移。在对从0.5到2.5s的非重叠时间段中提取的信号进行滤波之后,使用公共空间模式(common spatial pattern,csp)方法提取预处理信号的csp特征,用于后续的分类
处理。
[0063]
步骤二,将预处理后的脑电特征数据分为训练集和测试集。然后从[10,20,30,40,50,60,70]中选择作为训练集中有标签样本的数量。实验参数设置:隐藏特征的数量k是类别数量的两倍。在宽度学习系统中,每个窗口的特征节点数为20个,窗口数为10个,增强节点数为100个。
[0064]
步骤三,基于图一的生成模型,对有标签样本和无标签样本分别建立基于欧式距离的样本关系矩阵和基于黎曼度量的样本关系矩阵。设置未知权重w融合两种模型。
[0065]
步骤四,按照em算法,以联合模型的值为参考值,分别计算基于欧式度量模型和基于黎曼度量模型的贡献度。然后根据权重更新公式使用模型的贡献度来更新联合模型中的权重参数w。最终根据em算法的解来计算得到隐藏特征,并将该特征对应的后验概率连接到有标签样本特征后,形成新的训练集。
[0066]
步骤五,使用宽度学习系统对训练集训练得到分类模型,然后对测试集进行分类。本次说明在bci竞赛iii数据集4a数据集,bci竞赛iv数据集1数据集,bci竞赛iv数据集2a数据集上进行。并且将本发明中的算法和其他几种先进的半监督算法进行了比较。实验分类结果如表1,2,3所示。
[0067]
步骤六,针对跨域情况,我们在bci竞赛数据集试验两种算法:fssl和cmfssl。本实验使用的是bci竞赛iv数据集2a数据集。实验中以其他受试者的样本作为无标签样本,选取其自身样本的一部分作为有标签样本,其余样本作为测试集。例如,在对a1进行分类时,a1自身的30个样本作为有标签样本。此外,每个受试者a2

a9的样本被随机选择作为无标签样本。这些无标签样本用于生成隐藏特征。这样就形成了有标签样本和无标签样本的不同分布,构成了跨域条件。实验分类结果如表4所示。
[0068]
表1.bci竞赛iii数据集4a的平均分类结果(%)
[0069][0070]
表2.bci竞赛iv数据集1的平均分类结果(%)
[0071][0072]
表3.bci竞赛iv数据集2a的平均分类结果(%)
[0073][0074]
表4.跨域实验结果
[0075][0076]
本范例介绍了一种针对脑电信号的自适应联合模型半监督学习分类方法。该方法除了基本的欧氏度量模型外,还引入了黎曼度量模型来构建更好的联合模型。在内部em算法的迭代过程中,通过衡量不同模型的贡献度,赋予不同模型不同的权重来更新模型,这使得模型的平衡过程具有自适应性。在三个数据集上的实验结果表明,该算法在脑电信号分类和识别中具有较好的性能。此外,与原有的fssl算法相比,该算法在跨域问题上也有很好的改进。在权值更新策略下,联合模型可以更好地接近原始数据模型,从而进一步挖掘隐藏特征进行连接。该方法在三个bci数据集上进行了验证,并与几种最新的方法进行了比较。实验结果表明,该方法取得了较好的效果,且具有较好的跨域分类效果。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献