一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种融合稀疏学习和二分法的情绪状态特征选择优化方法与流程

2021-10-27 20:17:00 来源:中国专利 TAG:数据处理 稀疏 融合 情绪 特征


本发明涉及数据处理技术领域,尤其涉及一种融合稀疏学习和二分法的情绪状态特征选择优化方法。


背景技术:

随人机交互的需求激增,情绪作为人的心理状态的内在反映,在许多领域已受到广泛关注。采用内在的生理信号来辨识微妙的情绪状态相比外在的表情、语音、姿势等信号源来说具有更客观的研究意义。在生理信号特征的提取上,使用机器学习方法需要人为地提取特征。如何有效地判别所提特征的优劣,进行情绪状态表征,是研究情绪辨识的关键。常见的特征选择的方法包括方差选择法、卡方检验、互信息、稀疏学习等。特征选择的好坏直接关系到特征分类的效率。特征选择的方法应考虑每类信号下与类别目标的相关性,从而选出合适的特征。一般认为,稀疏学习中权重系数的稀疏性与特征选择中所选择特征的稀疏性具有天然的相似性,通过适当的建模,稀疏学习的方法就可以很好的应用在特征选择的问题上。另外二分法在函数中作为一种快速求解近似值的方法,组合稀疏学习对用于搜索最优特征维度具有重要的研究价值。


技术实现要素:

本发明的目的是提供一种融合稀疏学习和二分法的情绪状态特征选择优化方法,对生理信号特征进行了有效的选择和优化,提升状态表征效果,减少后期分类辨识的计算复杂度。本发明为实现上述发明目的采用如下技术方案:本发明提供了一种融合稀疏学习和二分法的情绪状态特征选择优化方法,包括:获取情绪状态表征较好的初始特征集,并作归一化处理,所述特征集根据预处理生理信号特性,进行特征提取,初步筛选出表征效果好的单特征组建特征集;利用稀疏学习算法,通过最小范数最小二乘方法求解稀疏学习系数以此来判别每类信号下的特征与目标类别间的相关性,并按每类特征的贡献度进行排序,结合二分法搜索出每类信号下不同的最优特征子集;把不同类生理信号下各自的最优特征子集进行融合,得到最优的情绪状态表征。进一步地,筛选最优特征子集包括:进行稀疏学习,通过整理和分析特征集,构建特征矩阵d和类别信息矩阵s;利用最小范数最小二乘法计算稀疏权重系数,并构建稀疏系数矩阵h;依据稀疏系数矩阵h得出每个特征的特征分数f;依据特征分数f得到有序的特征集n
i
,结合二分法进行特征选择优化;对有序的特征集n
i
,依据缩进值δ拆分前向维度段n
f
和后向维度段n
b
,分别进行前向搜索和后向搜索,各自利用svm分类器进行分类;
依据svm分类器的分类结果,比较前向维度段n
f
和后向维度段n
b
的性能,性能高的特征段将作为下一次迭代的当前维度n
i
;记录并比较多次迭代中最优的高性能特征段,挑出最优的高性能特征段n
p
作为该信号下的最优特征子集。进一步地,预处理生理信号的方法包括:提取相关生理信号,降低采样频率,去除基线和眼电伪迹并对各类生理信号进行数据划分。进一步地,提取的特征包括:几何平均、调和平均、峭度、最大值、平均值、中值、最小值、阈值、斜度、标准差和方差。进一步地,采用数据平滑处理和去趋势的方式进行特征提取。进一步地,所述数据平滑处理和去趋势的方式包括:移动标准差移动方差移动均值移动中位数mmad=median(|a
i

median(a)|);其中,a是一个移动的向量,向量的长度为n,a
i
表示a中第i个向量值,μ表示均值。本发明的有益效果如下:本发明利用稀疏学习算法分析了特征与类别目标间的相关性,并依据每个特征对目标类别贡献度的大小对特征的重要性进行了排序;通过最小范数最小二乘的方法求解稀疏学习系数,使其解具有唯一性;提出融合稀疏学习和二分法的方法,使得每类信号下都具有各自不同的最优特征子集,有利于更客观的表征每类生理信号;融合了不同生理信号下各自的最优特征子集,使得情绪的表征更加全面。
附图说明
图1为根据本发明实施例提供的一种融合稀疏学习和二分法的情绪状态特征选择优化方法的整体流程图;图2为根据本发明实施例提供的一种融合稀疏学习和二分法的情绪状态特征选择优化方法中融合稀疏学习和二分法的原理示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明所涉及方法的整体流程图如图1所示,包括以下步骤:步骤1:预处理相关生理信号。相关的生理信号包括:呼吸(rsp)、血压(bvp)、皮电(gsr)、肌电(emg)及眼电(eog)。降低采样频率至128hz,每个训练样本去除眼电伪迹和前3
秒的基线。对各类生理信号进行数据划分,6秒一段并作3秒的滑窗。步骤2:特征提取及初步筛选。尽可能多地提取特征以便组建特征集。常见的提取的特征包括:最大值(max)、最小值(min)、方差(var)、标准差(std)、中值(median)、均值(mean)、范围(range)、几何平均(geometric mean)、调和平均(harmonic mean)。采用一些数据平滑处理和去趋势的方法,同样提取以上特征,可以获得更多不同类型下的特征值。数据平滑处理和去趋势的方法包括:据平滑处理和去趋势的方法包括:移动中位数(movmad)mmad=median(|a
i

median(a)|),a是一个移动的向量,向量的长度为n,a
i
表示a中第i个向量值,μ表示均值。分析每个单特征的分类特征,最终从99维特征中初步筛选出54维较好的特征。步骤3:如图2所示,利用融合稀疏学习和二分法的方法进行特征的选择和优化。首先,利用稀疏学习分析每类信号下特征与目标类别的相关性。其中,稀疏学习指为将含有稠密信息的样本找到合适的字典,将样本转化为合适的稀疏表达形式,从而使学习任务得以简化,模型复杂度得以降低。一般认为,稀疏学习中权重系数的稀疏性与特征选择中选择特征的稀疏性具有很大的关联性。因此,稀疏学习的方法可以很好的应用在特征选择的问题上。一个包含标签类别信息的类别矩阵s可以被如下定义:s=(s1,s2,...s
k
)其中,k表示样本的类别数。s
i
表示矩阵s中的列向量,i∈(1,2,...,k)。s
il
表示在当前列向量中的每一个样本值,l∈(1,2,...,m)。已知稀疏类别矩阵s
i
和特征矩阵d(d∈r
m
×
n
),稀疏权重系数α
i

i
∈r
n
×1)可以通过表达式s
i
=dα
i
求出。利用最小范数最小二乘法求解稀疏权重系数,使得稀疏权重系数的解具有惟一性。最终构成稀疏系数矩阵h,h=(α1,α2,...,α
k
),矩阵h的第j行(j∈(1,2,...,n))表示第j个特征对于每个目标类别的贡献度。该行所有值的绝对值的和便是该特征对于k分类样本的总贡献度,每个特征的重要性用特征分数f表示,f表达式定义为一般来说,f
j
的值越高,表明该特征对于k分类样本的相关性越大。其次,依据特征分数f对特征降序排序后得到有序的特征集n
i
,用二分法搜索出每类信号下不同的最优维度特征段。二分法分前向搜索n
f

δn
i
和后向搜索n
b

δn
i
,其中i表示迭代的次数,n
i
表示当前的特征维度,δ表示缩进的系数,假设当前特征维度n
i
=(1,...,m
b
,...,m
f
,...,m
n
)
t
,则n
f
表示前向的特征维度段(1,...,m
b
,...,m
f
)
t
,n
b
表示后向的特征维度段(m
b
,...,m
f
,...,m
n
)
t
,n
f
和n
b
分别依据缩进值δ(δ=0.8)确定。用svm分类器分别测试并比较特征段n
f
和n
b
的性能,更高性能的特征段将被挑出作为下一次迭代中的当前特征维度n
i
,一共迭代8次。记录并比较8次迭代中最优的特征子集n
p
,所选出的特征段n
p
便是当前信号下最优的特征子集。
最后,把多个生理信号下各自的最优特征子集进行融合,以便表征更多的同一情绪状态。最终得到的特征集便是融合稀疏学习和二分法进行特征选择优化后最优的特征维度。为了验证本发明的有效性,本发明所用的一种基于生理信号的情绪辨识方法在国际公开的数据库deap(a database for emotion analysis using physiological signals)上进行验证。随机选择一人来验证本发明方法的有效性,实验结果如表1所示。
33.表1本发明方法在单人s01上4分类情绪辨识的比较人s01上4分类情绪辨识的比较注:标记*表示多路信号融合在表1中可见本发明提出的融合稀疏学习和二分法的特征选择方法,不仅挑出各信号下最优的特征子集,减少了特征维度,而且所挑出的最优特征子集的精度明显要优于未经过特征选择的准确率,从而说明本发明特征选择方法的有效性。另外,多信号的特征融合对于同一情绪表征的效果,相比于任一单一信号都要显著提升。这亦反映了本发明的特征选择优化的方法具有不错的有效性和可靠性。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜