一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于脑电信号的多视图深度学习的情绪分析方法和系统与流程

2022-03-05 10:17:15 来源:中国专利 TAG:


1.本发明涉及情绪识别领域,具体涉及一种基于脑电信号的多视图深度学习的情绪分析方法和系统。


背景技术:

2.人类情感是复杂的心理和生理表达,通常与主观感受、气质、性格、动机倾向、行为反应和生理唤醒有关。“情绪”是一种影响人们的认知、决策和行为的心理状态。情感计算在人工智能中发挥着关键的作用,特别是在人机交互领域,能够分析人类情感的人工机器能更好地理解人类,从而更好地满足人类的需求。
3.人类的情绪变化通常伴随着生理信号的变化,生理信号相较于面部表情或者语音信号的优点在于生理信号更能反应真实情绪状态。情感研究主要是利用脉搏、眼动、肌电、皮电等生理信号来识别,其中脑电信号因其较高的准确性和客观性备受情感识别研究者的青睐。
4.数据的表示问题是机器学习的重点和难点问题之一,因为学习效果往往受到数据表示方法的影响。对于客观世界的对象,常常提取它的特征,然后用特征向量表示此对象,在这些描述对象的特征中,有些特征具有不同的属性,因此不适合使用同一种学习器的单视图方法进行学习。与单视图方法相比,多视图学习方法则在不同的视图内侧重点不同,具有差异性,正因为具有差异,所以可以提取出相互关联、互补的特征,进而通过综合分析可以得到更全面的目标对象的描述,从而可以改善在数据集上的分类效果,使得算法能够采用充足的、多样的信息来解释事物的内在本质。
5.特征提取在基于脑电图的情绪识别中起着重要的作用。多种特征提取方法被应用在基于脑电的情绪识别领域,得到的脑电特征一般可分为三类:时域特征、频域特征和时频域特征。时域特征主要捕捉脑电信号的时间组织信息,具有代表性的时域脑电信号特征有hjorth特征、分形维数特征和高阶交叉特征等。频域特征主要从频域的角度捕捉情感信息。从脑电信号中提取频域的特征首先将频段分解成几个子频段(例如,delta(1-3hz)、theta(4~7hz)、alpha(8~13hz)、beta(14~30hz)和gamma(31~45hz)是最常用的方式,然后可以分别提取每个频带的脑电特征。当前常用的脑电频域特征提取方法有傅立叶变换(ft)、功率谱密度(psd)、小波变换(wt)和微分熵(de)。
6.目前,基于脑电的情绪识别算法被大量提出,这些算法多数是传统的机器学习算法。例如,支持向量机(support vector machine,svm)、k近邻(k-nearest neighbor,knn)和朴素贝叶斯(naive bayes,nb)等监督学习算法。近年来,深度神经网络被成功地应用到基于脑电的情绪识别中,并且达到了目前较高的研究水平。这些深度模型以各种脑电特征为输入,例如功率谱密度(psd)、微分熵(de)、微分不对称特征(dasm)、有理不对称特征(rasm)、微分尾度特征(dcau)等,输出脑电数据对应的情绪类别标签。常见的深度模型包括深度信念网络(dbn)、双模深度去噪自编码器(sdae)、双向长短时记忆网络(bi-lstm)模型、卷积神经网络(cnn)等。
7.一般来说,有两种广泛使用的情感模型来描述情感空间,一种是离散模型,另一种是维度模型。在离散模型中,情绪空间由几个基本的离散情绪来描述。尽管对基本情绪的类别还没有达成共识,但许多研究使用了至少六种基本情绪,包括喜悦、悲伤、惊讶、恐惧、愤怒和厌恶。另一方面,维度模型描述了情绪空间在二维或三维空间中具有连续一致性的特征。其中效价(valence)维度范围从消极到积极,唤醒(arousal)维度范围从平静到活跃,最后到兴奋,支配(dominance)维度描述一个人的情绪状态从控制到被控制。


技术实现要素:

8.本发明的目的是克服单视图学习方法中单一性、片面性的缺陷,提出一种基于脑电信号的多视图深度学习的情绪分析方法和系统。
9.根据本发明的第一方面,提供一种基于脑电信号的多视图深度学习的情绪分析方法。该方法包括以下步骤:
10.步骤s1:采集基于外界诱导刺激产生的脑电信号;
11.步骤s2:以滤除眼电和肌电伪迹为目标,利用带通滤波器对采集的脑电信号进行预处理,获得多通道脑电信号;
12.步骤s3:对所述多通道脑电信号进行表征提取,并将脑电信号分解为其组成信号视图,提取多个频率段的信号特征;
13.步骤s4:将所述多个频率段的信号特征分别输入到预训练的多列卷积神经网络模型,通过对每列卷积神经网络模型的决策结果进行加权平均得到最终的决策结果,其中每列神经网络模型对应一个频率段的信号特征;
14.步骤s5:利用情绪模型针对所述最终决策结果进行情绪分类。
15.根据本发明的第二方面,提供一种基于脑电信号的多视图深度学习的情绪分析系统。该系统包括:
16.信号采集模块:用于采集基于外界诱导刺激产生的脑电信号,并以滤除眼电和肌电伪迹为目标,利用带通滤波器对采集的脑电信号进行预处理,获得多通道脑电信号;
17.特征提取模块:用于对所述多通道脑电信号进行表征提取,并将脑电信号分解为其组成信号视图,提取多个频率段的信号特征;
18.算法模块:用于将所述多个频率段的信号特征分别输入到预训练的多列卷积神经网络模型,通过对每列卷积神经网络模型的决策结果进行加权平均得到最终的决策结果,其中每列神经网络模型对应一个频率段的信号特征;
19.情绪分类模块:用于利用情绪模型针对所述最终决策结果进行情绪分类。
20.与现有技术相比,本发明的优点在于,提出对脑电信号数据分频提取其组成信号,构成多个视图,并将多个视图输入到多列神经网络模型中学习,最大程度提高了数据预测的真实性,并且减少由于脑电数据的不稳定性以及环境变化带来的脑电特征之间的领域差异。
21.通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
22.被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
23.图1是根据本发明一个实施例的一种基于脑电信号的多视图深度学习的情绪分析系统的示意图;
24.图2是根据本发明一个实施例的基于多视图方法对脑电数据进行情绪计算的总体流程图;
25.图3是根据本发明一个实施例的原理结构图;
26.图4是根据本发明一个实施例的采集脑电信号的实验图;
27.图5是根据本发明一个实施例的采集脑电信号的32电极的国际10-20系统通道图;
28.图6是根据本发明一个实施例的情绪二维空间va(valence-arousal)模型图。
具体实施方式
29.现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
30.以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
31.对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
32.在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
33.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
34.参见图1所示,本发明提供的基于脑电信号的多视图深度学习的情绪分析系统包括信号采集模块、特征提取模块、算法模块和情绪分类模块。简言之,信号采集模块用于采集eeg信号(脑电信号)并对信号进行预处理。特征提取模块用于提取频域特征和时域特征等。算法模块用于建立多列神经网络模型进行训练或预测情绪决策结果,情绪分类模块用于根据算法模块的输出识别情绪分类。
35.具体地,结合图1和图2所示,所提供的基于脑电信号的多视图深度学习的情绪分析方法包括以下步骤。
36.步骤s110,采集基于外界诱导刺激产生的脑电信号。
37.在一个实施例中,具体操作可参照图4的实验图。例如,采集受试者观看音乐视频(每一个音乐视频1分钟)的生理信号和受试者对视频的唤醒度(valence)、愉悦度(arousa)的心理量表。信号采集仪和脑电帽安放的位置分布基本覆盖了脑部的四大区域,间距适中,从而能够有效的采集到所需要的脑电信号的原始数据。
38.步骤s120,对原始脑电信号数据进行预处理。
39.具体来说,首先将脑电数据采样频率下采样到128hz,然后用带通滤波器对原始脑电信号数据库去噪,处理眼电及肌电伪迹。预处理数据集为前32个通道的1~80hz的脑电数
据,如图5所示为采集脑电信号的32电极的国际10-20系统通道图。
40.在一个实施例中,为提高后续情绪分类的准确性,数据预处理过程包括以下步骤:
41.步骤s121,根据所要分析的信号频率,适当设定波形带宽,滤除不必要的信号;
42.步骤s122,伪迹去除、ica去眼电;
43.例如,去除由于设备或被试动作带来的伪差信号,针对采集的脑电数据中存在的眨眼、心电、肌电这些伪迹干扰问题,采用主成分分析法(pca)、独立成分分析法(ica)等进行去除。
44.步骤s123,将去除伪迹的脑电信号根据标记将要进行叠加平均的脑电信号提取出来,进行分段命名,叠加平均,基线校正,峰值检测等步骤,最后将数据输出。
45.步骤s130,通过快速傅里叶方法对多通道脑电信号进行表征提取,并分解成组成信号。
46.例如,首先利用训练好的dbn网络权重对影响情绪识别的关键频段和脑区进行研究。结果表明delta(1-3hz)、theta(4~7hz)、alpha(8~13hz)、beta(14~30hz)和gamma(31~45hz)这五个频段的情绪识别准确率高。进一步地,通过快速傅里叶变换(fft)对脑电信号进行频谱分析,提取脑电信号关键频段特征,首先调用傅里叶变换将信号从时域变换到频域,再调用傅里叶反变换获取delta、theta、alpha、beta和gamma五种波形的时域序列。
47.具体来说,通过快速傅里叶方法将脑电全信号分解成组成信号。如图3所示,可以分解为五个频带,即delta频带(1-3hz),theta频带(4-7hz),alpha频带(8-13hz),beta频带(14-30hz)以及gamma频带(》31hz)进行研究。
48.在一个实施例中,从脑电信号分离不同频率特征信号采用快速傅里叶变换和傅里叶反变换实现,公式如下:
[0049][0050][0051]
其中f(n)表示离散的脑电信号数据,n表示采样点数目。
[0052]
步骤s140,利用基于不同组成信号所训练的多列卷积神经网络模型获得决策结果。
[0053]
仍结合图3所示,在该步骤中,将得到的不同组成信号频带分别输入到不同的卷积神经网络模型(cnn)中学习训练,以调参优化模型,计算决策结果。最后,将这几列cnn模型的决策结果加权平均得到最终的决策结果。
[0054]
具体来说,以采用5列cnn模型为例,首先将步骤s130中不同频带输入到多列cnn模型中,每个cnn模型记为一个识别模块,表示为:
[0055]
v={vi|i=1,2,3,4,5}
ꢀꢀꢀ
(3)
[0056]
w={wi|i=1,2,3,4,5}
ꢀꢀꢀ
(4)
[0057]
其中vi是来自第i个识别模块的决策,wi是vi的预测概率,第i个决策的权重项,来自于该模块的预测概率。vi是一个二元值,即 1或-1,而 1代表高情绪状态,-1代表低情绪状态。为了提取vi,将wi(0.0-1.0)量化为(1-9)中的9点度量。然后,度量后面的结果值如果
等于或大于5就转换为 1,如果小于5就转换为-1。应理解的是,判断转换为 1或-1的阈值可根据需要设定,而不限于将阈值设置为5。
[0058]
最终模型的决策结果v(final)由这些不同识别模块加权平均得到,即模型由k个(如1-5个)识别模块组成,决策vi通过投票或按下式加权和策略合并为最终决定v(final),公式为:
[0059][0060]
步骤s150,根据情绪二维连续模型,针对最终决策结果做出有效的情绪分类。
[0061]
具体来说,情绪模型可分为离散型模型和连续型模型两种。对于离散型模型,其基本情绪包括喜、怒、哀、乐、爱、恶、欲等。对于连续型情绪模型,可以从维度观的角度进行理解。
[0062]
情绪的维度空间模型又可以分为二维、三维等不同类型。如图6所示,情绪二维模型的横轴和纵轴分别表示愉悦度(valence)和唤醒度(arousal)。愉悦度表示情绪的愉悦程度,唤醒度表示情绪的强烈程度。模型的四个极点表示四种不同的离散情绪类别,所以该二维表示模型也被称为va(valence-arousal)模型。基于愉悦度(valence)和唤醒度(arousal)的二维连续型模型以二维情绪的四个极点作为情绪的四个分类标准情绪标签,可由数字1到9的打分尺度来衡量,例如愉悦度评分在5以下的为低愉悦-1,五分以上为高愉悦 1,唤醒度同理。最终,根据步骤s140中的决策结果对情绪进行计算识别分类。
[0063]
综上所述,本发明首先采集基于外界诱导刺激产生的脑电信号,通过滤波器进行预处理;然后对脑电信号进行表征提取,通过快速傅里叶变换将脑电信号分解成组成信号;接着,将得到的不同信号分别输入到多列卷积神经网络模型中学习训练,计算决策结果;最后,根据情绪二维连续模型针对决策结果进行情感分类。本发明提出对脑电信号数据分频提取其组成信号,构成多个视图,并将多个视图输入到多列神经网络模型中学习,这种利用多个视图学习的方式,能够最大程度提高数据预测的真实性,并且减少由于脑电数据的不稳定性以及环境变化带来的脑电特征之间的领域差异。
[0064]
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
[0065]
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
[0066]
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
[0067]
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c 、python等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
[0068]
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
[0069]
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
[0070]
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
[0071]
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动
作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
[0072]
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献