一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种冰毒成瘾者检测模型的训练方法和系统与流程

2021-11-06 00:14:00 来源:中国专利 TAG:


1.本发明属于机器学习和特征检测技术领域,更具体地,涉及一种冰毒成瘾者检测模型的训练方法和系统。


背景技术:

2.冰毒成瘾者检测的金标准是进行尿液检测,主要特点是快速、方便、便于携带和准确率高。但该方法受到毒品半衰期影响,冰毒用药后尿检为阳性的时间段为吸毒后1小时—3天,即只能检测出吸毒后不久的成瘾者。鉴于冰毒成瘾者神经系统受损,有较大的潜在社会危害,因此如何从认知神经科学的角度,成功识别冰毒成瘾者,弥补尿液检测的短时性缺点,已经成为业界的研究热点。
3.现有从认知神经科学角度的冰毒成瘾者检测方法主要包括使用脑电图 (electroencephalogram,简称eeg)、使用功能核磁共振(functional magneticresonance imaging,简称fmri)、以及使用功能性近红外光谱((functionalnear

infrared spectroscopy,简称fnirs)。
4.然而,上述冰毒成瘾者检测方法均存在一些不可忽略的技术问题,对于 eeg方法而言,其虽然简单便携、时间分辨率高,但其空间分辨率较低;对于fmri方法而言,其能直观地反映脑区激活程度,但设备昂贵;对于 fnirs方法而言,其时空分辨率和设备价格处于eeg方法和fmri方法之间,但待检测者的头发会影响检测的准确性。


技术实现要素:

5.针对现有技术的以上缺陷或改进需求,本发明提供了一种冰毒成瘾者检测模型的训练方法和系统,其目的在于,弥补尿液检测的短时性缺点,解决现有基于eeg实现的冰毒成瘾者检测方法存在的空间分辨率较低的技术问题,以及基于fmri的冰毒成瘾者检测方法存在的设备昂贵的技术问题,以及基于fnirs的冰毒成瘾者检测方法存在的待检测者的头发会影响检测准确性的技术问题。
6.为实现上述目的,按照本发明的一个方面,提供了一种冰毒成瘾者检测模型的训练方法,包括以下步骤:
7.(1)获取多个待测试者在看到视觉诱发刺激图片后的脑电图信号;
8.(2)对步骤(1)得到的每个待检测者对应的脑电图信号进行预处理,以得到对应于每个待检测者的预处理后的脑电图信号;
9.(3)针对步骤(2)得到的对应于每个待检测者的预处理后的脑电图信号而言,将其中每个对应于标准刺激图片的子脑电图信号的电压值a1、 a2、

、am分别与每个对应于成瘾偏差图片的子脑电图信号的电压值b1、 b2、

、bn相减,从而得到对应于该待检测者、并由多个电压差值构成的数据集,即{a1

b1,a1

b2,

,a1

bn,a2

b1,a2

b2,...,a2

bn,..,am

b1, am

b2,

am

bn},将所有待检测者的数据集按照4:1的比例划分为训练集和测试集,其中n表示对应于成瘾偏差图片的子脑电图信号的总数,m表示对应于标准刺激图片的
子脑电图信号的总数。
10.(4)将步骤(3)得到的训练集输入冰毒成瘾者检测网络模型中,并使用反向传播算法对冰毒成瘾者检测网络模型中每层的权重参数和偏置参数进行更新和优化,以得到更新后的冰毒成瘾者检测网络模型。
11.(5)对步骤(4)更新后的冰毒成瘾者检测网络模型进行迭代训练,直到该冰毒成瘾者检测网络模型的损失函数达到最小为止;
12.(6)使用步骤(3)得到的测试集对迭代训练后的冰毒成瘾者检测网络模型进行迭代验证,直到得到的分类精度达到最优为止,从而得到训练好的冰毒成瘾者检测网络模型。
13.优选地,步骤(1)具体为,首先在oddball实验模式下,采集待测试者先后看到不同视觉诱发刺激图片后的64通道脑电图信号,然后,在预定的时间间隔后继续重复该过程,从而最终得到最终的脑电图信号。
14.优选地,视觉诱发刺激图片包括标准刺激图片和成瘾偏差图片,其中标准刺激图片是与冰毒完全无关的图片,成瘾偏差图片是与冰毒高度相关的图片。
15.优选地,步骤(2)具体为,首先,针对每个待检测者对应的脑电图信号而言,选择tp9、tp10通道的平均电压作为参考电压,然后将其他所有 62路通道的电压分别减去该参考电压,从而得到去参考后的脑电图信号,然后,对该脑电图信号进行1到30hz的带通滤波,随后,去除带通滤波后的脑电图信号中的伪迹、信号漂移和非生物信号,随后,采用独立成分分析 (ica)方法去除脑电图信号中的眼电干扰,以得到去除干扰后的脑电图信号;然后,从去除干扰后的脑电图信号中,截取每张标准刺激图片被呈现给待测试者的时刻前200ms、后1000ms的脑电图信号,从而生成对应于每张标准刺激图片的子脑电图信号,并截取每张成瘾偏差图片被呈现给待测试者的时刻前200ms、后1000ms的脑电图信号,从而生成对应于每张成瘾偏差图片的子脑电图信号,所有对应于所有标准刺激图片的子脑电图信号和所有对应于所有成瘾偏差图片的子脑电图信号共同构成对应于该待检测者的预处理后的脑电图信号。
16.优选地,步骤(4)中权重参数的初始值是使用标准差为0.1的截断式正态分布输出的随机值,偏置参数的初始值设为0;
17.反向传播算法是采用adam

optimizer作为优化器。
18.优选地,冰毒成瘾者检测网络模型的损失函数l为:
[0019][0020]
其中n表示训练集的样本总数,k表示训练集中类别的数量,t
i,k
表示第 k类第i个训练样本输入冰毒成瘾者检测网络模型后的预测结果,y
i,k
表示第k类第i个训练样本对应的真实结果,k∈[1,k],λ表示正则化程度,其取值为0.01,w
i,k
表示第k类第i个训练样本输入冰毒成瘾者检测网络模型时的权重参数,其随着cnn冰毒成瘾者检测网络模型的训练自行变化。
[0021]
优选地,冰毒成瘾者检测网络模型采用卷积神经网络,其具体结构如下:
[0022]
第一层是输入层,其输入大小为300
×
62的脑电图信号;
[0023]
第二层是一维卷积层,其卷积核大小为1
×
100,卷积核个数为64,其输入为输入层
的300
×
62的脑电信号,其输出维度为201
×
64。
[0024]
第三层是最大池化层,其步距为2,其输入维度为201
×
64,其输出维度为100
×
64。
[0025]
第四层是卷积层,其卷积核大小为1
×
32,卷积核个数为128,其输入维度为100
×
64,其输出维度为69
×
128。
[0026]
第五层是最大池化层,其步距为2,其输入维度为69
×
128,其输出维度为34
×
128。
[0027]
第六层是卷积层,其卷积核大小为1
×
32,卷积核个数为256,其输入维度为34
×
128,其输出维度为3
×
256。
[0028]
第七层是最大池化层,其步距为2,其输入维度为3
×
256,其输出维度为1
×
256。
[0029]
第八层是dropout层,其比率为0.3,其输出维度为1
×
256。
[0030]
第九层是全连接层,其输入维度为1
×
256,其输出维度为1
×
2;
[0031]
按照本发明的另一方面,提供了一种冰毒成瘾者检测模型的训练系统,包括:
[0032]
第一模块,用于获取多个待测试者在看到视觉诱发刺激图片后的脑电图信号。
[0033]
第二模块,用于对第一模块得到的每个待检测者对应的脑电图信号进行预处理,以得到对应于每个待检测者的预处理后的脑电图信号;
[0034]
第三模块,用于针对第二模块得到的对应于每个待检测者的预处理后的脑电图信号而言,将其中每个对应于标准刺激图片的子脑电图信号的电压值a1、a2、

、am分别与每个对应于成瘾偏差图片的子脑电图信号的电压值b1、b2、

、bn相减,从而得到对应于该待检测者、并由多个电压差值构成的数据集,即{a1

b1,a1

b2,

,a1

bn,a2

b1,a2

b2,...,a2

bn,.., am

b1,am

b2,

am

bn},将所有待检测者的数据集按照4:1的比例划分为训练集和测试集,其中n表示对应于成瘾偏差图片的子脑电图信号的总数, m表示对应于标准刺激图片的子脑电图信号的总数;
[0035]
第四模块,用于将第三模块得到的训练集输入冰毒成瘾者检测网络模型中,并使用反向传播算法对冰毒成瘾者检测网络模型中每层的权重参数和偏置参数进行更新和优化,以得到更新后的冰毒成瘾者检测网络模型;
[0036]
第五模块,用于对第四模块更新后的冰毒成瘾者检测网络模型进行迭代训练,直到该冰毒成瘾者检测网络模型的损失函数达到最小为止;
[0037]
第六模块,用于使用第三模块得到的测试集对迭代训练后的冰毒成瘾者检测网络模型进行迭代验证,直到得到的分类精度达到最优为止,从而得到训练好的冰毒成瘾者检测网络模型。
[0038]
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
[0039]
1、由于本发明采用了步骤(1)到步骤(6),其采用脑电信号,从认知科学角度对冰毒成瘾者检测,因此能够解决尿液检测的时间有效性问题;脑电采集设备的成本较低,因此能够解决现有基于fmri的冰毒成瘾者检测方法存在的设备昂贵的技术问题;脑电采集过程中,脑电信号不受头发等因素的影响,因此能够解决现有基于fnirs的冰毒成瘾者检测方法存在的待检测者的头发会影响检测准确性的技术问题;
[0040]
2、由于本发明采用了步骤(1)到步骤(6),其采用10

20标准的64 通道脑电信号,因此能够解决现有基于eeg实现的冰毒成瘾者检测方法存在的空间分辨率较低的技术问题;
[0041]
3、由于本发明采用了步骤(1)到步骤(6),其采用人工智能技术,跨被试的预测平均正确率能够达到86%,因此能够解决现有基于eeg实现的冰毒成瘾者检测方法的识别的可行性问题;
[0042]
4、由于本发明采用了步骤(3),其采用样本扩增技术,将样本量扩增了30倍,同时减少了个体脑电的特异性影响,因此能够解决现有深度卷积网络模型样本量不够、特征不够明显,导致的识别效率较低的问题。
附图说明
[0043]
图1是本发明冰毒成瘾者检测模型的训练方法的流程图;
[0044]
图2是本发明冰毒成瘾者检测网络模型的网络结构图。
具体实施方式
[0045]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
[0046]
如图1所示,本发明提供了一种冰毒成瘾者检测模型的训练方法,包括以下步骤:
[0047]
(1)获取多个待测试者在看到视觉诱发刺激图片后的脑电图信号;
[0048]
具体而言,本步骤具体为,首先是在oddball实验模式下,采集待测试者先后看到不同视觉诱发刺激图片(在本示例中是总计85张)后的64通道(10

20国际电极标准系统)脑电图信号(前后两张图片的间隔是2.8到 3.8秒),然后,间隔某个预定的时间间隔(其可以为5分钟到10分钟之间) 后继续重复该过程,从而最终得到最终的脑电图信号。
[0049]
其中视觉诱发刺激图片被分成两种类型,即标准刺激图片(其是与冰毒完全无关的图片,在本示例中其是70张篮球图片)、以及成瘾偏差图片(其是与冰毒高度相关的图片,例如吸毒装置、冰毒本身等的图片,在本示例中是从45张预设的成瘾偏差图片集中随机获取15张)。
[0050]
需要注意的是,本发明呈现给待测试者的85张图片,并不是以固定的顺序进行排列,可以以任何顺序采集以获得最终的多个脑电图信号。
[0051]
(2)对步骤(1)得到的每个待检测者对应的脑电图信号进行预处理,以得到对应于每个待检测者的预处理后的脑电图信号;
[0052]
本步骤具体为,首先,针对每个待检测者对应的脑电图信号而言,选择 tp9、tp10通道的平均电压作为参考电压,然后将其他所有62路通道的电压分别减去该参考电压,从而得到去参考后的脑电图信号,然后,对该脑电图信号进行1到30hz的带通滤波(将采样频率下采样到250hz),随后,去除带通滤波后的脑电图信号中的伪迹、信号漂移和非生物信号,随后,采用独立成分分析(independent component analysis,简称ica)方法去除脑电图信号中的眼电干扰,以得到去除干扰后的脑电图信号;然后,从去除干扰后的脑电图信号中,截取每张标准刺激图片被呈现给待测试者的时刻前 200ms、后1000ms的脑电图信号,从而生成对应于每张标准刺激图片的子脑电图信号,并截取每张成瘾偏差图片被呈现给待测试者的时刻前200ms、后1000ms的脑电图信号,从而生成对应于每张成瘾偏差图片的子脑电
图信号,所有对应于所有标准刺激图片的子脑电图信号和所有对应于所有成瘾偏差图片的子脑电图信号共同构成对应于该待检测者的预处理后的脑电图信号。
[0053]
本步骤的优点在于,流程化去除脑电伪迹,批量提取特定刺激诱发的脑电信号。
[0054]
(3)针对步骤(2)得到的对应于每个待检测者的预处理后的脑电图信号而言,将其中每个对应于标准刺激图片的子脑电图信号的电压值a1、 a2、

、am分别与每个对应于成瘾偏差图片的子脑电图信号的电压值b1、 b2、

、bn相减,从而得到对应于该待检测者、并由多个电压差值构成的数据集,即{a1

b1,a1

b2,

,a1

bn,a2

b1,a2

b2,...,a2

bn,..,am

b1,am

b2,

am

bn},其中n表示对应于成瘾偏差图片的子脑电图信号的总数, m表示对应于标准刺激图片的子脑电图信号的总数,共得到353319个数据。将所有待检测者的数据集按照4:1的比例划分为训练集和测试集;
[0055]
本步骤的优点在于,扩增了用于深度卷积神经网络学习的训练样本,其数量提升了约30倍,因此提高了深度卷积神经网络的泛化能力。同时,标准刺激诱发电位与成瘾偏差刺激诱发电位的差值,一定程度上弱化了不同被试的个体差异,更有效地反映出两类被试间的固有差异,使数据集具有更好的分类特征。
[0056]
(4)将步骤(3)得到的训练集输入冰毒成瘾者检测网络模型中,并使用反向传播算法对冰毒成瘾者检测网络模型中每层的权重参数和偏置参数进行更新和优化,以得到更新后的冰毒成瘾者检测网络模型;
[0057]
具体而言,权重参数的初始值是使用标准差为0.1的截断式正态分布输出的随机值,偏置参数的初始值设为0;
[0058]
具体而言,为了加快损失值的下降速度,本步骤中的反向传播算法是采用adam

optimizer作为优化器,这是由于该优化器具有动量以及自适应学习率的优势。
[0059]
(5)对步骤(4)更新后的冰毒成瘾者检测网络模型进行迭代训练,直到该冰毒成瘾者检测网络模型的损失函数达到最小为止;
[0060]
冰毒成瘾者检测网络模型的损失函数l为:
[0061][0062]
其中n表示训练集的样本总数(在本实施方式中,其为282655),k表示训练集中类别的数量(在本实施方式中,其为2),t
i,k
表示第k类第i个训练样本输入冰毒成瘾者检测网络模型后的预测结果,y
i,k
表示第k类第i 个训练样本对应的真实结果,k∈[1,k],λ表示正则化程度,其取值为0.01,w
i,k
表示第k类第i个训练样本输入冰毒成瘾者检测网络模型时的权重参数,其随着cnn冰毒成瘾者检测网络模型的训练自行变化。
[0063]
(6)使用步骤(3)得到的测试集对迭代训练后的冰毒成瘾者检测网络模型进行迭代验证,直到得到的分类精度达到最优为止,从而得到训练好的冰毒成瘾者检测网络模型。
[0064]
如图2所示,本发明中的冰毒成瘾者检测网络模型采用卷积神经网络 (convolutional neural network,简称cnn),其具体结构如下:
[0065]
第一层是输入层,其输入大小为300
×
62的脑电图信号;
[0066]
第二层是一维卷积层,其卷积核大小为1
×
100,卷积核个数为64,其输入为输入层的300
×
62的脑电信号,其输出维度为201
×
64。
[0067]
第三层是最大池化层,其步距为2,其输入维度为201
×
64,其输出维度为100
×
64。
[0068]
第四层是卷积层,其卷积核大小为1
×
32,卷积核个数为128,其输入维度为100
×
64,其输出维度为69
×
128。
[0069]
第五层是最大池化层,其步距为2,其输入维度为69
×
128,其输出维度为34
×
128。
[0070]
第六层是卷积层,其卷积核大小为1
×
32,卷积核个数为256,其输入维度为34
×
128,其输出维度为3
×
256。
[0071]
第七层是最大池化层,其步距为2,其输入维度为3
×
256,其输出维度为1
×
256。
[0072]
第八层是dropout层,其比率为0.3,其输出维度为1
×
256。
[0073]
第九层是全连接层,其输入维度为1
×
256,其输出维度为1
×
2。
[0074]
实验结果
[0075]
实验进行了70次标准试次,15次成瘾偏差试次。实验中,采用的刺激为视觉刺激,被试人员在电脑屏幕前观察图片,并迅速做出反应。其中标准刺激图片为70张篮球图片,记为s1,45张冰毒相关图片,记为s2。
[0076]
本发明旨在识别数据是来源于成瘾被试还是正常被试,将训练集分为 s1,s2两种。预测集随机选择。由于一次运算具有偶然性,又考虑到运算的速度,本发明选择五重交叉验证,对五种可能训练集和两种可能预测集分别测试,结果如下。
[0077]
表1预测集随机选择交叉验证结果
[0078][0079]
表1的结果表明预测结果较好,然而根据实际情况,本发明需要以被试人数划分数据集,将五分之一的被试所有数据作为预测集,剩余被试的数据作为训练集,进行五重交叉验证,循环五次。结果如下:
[0080]
表2按被试人数划分交叉验证结果
[0081][0082]
如表2中所示,按被试人数划分预测集的正确率普遍低于随机选择的正确率。这是因为随机选择数据作为预测集,训练集中会包含该被试的其他数据,同一被试的脑电波形是相似的,所以预测的准确率更高。按照被试人数划分数据,只能依靠其他被试的数据建立模型,预测正确率自然偏低。
[0083]
为了提高冰毒成瘾者检测网络模型的性能,本发明将训练数据进行了扩增。如201号被试中,s1有206个数据,记为a1,a2,a3

a206,s2有 44个数据,记为b1,b2,b3

b44。取a1

b1,a1

b2

a1

b44,a2

b1,a2
‑ꢀ
b2

a2

b44等插值作为新的输入特征。s1

s2差值过后,数据总数为353319 个,数据格式为mat格式。比三种刺激的总数11864扩大了近三十倍。在扩充后的数据上进行五重交叉验证,结果如表3所示。
[0084]
表3扩增数据后交叉验证结果
[0085][0086]
从表3中可以观察到,数据扩增的方法对提高争取率是有效的,模型的准确率进一步得到了提高。今后,可以继续完善数据集,增加被试的样本数,采集更多数据作为训练集。
[0087]
本发明利用成瘾被试与正常被试在面对刺激时脑电波形不同的特征,完成成瘾与正常被试的脑电数据的二分类问题。在脑电数据处理时,首先需要考虑电脑相关配置的型号与功能。
[0088]
表4硬件配置
[0089][0090]
本发明选择的电脑内存大小和显卡型号基本可以实现项目数据运算的要求,运算快速,运行流畅。
[0091]
表5交叉验证运行时间
[0092][0093]
表5可知,按被试人数划分训练集与预测集时,五重交叉验证时间最短的为s3刺激下的数据训练,运行一次需要的时间为370.565s。耗时最长的为差值运算s1

s2的数据运算。这是由于s1

s2差值运算下扩充的数据量最大,所以耗时长。但总体看来,模型的运算时间都在可以接受的范围内,该模型是可行的。
[0094]
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献