一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于神经网络模型的COPD诊断信息敏感数据挖掘方法与流程

2021-10-27 21:53:00 来源:中国专利 TAG:神经网络 数据挖掘 诊断 模型 敏感

技术特征:
1.基于神经网络模型的copd诊断信息敏感数据挖掘方法,其特征在于,所述方法包括以下步骤:s1、采用无监督进步式学习算法对copd诊断信息进行清洗,消除重复记录的数据;s2、通过支持向量机构建立copd诊断信息敏感数据挖掘模型;s3、神经网络模型对copd诊断信息敏感数据挖掘模型进行自动求解和参数自动调优,从而实现copd诊断信息敏感数据自动挖掘。2.根据权利要求1所述的基于神经网络模型的copd诊断信息敏感数据挖掘方法,其特征在于,步骤s1中,对数据的清洗包括以下步骤:得到原始数据后,先对数据集进行预处理,再选择合适的属性;找到合适的聚类算法和分类方法再去分组记录;采用数据挖掘技术进行相似度的计算;采用无监督步进式学习算法对诊断信息中相似的数据进行清理。3.根据权利要求2所述的基于神经网络模型的copd诊断信息敏感数据挖掘方法,其特征在于,所述无监督进步式学习算法采用竞争学习,所述竞争学习由互相竞争的中性细胞组成,其所述中性细胞的应用规则描述为:e(n)=a/2

φ(w
t
x)
ꢀꢀꢀ
(1)式中,e(.)表示期望值,n描述的是次数;a表示遗忘系数,通常情况下大于等于零,φ(
·
)表示可微函数,x描述的是输入样本向量参数,w描述的是权重向量参数,t描述的是向量值;中性细胞的输出为:y=dφ(υ)/dυ=f(υ)
ꢀꢀꢀ
(2)式中:υ=w
t
x表示中性细胞的活性系数,x描述的是输入样本向量参数,w描述的是权重向量参数;t描述的是向量值,在梯度的下降法则基础上得出一种持续学习的规则为:

u
ω
e(ω)=dω/dυ
ꢀꢀꢀ
(3)式中:u表示一种学习速度系数,并大于零,ω表示权值,所以梯度为:式中:ω表示权值;从上述方程函数中可知,中性细胞的学习规则如下:dω/dt=u[yx

aω]
ꢀꢀꢀ
(5)式中:u表示一种学习速度系数,并大于零,a表示遗忘系数,通常情况下大于等于零,x描述的是输入样本向量参数,y描述的是变量值,ω表示权值;离散的学习规则为:ω(t 1)=u[y(t 1)x(t 1)

aω(t)] ω(t)
ꢀꢀꢀ
(6)式中:u表示一种学习速度系数,并大于零,a表示遗忘系数,通常情况下大于等于零,x描述的是输入样本向量参数,y描述的是变量值,t描述的是统计量,ω表示权值;若y是奖惩系数,a等于1,是遗忘系数,i

th中性细胞在被激活情况下的学习规则为:ω
i
(t 1)=uy
i
[x(t 1)

ω
i
(t)] ω
i
(t)
ꢀꢀꢀ
(7)
其中:式中:u表示一种学习速度系数,并大于零,x描述的是输入样本向量参数,ω
i
表示权重系数,y
i
表示第i个变量值,d
i
表示i

th中性细胞的相似值,β是惩罚系数,θ代表相似度的门槛,并且:式中:d
p
表示相似值,p表示样本率,ω2表示权值2,y
i
是向量y的i

th元素,x
i
是向量x的i

th元素,i=1,...,l。4.根据权利要求3所述的基于神经网络模型的copd诊断信息敏感数据挖掘方法,其特征在于,利用所述中性细胞的应用规则对copd诊断信息进行清洗的过程:在加第一个中性细胞ω0前,需要接收第一个copd诊断信息样本向量x,同时,将其初始化;学习若已经结束,则转到第(5)步,学习若未结束,则从copd诊断信息样本空间接收copd诊断信息样本向量,接着代入第(9)步计算相似度的值;找出胜利的中性细胞在竞争力能力的基础上判断,若d
i
大于0,添加一个x作为新的中性细胞,接着返回第(3)步;根据等式(8)计算惩罚系数;在等式(7)中更新权重,然后返回第(3)步;通过上述过程获得copd诊断信息之间的相识度,去除相识度较大的copd诊断信息,实现copd诊断信息的清洗。5.根据权利要求1所述的基于神经网络模型的copd诊断信息敏感数据挖掘方法,其特征在于,在步骤2中,利用支持向量机建立最优分类函数,实现对数据的初步划分;最优分类函数建立包括以下步骤:设copd诊断信息样本集为(x
i
,y
i
),i=1,

,n,,x
i
∈r
d
为选择出的有效特征组合,y
i
∈{ 1,

1}为类别标号,则线性判别函数可写为:式中:b表示系数,表示平均权值,表示样本均值;分类面方程如下:为了使判别函数对两种copd诊断信息样本中的情况全部满足:假设向量集中的向量满足:y
i
(w
·
x b)≥1i=1,

,n
ꢀꢀꢀ
(13)式中:y
i
是向量y的i

th元素,w表示权值,x表示样本值,b表示系数,l表示下限,n表示样本数;
由于面h1与最优分类面h之间的距离如下:式中:b表示系数,表示平均权值,表示样本均值;根据上述总结出求最优分类面就是求下列的最优化问题:因此最优分类函数表达式:式中:b表示系数,表示平均权值,表示样本均值,s表示样本标准差,t表示检验的统计量。6.根据权利要求5所述的基于神经网络模型的copd诊断信息敏感数据挖掘方法,其特征在于,构造lagrange函数表达式为:式中:λ代表lagrange系数,b表示回归系数,表示平均权值,表示偏差系数均值,表示样本均值,最优分类函数表达式(15)中,分别对和b求偏导并使其为0,得到如下:和b求偏导并使其为0,得到如下:如果最优解得到的是则最优分类函数可表示为:式中:sgn()表示符号函数;而当非支持向量的所以仅对支持向量做以上运算即可;求b
*
的值只需将代入上式(18)中即可;对于未知copd诊断信息样本来说,想要判定其分类情况,代入式(19)运算即可。7.根据权利要求5所述的基于神经网络模型的copd诊断信息敏感数据挖掘方法,其特征在于,当线性不可分和事先不清楚是否线性可分的情况下,部分copd诊断信息样本在不满足式(14)时,引进一个松弛项ζ
i
≥0,引进ζ
i
≥0后得到:当ζ
i
>0划分出现错误时,其最优分类函数表达式如下:
式中:c代表可调参数,ζ
i
表示第i个松弛项,b表示回归系数,表示平均权值,表示样本均值,s表示标准层,t表示统计量。8.根据权利要求7所述的基于神经网络模型的copd诊断信息敏感数据挖掘方法,其特征在于,构造lagrange函数如下:式中:λ
i
、ρ
i
代表lagrange乘子,c代表可调参数,ζ
i
表示第i个松弛项,b表示系数,表示平均权值,表示样本均值;根据kuhn

tucker条件,该优化问题的解满足:由此可知数据自动挖掘问题就是要构建广义最优分类面的问题:式中:λ
i
表示第i个松弛项,λ
j
表示第j个松弛项,b表示系数,w表示平均权值,表示样本均值;当c≥λ
i
≥0,ζ
i
=0,将满足c≥λ
i
≥0的某λ
i
代入得到b的值。9.根据权利要求1所述的基于神经网络模型的copd诊断信息敏感数据挖掘方法,其特征在于,步骤3中,神经网络模型在网络的拓扑结构和运行方式的基础上分为前馈多层式网络模型、反馈递归式网络模型和随机型网络模型;所述前馈多层式网络中的bp网络包括输入层、隐含层和输出层,其所述bp网络采用最小均方差的算法,函数自动求解过程如下:bp网络每个处理单元之间的关系为非线性输入输出,当每层都有n个处理单元,则输出函数为:f(x)=1/1 e

x
ꢀꢀꢀ
(25)
提取copd诊断信息作为数据训练集,根据症状表现特征将训练集分为h个copd诊断信息样本模式对(x
k
y
k
)(k=1,2...,h),net
pj
记为是对第p个样本单元j的输入总和,o
pj
记为单元的输出,故:net
pj
=∑ω
pj
o
pj
ꢀꢀꢀ
(26)式中:ω
pj
表示第p个样本单元j的输入值;对每个输入模式p来说,如果随意设置初始权值就会导致网络的实际输入与期望输出之间出现误差,网络误差值如下:e
p
=1/2∑(d
pj

o
pj
)2ꢀꢀꢀ
(28)e=∑e
p
ꢀꢀꢀ
(29)在式中,d
pj
代表输出单元j的期望输出,第p个输入模式,o
pj
记为单元的输出;基于上述网络误差值,其误差变化率的函数公式如下:在式中δ
pj
代表第p个输入模式对第j个单元的copd诊断信息分类的误差变化率,其中η1代表输出层学习率,η2代表隐含层学习率。10.根据权利要求9所述的基于神经网络模型的copd诊断信息敏感数据挖掘方法,其特征在于,bp网络的学习过程中可自动修改分类学习因子,实现最优分界函数自动求解,具体步骤如下:当o
pj
为隐单元输出时:式中:net
pj
记为是对第p个样本单元j的输入总和,o
pj
记为单元的输出,e
p
记为网络误差值;将隐单元输出结果作为输入,输入输出层中,自动获得函数的最优解,实现copd诊断信息敏感数据的自动挖掘:式中:d
pj
代表输出单元j的期望输出,第p个输入模式,net
pj
记为是对第p个样本单元j的输入总和,o
pj
记为单元的输出,e
p
记为网络误差值。

技术总结
本发明涉及数据挖掘技术领域,尤其涉及基于神经网络模型的COPD诊断信息敏感数据挖掘方法,采用无监督进步式学习算法对COPD诊断信息进行清洗,消除重复记录的数据,通过支持向量机构建立COPD诊断信息敏感数据挖掘模型,神经网络模型对COPD诊断信息敏感数据挖掘模型进行自动求解和参数自动调优,从而实现COPD诊断信息敏感数据自动挖掘。该方法通过无监督进步式的学习算法对COPD诊断信息敏感数据进行清洗,以神经网络模型优化支持向量机模型,实现最优分界函数自动求解和参数自动调优,可以自动地记录、处理未标记的、大量的数据记录,更加有效地发挥数据挖掘过程中的潜在价值,提高了查全率,缩短了消耗的时间,提高了错误数据的检测率。的检测率。的检测率。


技术研发人员:卢剑伟
受保护的技术使用者:常州工业职业技术学院
技术研发日:2021.07.22
技术公布日:2021/10/26
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜