一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种针对无标签表格数据的深度异常检测方法及电子设备

2023-02-15 15:33:18 来源:中国专利 TAG:

技术特征:
1.一种针对无标签表格数据的深度异常检测方法,其特征在于,包括以下步骤:s1、构造表格的异常数据样本,将构造的异常数据样本与表格的正常数据样本合并为训练集;s2、通过在特征空间中检索各个训练集中数据样本之间的欧几里得距离,将表格结构数据转化为图结构数据,并获取对应的邻接矩阵;s3、将邻接矩阵作为训练数据对深度图自编码器进行训练,得到训练后的深度图自编码器;s4、采用训练后的深度图自编码器对目标表格的数据样本进行检测,实现无标签表格数据的深度异常检测。2.根据权利要求1所述的针对无标签表格数据的深度异常检测方法,其特征在于,步骤s1中构造表格的异常数据样本的具体方法为:通过特征子空间施加微小扰动和特征子空间均匀分布构造表格的异常数据样本。3.根据权利要求2所述的针对无标签表格数据的深度异常检测方法,其特征在于,通过特征子空间施加微小扰动的具体方法为:获取正常数据样本集x,并根据公式:对正常数据样本集x中的样本x进行归一化,得到归一化后的样本x'及归一化后的样本集x';其中x
min
为正常数据样本集x中的最小值;x
max
为正常数据样本集x中的最大值;根据公式:x
negative
=x' m
·
εz对归一化后的样本集x'进行扰动,得到异常数据样本集x
negative
;其中m为一个由0和1组成的d维向量,当m中元素在某维度上取值为0时,表示不施加扰动,取值为1时表示施加扰动;z为概率密度服从标准正态分布的高斯白噪声;ε为常数。4.根据权利要求1所述的针对无标签表格数据的深度异常检测方法,其特征在于,步骤s2的具体方法包括以下子步骤:s2-1、将训练集中每一个数据样本看作图上的一个节点,检索各个节点之间的欧几里得距离;s2-2、将与每个节点距离最近的k个数据样本作为该节点的邻居;s2-3、利用节点与邻居以及对应的欧几里得距离建立邻接矩阵形式的图结构数据;其中数据样本为图结构数据中的节点,每个节点通过k条边连接至其k个邻居;s2-4、根据公式:获取图结构数据的邻接矩阵e;其中e
ij
表示数据样本x
i
为节
点时对应的边特征;x
j
为数据样本x
i
的邻居;n
i
为数据样本x
i
的邻居集合;dist(x
i
,x
j
)表示x
i
和x
j
之间的欧几里得距离。5.根据权利要求4所述的针对无标签表格数据的深度异常检测方法,其特征在于,步骤s3的具体方法为:构建深度图自编码器,定义损失函数,以最小化损失函数为目标,使用adam优化器进行优化,设置adam优化器的学习率为0.001,权重衰减为0.1,将图结构数据作为训练数据对深度图自编码器进行训练,得到训练后的深度图自编码器。6.根据权利要求5所述的针对无标签表格数据的深度异常检测方法,其特征在于,步骤s3中深度图自编码器包括消息传递模块、聚合模块、更新模块、属性解码器和标签解码器,其中:消息传递模块,用于将边特征e
ij
作为从源节点x
j
沿边(j,x)传递到节点x
i
的信息;聚合模块,用于通过深度神经网络产生在数据集上具备学习适应能力的聚合函数,具体过程为:根据公式:e
(i)
=[e
1,i
,e
2,i
,...,e
j,i
,...,e
k,i
]将节点x
i
的邻居传递给节点x
i
的信息拼接在一起形成k维输入向量e
(i)
;e
j,i
为节点x
i
的邻居x
j
传递给节点x
i
的信息,即e
ij
;根据公式:获取节点x
i
对应的低维嵌入表示其中θ表示深度神经网络f的权重参数;深度神经网络f的第l层神经元的输出表达式为:a
l
=σ(h
l
)=σ(w
l
a
l-1
b
l
),a
l
为第l层神经元的输出,a
l-1
为第l-1层神经元的输出,a1=e(i);h
l
为第l层神经元的线性表示;σ(
·
)为第l层神经元的激活函数;w
l
为第l-1层神经元到第l层神经元的系数矩阵;b
l
为第l层神经元的偏置矩阵;更新模块,用于将聚合模块的输出结果更新当前节点的表示,表达式为:其中h为更新模块的输出;为节点x
n
对应的低维嵌入表示;v为低维嵌入表示的维数;h
nv
表示中的第v维数据;属性解码器,用于根据更新模块的输出进行邻接矩阵重构,其解码表达式为:其中为重构的邻接矩阵;(
·
)
t
表示矩阵的转置;标签解码器,用于重构出原始的节点标签,其解码表达式为:
其中为标签解码结果;w为系数矩阵;b为偏置矩阵;σ
*
(
·
)为激活函数。7.根据权利要求6所述的针对无标签表格数据的深度异常检测方法,其特征在于,损失函数的表达式为:其中loss为深度图自编码器的损失值,α为加权系数;||
·
||2为矩阵二范数,表示属性重构误差;bceloss(
·
)为二分类交叉熵计算函数,表示采用二分类交叉熵计算的标签重构误差;l
*
为真实标签向量。8.根据权利要求7所述的针对无标签表格数据的深度异常检测方法,其特征在于,步骤s4的具体方法包括以下子步骤:s4-1、采用与步骤s1和步骤s2相同的方法获取目标表格的数据样本m对应的邻接矩阵e(m);s4-2、将目标表格的数据样本m对应的邻接矩阵e(m)作为训练后的深度图自编码器的输入,得到目标表格的数据样本m对应的重构的邻接矩阵和标签解码结果s4-3、根据公式:获取目标表格的数据样本m的异常分数score
m
,完成无标签表格数据的深度异常检测;其中β为加权系数;异常分数score
m
越高表示目标表格的数据样本m异常的概率越大。9.一种电子设备,其特征在于,包括:存储器,存储有可执行指令;以及处理器,被配置为执行存储器中可执行指令以实现权利要求1~8中任一项所述的一种针对无标签表格数据的深度异常检测方法。

技术总结
本发明公开了一种针对无标签表格数据的深度异常检测方法及电子设备,包括以下步骤:构造表格的异常数据样本,将构造的异常数据样本与表格的正常数据样本合并为训练集;将表格结构数据转化为图结构数据,并获取对应的邻接矩阵;将邻接矩阵作为训练数据对深度图自编码器进行训练,得到训练后的深度图自编码器;采用训练后的深度图自编码器对目标表格的数据样本进行检测,实现无标签表格数据的深度异常检测。本发明对不同数据集具有适用性高、识别精度高、充分利用数据信息的优点。本发明解决了传统异常检测方法对于不同数据集的适应性较差的问题,在实际使用中,减小了由于人为设定阈值等参数带来的人为误差,并且减小了工作量和开销。量和开销。量和开销。


技术研发人员:彭敏 江柳池 刘震
受保护的技术使用者:电子科技大学
技术研发日:2022.11.09
技术公布日:2023/2/3
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献