一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于混合深度学习的医疗设备故障不良事件自动识别方法

2022-12-13 20:46:46 来源:中国专利 TAG:


1.本发明涉及医疗设备故障技术领域,更具体的说是涉及一种基于混合深度学习的医疗设备故障不良事件自动识别方法。


背景技术:

2.医疗器械不良事件是指获准注册或已备案、质量合格的医疗器械,在正常使用情况下发生的,导致或可能导致人体伤害的各种有害事件。医疗器械一般分为医疗设备和医用耗材,医疗设备不良事件通常表现为设备故障,需要不良事件监测人员结合故障表现和其他信息,才能区分普通设备故障与不良事件,这是一个相当困难的工作。由于缺乏强制性要求,监测人员普遍缺乏工作积极性,同时各级医疗机构监测人员技术水平的差异也制约着监测工作的顺利开展。
3.目前尚未有针对于医疗设备故障类不良事件的自动识别技术,与之类似的药品及医用耗材不良事件,一般是将事件描述信息与不良事件关键词汇进行匹配,根据匹配结果进行直接判断,该方法不能直接应用在医疗设备故障类不良事件识别领域。
4.因此,如何全自动判断医疗设备故障是否属于不良事件,降低对监测人员技术水平的依赖,提高识别准确度是本领域技术人员亟需解决的技术问题。


技术实现要素:

5.有鉴于此,本发明提供了一种基于混合深度学习的医疗设备故障不良事件自动识别方法,使用人工智能技术替代人工,识别医疗设备故障是否属于不良事件,降低对监测人员技术水平的依赖,提高不良事件的上报率及识别的准确率。
6.为了实现上述目的,本发明提供如下技术方案:
7.一种基于混合深度学习的医疗设备故障不良事件自动识别方法,包括以下步骤:
8.获取监测人员上报的设备故障描述信息,根据所述设备故障描述信息关联设备的基础属性信息;
9.对所述设备故障描述信息的文本进行处理,并通过获取的故障描述归一化模型得到所述设备故障描述信息的归一化标签;
10.将所述设备的基础属性信息与归一化标签进行组合,生成标准化的特征向量集;
11.通过获取的不良事件识别模型对所述特征向量集进行处理,判别设备故障是否属于不良事件。
12.上述技术方案达到的技术效果为:使用人工智能技术替代人工,可根据医疗设备故障描述信息及设备信息全自动判断该故障是否属于不良事件,降低对监测人员技术水平的依赖,提高不良事件的上报率及识别的准确率。
13.可选的,所述设备的基础属性信息包括设备品牌、型号、产地、类型、注册年限、设备使用地点、使用年限、故障原因、故障类型、故障发生地点、故障表现、同故障发生次数、故障修复方法、故障分析等,这些属性能转换为连续的或者离散的数值型变量,最终形成一组
标准化的特征向量集。
14.可选的,对所述设备故障描述信息的文本进行处理,具体包括以下步骤:
15.将所述设备故障描述信息保存为一个txt文件,每个故障描述文件对应一个故障归一化类别;
16.将txt文件中的文本序列切分为单词,并对处理后的文本信息进行归一化,将归一化的故障标签转换为one-hot表示向量,并将编码完成的数据划分为训练集和验证集;
17.将所述单词转化为向量表示,将每个词都映射到一个较短的词向量上,训练得到嵌入空间并存储到文件中;
18.对嵌入空间文件进行解析,构建将词语映射为所述向量表示的索引及可加载到嵌入层中的嵌入矩阵。
19.可选的,所述故障描述归一化模型的获取包括以下步骤:
20.配置深度学习分类模型,所述深度学习分类模型包括输入层、中间层和输出层;
21.将所述嵌入矩阵加载到嵌入层中,所述嵌入层中只有一个权重矩阵,是一个二维的浮点数矩阵,其中每个元素i是与索引i相关联的词向量;
22.对所述嵌入层进行冻结,在模型训练期间不更新所述嵌入层保存的信息,避免丢失;
23.将所述训练集和验证集输入深度学习分类模型中进行模型训练,直至损失函数不再下降或预设时间内精确度不再上升时停止训练,保存训练好的模型作为故障描述归一化模型。
24.可选的,在所述故障描述归一化模型中,隐藏层激活函数使用relu,输出层激活函数使用softmax,损失函数采用分类交叉熵categorical_crossentropy;激活函数用于将来自节点的加权输入转换为所述加权输入的节点或输出的激活;
25.其中,relu是一个分段线性函数,若输入为正则直接输出,否则输出为0,激活函数公式表示为:
[0026][0027]
softmax函数对输出值进行归一化操作,将所述输出值转化为概率,所有概率值的和为1;softmax激活函数公式表示为:
[0028][0029]
损失函数用于估量模型的预测值与真实值之间的差距,它是一个非负实值函数,损失函数越小,模型的鲁棒性越好;交叉熵用于评估当前训练得到的概率分布与真实分布的差异情况,它刻画的是实际输出(概率)与期望输出(概率)的距离,也就是交叉熵的值越小,两个概率分布就越接近;categorical_crossentropy损失函数的公式表示为:
[0030][0031]
式中,yk表示第k个神经元的输出,ak表示输入信号,exp表示指数函数,n表示输出
层神经元的个数,exp(ak)表示输入信号ak的指数函数,表示所有输入信号的指数函数的和;categorical_crossentropy损失函数通常搭配softmax函数一起应用,适用于本文所涉及的单标签多分类问题,yi表示第i个类别的真实值,取值为0或1;对应于softmax的输出yk,outputsize对应于softmax函数中的输出层神经元个数n。
[0032]
可选的,所述不良事件识别模型的获取包括以下步骤:
[0033]
通过所述标准化的特征向量集构建样本数据库,所述样本数据库中包含不良事件和非不良事件;
[0034]
将所述样本数据库中的特征向量及与所述特征向量对应的是否属于不良事件进行组合,形成训练数据集并将所述训练数据集进行数据的标准化,避免有的数据特别大而有的数据特别小,降低计算难度;
[0035]
选择支持向量机核函数,将数据映射到高维空间;支持向量机首先在低维空间中完成计算,然后通过核函数将输入空间映射到高维特征空间,最终在高维空间中构造出最优分离超平面;
[0036]
采用交叉验证、网格遍历的方法获取最佳参数对,避免由于数据集划分不合理而导致的过拟合问题;
[0037]
根据选定的核函数及获取的最佳参数对,对所述样本数据库中的特征向量进行计算,构造样本可分的特征空间,完成支持向量机的训练,得到最终模型并保存作为不良事件识别模型。
[0038]
可选的,所述方法还包括:
[0039]
当存在数据缺失情况时,从所述样本数据库中提取既往故障信息直接进行缺失项填充或通过包括粗糙集理论、对抗神经网络在内的智能数据补全方法进行智能填充。
[0040]
可选的,所述方法还包括:
[0041]
若判别结果不存在于所述样本数据库中,则对所述不良事件识别模型进行更新,并将最新的不良事件特征添加到所述样本数据库中。
[0042]
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于混合深度学习的医疗设备故障不良事件自动识别方法,具有以下有益效果:
[0043]
(1)采用混合深度学习算法,综合了深度学习方法在自然语言处理方面的优势和传统机器学习方法在故障诊断中的优势,以人工智能技术替代人工,可克服对监测人员技术水平的依赖,提高监测的准确率,且机器学习技术对于既往不良事件数据库中尚未出现的新型不良事件具备一定的识别能力;
[0044]
(2)本方案适用于医疗设备故障类不良事件的自动识别,设备种类不限,可根据医疗设备故障描述信息及设备信息全自动判断该故障是否属于不良事件,提高不良事件的上报率及识别的准确率;
[0045]
(3)此外,对于发现的新型不良事件,经过专家判断后,可将特征信息反馈到训练数据中,使模型具有更好的学习能力和泛化能力;在各级医疗机构中,可有效克服技术人员不足的困难,对于开展医疗设备不良事件监测工作具有重要的意义。
附图说明
[0046]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0047]
图1为基于混合深度学习的医疗设备故障不良事件自动识别方法的流程图;
[0048]
图2为模型训练流程示意图;
[0049]
图3为识别流程示意图;
[0050]
图4为word2vec中的算法示意图;
[0051]
图5为深度学习分类模型的结构示意图。
具体实施方式
[0052]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0053]
本发明实施例公开了一种基于混合深度学习的医疗设备故障不良事件自动识别方法,如图1所示,包括以下步骤:
[0054]
获取监测人员上报的设备故障描述信息,根据设备故障描述信息关联设备的基础属性信息;
[0055]
对设备故障描述信息的文本进行处理,并通过获取的故障描述归一化模型得到所述设备故障描述信息的归一化标签;
[0056]
将所述设备的基础属性信息与归一化标签进行组合,生成标准化的特征向量集;
[0057]
通过获取的不良事件识别模型对所述特征向量集进行处理,判别设备故障是否属于不良事件,参见图3。
[0058]
在本实施例中使用的既往不良事件数据可以来自于医疗机构自主收集的不良事件信息,也可以是业务主管部门组织专家统一制定的数据库。监测人员可在系统中填报设备故障描述信息,同时系统也会显示医疗设备的基础信息。从故障信息和医疗器械基础信息中提取设备的基础属性,如设备品牌、型号、产地、类型、注册年限、设备使用地点、使用年限、故障原因、故障类型、故障发生地点、故障表现、同故障发生次数、故障修复方法、故障分析等,以上属性均可转换为连续的或者离散的数值型变量,最终形成一组标准化的特征向量集。基于上述的故障归一化标签和标准的特征向量集,分别使用深度学习算法和支持向量机训练出两个模型:故障描述归一化模型和不良事件识别模型,具体如图2所示。
[0059]
在获取故障描述归一化模型时,首先对故障描述的文本信息进行向量化,将文本转换为深度学习模型可以处理的数值张量,使用深度学习算法对数值张量进行处理,大致方法可概括如下:领域专家以人工方式对设备故障描述进行归一化,获取多对一的故障描述与归一化标签的对应关系;将故障描述的文本信息分割为单词;将单词转换为向量,从而将故障文本信息转换为唯一的向量矩阵;将归一化的故障标签转换为one-hot表示向量;配置深度学习分类模型;将向量矩阵和表示向量作为特征输入;对向量矩阵进行分级加权计
算;计算验证集中预测值和真实值的损失函数;利用优化函数降低模型的损失值,得到最终的分类模型。
[0060]
在本实施例中,对以上方法的具体实施步骤进行详细阐述,具体如下:
[0061]
一、故障描述归一化模型
[0062]
(1)数据获取
[0063]
将获取的设备故障描述信息保存为一个txt文件,每个故障描述文件对应一个故障归一化类别。
[0064]
(2)数据分词
[0065]
2a.使用jieba分词工具将txt文件中的文本序列进行切分,将每一条文本信息分解成为单独的词语表示;
[0066]
2b.通过中文停用词表将文本信息中的停用词去掉,词语之间用空格分隔,处理后的文本保存在新的txt文本中;
[0067]
jieba是一个在中文自然语言处理中用的最多的工具包之一,jieba提供了三种分词模式:

精确模式:在该模式下,jieba会将句子进行最精确的划分;

全模式:把句子中所有可以成词的词语都扫描出来,优点在于该模式非常快,但不能有效解决歧义的问题;

搜索引擎模式:在精确模式的基础上,对长词进行再次划分,该模式适合用于搜索引擎构建索引的分词。
[0068]
jieba分词算法使用了基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能生成词情况所构成的有向无环图(dag),采用了动态规划查找最大概率路径,找出基于词频的最大切分组合,对于未登录词,采用了基于成语能力的hmm模型。本实施例中采用精确模式。
[0069]
(3)数据标签化
[0070]
3a.将(2)中处理后的文本信息转换成故障描述列表表示,列表中的每个字符对应一条故障描述语句,同时将故障描述语句对应的故障归一化描述转换成标签列表;
[0071]
3b.使用one-hot编码将故障描述列表和标签列表转换为整数索引组成的列表,在编码过程中将每条故障描述语句截断为词语数量相等的长度(长度不够的补0,超出范围的截断),在此过程中同时指定使用数据及词语的数量(如只考虑列表中出现频次前m的词语,m位之后的词语忽略);
[0072]
3c.将编码完成的数据打乱次序,并划分为训练集和验证集。
[0073]
(4)生成嵌入向量
[0074]
使用word2vec将(2)中分词后的所有词语转化为向量表示,将每个词都映射到一个较短的词向量上来,训练得到一个嵌入空间,词向量的维度可以在训练时指定,将生成的嵌入空间存储到文件中;word2vec是一个过程(技术),在这个过程中,将文本作为神经网络的训练数据,这个神经网络的输出向量被称作嵌入,这些嵌入(向量)在训练后会包含单词的语义信息。这个过程做的就是从每个单词由多个维度的空间嵌入到具有低得多维度的连续向量空间,这些向量就可以作为后续任务中神经网络模型的输入。
[0075]
word2vec是一种将词转为向量的方法,其包含两种算法,分别是skip-gram和cbow,它们最大的区别是skip-gram是通过中心词去预测中心词周围的词,而cbow是通过周围的词去预测中心词。如图4所示,w(t)表示当前单词,w(t-i)表示前面的单词,w(t i)表示
后面的单词,简单来说,cbow就是使用周围的单词来预测当前单词,而skip-gram模型利用当前单词尝试预测周围大小为i的窗口中的单词。在本实施例中使用的是skip-gram算法。
[0076]
(5)对嵌入进行预处理
[0077]
5a.对(4)生成的嵌入空间文件进行解析,构建一个将词语映射为其向量表示(数值向量)的索引;
[0078]
5b.构建一个可加载到嵌入层(embedding)中的嵌入矩阵,嵌入矩阵必须是一个形状为(m,n)的矩阵,对于词语索引(在(3)中构建)中索引为i的词语,这个矩阵的元素i就是这个词语对应的n维向量。嵌入索引中找不到的词语(即词语频次在m位之后的词语),其嵌入向量全为0。
[0079]
词语索引

embedding

对应的词语向量
[0080]
(6)训练模型
[0081]
6a.配置深度学习分类模型的层,参见图5,深度学习分类模型包括输入层(input layer)、中间层或隐藏层(hidden layer)、输出层(output layer);
[0082]
6b.将(5)中准备好的嵌入矩阵加载到嵌入层(embedding)中,嵌入层中只有一个权重矩阵,是一个二维的浮点数矩阵,其中每个元素i是与索引i相关联的词向量;
[0083]
6c.对嵌入层进行冻结,因为embedding层已经经过了预训练,在模型训练期间不应该更新预训练过的部分,避免丢失它们保存的信息;
[0084]
6d.将3c中的训练集和验证集输入深度学习分类模型中进行模型训练,并保存训练好的模型。验证集的作用是在模型训练完毕后,使用验证集对模型的准确性进行验证,根据结果再对模型参数进行调整,进一步提高模型的精确度。模型训练的停止条件为使用验证集验证时损失函数(loss)不再下降,或者预设时间内精确度(accuracy)不再上升,同时训练过程中限定轮数,避免长时间训练无法结束。
[0085]
在本实施例中,因为有多个类别(故障归一化类型),所以这属于一个多分类问题,又因为每条故障描述语句只能划分到一个类别中,所以这属于一个多分类、单标签的任务。因此,在该模型中,隐藏层激活函数使用relu,输出层激活函数使用softmax,损失函数采用分类交叉熵categorical_crossentropy。
[0086]
其中,激活函数负责将来自节点的加权输入转换为所述加权输入的节点或输出的激活。relu是一个分段线性函数,若输入为正则将直接输出,否则输出为0,这种操作被称为单侧抑制。relu激活函数公式表示为:
[0087][0088]
softmax函数对输出值进行归一化操作,将所有输出值转化为概率,所有概率值的和为1;softmax激活函数公式表示为:
[0089][0090]
损失函数(loss function)用于估量模型的预测值与真实值之间的差距,它是一个非负实值函数,损失函数越小,模型的鲁棒性就越好;交叉熵用于评估当前训练得到的概率分布与真实分布的差异情况,它刻画的是实际输出(概率)与期望输出(概率)的距离,也
就是交叉熵的值越小,两个概率分布就越接近;categorical_crossentropy损失函数的公式表示为:
[0091][0092]
在softmax激活函数公式中,yk表示第k个神经元的输出,ak表示输入信号,exp表示指数函数,n表示输出层神经元的个数,exp(ak)表示输入信号ak的指数函数,表示所有输入信号的指数函数的和;
[0093]
categorical_crossentropy损失函数通常搭配softmax函数一起应用,适用于本文所涉及的单标签多分类问题,yi表示第i个类别的真实值,取值为0或1;对应于softmax的输出yk,outputsize对应于softmax函数中的输出层神经元个数n。
[0094]
二、不良事件识别模型
[0095]
通常,可以采用多种机器学习算法进行判别,如决策树、随机森林、人工神经网络等,在本实施例中采用支持向量机方法对特征向量进行判别。支持向量机(supportvectormachine),简称svm,它是一种二类分类模型,在深度学习出现之前,支持向量机被认为机器学习中近十几年最成功、表现最好的算法,目前在故障检测领域仍然具有广泛的应用。
[0096]
在本实施例中,具体实施过程如下:
[0097]
1.1通过标准化的特征向量集构建样本数据库,所述样本数据库中包含不良事件和非不良事件;
[0098]
1.2将样本数据库中的特征向量及该条数据信息对应的是否属于不良事件进行组合,形成训练数据集;
[0099]
1.3将所述训练数据集进行数据的标准化,避免有的数据特别大而有的数据特别小,降低计算难度;
[0100]
1.4选择支持向量机核函数,在处理非线性的情况中,svm选择一个核函数(kernel trick),将数据映射到高维空间。支持向量机首先在低维空间中完成计算,然后通过核函数将输入空间映射到高维特征空间,最终在高维空间中构造出最优分离超平面。在本实施例中采用较为通用的径向基核函数。
[0101]
1.5采用交叉验证、网格遍历的方法获取最佳参数对,包括径向基核函数的参数γ和运算过程中所用到的最佳错误惩罚参数(在运算过程中,设置错误惩罚参数,平衡支持向量的复杂度和误分类率这两者之间的关系)。
[0102]
采用交叉验证、网格遍历的方法获取径向基函数的最佳参数,将训练数据集分成k份,其中k-1份作为训练集,剩下一份作为测试集,交叉验证的精度就是在所有测试集上测试结果的平均值,精度最高的参数被确定为最佳参数。在本实施例中选用5倍交叉验证,本方案基于小规模数据集,采用交叉验证可以避免由于数据集划分不合理而导致的过拟合问题。
[0103]
1.6模型训练:支持向量机训练过程就是根据选定的核函数,使用交叉验证得到的最佳参数,对样本集的所有特征向量进行计算,构造一个使样本可分的特征空间,得到最终模型并保存。支持向量机的训练步骤可概述如下:用分类器将所有样本集的特征分类;根据选定的核函数分别计算每个分类器中每个特征向量的有关值;根据这些特征相关值计算协
方差矩阵空间;对这个协方差矩阵空间进行householder变换;计算特征系数,得到协方差矩阵以及其对应的超平面矩阵;获得模型参数。
[0104]
除此之外,若存在数据缺失情况,可以对数据进行补全。例如:从样本数据库中提取相近类型设备的既往故障信息,直接填充缺失项;也可以通过粗糙集理论、对抗神经网络等各种智能数据补全方法进行智能填充。
[0105]
在此基础上,还可以基于本方法设计一种基于云端的识别装置,模型训练过程均在云端实现,医疗机构的装置使用人员只需输入故障描述信息,同时关联调用故障设备基础信息,就可以直接利用该装置完成不良事件识别。
[0106]
此外,关于识别的结果,若判别结果不存在于样本数据库中,可以经过专家判别后人工添加到不良事件数据库中,由此更新识别系统;同时业务主管部门也可以在云端设计升级功能,对识别装置中的模型进行主动更新,将最新的不良事件特征添加到数据库中。
[0107]
本技术方案采用混合深度学习算法,综合了深度学习方法在自然语言处理方面的优势和传统机器学习方法在故障诊断中的优势,以人工智能技术替代人工,可克服对监测人员技术水平的依赖,提高监测的准确率,且机器学习技术对于既往不良事件数据库中尚未出现的新型不良事件具备一定的识别能力,可将特征信息反馈到训练数据中,使模型具有更好的学习能力和泛化能力。
[0108]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0109]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献