一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于知识图谱的设备故障诊断与维修知识推荐系统

2022-06-05 06:21:17 来源:中国专利 TAG:


1.本发明属于设备故障诊断技术领域,尤其涉及基于知识图谱的设备故障诊断与维修知识推荐系统。


背景技术:

2.设备健康管理中的智能故障诊断与设备维护是多学科、多部门参与的复杂动态过程,随着人工智能技术的迅速发展,故障维修系统的重心逐渐朝着诊断维护的智能化偏移,越来越多的智能维修平台与系统应用于生产实践。随着设备维护流程与诊断对象的复杂程度不断增加,尽管智能诊断领域已经积累了一些研究成果,提出了一些系统和测试原型,但在开放性、扩展性、实用性等诸多方面仍然不能满足智能诊断维护的应用需求,许多关键问题仍亟待深入研究。目前,智能故障诊断与维修系统面临的挑战主要有:
3.(1)亟需针对目前设备及数据的特点,结合诊断维护中对知识资源管理的需求,从管理学、计算机科学、可靠性等交叉学科的角度,提出基于知识的全过程智能设备健康管理和故障诊断模型。
4.目前存在的智能故障诊断和维修软件与系统主要集中于系统监测和故障出现后的诊断与维修,对整个系统的诊断模式、故障分析推荐、知识服务等方面的研究较少,且多从自动化、机械学科的角度入手,重点关注信号分析、状态监测传感器、监测仪表的设计应用和与监测传感器配套使用的状态监测与故障诊断支撑软件的开发,缺乏基于知识资源,利用管理学思想,针对设备健康管理全流程的智能系统的开发与设计。
5.①
目前存在的智能故障诊断与维修主要集中于系统当前的运行状态,重点关注故障出现后的诊断与维修,较少涉及故障发生前的预测与推理,且多从关联规则和案例推理的角度,缺乏基于知识资源,针对设备健康管理全流程的智能系统的开发与设计。
6.②
对于故障诊断方面的知识、经验、资源重用率较低,如何有效萃取、组织与优化利用诊断维护知识资源还有待深入研究。
7.③
具体企业的设备故障诊断、维护的管理模式与实施环境存在较大差异,目前的智能诊断与维修系统所涉及到的故障诊断软件或系统的应用领域比较单一,需要探索具有通用性的智能故障诊断的工具、流程、基础和系统。
8.如何基于设备全生命周期的海量异构数据,将机器学习、知识图谱、推荐算法等先进的人工智能方法在故障识别、预测与诊断领域进行探索应用,以“数据采集

专家经验萃取

用户需求建模

领域知识图谱构建

链路预测算法推理补全

故障原因推荐与维护决策方案推荐”为主线构造基于知识的智能故障诊断系统是亟需解决的问题。
9.(2)亟需探索适用于设备健康管理智能故障诊断与维护的知识萃取的理论、技术和方法。
10.目前关于设备健康管理领域的知识获取方面的研究多集中在基于数据挖掘的知识获取,经验资源重用率较低,对于如何有效萃取、组织与优化利用诊断维护知识资源还有待深入研究,亟需探索适用于设备健康管理智能故障诊断与维护的知识萃取的理论、技术
和方法。所以,针对知识、经验资源的特点,利用知识萃取进行特征提取和专家经验挖掘相结合的研究设备诊断知识建模和服务方式亟需研究。
11.(3)由于设备健康管理中知识与经验具有异构多源、表现形式与构成方法各异的特点,亟需探索适用于设备健康管理故障预测、诊断和维修模型中的知识表示技术和方法。
12.知识图谱本质是通过可视化方法表示知识并对知识间关系进行探索分析,能够揭示知识领域的动态发展规律并实现知识共享与重用,但仍存在算法准确性和召回率低、限制条件多、扩展性不好的问题,知识融合方面如何实现自动的本体构建,知识质量评估等问题。同时,随着知识图谱中实体规模的不断扩大,由于存在故障内容及维修信息描述不全的问题,部分特征未能全部抽取,知识图谱需要进一步完善,知识图谱链路预测作为知识图谱补全的重要环节,将变得愈来愈重要。虽然大多数模型方法对知识图谱的补全研究工作做出了贡献,但是在数据量急剧增长的环境下仍然显现出实时更新性差、错误信息干扰度高、推理预测准确率低等问题。对于知识图谱中的链路预测,对于外部知识和知识图谱中的数据没有实现有机结合,同时缺乏对于链路存在可能性的定量计算。因此,利用知识图谱链路预测进行推理补全的知识表达在故障诊断与维护领域亟待研究。
13.(4)亟需探索适用于设备故障智能诊断与维修的推荐算法。
14.应用推荐系统中的人工智能算法进行设备的故障诊断、方案推荐时,同时应用的数据类型仍然较少,技术手段相对单一,且往往只关注于个体的属性、或者孤立的研究两者间的关系,而忽略了个体在整个网络中与其他个体的间接的关系,缺少一个资源丰富、结构合理的知识库。因此,通过构建领域知识图谱来进行推荐系统中数据存储方式的改进和知识组织的新方式是设备健康管理领域的必然诉求。面对海量的专家经验反馈数据和维修记录的文档数据,推荐系统如何对用户偏好进行精准建模来更深层次地发掘用户的需求,如何合理利用知识图谱中精度较高的领域知识来为用户做出更符合用户需求的推荐,是目前需要重点关注的研究问题。基于知识图谱的个性化推荐在解决推荐的冷启动、可解释性以及推荐多样性等问题上具有强大的优势,但是目前基于知识图谱的个性化推荐的研究大多集中在商品推荐、电影推荐等开放领域,对于特定领域-故障诊断领域的研究较少,还处于起步阶段。因此,如何结合设备特点,结合知识图谱等技术,通过计算不同事故故障原因的相似性,找出最相似的事故故障原因和故障维修方案,从而实现事故故障原因及维修经验智能推荐,缩短人工现场检测判断故障的时间,提高设备检修的智能化水平和工作效率,训练普通检修人员的检修方法和操作检修工具的技能,是当前设备智能故障诊断亟需解决的问题。
15.(5)亟需将知识图谱、链路预测、个性化推荐等技术方法应用于设备健康管理实践,构建基于知识图谱的设备故障诊断与维修知识推荐系统。
16.智能设备故障诊断和维修需要在探究共性技术方法的基础上,针对不同行业、不同类型的设备与应用场景,研究适用的方法和技术,如采集生产现场异常状态数据、非结构化故障数据和领域知识以及经验知识萃取,构建行业领域知识图谱、基于链路预测的知识图谱补全,探索适用的个性化推荐技术,进行故障原因和维修方案的智能推荐,提高设备维修保障的效率及精准性,实现更为高效、安全、智能的故障诊断与维修决策。因此亟需探索适用于具体行业和设备领域的诊断模型和智能平台,为设备健康管理的长期监测,为进行健康评估和维修推荐提供了高效便捷的途径的体系和方法。
17.安全和效率是设备管理的永恒主题,某些设备部件故障,就可能使整个系统发生灾难性事故,造成巨大的经济损失。随着设备大型化、结构复杂化和非结构化、多源异构数据的增加,设备系统故障的预测、诊断、维护等工作难度的日益加大,客观上推动设备健康管理进入大数据和智能化管理时代。


技术实现要素:

18.本发明的目的在于克服现有技术的缺陷,提出了基于知识图谱的设备故障诊断与维修知识推荐系统。
19.为了实现上述目的,本发明提出了一种基于知识图谱的设备故障诊断与维修知识推荐系统,所述系统包括:
20.数据层,用于采集监测设备的健康管理领域知识;
21.构建分析层,用于对设备健康管理领域知识进行萃取并构建知识图谱,利用链路预测对知识图谱进行推理与补全,基于补全推理好的知识图谱,利用知识图谱特征学习与协同过滤推荐算法相结合,计算相似度,进行设备诊断与维修知识预测排序;
22.应用层,用于根据设备诊断与维修知识预测排序为监测设备提供异常状况下的故障诊断和正常运行状态下的趋势预测分析,实现设备故障原因和维修方案推荐。
23.作为上述系统的一种改进,所述监测设备的健康管理领域知识包括:故障维修工单、设备维护记录、设备管理文件、厂家生产使用说明、操作手册、技术标准、系统日志、行业数据、设备监控图像、设备传感器数据、检修专家的重要信息反馈、分析报告和专家结论。
24.作为上述系统的一种改进,所述构建分析层包括:知识分类评估模块、知识萃取模块、用户需求模型建立模块、知识图谱构建模块、知识图谱推理补全模块和设备故障诊断与维修知识排序模块;其中,
25.所述知识分类评估模块,用于从浅知识和深知识的角度,对多源异构的监测设备的健康管理领域知识进行分类;
26.所述知识萃取模块,用于通过两阶段的知识萃取实现故障诊断领域知识的集成与融合,得到包括故障现象、故障模式、故障原因和征兆表现的设备知识模型;
27.所述用户需求模型建立模块,用于基于问题识别建立用户需求模型;
28.所述知识图谱构建模块,用于根据设备知识模型和用户需求模型构建知识图谱;
29.所述知识图谱推理补全模块,用于对知识图谱中实体间可能存在的关系进行预测,利用知识图谱链路预测实现知识图谱中缺失信息的发现和还原;
30.所述设备故障诊断与维修知识排序模块,用于根据推理补全的知识图谱与协同过滤算法相结合,计算相似度并排序,生成分别对应故障原因和设备维修方案的top-n推荐列表。
31.作为上述系统的一种改进,所述知识分类评估模块的处理过程具体包括:
32.将设备维护记录、设备管理文件、厂家生产使用说明、操作手册、技术标准和系统日志归为检修专业技术文档;
33.将检修专家的重要信息反馈、故障维修工单、分析报告和专家结论归为检修专家历史经验知识;
34.将行业数据、设备监控图像、设备传感器数据归为设备实时检测采集信息。
35.作为上述系统的一种改进,所述知识萃取模块的处理过程具体包括:
36.基于所述知识分类评估模块的分类模型,针对不同的知识类型特点进行第一次知识萃取,抽取知识包含的概念、属性和不同概念属性之间的关联关系,形成局部的知识;
37.针对第一次萃取的知识进行二次萃取,整合局部知识,进行多源信息的集成与融合,得到包括故障现象、故障模式、故障原因和征兆表现的设备知识模型。
38.作为上述系统的一种改进,所述用户需求模型建立模块的处理过程具体包括:
39.针对不同的业务和用户需求,集合用户的属性维度,将用户属性、行为和语言联结形成完整的用户画像,并基于设备管理领域用户特征的用户画像标签体系和用户画像方法,构建用户画像;
40.建立基于用户特点的用户语句特征提取模型,通过自然语言处理方法分析用户的问题;将用户问题规范化,对设备管理领域问题进行分类,确定表示方式,提取问题中的术语并构建术语体系,给出基于设备管理领域的问题规范;引入问题分类本体,构建设备管理领域的问题分类体系,将识别到的用户需求匹配到相应的问题类别;然后基于用户问题分类本体及字索引词典进行关键词抽取,在此基础上进行模糊匹配,以提高对用户需求的语义理解能力,进而构建用户需求模型。
41.作为上述系统的一种改进,所述知识图谱的结构包括数据层和模式层,其中,
42.所述模式层由gs=《ns,ps,es》表示,其中ns表示概念或类的集合,ps表示属性的集合,es表示图gs中类之间关系的集合,且有
43.所述数据层由gd=《nd,pd,ed》表示,其中nd代表概念或类的实例集合,pd表示节点属性的集合,ed表示图gd中类之间关系的集合;每个三元组代表一个事实;
44.所述数据层gd和模式层gs之间的关联r满足下式:
45.r={(instance,rdf:type,class)|instance∈ni,class∈ns}
46.其中,instance表示数据层的实例,rdf:type表示描述的资源是某个类的成员,class表示模式层所描述的概念或类。
47.作为上述系统的一种改进,所述知识图谱推理补全模块的处理过程具体包括:由知识图谱,结合标签数据集外部知识,构建链接贝叶斯网lbn模型,基于lbn模型进行概率推理,从而完成知识图谱的链路预测。
48.作为上述系统的一种改进,所述设备故障诊断与维修知识排序模块的处理过程具体包括:
49.步骤s1)通过图谱特征学习,将知识图谱中的故障原因进行实体映射,得到故障实体向量矩阵,进而计算得到故障原因语义相似度;
50.步骤s2)利用协同过滤算法,由故障原因矩阵计算得到故障原因相似度;
51.步骤s3)将故障原因语义相似度和故障原因相似度进行融合,利用基于知识图谱的协同过滤算法生成故障原因融合相似度矩阵,再进行预测排序,生成故障原因top-n推荐列表;
52.步骤s4)通过图谱特征学习,将知识图谱中的维修措施进行实体映射,得到维修措施实体向量矩阵,进而计算得到维修措施语义相似度;
53.步骤s5)利用协同过滤算法,由维修措施矩阵计算得到维修措施相似度;
54.步骤s6)将维修措施语义相似度和维修措施相似度进行融合,利用基于知识图谱
的协同过滤算法生成维修措施融合相似度矩阵,再进行预测排序,生成维修方案top-n推荐列表。
55.与现有技术相比,本发明的优势在于:
56.1、将知识图谱和链路预测的推荐技术应用到设备健康管理领域,提出基于知识的全过程智能设备健康管理模型、方法、技术和平台,构建基于知识图谱的设备故障诊断与维修知识推荐系统,并以“数据采集

专家经验萃取

用户需求建模

领域知识图谱构建

链路预测算法推理补全

故障原因推荐与维护决策方案推荐”为主线,关注将设备相关结构化、非机构化知识(设备领域知识、维修专家经验等)动态集成并应用于实际管理中,注重对挖掘结果的深层次处理,注重人机交互,从海量的文本信息中抽取结构化数据,从而进行设备故障原因的推荐、预测与故障维修方案的推荐等,提高设备维修保障的效率及精准性,实现更为安全、高效的设备健康管理;
57.2、该系统主要有以下几个特点:1)强调对推荐全过程的管理,包括数据层、构建分析层(包括知识分类评估模块、知识萃取模块、用户需求模型建立模块、知识图谱构建模块、知识图谱推理补全模块和设备故障诊断与维修知识排序模块)、应用层;2)强调不同行业设备管理的共性问题,搭建设备领域知识的框架,加强系统的通用性;3)设计简单友好的用户接口,便于企业根据自身需求进行知识萃取和构建知识图谱,根据企业需要动态地整合到系统的知识图谱中,实现系统的个性化推荐;4)是一个人机协作、往复循环、不断对设备知识进行深挖掘的过程,逐渐提高系统的推荐的效率。
附图说明
58.图1是设备健康管理领域中基于知识图谱和链路预测的推荐模型框架;
59.图2是设备故障诊断知识图谱的模式层构建示意图;
60.图3是故障网络关系图;
61.图4是知识图谱异构信息设备特征向量提取模型;
62.图5是协同过滤算法kg-cf框架;
63.图6是基于知识图谱的故障原因推荐模型;
64.图7是基于知识图谱的故障维修方案推荐模型;
65.图8是基于知识图谱的设备故障诊断与维修知识推荐系统平台架构示意图。
具体实施方式
66.针对传统推荐技术的问题及设备健康管理中设备故障诊断、预测、维修的特殊需求,本发明从知识图谱、链路预测、数据挖掘、知识萃取综合交叉学科的角度进行研究,为提高推荐的精确性、多样性提供新的手段。针对现有智能故障诊断系统的问题,探索从知识图谱、链路预测、个性化推荐等先进的人工智能方法构造集通用性与创新性于一体的智能故障诊断系统,为智能故障诊断的进一步研究发展提供新的思路。模型框架如图1所示。
67.基于知识图谱和链路预测的推荐技术研究是一个全新的领域,目前国内外学术界都处于尝试阶段,研究中的诸多问题没有得到系统性的回答。此外,设备健康管理是一个由设备、人、机、料、管理和环境等组成的复杂系统,不同行业、不同种类设备的故障模式既有共性,又存在差异。智能设备故障诊断和维修需要在探究共性技术方法的基础上,针对不同
行业、不同类型的设备与应用场景,研究适用的方法和技术,如采集生产现场异常状态数据、非结构化故障数据和领域知识以及经验知识萃取,构建行业领域知识图谱、基于链路预测的知识图谱补全,探索适用的个性化推荐技术,进行故障原因和维修方案的智能推荐,提高设备维修保障的效率及精准性,实现更为高效、安全、智能的故障诊断与维修决策,形成基于知识的全过程智能设备健康管理和故障诊断模型、构建基于知识图谱的设备故障诊断与维修知识推荐系统来解决设备管理中的实际问题。
68.因此本发明以设备健康管理领域中的设备维护与故障诊断需求为导向,针对设备相关数据和知识的非结构化、多源异构的特点以及在设备故障诊断和维修中的科学问题和瓶颈问题,提出基于知识的全过程智能设备健康管理和故障诊断模型,建立基于知识图谱的设备故障诊断与维修知识推荐系统,以实现更为高效、安全、智能的设备健康管理。本发明构建设备健康管理领域中基于知识图谱和链路预测的推荐模型框架,并针对非结构化设备故障知识进行分类及非规范化知识萃取并进行用户需求建模,构建故障领域知识图谱并利用链路预测进行知识图谱的推理与补全,最后针对设备智能故障诊断知识管理与诊断推理应用的需求,将知识图谱、链路预测、个性化推荐等技术方法应用于设备健康管理实践,以“数据采集

专家经验萃取

用户需求建模

领域知识图谱构建

链路预测算法推理补全

故障原因推荐与维护决策方案推荐”为主线构造智能故障诊断系统,关注将设备相关结构化、非机构化、知识(设备领域知识、维修专家经验等)动态集成并应用于实际管理中,注重对挖掘结果的深层次处理,注重人机交互,从海量的文本信息中抽取结构化数据,从而进行设备故障原因的推荐、预测与故障维修方案的推荐等,提高设备维修保障的效率及精准性,实现更为安全、高效的设备健康管理。
69.下面结合附图和实施例对本发明的技术方案进行详细的说明。
70.实施例1
71.一、非结构化设备故障知识分类及非规范化知识萃取与用户需求建模
72.(一)设备故障知识分类模型与关键知识识别评估
73.浅知识主要指专家的经验等隐性知识,深知识的应用则需要基于隐性知识和大量的显性知识。复合式故障诊断能够提高诊断效果,所以需要合理应用浅知识和深知识。因此,根据智能维修设备和故障识别的目的,按照浅知识和深知识建立一套故障知识的分类标准,能充分梳理出对故障诊断和维修有用的知识,为关键知识的识别评估打下基础。
74.1、建立设备故障知识分类模型,在对设备故障知识特点进行分析梳理的基础上,结合故障诊断、预测和维修对知识的需求差异,从浅知识和深知识的角度,建立设备故障知识分类标准和模型,对多源异构的知识进行分类研究。
75.2、建立关键知识识别评估模型,主要从浅知识和深知识两个层面建立评估体系,识别需要萃取的关键知识。一是建立浅知识评估标准,确定专家经验这类浅知识需要提取的关键知识要点,建立知识重要性评估指标和模型;二是建立深知识评估标准,基于对设备健康管理的贡献性分析提出深知识所需要的关键知识类型(如设备维修记录、特定的约束关系、相关定律知识等)。
76.(二)基于两阶段的非规范故障深层次知识萃取方法研究
77.1、针对现有的故障诊断知识和数据分为三类进行第一次知识萃取:诊断检修专业技术文档(如应急故障处理手册、修程修制、用户手册和检修技术条件等)、诊断检修专家历
史经验知识(如重要信息反馈、故障日报、分析报告和专家结论等)以及设备实时检测采集信息(如设备采集数据、运行数据等),针对不同的知识类型特点分别研究相适应的知识萃取方法,进行第一次知识萃取。
78.2、深层次知识萃取研究:针对第一次萃取的知识进行二次萃取,即“深层次”知识萃取。第一次萃取目的是克服知识存在的非规范性,因此针对不同的资料类型分别建立对应知识萃取方法,抽取知识包含的概念、属性和不同概念属性之间的关联关系,形成局部的知识。第二次萃取即“深层次”知识萃取是为了整合局部知识,浅知识和深知识是基于设备诊断方式的不同对设备健康管理领域的全局知识进行划分,并不局限于一种知识类型。因此为了进一步提炼浅知识和深知识,提高故障诊断的准确性,需要对不同类型的知识整合成复合式知识,形成全局知识库。通过对局部的知识进行深层次萃取,实现故障诊断领域知识的概念术语统一、多源信息的集成与融合,得到故障现象、故障模式、故障原因、征兆表现等深层次的知识。
79.(三)设备健康管理用户需求建模
80.本部分研究设备健康管理领域的用户画像构建,提出基于问题识别建立用户需求模型:
81.1、构建设备健康管理的用户画像。针对不同的业务和用户需求,集合用户的属性维度,将专业领域的用户属性、行为和语言联结起来形成完整的用户画像,并探讨适合基于设备管理领域用户特征的用户画像的标签体系和用户画像方法,构建用户画像模型。
82.2、在用户画像的基础上,建立基于用户问题识别的用户需求模型。建立基于用户特点的用户语句特征提取模型,通过自然语言处理的方法来分析并理解用户的问题;将用户问题规范化,对设备管理领域问题进行科学分类,确定表示方式,提取问题中的术语构建术语体系,给出系统的问题库中基于设备管理领域的问题规范;引入问题分类本体,构建设备管理领域中完善的问题分类体系,将识别到的用户需求匹配到相应的问题类别;然后基于用户问题分类本体及字索引词典进行关键词抽取,在此基础上进行模糊匹配,实现纠错和容错的功能,从而提高对用户需求的语义理解能力,最终构建用户需求模型。
83.本部分重点对非结构化设备故障知识进行分类,并建立关键知识评估模型选取需要萃取的知识。在知识分类评估的基础上,重点探究对非规范化的设备知识萃取的两阶段、深层次知识萃取方法。然后通过构建设备健康管理的用户画像并建立用户需求模型来有效识别设备健康管理领域用户知识需求特点和表达方式,为后续设备故障特征提取和设备知识图谱以及智能推荐系统平台提供基础支撑。
84.二、故障诊断知识图谱的构建与推理补全
85.(一)设备故障诊断知识图谱构建
86.1、概念和关系模式设计
87.从逻辑结构来看,知识图谱分为数据层(data)和模式层(schema),在数据层,知识图谱以事实(fact)为单位存储,以“实体-关系-实体”或“实体-属性-值”三元组作为事实的基本表达方式,存储在图数据。
88.库中的所有数据可以构成庞大的实体关系网络。模式层是知识图谱的核心,相当于知识库的模具,其中存储了经过提炼的知识,通常采用本体库来管理知识图谱的模式层,借助本体库对公理、规则和约束条件的支持能力来规范实体、关系以及实体的类型和属性
等对象之间的联系,本体库可以有效减少知识库的冗余知识。
89.模式层可由gs=《ns,ps,es》表示,其中ns表示概念或者类的集合(concepts,classes),ps表示属性的集合(properties),es表示图gs中类之间关系的集合,且有数据层由gd=《nd,pd,ed》表示,其中nd代表概念(类)的实例集合,pd表示节点属性的集合(properties),ed表示图gd中类之间关系的集合。每个三元组(subject,predicate,object)代表一个事实(fact)。数据层gd和模式层gs之间的关联可以由关系r={(instance,rdf:type,class)|instance∈ni,class∈ns}来连接。
90.图2展示了设备故障诊断图谱的模式层,其中节点包含了故障症状(fault symptoms)、原因(causes)、故障模块(fault modules)解决方案(solutions)、员工(crew)、部件(units);属性主要是节点的名称(name)和编号(id)等;关系包含了原因、父现象(fatherof)、故障部件(troubleunits)、检修人员(maintainer)等;属性包括节点名称(name)、相应编码(crewid)等。
91.2、设备故障诊断信息抽取
92.构建设备故障诊断知识图谱的数据来源一般包括:故障维修工单、设备维护记录、设备管理文件、厂家生产使用说明、操作手册、技术标准、设备监控图像、设备传感器数据等等。诊断经验主要包括两个方面的信息,即故障的可能影响;以及故障的可能原因。故障的影响可以反映在故障设备上的异常运行数据中。故障的原因包括操作错误,安装缺陷,材料老化等。有些可以在线监视,而另一些只能在维护期间通过检查确定。设备故障诊断信息抽取主要是指从以上数据中,提取模式层设计中包含的实体对象、属性及实体之间的关系。
93.本部分选取了某铁路局在2015年1月至2016年12月的2797条设备故障检修台账数据,结合设备维修手册及专家咨询,提取了故障症状、故障原因、故障部件、故障维修方案等信息,并构建知识图谱。针对cir设备,最终提取出各类实体、关系,不同类型的实体关系数据如表1所示。
94.表1不同类型的实体关系及属性数量
[0095][0096]
3、基于neo4j的知识储存
[0097]
本部分使用neo4j存储设备维修知识,借助neo4j中的标签实现cir设备相关实体和关系类型的标识。构建好的的铁路cir设备故障诊断知识图谱共由1593个节点标签和2077条边组成,节点标签类由定义的6类实体组成,关系类型由定义的6类关系组成,同时还包含大量的属性键值。
[0098]
(二)基于链路预测的知识图谱推理与补全
[0099]
对于设备健康管理领域的知识图谱,随着提取的实体数据和实体之间的关系越来越多,存在故障内容及维修信息描述不全的问题,如人员、施工部位以及与施工任务相关的材料、设备、工艺方法、环境等未能全部抽取,领域知识图谱需要迭代更新,进一步完善和补全,亟需在知识推理和知识补全等方面进行拓展研究。通过链式规则发现实体之间隐藏的关系,链路预测则是推理研究中被广泛研究的方向之一。知识图谱链路预测是知识图谱补全与推理的重要应用,其主要任务是对知识图谱中实体间可能存在的关系进行预测,实现知识图谱中缺失信息的发现和还原。
[0100]
贝叶斯网是典型的概率图模型,同时考虑了网络结构和节点属性信息,能够对不确定性知识做出有效的推理,是目前不确定知识表达和推理领域最有效的模型之一。贝叶斯网络综合考虑先验信息和样本数据,充分地利用专家知识和经验,可以进行定性分析和定量分析。
[0101]
lbn是链接贝叶斯网(link bayesian network,lbn)模型,用一个二元组g=(g
l
,p)表示,其中:
[0102]
(1)g
l
=(o
l
,e
l
),为lbn的dag结构,o
l
={o1,o2,

,om}为节点集合,每个节点对应kg中的一个商品节点,有向边集合e
l
为节点之间相似关系的集合,oi(1≤i≤m)取值为1或0,分别表示oi在gk中是否和用户节点u之间存在链接。若存在有向边{oi,oj},则称oi为oj的一个父节点,oj的父节点集记为pa(oi)。
[0103]
(2)p={p(oi|pa(oi)|oi∈o)}为条件概率分布的集合,由各节点cpt中概率参数值构成,p(oi|pa(oi))表示节点oi在其父节点的影响下的条件概率,用来描述pa(oi)的状态对oi的影响。
[0104]
引入标签数据集d这一“外部知识”,d中主要描述的是kg中集合o的设备实体对应的标签类型信息:数据集d中一个设备的标签类型记录item可以表示为{oi,ti,li},其中oi(1≤i≤m)用以标识kg中设备集合o中的实体,ti表示oi对应设备的名称,li={l1,l2,

,ln}表示oi所对应的标签。
[0105]
本部分基于上部分已经构建好的设备故障知识图谱,结合标签数据集外部知识,构建lbn模型,基于lbn进行概率推理,从而完成kg链路预测。具体研究思路为:(1)提出构建lbn模型的方法,将kg和标签数据集相结合构成的物品属性,构建描述物品之间相关性的lbn,作为bn概率推理及链路预测的基础。(2)研究基于lbn的近似推理算法和kg链路预测方法,量化未知链接真实存在的可能性。(3)将知识图谱链路预测应用到设备健康管理领域,利用cir设备的维修数据集,实现并测试lbn的构建、近似推理和链路预测方法的有效性。
[0106]
(三)基于故障诊断知识图谱的故障隔离定位
[0107]
基于上述步骤已经推理补全好的知识图谱,进行故障定位查询。故障网络关系图如图3所示。维修工人可以根据所观察到的故障现象判断该采取何种故障排查措施,根据此关键词对应到故障知识图谱中的“故障排查路径”(troubleshooting path),根据如下
cypher查询语句,考虑输出包含“故障原因”(cause)、“故障部件”(troubleunits)、“故障排查路径”(troubleshooting path)三类关键实体节点的故障网络图,其中“故障排查路径”信息可为维修人员提供有效的故障排查引导。
[0108]
表2故障定位排查示例
[0109][0110]
本部分进行设备故障概念模式设计和信息抽取来完成设备故障知识图谱构建,然后结合实际设备的维修数据集,用链路预测的方法进行设备健康管理领域知识图谱的推理与补全,有利于提高后续推荐应用的准确性。
[0111]
三、设备健康管理中基于知识图谱的推荐模型
[0112]
本部分在推荐系统中引入上步骤已经构建和补全好的知识图谱,能够提供给推荐对象更为丰富的信息关系网,为知识推荐模型训练提供潜在的辅助信息来源,解决推荐系统现存的稀疏性、冷启动等问题。
[0113]
(一)基于知识图谱特征学习的异构信息设备特征向量提取
[0114]
本部分提出知识图谱异构信息设备特征向量提取模型,进行图谱特征学习。本模型主要解决设备健康管理以下几个突出的问题:(1)突出对设备维修知识文本数据的处理,文本数据在设备描述中是最全面的,(2)充分利用设备的图片信息,在实际的工业场景中,每一样设备都有铭牌,通常故障维修诊断反馈也有许多的图片信息,这些信息对于描述设备故障以及辅助维修具有重要意义。
[0115]
结合深度学习的方法对多源数据进行联合训练,构建知识图谱异构信息设备特征向量提取模型如图4所示。首先对结构信息(structural knowledge)采用transr来得到实体的向量特征,其次文本数据(textual knowledge)与图像数据(visual knowledge)分别使用降噪自编码器(stacked denoising auto-encoders,sdae),最后设备向量的计算方法为:
[0116]ej
=vj xj zj[0117]
其中,vj,xj,zj分别表示结构化知识,文本知识,图片知识的向量,item的向量是由从知识库中提取的三个向量组成。训练过程通过不断优化不同item之间的ranking来学习user的隐向量与item的隐向量,定用户i的表示ei和候选知识表示ej,用户i点击偏好知识内容的概率用另外一个dnn来计算:
[0118]
p
i,j
=φ(ei,ej)
[0119]
(二)基于知识图谱的协同过滤算法
[0120]
本部分提出一种基于知识图谱的协同过滤算法(kg-cf),如图5所示。对知识图谱和协同过滤算法进行结合通过在协同过滤算法中引入物品丰富的内容信息,以弥补协同过滤算法忽略了物品本身内容信息的缺陷,从而缓解数据稀疏性问题。
[0121]
在互联网领域,将知识图谱中的的物品实体映射为实体向量,并计算这些物品的内容相似度。利用用户对物品的行为矩阵,也得到物品的相似性。然后将这两种物品相似度进行融合,生成物品融合相似度矩阵。基于物品相似度矩阵,为每个用户计算其对未产生过行为的物品的预测评分,然后根据这些预测评分为用户生成推荐物品列表。
[0122]
在故障诊断与维修领域,借鉴互联网用户商品推荐思维,将事故故障名称作为“用户”,将故障原因和故障维修措施作为购买的“物品”,分别得到基于知识图谱的故障原因推荐模型,见图6以及维修方案推荐模型,见图7。针对历史故障文本数据,挖掘设备故障的关联关系,找出故障发生规律,进行故障的原因推荐与维修方案分析。
[0123]
本部分主要包括:
[0124]
(1)首先进行图谱特征学习,将知识图谱中的故障原因和维修方案等实体进行映射为实体向量矩阵,计算其实体语义相似度,然后利用协同过滤算法,计算故障原因和维修方案的相似度,将其两种相似度进行融合,利用基于知识图谱的协同过滤算法生成融合相似度矩阵,进行预测排序,生成推荐列表top-n,实现故障原因和维修方案的智能推荐。
[0125]
(2)此外,进行事故故障关联分析,通过计算出不同事故故障的相似度,应用基于用户的协同过滤分析模型,并进行排名,找出由相同原因导致的事故故障集合,当一个事故故障发生时,找出由该故障最可能引发的其他事故故障,从而实现事故故障的超前防范和预警。
[0126]
四、基于知识图谱的设备故障诊断与维修知识推荐系统构建
[0127]
在上述基础上,开发和设计基于知识图谱的设备故障诊断与维修知识推荐系统,特别是发现不同行业设备管理的共性问题,实现系统与不同企业、不同行业的设备领域知识的强适应性和集成性,帮助企业高效的进行设备健康管理,避免因为设备问题导致的重大经济损失。
[0128]
该系统主要有以下几个特点:1)强调对推荐全过程的管理,包括数据层、构建分析层(包括知识图谱构建层和协同过滤分析层)、应用层;2)强调不同行业设备管理的共性问题,搭建设备领域知识的框架,加强系统的通用性;3)设计简单友好的用户接口,便于企业根据自身需求进行知识萃取和构建知识图谱,根据企业需要动态地整合到系统的知识图谱中,实现系统的个性化推荐;4)是一个人机协作、往复循环、不断对设备知识进行深挖掘的过程,逐渐提高系统的推荐的效率。
[0129]
系统主要分为数据层、构建分析层和应用层。平台架构示意图如图8所示。
[0130]
(1)数据层:采集设备健康管理领域知识如故障维修工单、设备维护记录、设备管理文件、厂家生产使用说明、操作手册、技术标准、系统日志、行业数据、设备监控图像和设备传感器数据等。
[0131]
(2)构建分析层:主要分为知识图谱构建层和协同过滤分析层。
[0132]
知识图谱构建层:与企业已有的外部控制和自动化系统实现交互,集成设备领域的所有数据。主要包括知识分类评估模块、知识萃取模块、用户需求模型建立模块、知识图谱构建模块和知识图谱推理补全模块。
[0133]
知识分类评估模块、知识萃取模块和用户需求模型建立模块,主要利用设备故障特征提取和专家经验挖掘相结合对知识分类,然后进行两阶段知识萃取并对用户需求进行建模分析。知识图谱构建模块是将铁路事故故障分为设备结构域、事故故障原因域、事故故障类别域和维修措施域等4个相互关联的域。其中,设备结构域为相应事故故障发生的设备结构关系,事故故障原因域主要是可能引起的事故故障发生的所有原因描述,事故故障类别域为所有事故故障名称和分类,维修措施域则要根据事故故障的类别和名称,对设备进行维修处置。构建并维护设备领域的核心本体,构建知识图谱。在设备健康管理领域,为了实现领域相关知识的共享和复用、相关名词和术语的一致性,以及故障诊断、预测、原因与维修方案推荐功能的通用性。知识图谱推理补全模块主要实现对诊断知识资源的概率推理,其中根据设备本体库中的知识语义描述与概率信息,结合算法实现不确定性诊断知识的精确推理,形成对知识图谱的推理与补全完善。
[0134]
协同过滤分析层:利用知识图谱和协同过滤结合的平台对子系统、部件的行为以及材料的状况得出检测报告,并将这些数据同预定的失效判据等进行比较,从而使用户更好地掌握设备健康状态。将构建层的数据、知识集成,通过设备故障的定位与识别为维护方案的科学决策提供依据。基于补全推理好的知识图谱,利用知识图谱特征学习与协同过滤推荐算法相结合,通过计算事故故障原因、维修方案的相似度,进行设备诊断与维修知识的推荐排序。
[0135]
(3)应用层:以系统服务的形式提供监测设备异常状况下的故障诊断和正常运行状态下的趋势预测分析功能,实现设备故障原因推荐和维修方案的智能推荐,挖掘设备故障的关联关系,找出故障发生规律,实现事故故障的超前防范和预警,为设备管理人员提供科学准确的维护决策支持。基于知识图谱、链路预测和个性化推荐,建立基于知识的全过程智能设备健康管理和故障诊断模型,根据用户的实际需要和设备情况,进行设备故障原因的推荐与故障维修方案的推荐等,提高设备维修保障的效率及精准性,实现更为安全、高效的设备健康管理。
[0136]
特色与创新体现在以下几个方面:
[0137]
(1)以设备健康管理领域中的设备维护与故障诊断需求为导向,针对目前设备相关数据和知识的规模性、快速性、多样性和价值性的特点和在设备故障诊断和维修中面临的瓶颈问题,从管理学、计算机科学、知识科学、计算机科学、机械自动化等交叉学科的角度,提出基于知识的全过程智能设备健康管理和故障诊断模型,探索适用于特定设备智能健康管理的理论、技术和方法,拓展适用于设备故障预测、诊断和维修智能设备健康管理的新领域。
[0138]
(2)利用知识萃取对非规范性的设备故障知识进行深层次的发掘。建立设备故障知识的分类标准和关键知识评估模型,将故障数据和诊断经验知识转换为机器可处理的诊断维护知识,挖掘蕴藏在文本数据中的价值。针对故障知识资源的特点,基于以往的设备维修记录进行知识萃取和科学表达,结合本体在知识表示方面的优势,利用知识萃取、特征提取和专家经验挖掘相结合研究故障知识建模和服务方式。提出两阶段深层知识萃取模型,第一次萃取解决设备领域知识的非规范性问题,第二次萃取将整合局部知识并进行深层次知识提取,实现对故障现象、故障模式、故障原因、征兆表现等深层次的知识的发现。
[0139]
(3)将领域知识图谱与个性化推荐相结合,并在此基础上建立用户需求模型、领域
本体,通过构建领域知识图谱来进行推荐系统中数据存储方式的改进和知识组织的创新,同时利用链路预测算法对知识图谱进行推理与补全,提出基于领域知识图谱和链路预测的个性化推荐模型,提高知识图谱的完善性与推荐的精确性,利用从知识图谱中提取的语义信息提高推荐的质量,在解决推荐的冷启动、可解释性以及推荐多样性等问题上提供可行路线和有益探索,将开拓设备健康管理领域基于知识图谱和链路预测的个性化推荐的新方法。
[0140]
(4)将知识图谱链路预测引入个性化推荐研究,进行基于领域知识图谱的链路预测在设备健康管理领域的应用研究。通过结合实际设备的维修数据集,进行设备健康管理领域知识图谱的推理与补全,将补全的知识图谱与个性化推荐相结合,实现过载信息的过滤,辅助进行设备故障原因分析,推送相关的维修方法,最大程度地发挥业务数据的作用。
[0141]
(5)搭建基于知识图谱的设备故障诊断与维修知识推荐系统平台并与合作企业紧密结合进行实证研究。与传统的故障诊断系统相比,本系统平台关注将设备健康管理知识(领域知识、专家经验等)动态集成并应用于实际管理中,以知识和数据为驱动,从管理科学、系统科学、知识科学、计算机科学等交叉学科的角度,注重对挖掘结果的深层次处理。从海量的文本信息中抽取结构化数据,从而进行设备故障原因的推荐、预测与故障维修方案的推荐等,提高设备维修保障的效率及精准性,实现更为安全、高效的设备健康管理。
[0142]
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献