基于可扩展本体的产品全生命周期质量追溯方法和装置

2022-04-25 01:46:17 来源：中国专利 TAG：

1.本发明涉及产品全生命周期的质量追溯领域、知识管理领域及人工智能领域，尤其是涉及一种基于可扩展本体的产品全生命周期质量追溯方法和装置。

背景技术：

2.在产品全生命周期的质量追溯过程中，由于时间和空间的跨度大、数据类型复杂、参与的环节众多，而且追溯标识不唯一，造成工作效率低下、成本虚高，并且很少有人针对整个追溯过程进行知识融合。本发明在采集全生命周期各个环节的大数据的基础上，提出基于扩展本体和gcn的多视图知识融合模型及方法，对跨域跨层、跨时间维度多源数据和知识进行融合，可有效提升产品全生命周期的质量追溯的高效性。

技术实现要素：

3.本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于可扩展本体的产品全生命周期质量追溯方法和装置，对跨域跨层、跨时间维度多源数据和知识进行融合，有效提升产品全生命周期的质量追溯的高效性。
4.本发明的目的可以通过以下技术方案来实现：
5.一种基于可扩展本体的产品全生命周期质量追溯方法，具体包括以下步骤：
6.s1、获取质量追溯目标的产品信息，根据产品信息构建质量追溯目标的可扩展本体模型并融合相关数据；
7.s2、基于融合的相关数据构建可扩展本体模型的多个视图，并对得到的视图进行可解释性评估；
8.s3、基于图卷积神经网络(gcn)对每个视图进行特征提取，得到每个视图的特征图；
9.s4、将每个视图的特征图再进行融合，得到质量追溯目标的有机知识图谱并对可扩展本体模型进行扩展，得到质量追溯本体模型对质量追溯目标进行质量追溯。
10.所述可扩展本体模型具体为跨长周期、多源异构的数据融合模型。
11.所述可扩展本体模型包括可继续扩展领域本体以及从有价值的事件中提取的本体。
12.进一步地，所述可扩展本体模型中的可继续扩展领域本体通过引入外部知识来扩展本体。
13.所述步骤s2中还包括在视图经过可解释性评估后，提取其中的关联型的新子图。
14.所述步骤s3中对每个视图进行特征提取，得到每个视图的特征图的过程具体包括图的构建、频域图卷积、特征提取、分类、adam优化、l2权重衰减和可视化处理。
15.进一步地，所述步骤s3中通过特征提取器进行特征提取，所述特征提取器包括两个图卷积层和一个输出层，特征提取器的主要作用是从源域和目标域数据中提取可传递的特征。
16.进一步地，所述步骤s3中通过分类器进行分类，所述分类器包括softmax层，所述softmax层的神经元个数为质量追溯目标的故障的类别数。
17.进一步地，所述步骤s3中l2权重衰减的目的是将权重降到一个较小的值，并在一定程度上减少模型过重的问题。
18.进一步地，所述步骤s3中可视化处理包括主成分分析降维。
19.所述步骤s4中将每个视图的特征图再进行融合的过程具体为指将数据按照不同的视图进行拆分，得到可解释性很强的多个分析视图。
20.所述步骤s4中的有机知识图谱具体为既保留领域知识图谱的层次结构，同时也兼顾面向业务目标的知识结构的有机知识图谱。
21.一种基于可扩展本体的产品全生命周期质量追溯装置，包括：
22.异构数据预处理模块，将质量追溯目标对应的信息系统、统计表格、质量报告基于可扩展本体模型进行数据集成；
23.构建可解释的多视图模块，将可扩展本体模型基于专家经验构建多视图，得到多个可解释性评估视图；
24.基于多视图的知识融合模块，对多视图进行基于图卷积神经网络的特征提取，并进行目标导向的知识融合，得到质量追溯目标的有机知识图谱；
25.质量追溯模块，基于有机知识图谱对可扩展本体模型进行扩展，得到质量追溯本体模型对质量追溯目标进行质量追溯。
26.与现有技术相比，本发明具有以下有益效果：
27.本发明在采集全生命周期各个环节的大数据的基础上，通过基于可扩展本体模型和图卷积神经网络进行多视图知识融合模，对跨域跨层、跨时间维度多源数据和知识进行融合，得到更加贴合质量追溯目标的有机知识图谱来进行质量追溯，有效提升了产品全生命周期的质量追溯的高效性和准确性，最终达到降本增效的目的。
附图说明
28.图1为本发明的结构示意图；
29.图2为本发明装置的结构示意图；
30.图3为本发明实施例中图卷积神经网络输出的多视图的示意图，其中图3(a)、(b)、(c)和(d)均为图卷积神经网络输出的视图；
31.图4为本发明实施例中有机知识图谱的示意图；
32.图5为本发明实施例中故障损失占比最大模块的示意图；
33.图6为本发明实施例中故障损失较大地域的示意图；
34.图7为本发明实施例中使用时间较长地域的示意图；
35.图8为本发明实施例中售后初判准确率图。
具体实施方式
36.下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。
37.实施例
38.如图1所示，一种基于可扩展本体的产品全生命周期质量追溯方法，具体包括以下步骤：
39.s1、获取质量追溯目标的产品信息，根据产品信息构建质量追溯目标的可扩展本体模型并融合相关数据；
40.s2、基于融合的相关数据构建可扩展本体模型的多个视图，并对得到的视图进行可解释性评估；
41.s3、基于图卷积神经网络(gcn)对每个视图进行特征提取，得到每个视图的特征图；
42.s4、将每个视图的特征图再进行融合，得到质量追溯目标的有机知识图谱并对可扩展本体模型进行扩展，得到质量追溯本体模型对质量追溯目标进行质量追溯。
43.可扩展本体模型具体为跨长周期、多源异构的数据融合模型。
44.可扩展本体模型包括可继续扩展领域本体以及从有价值的事件中提取的本体。
45.可扩展本体模型中的可继续扩展领域本体通过引入外部知识来扩展本体。
46.步骤s2中还包括在视图经过可解释性评估后，提取其中的关联型的新子图。
47.步骤s3中对每个视图进行特征提取，得到每个视图的特征图的过程具体包括图的构建、频域图卷积、特征提取、分类、adam优化、l2权重衰减和可视化处理。
48.步骤s3中通过特征提取器进行特征提取，特征提取器包括两个图卷积层和一个输出层，图卷积层后又作为激活函数，映射神经元的输出，特征提取器的主要作用是从源域数据和目标域数据中提取可传递的特征。特征提取后将数据进行归一化处理。特征提取器上的模型的目的是找到特征区域。学习源域数据和目标域数据在特征空间的特征映射，并减少源域数据和目标域数据之间的数据分布差异。因此，模型在特征提取器上的目标是学习域的不变特征。
49.步骤s3中通过分类器进行分类，分类器的主要作用是在模型训练和预测过程中对特征提取器提取的特征进行分类。
50.分类器将特征提取器学习到的特征映射到样本空间，其中应用了dropout随机丢弃部分神经元，分类器包括softmax层，softmax层的神经元个数为质量追溯目标的故障的类别数，对应的结果表示故障的标签。
51.本实施例中，可扩展本体模型要根据特征提取器学习到的特征，识别检测设备的健康状况，因此，模型在分类器上的目标是减少源域数据上的故障分类错误，表现为最小化源域数据集上的nll_loss损失函数来最小化分类损失。softmax激活函数的计算方式是，先将输入的每个xi求然后再除以每个值xi对应的以e为底的指数和，其计算公式如下所示：
[0052][0053]
logsoftmax就是对softmax的输出，再求对数，其计算公式如下所示：
[0054]
[0055]
由上面分析可知，softmax的输出值的取值区间是[0,1]，值的含义表示对应类别的概率。但在机器学习中，通常最小化某个函数值，故对概率值再进行一次log变换。经过log变换之后，最大概率值即为最接近于0的值。其它概率值经log变换之后，均为小于0的实值。为了满足最小化的条件，loss函数通常会取个负号。此时，若实际标签张量在模型输出结果logsfm(output)的对应位置的值越接近0，则具有越小的损失值；否则，损失值越大。
[0056]
步骤s3中l2权重衰减的目的是将权重降到一个较小的值，并在一定程度上减少模型过重的问题。
[0057]
本实施例中，adam优化算法与l2权重衰减过程如下：
[0058]
adam本质上是带有动量项的rmsprop，它利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率。它的优点主要在于经过偏置校正后，每一次迭代学习率都有个确定范围，使得参数比较平稳。其公式如下：
[0059]mt
＝β1*m
t-1
(1-β1）*g
t
[0060]vt
＝β2*v
t-1
(1-β2)*g
t2
[0061][0062][0063][0064]
其中，前两个公式分别是对梯度的一阶矩估计和二阶矩估计，可以看作是对期望e|g
t
|和e|g
t2
|的估计，β1、β2和g
t
为过程参数，第三个和第四个公式对一阶二阶矩估计的校正，可以近似为对期望的无偏估计；可以看出，直接对梯度的矩估计对内存没有额外的要求，而且可以根据梯度进行动态调整。最后一项前面部分是对学习率η形成的一个动态约束，而且有明确的范围，α和∈为过程参数。
[0065]
l2权重衰减的目的就是为了让权重衰减到更小的值，在一定程度上减少模型过拟合的问题，所以权重衰减也叫l2正则化。
[0066]
l2正则化就是在代价函数后面再加上一个正则化项：
[0067][0068]
其中，c0代表原始的代价函数，后面那一项就是l2正则化项：所有参数w的平方的和，除以训练集的样本大小n，λ就是正则项系数(即权重衰减系数)，权衡正则项与c0项的比重。
[0069]
步骤s3中可视化处理包括主成分分析降维。
[0070]
本实施例中，可视化处理的过程如下：
[0071]
pca将n维输入数据缩减为r维，其中r＜n。简单地说，pca实质上是一个基变换，使得变换后的数据有最大的方差，也就是通过对坐标轴的旋转和坐标原点的平移使得其中一个轴(主轴)与数据点之间的方差最小，坐标转换后去掉高方差的正交轴，得到降维数据集。
[0072]
本实施例中采用svd方法进行pca降维，假定有p
×
n维数据样本x，共有p个样本，每
行是n维，p
×
n实矩阵可以分解为：
[0073]
x＝u∑v
t
[0074]
yr＝u∑r[0075]
其中，正交阵u的维数是p
×
n，正交阵v的维数是n
×
n(正交阵满足：uu
t
＝v
t
v＝1)，∑是n
×
n的对角阵；将ε分割成r列，记作εr；利用u和v便能够得到降维数据点yr。
[0076]
本实施例中，步骤s3中图的构建和频域图卷积过程如下：
[0077]
一张图可以表示为g＝(v,e,w)，其中v表示图中节点，e表示两个节点之间的边，w表示两个顶点之间边的权重。此外，图还可以用拉普拉斯矩阵表示，即为l＝d-a，其中d和a分别代表度矩阵和邻接矩阵。拉普拉斯矩阵可以按如下方式进行特征分解：
[0078][0079]
其中，是由单位特征向量组成的矩阵，λ是由拉普拉斯矩阵的特征值组成的对角矩阵，λ1～λn为特征值。因为u是正交矩阵(即uu
t
＝e)，所以拉普拉斯矩阵的特征分解也可以写成如下形式：
[0080][0081]
由于拉普拉斯矩阵具有以上两个性质，图卷积操作得以快速在频域中实现。
[0082]
自适应图卷积神经网络主要基于频域卷积理论，其核心思想是将图信号进行图傅里叶变换，在频谱域进行卷积，然后再对信号进行图傅里叶逆变换。其中，图傅里叶变换操作如下：
[0083][0084]
其中，f是图的n维分量，f(i)与图中节点一一对应；u
l
(i)表示第l个特征向量的第i的分量；u
l*
(i)表示u
l
(i)的共轭向量。图傅里叶变换矩阵形式为与之相对应的图傅里叶逆变换为：
[0085][0086]
所以图上傅立叶逆变换的矩阵为根据卷积定理(即函数f(t)和g(t)两者的卷积是其函数傅立叶变换乘积的逆变换)，所以图卷积如下所示：
[0087][0088]
其中，f*h表示函数f(t)和g(t)的卷积，u
t
f表示f的傅里叶变换，g表示卷积核。
[0089]
根据拉普拉斯矩阵自身特性，则有(f*h)g＝u(u
th⊙ut
f),其中
⊙
为哈达马积，表示
两个维度相同的向量进行对应位置的逐元素乘积运算。所以图卷积网络的输出表示如下：
[0090]youtput
＝σ(ug
θ
(λ)u
t
x)
[0091]
其中，x为输入特征，σ(*)为激活函数，g
θ
(λ)为卷积核。
[0092]
步骤s4中将每个视图的特征图再进行融合的过程具体为指将数据按照不同的视图进行拆分，得到可解释性很强的多个分析视图。
[0093]
步骤s4中的有机知识图谱具体为既保留领域知识图谱的层次结构，同时也兼顾面向业务目标的知识结构的有机知识图谱。
[0094]
如图2所示，一种基于可扩展本体的产品全生命周期质量追溯装置，包括：
[0095]
异构数据预处理模块，将质量追溯目标对应的信息系统、统计表格、质量报告基于可扩展本体模型进行数据集成；
[0096]
构建可解释的多视图模块，将可扩展本体模型基于专家经验构建多视图，得到多个可解释性评估视图；
[0097]
基于多视图的知识融合模块，对多视图进行基于图卷积神经网络的特征提取，并进行目标导向的知识融合，得到质量追溯目标的有机知识图谱；
[0098]
质量追溯模块，基于有机知识图谱对可扩展本体模型进行扩展，得到质量追溯本体模型对质量追溯目标进行质量追溯。
[0099]
具体实施时，构建海尔热水器质量追溯的可拓展本体，如表1所示：
[0100]
表1海尔热水器可拓展本体信息表
[0101]
[0102]
[0103][0104][0105]
具体实施时gcn算法伪代码流程如下：
[0106]
输入：源数据的节点序号node、类别class和特征feature和邻接矩阵adj；
[0107]
输出：模型的聚类效果和分类准确率accuracy。
[0108]
步骤1、初始化超参数，如迭代次数epochs，学习率lr，权重衰减weight_decay，随机初始化网络参数，如权重参数w，隐藏层个数hidden，dropout等；
[0109]
步骤2、计算源数据经过特征提取器后的特征表示features；
[0110]
步骤3、计算分类的nll_loss，并通过模型反向传播更新分类器参数；
[0111]
步骤4、根据式(14)和adam单次优化算法计算模型损失，模型反向传播更新特征提取器参数；
[0112]
步骤5、重复步骤2直至网络收敛或达到预先设定的迭代次数。
[0113]
通过扩展本体的构建，在多源异构数据之间建立丰富的数据关系和链接，并评估数据之间的权重，以此来实现灵活高效的数据融合。基于gcn的特征提取，经过可解释性评估后，得到如图3所示的多个视图，经过将数据按照不同的视图进行拆分，得到质量追溯过程中，可解释性很强的多个分析视图，再进行融合。参照图4至图8所示，最终得到有机知识图谱，其既保留领域知识图谱的层次结构，同时也兼顾面向业务目标的知识结构。
[0114]
具体的，参照图5所示，热水器中损失占比最大的模块为内胆，主要问题有水管焊接问题、法兰问题、内胆环缝焊接问题、内胆直缝焊接问题、内胆质量问题，内胆t型口问题，实施例中热水器平均使用年份为5.4年。实施例中故障损失较大地域参照图6所示，热水器使用时间较长的地域参照图7所示，售后初判准确率标准参照图8所示。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种核电经验反馈智能化推荐系统和方法与流程

基于可扩展本体的产品全生命周期质量追溯方法和装置

相关文献

最热文献