一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于密度聚类的采用声音识别设备生命周期的方法及系统与流程

2022-05-27 00:31:04 来源:中国专利 TAG:


1.本发明涉及一种设备生命周期判断技术,尤其是一种基于密度聚类的采用声音识别设备生命周期的方法及系统。


背景技术:

2.设备生命周期是指设备从投入使用开始,到在技术上或经济上不宜继续使用而退出使用过程为止所经历的时间。设备生命周期亦称自然寿命。它是指设备从投入使用开始,到由于有形磨损使设备在技术上完全丧失使用价值而报废为止所经历的时间。
3.生命周期是管理设备和预测设备故障的重要因素。现有的设备生命周期识别方法,主要有是依靠设备运行时长、联机数据(scada、dcs、mes等)、各类传感器监测数据(振动、温度等)、视频监测数据等,来判断设备所处的生命周期。但是在实际应用中,存在无法获取联机数据、无法安装(接触式)传感器、视频遮挡、光线强度等诸多限制,无法准确获得设备生命周期。
4.现代的生产制造过程中,需要对生产线各种设备运行的状态进行监测,识别或预测设备故障,及时维护和更换故障设备,保证正常生产。设备故障的识别或预测算法,若能结合设备所处的生命周期信息,将大大提高算法的正确性。同时,可以利用设备生命周期信息,对设备的监测数据,进行更精细的状态标注,提高设备监测数据的质量。
5.现有方法主要是将设备生命周期定为磨合期、健壮期、衰退期、危险期、报废期等几个周期,生命周期识别有2类:(1)根据设备运行时长,结合专家经验进行估计;(2)根据联机数据(scada、dcs、mes等)、各类传感器监测数据(振动、温度等)、视频监测数据等,利用arima、灰色模型、模糊逻辑、神经网络等机器学习方法识别生命周期。
6.现有的设备状态监测技术主要是依靠scada/dcs、mes系统的各类接触式传感器和视频监控来判断设备的状态。但基于震动传感的监测由于安装困难而极大地受到影响;联机数据无法获取的问题;利用视频图像数据,由于视频遮挡、光线强度等诸多方面的影响和限制,无法检测到内部设备的状态。


技术实现要素:

7.本发明是为避免上述已有技术中存在的不足之处,提供一种基于密度聚类的采用声音识别设备生命周期的方法及系统,以利用密度聚类算法对声音信息进行聚类建模,进而识别设备的生命周期。
8.本发明为解决技术问题采用以下技术方案。
9.基于密度聚类的采用声音识别设备生命周期的方法,其特点是,包括如下步骤:
10.步骤1:声音信号采集步骤;获取设备运行的声音信息,对声音信息进行初步处理,获得待检设备运行的原始声音数据集;
11.步骤2:预处理步骤;对原始声音数据集进行去噪、分帧、加窗处理;
12.步骤3:特征提取步骤;从步骤2中处理后的原始声音数据集中,提取时域、频域和
时频域特征,得到以特征值向量组成的标准样本集;
13.步骤4:构造kd树步骤;构造kd树,将步骤2中的标准样本空间划分为l个不同的区域;
14.步骤5:聚类模型训练步骤;结合kd树快速搜索算法和密度聚类算法,对标准样本集进行聚类,获取聚类模型并训练该聚类算法模型,获取训练后的聚类模型;
15.步骤6:模糊匹配识别生命周期步骤;获取待检设备运行的实时声音信息并对该实时声音信息进行预处理和特征提取,输入至步骤5中训练后的聚类模型;利用步骤5中训练后的聚类模型进行模糊匹配,识别待检设备的生命周期。
16.本发明的一种基于密度聚类的采用声音识别设备生命周期的方法的特点也在于:
17.进一步地,所述步骤1中:对声音信息进行初步处理,包括但不限于一致性检查和缺失值、异常值处理。
18.进一步地,所述步骤3中:将样本数据进行特征提取后,原始声音数据集的声音模拟信号,转化为无量纲的纯数值特征信息。
19.进一步地,所述步骤4包括如下步骤:
20.步骤41:构造根节点,确定切分超平面,将样本空间切分为两个子区域;
21.步骤42:重复切分样本空间;
22.步骤43:重复步骤41和步骤42,直到两个子区域没有实例,或分区数达到l时停止,形成kd树的区域划分。
23.构造kd树,将标准样本空间划分为l个不同的区域包括以上3个步骤41-43。以下通过一个简单的例子说明该构造kd树的过程。
24.例如,对于有二十个元素的集合q{(35,1),(26,15),(17,22),(4,23),(26,4),(12,3),(22,8),(26,36),(10,30),(19,2),(5,23),(26,25),(23,16),(10,19),(6,2),(25,23),(4,26),(22,10),(7,12),(22,4)},其kd树及其区域划分如图3和图4。
25.进一步地,所述步骤5中,对标准样本集进行聚类包括如下步骤:
26.步骤51:初始化步骤;将核心对象集h、类别集c和噪声集n置为空集,将未访问集t置为所有输入样本;
27.步骤52:在未访问集t中,随机选一个样本xi,利用kd树计算样本xi以eps为半径的邻域内样本个数n;
28.步骤53:判断n是否大于预设的密度阈值;若是,则将样本xi放入核心对象集h;若不是,则将样本xi放入噪声集n,返回执行步骤52;
29.步骤54:建立一个新类cj,类集为cj;新建候选集s,候选集s初始元素为步骤53产生的核心对象xi;
30.步骤55:从候选集s中任取一个样本x
p

31.步骤56:若候选集s非空,则返回步骤55执行;
32.步骤57:将cj加入类别集c;
33.步骤58:若未访问集t非空,则返回步骤52执行
34.步骤59:输出类别集c={c1,c2,

,ck}。
35.进一步地,所述步骤52中,利用kd树计算xi以eps为半径的邻域内样本个数n的过程包括如下步骤:
36.步骤521:二叉树搜索步骤;先从根点开始查找kd树,依次到达节点k
1,k2,

,km,km为最后到达的节点,在km区域计算距离小于eps的样本点;m为节点总个数;
37.步骤522:回溯查找步骤;依次向上一级回溯k
m-1
,k
m-2
,

,k1,判断在该父节点的其它子节点空间中是否有eps邻域内样本,以km节点为圆心,以eps为半径画圆,判断该圆和层的区域分隔超平面交割,若相交则计算其它子节点空间是否有eps邻域内样本,再回溯到上一级父节点;若不想交,则直接回溯到上一级父节点。
38.本发明还提供了一种基于密度聚类的采用声音识别设备生命周期的方法的系统,包括声音信号采集模块、预处理模块、特征提取模块、kd树构造模块、构造kd树模块、模糊模式匹配模块和生命周期识别模块;
39.所述声音信号采集模块,用于获取设备运行的声音信息,对声音信息进行初步处理,获得待检设备运行的原始声音数据集;
40.所述预处理模块,用于对原始声音数据集进行去噪、分帧、加窗处理;
41.所述特征提取模块,用于从上述处理后的原始声音数据集中,提取时域、频域和时频域特征,得到以特征值向量组成的标准样本集;
42.所述构造kd树模块,用于构造kd树,将所述标准样本集样本空间划分为l个不同的区域;
43.所述聚类模型训练模块,用于结合kd树快速搜索算法和密度聚类算法,对标准样本集进行快速聚类,获取聚类模型;
44.所述模糊匹配模块,用于获取待检设备运行的实时声音信息并对该实时声音信息进行预处理和特征提取,输入至上述训练后的聚类模型;利用上述训练后的聚类模型进行模糊模式匹配,利用实时声音信息识别待检设备的生命周期;
45.上述生命周期识别模块,用于根据生命周期类别获取待检设备所处的生命周期。
46.本发明还提供了一种电子设备,包括:至少一个处理器以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述的基于密度聚类的采用声音识别设备生命周期的方法。
47.本发明还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于密度聚类的采用声音识别设备生命周期的方法。
48.与已有技术相比,本发明有益效果体现在:
49.本发明公开了一种基于密度聚类的采用声音识别设备生命周期的方法及系统,包括声音信号采集步骤、数据预处理步骤、特征提取步骤、构造kd树步骤、聚类算法模型训练步骤、模糊模式匹配步骤和生命周期识别步骤;根据生命周期类别获取待检设备所处的生命周期。
50.1、利用声音信息识别设备生命周期,具有非接触、不停机、不受遮挡物与光线影响等优点
51.2、利用密度聚类对声音信息进行聚类建模,获得设备不同的生命周期模型,自动识别设备的不同生命周期个数,可以克服固定周期数灵活性不足的问题
52.3、结合kd树实现密度聚类的领域样本的快速计算,时间复杂度由传统的o(n)降至树搜索的o(log n),缩短了计算时间,大大提高了计算效率。
53.本发明基于密度聚类的采用声音识别设备生命周期的方法及系统,具有非接触、不停机、不受遮挡物与光线影响等优点,能够自动识别设备的不同生命周期个数,可以克服固定周期数灵活性不足的问题。
附图说明
54.图1为本发明的一种基于密度聚类的采用声音识别设备生命周期的方法的流程图。
55.图2为本发明的一种基于密度聚类的采用声音识别设备生命周期的方法中一个例子的kd树的示意图。
56.图3为图2中例子的区域划分图,其中线最粗代表是第一次划分,以此类推,线的宽度助词减小。
57.图4为本发明的一种基于密度聚类的采用声音识别设备生命周期的方法步骤5的聚类方法的流程图,其中最小密度阈值根据经验设置,或采用某种寻优算法获得。
58.图5是本发明的聚类方法的聚类结果示例图,其中不同的灰度代表不同的类别。
59.图6是为某一样本点(13,8)的eps邻域内样本搜索示例。
60.以下通过具体实施方式,并结合附图对本发明作进一步说明。
具体实施方式
61.参见图1-图6,本发明的基于密度聚类的采用声音识别设备生命周期的方法,包括如下6个步骤:
62.步骤1:声音信号采集步骤;获取设备运行的声音信息,对声音信息进行初步处理,获得待检设备运行的原始声音数据集;
63.步骤2:预处理步骤;对原始声音数据集进行去噪、分帧、加窗处理;
64.步骤3:特征提取步骤;从步骤2中处理后的原始声音数据集中,提取时域、频域和时频域特征,得到以特征值向量组成的标准样本集;
65.步骤4:构造kd树步骤;构造kd树,将步骤2中的标准样本空间划分为l个不同的区域;
66.步骤5:聚类模型训练步骤;结合kd树快速搜索算法和密度聚类算法,对标准样本集进行聚类,获取聚类模型并训练该聚类算法模型,获取训练后的聚类模型;
67.步骤6:模糊匹配识别生命周期步骤;获取待检设备运行的实时声音信息并对该实时声音信息进行预处理和特征提取,输入至步骤5中训练后的聚类模型;利用步骤5中训练后的聚类模型进行模糊匹配,识别待检设备的生命周期。
68.本发明将kd树快速搜索算法与密度聚类算法结合,采用kd树快速搜索算法解决密度聚类算法在计算邻域样本距离的时间复杂度较大的问题,在满足聚类算法中计算样本浓度的需求下,提高了执行效率,降低浓度聚类算法的训练成本,能够样本数量较大时在较低配置的计算资源上也能完成训练与识别需求,提高了计算速度和计算效率。
69.进一步地,所述步骤1中:对声音信息进行初步处理,包括但不限于一致性检查和缺失值、异常值处理。
70.通过对声音信息的样本数据集进行一致性检查和缺失值、异常值处理,能够提高
对样本数据分类的准确率和提高执行效率。
71.进一步地,所述步骤3中:将样本数据进行特征提取后,原始声音数据集的声音模拟信号,转化为无量纲的纯数值特征信息。
72.进一步地,所述步骤4包括如下步骤:
73.步骤41:构造根节点,确定切分超平面,将样本空间切分为两个子区域;
74.构造根节点,选择第一个特征t1为坐标轴;以所有样本的特征t1的值的中位数为根节点,将经过根节点且与坐标轴t1垂直的超平面作为切分超平面,将样本空间切分为两个子区域:左区域和右区域;所述左区域、右区域分别对应左子树、右子树;左区域对应于特征t1的值小于切分点的子区域,右区域对应于特征t1的值大于切分点的子区域;
75.步骤42:重复切分样本空间;
76.选取切分坐标轴t
i 1
=(ti 1)%k(k为样本空间的维数),分别对左右区域重复s301,即以特征t
i 1
为坐标轴的中位数为切分点,并保存为子树的根节点,然后同样分成两个子树;
77.步骤43:重复步骤41和步骤42,直到两个子区域没有实例,或分区数达到l时停止,形成kd树的区域划分。
78.构造kd树,将标准样本空间划分为l个不同的区域包括以上3个步骤41-43。以下通过一个简单的例子说明该构造kd树的过程。
79.例如,对于有二十个元素的集合q{(35,1),(26,15),(17,22),(4,23),(26,4),(12,3),(22,8),(26,36),(10,30),(19,2),(5,23),(26,25),(23,16),(10,19),(6,2),(25,23),(4,26),(22,10),(7,12),(22,4)},其kd树及其区域划分如图3和图4。
80.进一步地,所述步骤5中,对标准样本集进行聚类包括如下步骤:
81.步骤51:初始化步骤;将核心对象集h、类别集c和噪声集n置为空集,将未访问集t置为所有输入样本;
82.步骤52:在未访问集t中,随机选一个样本xi,利用kd树计算样本xi以eps为半径的邻域内样本个数n;
83.步骤53:判断n是否大于预设的密度阈值;若是,则将样本xi放入核心对象集h;若不是,则将样本xi放入噪声集n,返回执行步骤52;
84.步骤54:建立一个新类cj,类集为cj;新建候选集s,候选集s初始元素为步骤53产生的核心对象xi;
85.步骤55:从候选集s中任取一个样本x
p

86.若x
p
还未被聚到任意一个类,则加入上述新类cj;若x
p
是核心对象,属于核心对象集h,则选择x
p
的eps邻域内的样本,不在集合cj中的x
p
的eps邻域内的样本加入候选集s;
87.若x
p
在噪声集n中,则将其从集合n中移除;
88.若x
p
在未访问集t中,则将其从集合t中移除;
89.步骤56:若候选集s非空,则返回步骤55执行;
90.步骤57:将cj加入类别集c;
91.步骤58:若未访问集t非空,则返回步骤52执行
92.步骤59:输出类别集c={c1,c2,

,ck}。
93.如图4是上述步骤5的聚类方法的流程图。如图5是上述20个元素的集合q的聚类结
果图。
94.进一步地,所述步骤52中,利用kd树计算xi以eps为半径的邻域内样本个数n的过程包括如下步骤:
95.步骤521:二叉树搜索步骤;先从根点开始查找kd树,依次到达节点k
1,k2,

,km,km为最后到达的节点,在km区域计算距离小于eps的样本点;m为节点总个数;
96.步骤522:回溯查找步骤;依次向上一级回溯k
m-1
,k
m-2,

,k1,判断在该父节点的其它子节点空间中是否有eps邻域内样本,以km节点为圆心,以eps为半径画圆,判断该圆和层的区域分隔超平面交割,若相交则计算其它子节点空间是否有eps邻域内样本,再回溯到上一级父节点;若不想交,则直接回溯到上一级父节点。
97.如图6是为某一样本点(13,8)的eps邻域内样本搜索示例,所有区域共5个样本在eps邻域内。
98.本发明还提供了一种基于密度聚类的采用声音识别设备生命周期的方法的系统,包括声音信号采集模块、预处理模块、特征提取模块、kd树构造模块、构造kd树模块、模糊模式匹配模块和生命周期识别模块;
99.所述声音信号采集模块,用于获取设备运行的声音信息,对声音信息进行初步处理,获得待检设备运行的原始声音数据集;
100.所述预处理模块,用于对原始声音数据集进行去噪、分帧、加窗处理;
101.所述特征提取模块,用于从上述处理后的原始声音数据集中,提取时域、频域和时频域特征,得到以特征值向量组成的标准样本集;
102.所述构造kd树模块,用于构造kd树,将所述标准样本集样本空间划分为l个不同的区域;
103.所述聚类模型训练模块,用于结合kd树快速搜索算法和密度聚类算法,对标准样本集进行快速聚类,获取聚类模型;
104.所述模糊匹配模块,用于获取待检设备运行的实时声音信息并对该实时声音信息进行预处理和特征提取,输入至上述训练后的聚类模型;利用上述训练后的聚类模型进行模糊模式匹配,利用实时声音信息识别待检设备的生命周期;
105.上述生命周期识别模块,用于根据生命周期类别获取待检设备所处的生命周期。
106.本发明还提供了一种电子设备,包括:至少一个处理器以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述的基于密度聚类的采用声音识别设备生命周期的方法。
107.本发明还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于密度聚类的采用声音识别设备生命周期的方法。
108.为了解决现有技术的设备检测当中,采用设备运行的声音信息进行设备故障状态监测时,由于生产线能采集到的多数为正常状态数据,故障或异常状态数据极少的原因,导致故障识别或预测准确率较低的问题。本发明提供一种基于密度聚类的采用声音识别设备生命周期的方法及系统,包括数据预处理、确定关键指标、聚类训练出正常状态类别、识别生命周期等步骤和过程。
109.本专利基于声音信息来判断设备的生命周期,具有非接触、不停机、不受遮挡物与
光线影响等优点。本发明通过密度聚类的方式,自动识别设备的不同生命周期个数,可以克服固定周期数灵活性不足的问题。
110.需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
111.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
112.本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
113.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
114.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
115.尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
116.对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
117.此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献