发动机型号检测方法和装置、电子设备、存储介质与流程

2022-11-19 10:34:21 来源：中国专利 TAG：

1.本技术涉及人工智能技术领域，尤其涉及一种发动机型号检测方法和装置、电子设备、存储介质。

背景技术：

2.相关技术中，通过人工进行汽车发动机检测，但是人工检测方式要求具备专业的发动机检测技术，需要耗费大量的时间，不仅检测效率低，而且检测不出发动机的型号。

技术实现要素：

3.本技术实施例的主要目的在于提出一种发动机型号检测方法和装置、电子设备、存储介质，能够自动识别发动机型号，提高发动机检测效率。
4.为实现上述目的，本技术实施例的第一方面提出了一种发动机型号检测方法，包括：
5.获取待检测发动机的初始音频；
6.对所述初始音频进行静音检测，得到目标音频；
7.若所述目标音频满足预设条件，则对所述目标音频进行特征提取，得到所述目标音频对应的目标声纹特征；
8.获取样本声纹特征；
9.将所述目标声纹特征与所述样本声纹特征进行比对，得到比对结果；
10.若所述比对结果为所述目标声纹特征与所述样本声纹特征匹配，则根据所述样本声纹特征从预设的映射关系中查找出对应的发动机型号，并根据所述发动机型号得到所述待检测发动机的型号。
11.在一些实施例，所述对所述初始音频进行静音检测，得到目标音频，包括：
12.对所述初始音频进行静音检测，得到语音段和非语音段；
13.从所述初始音频中剔除所述非语音段，得到所述目标音频。
14.在一些实施例，所述若所述目标音频满足预设条件，则对所述目标音频进行特征提取，得到所述目标音频对应的目标声纹特征，包括：
15.计算所述目标音频的信噪比、截幅和音量；
16.若所述信噪比大于预设的第一阈值，所述截幅大于预设的第二阈值，所述音量大于预设的第三阈值，则对所述目标音频进行特征提取，得到所述目标声纹特征。
17.在一些实施例，所述若所述信噪比大于预设的第一阈值，所述截幅大于预设的第二阈值，所述音量大于预设的第三阈值，则对所述目标音频进行特征提取，得到所述目标声纹特征，包括：
18.若所述信噪比大于所述第一阈值，所述截幅大于所述第二阈值，所述音量大于所述第三阈值，则对所述目标音频进行第一特征提取，得到初始声纹特征；
19.将所述初始声纹特征输入至预设的特征提取模型，对所述初始声纹特征进行第二
特征提取，得到目标声纹特征。
20.在一些实施例，所述若所述信噪比大于所述第一阈值，所述截幅大于所述第二阈值，所述音量大于所述第三阈值，则对所述目标音频进行第一特征提取，得到初始声纹特征，包括：
21.若所述信噪比大于所述第一阈值，所述截幅大于所述第二阈值，所述音量大于所述第三阈值，计算所述目标音频的功率谱；
22.根据梅尔滤波器组对所述功率谱进行梅尔滤波，得到第一滤波器组能量；
23.对所述第一滤波器组能量进行对数变换，得到第二滤波器组能量；
24.根据所述第二滤波器组能量得到初始声纹特征。
25.在一些实施例，所述根据所述第二滤波器组能量得到初始声纹特征，包括：
26.对所述第二滤波器组能量进行离散余弦变换，得到静态声纹特征；
27.计算所述静态声纹特征的一阶差分参数和二阶差分参数；
28.计算所述目标音频的短时能量；
29.根据所述短时能量计算一阶差分能量和二阶差分能量；
30.根据所述一阶差分参数、所述二阶差分参数、所述一阶差分能量和所述二阶差分能量得到动态声纹特征；
31.根据所述静态声纹特征和所述动态声纹特征得到初始声纹特征。
32.在一些实施例，所述将所述目标声纹特征与所述样本声纹特征进行比对，得到比对结果，包括：
33.计算所述目标声纹特征与所述样本声纹特征的余弦相似度；
34.将所述余弦相似度作为所述目标声纹特征与所述样本声纹特征进行比对的得分值；
35.若所述得分值大于预设的得分阈值，则确定所述目标声纹特征与所述样本声纹特征的比对结果为所述目标声纹特征与所述样本声纹特征匹配。
36.本技术实施例的第二方面提出了一种发动机型号检测装置，包括：
37.第一获取模块，用于获取待检测发动机的初始音频；
38.静音检测模块，用于对所述初始音频进行静音检测，得到目标音频；
39.特征提取模块，用于若所述目标音频满足预设条件，则对所述目标音频进行特征提取，得到所述目标音频对应的目标声纹特征；
40.第二获取模块，用于获取样本声纹特征；
41.特征比对模块，用于将所述目标声纹特征与所述样本声纹特征进行比对，得到比对结果；
42.发动机型号检测模块，用于若所述比对结果为所述目标声纹特征与所述样本声纹特征匹配，则根据所述样本声纹特征从预设的映射关系中查找出对应的发动机型号，并根据所述发动机型号得到所述待检测发动机的型号。
43.本技术实施例的第三方面提出了一种电子设备，所述电子设备包括存储器和处理器，其中，所述存储器中存储有程序，所述程序被所述处理器执行时所述处理器用于执行如本技术第一方面实施例任一项所述的发动机型号检测方法。
44.本技术实施例的第四方面提出了一种存储介质，该存储介质为计算机可读存储介
质，所述存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如本技术第一方面实施例任一项所述的发动机型号检测方法。
45.本技术实施例提出的发动机型号检测方法和装置、电子设备、存储介质，通过获取待检测发动机的初始音频，对初始音频进行静音检测，得到目标音频，若目标音频满足预设条件，则对目标音频进行特征提取，得到目标音频对应的目标声纹特征，获取样本声纹特征，将目标声纹特征与样本声纹特征进行比对，得到比对结果，若比对结果为目标声纹特征与样本声纹特征匹配，则根据样本声纹特征从预设的映射关系中查找出对应的发动机型号，并根据发动机型号得到待检测发动机的型号，能够自动识别待检测发动机的型号，提高了发动机检测效率。
附图说明
46.图1是本技术实施例提供的发动机型号检测方法的第一流程图；
47.图2是图1中的步骤s120的流程图；
48.图3是图1中的步骤s130的流程图；
49.图4是图3中的步骤s320的流程图；
50.图5是图4中的步骤s410的流程图；
51.图6是图5中的步骤s540的流程图；
52.图7是图1中的步骤s150的流程图；
53.图8是本技术实施例提供的发动机型号检测方法的第二流程图；
54.图9是本技术实施例提供的发动机型号检测装置的模块结构框图；
55.图10是本技术实施例提供的电子设备的硬件结构示意图。
具体实施方式
56.为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本技术进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本技术，并不用于限定本技术。
57.需要说明的是，虽然在装置示意图中进行了功能模块划分，在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于装置中的模块划分，或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。
58.除非另有定义，本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本技术实施例的目的，不是旨在限制本技术。
59.此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本公开的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
60.附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。
即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
61.附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。
62.首先，对本技术中涉及的若干名词进行解析：
63.人工智能(artificial intelligence，ai)：是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学；人工智能是计算机科学的一个分支，人工智能企图了解智能的实质，并生产出一种新的能以人类智能相似的方式作出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能可以对人的意识、思维的信息过程的模拟。人工智能还是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
64.语音动态检测(voice activity detector，vad)：用于检测语音的状态，以确定语音状态为静默状态还是激活状态。
65.短时能量(short time energy，ste)：是指一帧语音信号的能量。
66.过零率(zero cross counter，zcc)：是指一帧语音信号在时间域内穿过零的次数。
67.信噪比：是指电子系统中信号和噪声的比例，可以根据信号平均功率与噪声平均功率的比值得到，也可以根据信号电压与噪声电压的比值得到。
68.截幅：是将信号的幅值限制在某一最大值。
69.音量：又称响度，是指声音的大小、强弱，音量的大小取决于振幅，振幅越大，音量越大；反之，振幅越小，音量越小。
70.滤波器组特征(filter bank，fbank)：是一种基于倒谱提取的频域特征，由于其更符合听觉响应特性，因此成为语音识别中一种常用的音频特征。
71.梅尔频率倒谱系数(mel-frequency cepstral coefficient，mfcc):是组成梅尔频率倒谱的系数，其中梅尔频率倒谱是基于声音频率的非线性梅尔刻度的对数能量频谱的线性变换。
72.相关技术中，通过人工检查的方式进行汽车发动机检测，但是这种方式不仅需要具备专业的发动机检测技术，而且还会耗费大量的时间，检测效率低，且可能无法检测出发动机的型号。
73.基于此，本技术实施例提出一种发动机型号检测方法和装置、电子设备、存储介质，通过提取待检测发动机音频的目标声纹特征，将目标声纹特征与样本声纹特征进行比对，当比对结果为目标声纹特征与样本声纹特征匹配，根据样本声纹特征从预设的映射关系中查找出对应的发动机型号，根据发动机型号得到待检测发动机的型号，能够自动识别待检测发动机的型号，避免发动机被改装，且无需花费大量时间去检测发动机，提高了发动机的检测效率。
74.本技术实施例提供的发动机型号检测方法和装置、电子设备、存储介质，具体通过如下实施例进行说明，首先描述本技术实施例中的发动机型号检测方法。
75.本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(artificial intelligence，ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
76.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
77.本技术实施例提供的发动机型号检测方法，涉及人工智能领域，也涉及声纹识别领域。本技术实施例提供的发动机型号检测方法可应用于终端中，也可应用于服务器端中，还可以是运行于终端或服务器端中的软件。在一些实施例中，终端可以是智能手机、平板电脑、笔记本电脑、台式计算机或者智能手表等；服务器端可以配置成独立的物理服务器，也可以配置成多个物理服务器构成的服务器集群或者分布式系统，还可以配置成提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn以及大数据和人工智能平台等基础云计算服务的云服务器；软件可以是实现发动机型号检测方法的应用等，但并不局限于以上形式。
78.本技术实施例可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本技术可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本技术，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
79.参照图1，根据本技术实施例第一方面实施例的发动机型号检测方法，包括但不限于包括步骤s110至步骤s160。
80.步骤s110，获取待检测发动机的初始音频；
81.步骤s120，对初始音频进行静音检测，得到目标音频；
82.步骤s130，若目标音频满足预设条件，则对目标音频进行特征提取，得到目标音频对应的目标声纹特征；
83.步骤s140，获取样本声纹特征；
84.步骤s150，将目标声纹特征与样本声纹特征进行比对，得到比对结果；
85.步骤s160，若比对结果为目标声纹特征与样本声纹特征匹配，则根据样本声纹特征从预设的映射关系中查找出对应的发动机型号，并根据发动机型号得到待检测发动机的型号。
86.在一些实施例的步骤s110中，获取待检测发动机的初始音频，其中初始音频为待检测发动机在工作时发出的声音。
87.在一些实施例的步骤s120中，为了减少发动机型号检测过程中的数据处理量，对初始音频进行静音检测，以确定初始音频中的静音片段和非静音片段，从初始音频中去除
静音片段，得到目标音频。
88.在一些实施例的步骤s130中，若目标音频满足预设条件时，说明目标音频的语音质量较高，待检测发动机能够正常工作，则对目标音频进行特征提取，得到目标声纹特征；若目标音频不满足预设条件，说明目标音频的语音质量较低，待检测发动机工作异常，或者待检测发动机已被改装，当前型号与初始型号不匹配，则不进行后续操作。通过判断目标音频的语音质量是否满足预设条件，能够对待检测发动机进行初步筛选，若待检测发动机的状态为异常，则不进行后续的操作，提高发动机检测效率。
89.在一些实施例的步骤s140中，获取样本发动机的样本音频，对样本音频进行特征提取，得到样本声纹特征，其中样本声纹特征为声纹库中样本发动机对应的声纹特征。可以理解的是，声纹库中存储有样本发动机型号与样本声纹特征的映射关系。需要说明的是，样本声纹特征的提取方法与目标声纹特征的提取方法相同，此处不再赘述。
90.在一些实施例的步骤s150中，将目标声纹特征与样本声纹特征进行比对，得到比对结果，其中比对结果用于表征目标声纹特征与样本声纹特征的相似度，若二者相似度大于预设的阈值，则说明目标声纹特征与样本声纹特征匹配，若二者相似度小于或者等于预设的阈值，则说明目标声纹特征与样本声纹特征不匹配。
91.在一些实施例的步骤s160中，若比对结果为目标声纹特征与样本声纹特征匹配，则从声纹库的映射关系中查找出对应于该样本声纹特征的样本发动机型号，将该样本发动机型号作为待检测发动机的型号。
92.本技术实施例的发动机型号检测方法，通过获取待检测发动机的初始音频，对初始音频进行静音检测，得到目标音频，若目标音频满足预设条件，则对目标音频进行特征提取，得到目标音频对应的目标声纹特征，获取样本声纹特征，将目标声纹特征与样本声纹特征进行比对，得到比对结果，若比对结果为目标声纹特征与样本声纹特征匹配，则根据样本声纹特征从预设的映射关系中查找出对应的发动机型号，并根据发动机型号得到待检测发动机的型号，能够自动识别待检测发动机的型号，提高了发动机检测效率。
93.在一些实施例中，如图2所示，步骤s120具体包括但不限于步骤s210至步骤s220。
94.步骤s210，对初始音频进行静音检测，得到语音段和非语音段；
95.步骤s220，从初始音频中剔除非语音段，得到目标音频。
96.在一些实施例的步骤s210中，可以采用基于短时能量和过零率的方法或者高斯混合模型对初始音频进行静音检测，得到语音段和非语音段。
97.采用短时能量和过零率进行静音检测的步骤如下：获取预设的信号采样率；根据信号采样率对初始音频进行采样，得到采样音频；获取预设的帧长；根据帧长对采样音频进行分帧，得到分帧音频；根据分帧音频的幅度平方和得到短时能量；计算分帧音频的过零率；若短时能量小于预设的短时能量阈值，且过零率大于预设的过零率阈值，则对应的分帧音频为非语音段，否则对应的分帧音频为语音段。其中，信号采样率可以8000hz，帧长可以为20ms。
98.采用高斯混合模型进行静音检测的步骤如下：获取预设的信号采样率；根据采样率对初始音频进行采样，得到采样音频；获取预设的帧长；根据帧长对采样音频进行分帧，得到分帧音频；在频率域对分帧音频进行分频，将分帧音频分为多个子频带；计算每个子频带的对数能量特征；将全部子频带的对数能量特征相加，得到全局能量特征；若全局能量特
征大于能量阈值，则将子频带的对数能量特征输入至高斯混合模型，计算子频带的第一概率和第二概率，其中第一概率用于表征子频带对应的音频段为语音段的概率，第二概率用于表征子频带对应的音频段为非语音段的概率；根据第一概率和第二概率的比值得到子频带的局部对数似然比；根据全部子频带的局部对数似然比的加权和得到全局对数似然比；若每一个子频带的局部对数似然比均大于第一似然比阈值或者全局对数似然比大于第二似然比阈值，则确定分帧音频为语音段，否则为非语音段。其中，信号采样率可以为8khz，帧长可以为20ms，子频带的数目可以为6个，6个子频带的频率范围分别为[80hz,250hz]、[250hz,500hz]、[500hz,1khz]、[1khz,2khz]、[2khz,3khz]和[3khz,4khz]。
[0099]
在一些实施例的步骤s220中，从初始音频中剔除非语音段，得到目标音频，其中非语音段可以为噪声音频段、静音段等。
[0100]
通过执行步骤s210至步骤s220，使得到的目标音频为有效语音片段，避免后续对无效语音片段进行特征提取，减少了发动机型号检测过程中的数据处理量，提高了发动机型号检测的效率。
[0101]
在一些实施例中，如图3所示，步骤s130具体包括但不限于步骤s310至步骤s320。
[0102]
步骤s310，计算目标音频的信噪比、截幅和音量；
[0103]
步骤s320，若信噪比大于预设的第一阈值，截幅大于预设的第二阈值，音量大于预设的第三阈值，则对目标音频进行特征提取，得到目标声纹特征。
[0104]
在一些实施例的步骤s310中，计算目标音频的信噪比、截幅和音量，通过信噪比、截幅和音量的数值大小度量目标音频的语音质量。可以通过向目标音频中添加某一特定噪声例如高斯噪声，分别计算目标音频的第一有功功率和特定噪声的第二有功功率，通过第一有功功率和第二有功功率的比值得到目标音频的信噪比，或者分别计算目标音频的第一平均幅值和特定噪声的第二平均幅值，通过第一平均幅值和第二平均幅值的比值得到目标音频的信噪比。也可以通过预设的滤波器将目标音频分离为有效音频和噪声音频，根据有效音频的第一有功功率和噪声音频的第二有功功率得到信噪比，或者根据有效音频的第一平均幅值和噪声音频的第二平均幅值得到信噪比。将目标音频的幅值限制在小于某一最大值的范围内，将该最大值作为计算得到的截幅。将目标音频的幅值限制在大于某一最小值的范围内，将该最小值作为计算得到的音量。
[0105]
在一些实施例的步骤s320中，若信噪比大于预设的第一阈值，截幅大于预设的第二阈值，音量大于预设的第三阈值，说明目标音频的语音质量较高，待检测发动机能够正常工作，对目标音频进行特征提取，得到目标声纹特征，否则说明目标音频的语音质量较低，待检测发动机工作异常，或者待检测发动机已被改装，则不进行后续操作。
[0106]
通过执行步骤s310至步骤s320，能够对工作状态异常的待检测发动机进行初步筛选，提高发动机检测效率。
[0107]
在一些实施例中，如图4所示，步骤s320具体包括但不限于步骤s410至步骤s420。
[0108]
步骤s410，若信噪比大于第一阈值，截幅大于第二阈值，音量大于第三阈值，则对目标音频进行第一特征提取，得到初始声纹特征；
[0109]
步骤s420，将初始声纹特征输入至预设的特征提取模型，对初始声纹特征进行第二特征提取，得到目标声纹特征。
[0110]
在一些实施例的步骤s420中，将目标声纹特征进行算法特征提取，生成新的声纹
特征向量。需要说明的是，算法特征提取是将目标声纹特征进行降维或者将目标声纹特征重新组合以生成新的声纹特征向量。
[0111]
在一些实施例的步骤s410至步骤s420中，若目标音频的信噪比大于第一阈值，截幅大于第二阈值，音量大于第三阈值，提取目标音频的初始声纹特征，初始声纹特征可以为梅尔频率倒谱系数、基频、滤波器组能量等，将初始声纹特征输入至卷积神经网络或者循环神经网络进行深度声纹特征提取，得到目标声纹特征，卷积神经网络可以为vgg网络、resnet网络等，循环神经网络可以为lstm网络、gru网络、双向lstm网络等。
[0112]
在一些实施例中，如图5所示，步骤s410具体包括但不限于步骤s510至步骤s540。
[0113]
步骤s510，若信噪比大于第一阈值，截幅大于第二阈值，音量大于第三阈值，计算目标音频的功率谱；
[0114]
步骤s520，根据梅尔滤波器组对功率谱进行梅尔滤波，得到第一滤波器组能量；
[0115]
步骤s530，对第一滤波器组能量进行对数变换，得到第二滤波器组能量；
[0116]
步骤s540，根据第二滤波器组能量得到初始声纹特征。
[0117]
在一些实施例的步骤s510中，若信噪比大于第一阈值，截幅大于第二阈值，音量大于第三阈值，对目标音频进行预加重、分帧、加窗等预处理，得到预处理音频，对预处理音频进行短时傅里叶变换，得到预处理音频对应的频谱，根据频谱计算得到目标音频的功率谱。为了减少截断效应，加窗处理中的窗函数可以为汉明窗或者汉宁窗。
[0118]
在一些实施例的步骤s520中，根据梅尔滤波器组对功率谱进行梅尔滤波，得到第一滤波器组能量，其中第一滤波器组能量为未经过对数变换的fbank特征。
[0119]
在一些实施例的步骤s530中，对第一滤波器组能量进行对数变换，得到第二滤波器组能量，其中第二滤波器组能量为fbank特征。
[0120]
在一些实施例的步骤s540中，可以将每帧音频的fbank特征作为目标音频的初始声纹特征。
[0121]
在一些实施例的步骤s510至步骤s540中，若目标音频的信噪比大于第一阈值，截幅大于第二阈值，且音量大于第三阈值，采用高通滤波器对目标音频进行预加重以增强目标音频的高频部分，对增强后的目标音频进行分帧，得到多个分帧音频，将预设的窗函数与分帧音频相乘并进行短时傅里叶变换，得到分帧音频的频谱，根据频谱数值的平方得到功率谱，根据多个梅尔滤波器对功率谱进行梅尔滤波，得到第一滤波器组能量，对第一滤波器组能量进行对数变换，得到第二滤波器组能量，将全部分帧音频的第二滤波器组能量作为目标音频的初始声纹特征。
[0122]
在一些实施例中，如图6所示，步骤s540具体包括但不限于步骤s610至步骤s660。
[0123]
步骤s610，对第二滤波器组能量进行离散余弦变换，得到静态声纹特征；
[0124]
步骤s620，计算静态声纹特征的一阶差分参数和二阶差分参数；
[0125]
步骤s630，计算目标音频的短时能量；
[0126]
步骤s640，根据短时能量计算一阶差分能量和二阶差分能量；
[0127]
步骤s650，根据一阶差分参数、二阶差分参数、一阶差分能量和二阶差分能量得到动态声纹特征；
[0128]
步骤s660，根据静态声纹特征和动态声纹特征得到初始声纹特征。
[0129]
在一些实施例的步骤s610中，对fbank特征进行离散余弦变换，得到12维的梅尔频
率倒谱系数，将该12维的梅尔频率倒谱系数作为静态声纹特征。
[0130]
在一些实施例的步骤s620中，计算静态声纹特征的一阶差分参数，根据一阶差分参数得到二阶差分参数。一阶差分参数的计算方法如公式(1)所示。
[0131][0132]
其中，d1(n)为第n个一阶差分参数，c(n)为第n个梅尔频率倒谱系数，n1为梅尔频率倒谱系数的阶数，本技术实施例中n1为12，m1为一阶差分参数的时间差，其取值可以为1或者2。
[0133]
根据一阶差分参数得到二阶差分参数的计算方法如公式(2)所示。
[0134][0135]
其中，d2(n)为第n个一阶差分参数，d1(n)为第n个一阶差分参数，n2为一阶差分参数的阶数，m2为二阶差分参数的时间差，其取值可以为1或者2。
[0136]
在一些实施例的步骤s630中，将目标音频经过预加重、分帧、加窗等预处理后，计算目标音频中所有帧对应的短时能量。
[0137]
在一些实施例的步骤s640中，根据短时能量计算一阶差分能量，根据一阶差分能量计算二阶差分能量。若第n帧音频的短时能量为e(n)，第n帧的一阶差分能量为δe(n)，一阶差分能量的计算方法如公式(3)所示。
[0138][0139]
其中n为目标音频的总帧数。
[0140]
二阶差分能量的计算方法如公式(4)所示。
[0141][0142]
在一些实施例的步骤s650中，将目标音频中所有帧的一阶差分参数、二阶差分参数、一阶差分能量和二阶差分能量作为动态声纹特征。
[0143]
在一些实施例的步骤s660中，提取目标音频中所有帧的基频，并将所有帧的静态声纹特征、动态声纹特征和基频作为初始声纹特征。
[0144]
在一些实施例的步骤s610至步骤s660中，对第二滤波器组能量进行离散余弦变换，得到12维的梅尔频率倒谱系数，根据梅尔频率倒谱系数得到一阶差分参数，根据一阶差分参数得到二阶差分参数，计算每个分帧音频的短时能量，根据相邻两个分帧音频的短时能量得到一阶差分能量，根据相邻两个一阶差分能量得到二阶差分能量，计算分帧音频的
短时平均幅度差，根据短时平均幅度差得到基音周期，根据基音周期的倒数得到基频，将梅尔频率倒谱系数、一阶差分参数、二阶差分参数、一阶差分能量、二阶差分能量和基频作为初始声纹特征。
[0145]
在一些实施例中，如图7所示，步骤s150具体包括但不限于步骤s710至步骤s730。
[0146]
步骤s710，计算目标声纹特征与样本声纹特征的余弦相似度；
[0147]
步骤s720，将余弦相似度作为目标声纹特征与样本声纹特征进行比对的得分值；
[0148]
步骤s730，若得分值大于预设的得分阈值，则确定目标声纹特征与样本声纹特征的比对结果为目标声纹特征与样本声纹特征匹配。
[0149]
在一些实施例的步骤s710中，计算目标声纹特征与声纹库中样本声纹特征的余弦相似度，其中余弦相似度用于表征目标声纹特征与样本声纹特征的相似度，目标声纹特征与样本声纹特征越相似，余弦相似度的取值越接近1。目标声纹特征与样本声纹特征的余弦相似度越小，表明二者差异较大，反之目标声纹特征与样本声纹特征的余弦相似度越大，表明二者差异越小。
[0150]
在一些实施例的步骤s720中，为了获取目标声纹特征与样本声纹特征进行比对的比对结果，将余弦相似度作为比对的得分值。
[0151]
在一些实施例的步骤s730中，若得分值大于预设的得分阈值，说明目标声纹特征与样本声纹特征的相似程度较大，确定比对结果为目标声纹特征与样本声纹特征匹配。若得分值小于或者等于得分阈值，说明目标声纹特征与该样本声纹特征不匹配，则继续遍历声纹库中的下一个样本声纹特征，直至目标声纹特征与样本声纹特征匹配。若遍历完声纹库的每个样本声纹特征，比对结果均为目标声纹特征与样本声纹特征不匹配，则确定待检测发动机已被改装，当前型号与原有型号不匹配。
[0152]
通过执行步骤s710至步骤s730，可以根据余弦相似度得到目标声纹特征与样本声纹特征进行比对的比对结果，便于确定待检测发动机的型号。
[0153]
参照图8，本技术另一实施例提出一种发动机型号检测方法，包括但不限于步骤s810至步骤s880。
[0154]
步骤s810，获取样本发动机的第一初始音频；
[0155]
步骤s820，对第一初始音频进行静音检测，从第一初始音频中剔除第一非语音段，得到第一目标音频；
[0156]
步骤s830，若第一目标音频的信噪比大于第一阈值，截幅大于第二阈值，音量大于第三阈值，对第一目标音频进行特征提取，得到第一目标音频的第一初始声纹特征，将第一初始声纹特征输入至神经网络模型中，对第一初始声纹特征进行特征提取，得到样本声纹特征，将样本声纹特征及其对应的样本发动机型号存储至声纹库；
[0157]
步骤s840，获取待检测发动机的第二初始音频；
[0158]
步骤s850，对第二始音频进行静音检测，从第二初始音频中剔除第二非语音段，得到第二目标音频；
[0159]
步骤s860，若第二目标音频的信噪比大于第一阈值，截幅大于第二阈值，音量大于第三阈值，对第二目标音频进行特征提取，得到第二目标音频的第二初始声纹特征，将第二初始声纹特征输入至神经网络模型中，对第二初始声纹特征进行特征提取，得到目标声纹特征；
[0160]
步骤s870，从声纹库中读取样本声纹特征，计算目标声纹特征与样本声纹特征的余弦相似度，若余弦相似度大于预设的第四阈值，则确定目标声纹特征与样本声纹特征的比对结果为目标声纹特征与样本声纹特征匹配；若余弦相似度小于或者等于第四阈值，则确定目标声纹特征与样本声纹特征的比对结果为目标声纹特征与样本声纹特征不匹配；
[0161]
步骤s880，若比对结果为目标声纹特征与样本声纹特征匹配，则根据样本声纹特征从声纹库中查找出样本发动机型号，并将样本发动机型号作为待检测发动机的型号；若比对结果为目标声纹特征与样本声纹特征不匹配，则继续从声纹库中读取下一个样本声纹特征，直至完全遍历声纹库中所有的样本声纹特征。
[0162]
本技术实施例还提供一种发动机型号检测装置，如图9所示，可以实现上述发动机型号检测方法，该装置包括第一获取模块910、静音检测模块920、特征提取模块930、第二获取模块940、特征比对模块950和发动机型号检测模块960。其中第一获取模块910用于获取待检测发动机的初始音频；静音检测模块920用于对初始音频进行静音检测，得到目标音频；特征提取模块930用于若目标音频满足预设条件，则对目标音频进行特征提取，得到目标音频对应的目标声纹特征；第二获取模块940用于获取样本声纹特征；特征比对模块950用于将目标声纹特征与样本声纹特征进行比对，得到比对结果；发动机型号检测模块960用于若比对结果为目标声纹特征与样本声纹特征匹配，则根据样本声纹特征从预设的映射关系中查找出对应的发动机型号，并根据发动机型号得到待检测发动机的型号。
[0163]
本技术实施例的发动机型号检测装置用于执行上述实施例中的发动机型号检测方法，其具体处理过程与上述实施例中的发动机型号检测方法相同，此处不再一一赘述。
[0164]
本技术实施例的发动机型号检测装置，通过第一获取模块获取待检测发动机的初始音频，静音检测模块对初始音频进行静音检测，得到目标音频，若目标音频满足预设条件，则利用特征提取模块对目标音频进行特征提取，得到目标音频对应的目标声纹特征，利用第二获取模块获取样本声纹特征，利用特征比对模块将目标声纹特征与样本声纹特征进行比对，得到比对结果，利用发动机型号检测模块对比对结果进行判断，若比对结果为目标声纹特征与样本声纹特征匹配，则根据样本声纹特征从预设的映射关系中查找出对应的发动机型号，并根据发动机型号得到待检测发动机的型号，能够自动识别待检测发动机的型号，提高了发动机检测效率。
[0165]
本技术实施例还提供了一种电子设备，包括：
[0166]
至少一个处理器，以及，
[0167]
与至少一个处理器通信连接的存储器；其中，
[0168]
存储器存储有指令，指令被至少一个处理器执行，以使至少一个处理器执行指令时实现如本技术第一方面实施例中任一项的发动机型号检测方法。
[0169]
下面结合图10对电子设备的硬件结构进行详细说明。该电子设备包括：处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。
[0170]
处理器1010，可以采用通用的cpu(central processin unit，中央处理器)、微处理器、应用专用集成电路(application specific integrated circuit，asic)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本技术实施例所提供的技术方案；
[0171]
存储器1020，可以采用rom(read only memory，只读存储器)、静态存储设备、动态存储设备或者ram(random access memory，随机存取存储器)等形式实现。存储器1020可以
存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器1020中，并由处理器1010来调用执行本技术实施例的发动机型号检测方法；
[0172]
输入/输出接口1030，用于实现信息输入及输出；
[0173]
通信接口1040，用于实现本设备与其他设备的通信交互，可以通过有线方式(例如usb、网线等)实现通信，也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信；和
[0174]
总线1050，在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息；
[0175]
其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
[0176]
本技术实施例还提供一种存储介质，该存储介质是计算机可读存储介质，该计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令用于使计算机执行本技术实施例的发动机型号检测方法。
[0177]
存储器作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外，存储器可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中，存储器可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0178]
本技术实施例描述的实施例是为了更加清楚的说明本技术实施例的技术方案，并不构成对于本技术实施例提供的技术方案的限定，本领域技术人员可知，随着技术的演变和新应用场景的出现，本技术实施例提供的技术方案对于类似的技术问题，同样适用。
[0179]
本领域技术人员可以理解的是，图1至图8中示出的技术方案并不构成对本技术实施例的限定，可以包括比图示更多或更少的步骤，或者组合某些步骤，或者不同的步骤。
[0180]
以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0181]
本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。
[0182]
本技术的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0183]
应当理解，在本技术中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“a和/或b”可以表示：只存在a，只存在b以及同时存在a和b三种情况，其中a，b可以是单数或者复数。字
符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。
[0184]
在本技术所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
[0185]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0186]
另外，在本技术各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
[0187]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括多指令用以使得一台电子设备(可以是个人计算机，服务器，或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read-only memory，简称rom)、随机存取存储器(random access memory，简称ram)、磁碟或者光盘等各种可以存储程序的介质。
[0188]
以上参照附图说明了本技术实施例的优选实施例，并非因此局限本技术实施例的权利范围。本领域技术人员不脱离本技术实施例的范围和实质内所作的任何修改、等同替换和改进，均应在本技术实施例的权利范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种智能吉他及智能吉他的变调控制方法与流程

发动机型号检测方法和装置、电子设备、存储介质与流程

相关文献

最热文献