一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

Morse信号检测与识别方法

2022-06-01 17:34:30 来源:中国专利 TAG:

morse信号检测与识别方法
技术领域
1.本发明涉及信号检测与识别技术领域,具体是一种morse信号检测与识别方法。


背景技术:

2.morse信号,是由点、划和间隔组成的排列组合,唯一地表示字母、数字和标点符号。因编码简单、传输高效、带宽成本小且适应恶劣紧急通信环境,morse电报被广泛用于航空、航海、气象等领域。长期以来,morse电报由人工听抄,在恶劣复杂通信环境下正确率难以保证,且长时间工作会对报务员身心健康产生诸多负面影响。因此,实现morse电报的自动接收具有迫切的应用需求。
3.morse信号的自动接收分为检测与识别两部分。检测是识别的前提,目的是判断接收到的无线音频中是否存在morse信号并获得其时频位置。识别是将检测到的morse信号还原为对应报文信息,是自动接收的最终目标。
4.morse信号检测方法主要有时域、频域和时频域法。包络检测是最早出现的方法,实时性强,不需已知信号频率,但抗噪性能差。锁相环法可以在已知目标信号频点的前提下跟踪信号,但对干扰很敏感。卡尔曼滤波法和自适应卡尔曼滤波法,可以在时域有效去除干扰,但需已知目标信号频率,采样点较多时会有一定时间延迟。频域模拟滤波法、频谱方差法基于频域来检测morse信号,但均难以区分单频信号与目标信号。时频分析法兼顾了信号时域、频域特征,与人工检测方法相似,现有文献采用离散gabor变换,在时频面上对高频电报信号进行捕捉,还有文献提出基于短时傅里叶变换形成的三维谱图,采用数字图像处理的方法来检测电报信号,证明了其可行性及抗干扰性。目前,效果较好的时频分析检测法大致有三种。其中两种方法通过能量分选提取时频图中有信号的片段,然后设计机器学习分类器或者深度神经网络分类器检测morse信号。另一种方法,直接在音频数据时频图上进行基于深度学习的目标检测。这几种方法信道环境均为宽带,各类电台信号间隔较远。但在目标morse信号受到破坏性干扰时,窄带环境内存在大量干扰信号,面临极低信噪比及邻频干扰问题,需要牺牲时频图的时间分辨率获取更高的频率分辨率。这种情况下,时频图中几乎看不出目标信号时域特征,甚至看不到目标信号,深度学习方法基本失效。
5.morse信号识别方法可分为传统机器学习方法和深度学习方法。传统机器学习方法,首先估计点、划及间隔的时域持续长度,对其分别分类,分类后根据其排列组合查表译码,适当加入纠错功能。持续时间的计算,不论是直接在时域跟踪信号波形,还是采用时频谱图,均需要预处理工作,识别结果会受到预处理效果的限制。分类阶段应用最广泛的为传统的机器学习模型,如支持向量机、k-means聚类、模糊c均值聚类等,此类方法只使用代码长度作为特征,没有上下文信息,对明显的代码长度偏差缺乏鲁棒性,不可避免地要进行额外的后处理,包括查表和纠错,增加了识别耗时。最近,隐马尔科夫模型(hmm)结合深度神经网络(dnn)的经典语音识别算法、经典文本识别网络crnn等深度学习方法在morse识别的应用,避免了分阶段的耗时与错误累积,使识别性能进一步提升。尤其crnn识别网络,识别准确率可以达到90%,但该网络需要大量训练样本,且信噪比在-10db以下时准确率会逐渐下
降。
6.另外,以往的研究,识别之初就假设提取的时频段只有目标morse信号,或者直接利用检测阶段检测到的morse信号时频图段作为识别阶段的输入,并没有在检测与识别两部分之间做处理。识别阶段和检测阶段分别对时间分辨率和频率分辨率有高要求,若直接应用检测阶段输出的morse信号时频段进行识别,会严重降低识别准确率,影响自动接收效果。


技术实现要素:

7.针对上述现有技术中morse信号自动化接收效果较差,邻频干扰及低信噪比环境下检测识别的准确率、速度无法达到实用要求的问题,本发明提供一种morse信号检测与识别方法,在复杂信道环境下能够有效地检测并识别morse信号,在保证实时性的同时,识别准确率优于目前最先进的方法。
8.为实现上述目的,本发明提供一种morse信号检测与识别方法,包括如下步骤:
9.步骤1,获取音频时域信号;
10.步骤2,对音频时域信号进行短时傅里叶变换,得到高频率分辨率的第一标准时频图像;
11.步骤3,对第一标准时频图像进行能量分选及特征提取,得到第一有效时频图像以及特征向量,并基于特征向量确定第一有效时频图像中morse信号的频点;
12.步骤4,基于morse信号的频点对音频时域信号进行数字滤波,得到无干扰信号;
13.步骤5,对无干扰信号进行短时傅里叶变换,得到高时间分辨率的第二标准时频图像,并对第二标准时频图像进行能量分选得到第二有效时频图像;
14.步骤6,对第二有效时频图像进行图像增强处理后进行特征序列提取,得到按时域排列的特征序列;
15.步骤7,基于按时域排列的特征序列进行报文预测并输出。
16.在另一个实施例中,步骤2中,所述对音频时域信号进行短时傅里叶变换,具体为:
[0017][0018]
式中,x(m)为音频时域信号,xn(e
j2πf
)为音频时域信号的时频矩阵;ω(n-m)为高频率分辨率逐步滑动的窗函数,即高频率分辨率的短时傅里叶变换参数;j为虚数单位,f为频率,m为音频信号序列的时间,n为短时傅里叶变换得到的时频矩阵的时间;
[0019]
获取音频时域信号时频矩阵模的平方,得到短时傅里叶谱图,即第一标准时频图像,为:
[0020]
pn(f)=|xn(e
j2πf
)|2[0021]
式中,pn(f)为第一标准时频图像。
[0022]
在另一个实施例中,步骤3中,所述对第一标准时频图像进行能量分选及特征提取,得到第一有效时频图像以及特征向量,具体为:
[0023]
将音频时域信号时频矩阵的同一频点的时间轴能量数据进行叠加,得到频率与能量的第一关系曲线,为:
[0024][0025]
式中,f(f)为第一关系曲线,n0为时频矩阵时间起始点,nk为时频矩阵时间结束点;
[0026]
基于第一关系曲线的均值与标准差构建第一自适应定位阈值,为:
[0027]
t=μ cσ
[0028]
式中,f为第一自适应定位阈值,μ为第一关系曲线的均值,σ为第一关系曲线的标准差,c为第一定位系数;
[0029]
在第一关系曲线中截取能量持续在第一自适应定位阈值以上的部分为第一有效信号频段;
[0030]
基于第一有效信号频段在第一标准时频图像中截取得到第一有效时频图像,并将第一有效时频图像的信号带宽、加窗标准差、平均矩形相似度、连通区域中心分布律作为特征向量。
[0031]
在另一个实施例中,步骤3中,所述基于特征向量确定第一有效时频图像中morse信号的频点,具体为:
[0032]
将特征向量输入已训练好的随机森林分类器,分类各调制信号并得到第一有效时频图像中morse信号的频点。
[0033]
在另一个实施例中,步骤4具体为:
[0034]
将morse信号的频点作为中心频率,在音频时域信号中将中心频率上下15hz以外的干扰信号及噪声全部滤掉后,得到无干扰信号。
[0035]
在另一个实施例中,步骤5中,所述对无干扰信号进行短时傅里叶变换,得到高时间分辨率的第二标准时频图像,具体为:
[0036][0037]
式中,x

(m)为无干扰信号,x
′n(e
j2πf
)为无干扰信号的时频矩阵;ω

(n-m)为高时间分辨率逐步滑动的窗函数,即高时间分辨率的短时傅里叶变换参数;j为虚数单位,f为频率,m为音频信号序列的时间,n为短时傅里叶变换得到的时频矩阵的时间;
[0038]
获取无干扰信号时频矩阵模的平方,得到短时傅里叶谱图,即第二标准时频图像,为:
[0039]
p
′n(f)=|x
′n(e
j2πf
)|2[0040]
式中,p
′n(f)为第二标准时频图像。
[0041]
在另一个实施例中,步骤5中,所述对第二标准时频图像进行能量分选得到第二有效时频图像,具体为:
[0042]
将无干扰信号时频矩阵的同一频点的时间轴能量数据进行叠加,得到频率与能量的第二关系曲线,为:
[0043][0044]
式中,f

(f)为第二关系曲线,n0为时频矩阵时间起始点,nk为时频矩阵时间结束
点;
[0045]
基于第二关系曲线的均值与标准差构建第二自适应定位阈值,为:
[0046]
t

=μ

c

σ

[0047]
式中,t

为第二自适应定位阈值,μ

为第二关系曲线的均值,σ

为第二关系曲线的标准差,c

为第二定位系数;
[0048]
在第二关系曲线中截取能量持续在第二自适应定位阈值以上的部分为第二有效信号频段;
[0049]
基于第二有效信号频段在第二标准时频图像中截取得到第二有效时频图像,并保存为合适尺寸。
[0050]
在另一个实施例中,步骤6中,采用加入卷积注意力机制的卷积神经网络层进行特征序列提取,其过程为:
[0051]
卷积层提取第二有效时频图像的特征图f,并基于通道注意力模块得到通道注意力特征图mc(f),为:
[0052][0053]
式中,σc、w0、w1分别为通道激活函数及mlp的权重,maxpool(f)、avgpool(f)分别为特征图f在通道注意力模块中进行全局最大池化处理、平均池化处理,分别为特征图f在通道注意力模块中进行全局最大池化处理、平均池化处理后的通道描述;
[0054]
将通道注意力特征图mc(f)与特征图f进行对应元素逐个相乘得到f

,并将f

作为空间注意力模块的输入,得到空间注意力特征图ms(f

),为:
[0055][0056]
式中,σs、f7×7分别为空间激活函数及拥有7
×
7卷积核的卷积层,maxpool(f

)、avgpool(f

)分别为特征图f

在空间注意力模块中进行全局最大池化处理、平均池化处理,分别为特征图f

在空间注意力模块中进行全局最大池化处理、平均池化处理后的通道描述;
[0057]
将空间注意力特征图ms(f

)与f

对应元素逐个相乘,生成特征图,为:
[0058][0059]
式中,f

为最终生成特征图,即按时域排列的特征序列。
[0060]
在另一个实施例中,步骤7中,所述基于按时域排列的特征序列进行报文预测并输出。
[0061]
采用双层的双向门控循环单元对按时域排列的特征序列进行识别,得到预测报文信息。
[0062]
本发明提供的一种morse信号检测与识别方法,该方法基于时频图对音频信号进行自适应能量分选,并根据特征检测出目标信号频点。在以该频点为中心频率对原音频信号进行窄带数字滤波,在降噪后的时频图上实现目标信号频段的再提取,并进行伪彩色图
像增强。最后进行识别,实现端到端译码,在复杂信道环境下能够有效地检测并识别morse信号,解决了检测与识别工作在分辨率方面的矛盾问题,有效提高了低信噪比环境下的识别准确率,验证了其鲁棒性及实用性。
附图说明
[0063]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
[0064]
图1为本发明实施例中ed-fe-ccbc结构的示意图;
[0065]
图2为本发明实施例中检测与识别方法的流程图;
[0066]
图3为本发明实施例中频谱图段示意图,其中,(a)为其他调制信号的时频图段示例,(b)为morse信号的时频图段示例;
[0067]
图4为本发明实施例中能量-时间变化曲线示意图,其中,(a)为其他调制信号的能量-时间变化曲线示例,(b)为morse信号的能量-时间变化曲线示例;
[0068]
图5为本发明实施例中滤波去噪前的时频图像;
[0069]
图6为本发明实施例中滤波去噪后的时频图像;
[0070]
图7为本发明实施例中注意力机制模块的结构图;
[0071]
图8为本发明实施例中按时域排列的特征序列示意图;
[0072]
图9为本发明实施例中两层的bigru与ctc拼接的结构图;
[0073]
图10为本发明实施例中示例下复杂环境下的莫尔斯信号检测示意图;
[0074]
图11为本发明实施例中示例下仿真数据的字准确率随信噪比的变化曲线示意图;
[0075]
图12为本发明实施例中示例下仿真数据的样本准确率随信噪比的变化曲线示意图。
[0076]
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0077]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0078]
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后
……
)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
[0079]
另外,在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0080]
在本发明中,除非另有明确的规定和限定,术语“连接”、“固定”等应做广义理解,
例如,“固定”可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接,还可以是物理连接或无线通信连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
[0081]
另外,本发明各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
[0082]
为了解决morse信号自动化接收效果较差,邻频干扰及低信噪比环境下检测识别的准确率、速度无法达到实用要求的问题。本实施例结合机器学习与深度学习,提出一种morse信号检测与识别方法,通过图1中的ed-fe-ccbc结构实现,该方法以窄带电台音频信号为输入,内部盲目地检测目标morse信号,并实现端到端报文信息的输出。在检测阶段,利用自适应阈值能量分选法,将时频图中各调制信号分离,选取时、频域特征进行提取,应用随机森林分类方法完成morse信号检测。在识别阶段,加入滤波再提取的预处理过程,用数字滤波器去除干扰,并进行高时间分辨率的短时傅里叶变换、目标频段截取、灰度时频图伪彩色化,生成合适尺寸作为识别网络的输入。基于对crnn网络的改进,提出融入卷积注意力机制的ccbc网络结构,实现端到端译码输出。可以保证实时性,且准确率优于目前最先进的方法。
[0083]
参考图2,为本实施例公开的一种morse信号检测与识别方法,具体包括如下步骤:
[0084]
步骤1,获取音频时域信号;
[0085]
步骤2,对音频时域信号进行短时傅里叶变换,得到高频率分辨率的第一标准时频图像;
[0086]
步骤3,对第一标准时频图像进行能量分选及特征提取,得到第一有效时频图像以及特征向量,并基于特征向量确定第一有效时频图像中morse信号的频点;
[0087]
步骤4,基于morse信号的频点对音频时域信号进行数字滤波,得到无干扰信号;
[0088]
步骤5,对无干扰信号进行短时傅里叶变换,得到高时间分辨率的第二标准时频图像,并对第二标准时频图像进行能量分选得到第二有效时频图像;
[0089]
步骤6,对第二有效时频图像进行图像增强处理后进行特征序列提取,得到按时域排列的特征序列;
[0090]
步骤7,基于按时域排列的特征序列进行报文预测并输出。
[0091]
本实施例中,参考图1,ed-fe-ccbc结构由三部分组成,分别为数据收集(对应上述步骤1)、信号检测(对应上述步骤2-3)、信号识别(对应上述步骤4-7)。在ed-fe-ccbc结构中,ed表示信号检测阶段能量检测法energy detection method的简写,fe表示信号识别阶段滤波再提取方法filtering and re-extraction method的简写,ccbc为识别网络cbam cnn bigru ctc的简写。
[0092]
在步骤1中的数据收集过程中,音频时域信号可以为真实音频数据。本实施例准备了两个来源的数据集,频率环境均为0~5000hz的电台常用频段。为了验证本实施例中检测与识别方法的的实用性,加强信号识别模型的可信度,可以利用专业的报训终端来收集真实音频数据,终端音频中会随机出现强度、载频、数目、信息均未知的am、fm、morse和话音信号等信号,发送端可控制发送morse信号的载频及数目。实时录制报训终端音频数据,并以
时间为单位等间隔截断,生成音频时域信号作为信号检测部分的输入信息。
[0093]
为了研究不同信噪比情况下识别模型的性能,模仿真实数据,可以应用程序生成了万条morse信号,将其随机加入不同信噪比的高斯白噪声。仿真数据的实验过程将省去数字滤波器及其之前的处理,直接进行短时傅里叶变换及信号分离。
[0094]
本实施例中,利用传统机器学习方法对morse信号进行信号检测,将音频时域信号进行短时傅里叶变换,基于时频图像,进行自适应阈值能量分选,分别提取分选信号的特征向量,应用随机森林分类器分类,实现morse信号检测并输出对应载频(即频点),简称为能量检测法(ed)。
[0095]
时频图能够同时反映能量、频率及时间三者的关系,有利于提取信号的有效特征。应用短时傅里叶变换(stft)公式可以得到信号时频谱,再将其统一映射到适合图像处理的像素值区间[0,255],得到待检测的标准时频图像。因此,在步骤2的具体实施过程中,对音频时域信号进行高频率分辨率的短时傅里叶变换,具体为:
[0096][0097]
式中,x(m)为音频时域信号,xn(e
j2πf
)为音频时域信号的时频矩阵;ω(n-m)为高频率分辨率逐步滑动的窗函数,即高频率分辨率的短时傅里叶变换参数;j为虚数单位,f为频率,m为音频信号序列的时间,n为短时傅里叶变换得到的时频矩阵的时间;
[0098]
获取音频时域信号时频矩阵模的平方,得到短时傅里叶谱图,即第一标准时频图像,为:
[0099]
pn(f)=|xn(e
j2πf
)|2[0100]
式中,pn(f)为第一标准时频图像。
[0101]
在时频图中,有信号的频段能量较背景噪声能量有明显增强,因此本实施例中应用能量快速定位法实现信号分离,将时频矩阵的同一频点的时间轴能量数据进行叠加,得到频率与能量的关系曲线,通过计算此曲线的均值与标准差,构建自适应定位阈值,取能量持续在阈值以上的部分为有效信号频段,并在原时频图中截取出各信号对应频段。因此,在步骤3的具体实施过程中,对第一标准时频图像进行能量分选及特征提取,得到第一有效时频图像以及特征向量,具体为:
[0102]
将音频时域信号时频矩阵的同一频点的时间轴能量数据进行叠加,得到频率与能量的第一关系曲线,为:
[0103][0104]
式中,f(f)为第一关系曲线,n0为时频矩阵时间起始点,nk为时频矩阵时间结束点;
[0105]
基于第一关系曲线的均值与标准差构建第一自适应定位阈值,为:
[0106]
t=μ cσ
[0107]
式中,t为第一自适应定位阈值,μ为第一关系曲线的均值,σ为第一关系曲线的标准差,c为第一定位系数,本实施例中经多次测试,将第一定位系数c设置为0.8。
[0108]
在第一关系曲线中截取能量持续在第一自适应定位阈值以上的部分所对应的频
段为第一有效信号频段。基于第一有效信号频段在第一标准时频图像中截取对应频段的时频图像,得到第一有效时频图像。本实施例中,选择第一有效时频图像中三个维度的四个特征组成特征向量,来区分morse信号,四个特征分别为:信号带宽、加窗标准差、平均矩形相似度、连通区域中心分布律,窄带环境下其表现相对稳定,且提取速度快。
[0109]
本实施例中的信号带宽即为有效信号的频段长度,如图3所示,morse信号带宽一般在几十赫兹以内,在信噪比较低情况下,通过阈值截取后甚至只有几赫兹,可以以此区分目标信号与话音信号等带宽大的电台信号。
[0110]
对于加窗标准差,根据有效信号频段对应的时频矩阵可计算得到对应f(f),并求出其取最大值时对应频点fi,进而可得到该频点对应的能量-时间曲线f(t),为了减小信号幅值大小的影响,将能量值全部映射到[0,255]区间。如图4所示,较其他信号,morse信号的f(t)波动强烈。将曲线时间轴等分为m个窗,分别计算能量值的标准差,再求平均,可以作为信号波动程度的衡量指标。
[0111]
对于平均矩形相似度,morse信号在时频图上表现为多个断续的规则矩形区域(如图3所示),相比其他调制信号,平均矩形相似度会较高。
[0112]
对于连通区域中心分布律,针对各连通区域的中心点的y坐标值(代表频率),求均值及最大值y
max
、最小值y
min
,可以计算区间[a,b],为:
[0113][0114]
区间内的中心点个数占总中心点个数的比例,即为中心分布律。morse信号的各矩形块中心基本分布在一条水平线上(如图2所示),较其他调制信号,中心分布律高。
[0115]
在确定第一有效时频图像以及特征向量后,本实施例中采用随机森林算法来确定第一有效时频图像中morse信号的频点。随机森林算法构建多个独立的子决策树作为分类任务的构建块,每个子决策树使用不同的方法来生成用于分类目的的二元问题,并对输入数据的预测进行投票,通过轮询过程确定最终的分类结果。与传统的决策树分类算法相比,随机森林分类器通过将小决策树与随机特征子集相结合,更有效地降低了偏方差,从而防止训练过程中的过拟合。因此,对于步骤3中的基于特征向量确定第一有效时频图像中morse信号的频点,其具体实施过程为:
[0116]
将特征向量输入已训练好的随机森林分类器,分类各调制信号并得到morse信号对应的特征向量,进而得到第一有效时频图像中morse信号的频点。即得到了信号检测结果及音频时域信号中对应morse电报频点。
[0117]
在信号检测阶段得到的目标信号时频图的时间特征明显失真,不能直接应用到识别工作中。如果利用高时间分辨率进行短时傅里叶变换截取信号频段(频率分辨率变为几百赫兹),因邻频morse干扰,会存在图5所示的混叠现象,无法识别。
[0118]
数字滤波器可以滤除指定带宽之外的所有信号,对提高信噪比有显著效果。因此,在步骤4的具体实施过程中,基于morse信号的频点对音频时域信号进行数字滤波,得到无干扰信号,具体为:
[0119]
以morse信号频点为中心频率的快速窄带滤波:将信号检测得到的morse信号的频点作为中心频率,在音频时域信号中将中心频率上下15hz以外的干扰信号及噪声全部滤掉后,得到无干扰信号。
[0120]
随后进行高时间分辨率的短时傅里叶变换,并再次利用检测阶段的信号分选法,截取出有效信号区域,由图6可以观察到,图片规律清晰,滤波去噪有效改善了高检测率与高识别率不能兼得的问题。因此,在步骤5的具体实施过程中,对无干扰信号进行短时傅里叶变换,得到高时间分辨率的第二标准时频图像,具体为:
[0121][0122]
式中,x

(m)为无干扰信号,x
′n(e
j2πf
)为无干扰信号的时频矩阵;ω

(n-m)为高时间分辨率逐步滑动的窗函数,即高时间分辨率的短时傅里叶变换参数;j为虚数单位,f为频率,m为音频信号序列的时间,n为短时傅里叶变换得到的时频矩阵的时间;
[0123]
获取无干扰信号时频矩阵模的平方,得到短时傅里叶谱图,即第二标准时频图像,为:
[0124]
p
′n(f)=|x
′n(e
j2πf
)|2[0125]
式中,p
′n(f)为第二标准时频图像。
[0126]
在步骤5中,对第二标准时频图像进行能量分选得到第二有效时频图像的具体实施过程为:
[0127]
将无干扰信号时频矩阵的同一频点的时间轴能量数据进行叠加,得到频率与能量的第二关系曲线,为:
[0128][0129]
式中,f

(f)为第二关系曲线,n0为时频矩阵时间起始点,nk为时频矩阵时间结束点;
[0130]
基于第二关系曲线的均值与标准差构建第二自适应定位阈值,为:
[0131]
t

=μ

c

σ

[0132]
式中,t

为第二自适应定位阈值,μ

为第二关系曲线的均值,σ

为第二关系曲线的标准差,c

为第二定位系数;
[0133]
在第二关系曲线中截取能量持续在第二自适应定位阈值以上的部分所对应的频段为第二有效信号频段。基于第二有效信号频段在第二标准时频图像中截取对应频段的时频图像,并保存为合适尺寸,即得到第二有效时频图像。
[0134]
图像增强主要是使经过处理的图像更适合人类视觉系统或计算机识别系统,增强图像的可重组性。伪彩色图像的处理是将黑灰色的灰度变换成不同的颜色,分离的层数越多,提取的信息就越多,从而达到图像增强的目的,是一种视觉效果显著且不太复杂的图像增强技术。因此,在步骤5的具体实施过程中,对第二有效时频图像进行图像增强处理具体为:
[0135]
选用viridis映射将灰度图伪彩色化,其通过改变色彩的饱和度形成渐变色,彼此接近的值具有相似的颜色,远离的值具有更多不同的颜色。viridis映射尽可能多地利用了色彩空间,可以保持均匀性,适用于数值分布线性分布的情况。绝大多数情况下,该渐变色可以作为首选。
[0136]
本实施例中,在步骤6中特征序列提取的实施过程中,采用加入卷积注意力机制的
卷积神经网络层进行特征序列提取。计算机视觉中的注意机制来源于对人类视觉的研究,通过训练调整参数配置,可以使计算机网络像人类视觉一样重视有用信息,减少无效信息的干扰,提高效率与准确率。卷积的注意力机制模块(cbam),将通道和空间注意力机制按照先后顺序相互结合,可以有效提升卷积层对关键特征的提取能力,抑制不必要特征。另外,cbam是轻量级即插即拔挂件式模块,可以无缝集成到任何cnn架构中(在每层cnn后接入)并忽略开销进行端到端训练,满足morse电报的快速译码要求。本实施例中的cbam结构如图7所示,其进行特征序列提取的过程为:
[0137]
卷积层通过第二有效时频图像提取到的特征图f∈rc×h×w首先经过通道注意力机制模块,辨别哪些内容具有重要作用。特征图f分别进行空间的全局最大池化和平均池化获得两个1
×1×
c的通道描述和送入含单层隐藏层的多层感知机(multilayer perceptron,mlp)构成的共享网络,输出后逐元素求和合并,经sigmoid函数激活,产生通道注意力特征图mc(f),为:
[0138][0139]
式中,σc、w0、w1分别为通道激活函数及mlp的权重,maxpool(f)、avgpool(f)分别为特征图f在通道注意力模块中进行全局最大池化处理、平均池化处理,分别为特征图f在通道注意力模块中进行全局最大池化处理、平均池化处理后的通道描述。
[0140]
将通道注意力特征图mc(f)与特征图f进行对应元素逐个相乘得到f

,并将f

作为空间注意力模块的输入。空间注意力机制关注图片哪些地方具有重要作用,f

进入最大池化层和平均池化层分别得到和卷积降维为1个通道数,激活生成空间注意力特征图ms(f)为:
[0141][0142]
式中,σs、f7×7分别为空间激活函数及拥有7
×
7卷积核的卷积层,maxpool(f

)、avgpool(f

)分别为特征图f

在空间注意力模块中进行全局最大池化处理、平均池化处理,分别为特征图f

在空间注意力模块中进行全局最大池化处理、平均池化处理后的通道描述;
[0143]
将空间注意力特征图ms(f

)与f

对应元素逐个相乘,最终生成特征图f

,整个cbam过程可表示为:
[0144][0145]
式中,表示对应元素逐个相乘,f

为最终生成特征图,即按时域排列的特征序列。
[0146]
本实施例中,cbam-cnn模块的具体设置如表1所示,组合层依次为卷积层、正则化层、激活函数、注意力机制模块、最大池化层,设计连续两个组合层,输入图片尺寸高度统一
为32,宽度不定,只设置最大宽度。经过此网络,morse信号时频图的频率方向维度(高度)变为1,时间方向维度(宽度)变为原图片的四分之一,通道方向维度为64,形成图8所示的特征序列。
[0147]
表1 cbam-cnn模块的具体设置
[0148][0149]
在步骤7中的具体实施过程中,采用双层的双向门控循环单元对按时域排列的特征序列进行识别,得到预测报文信息。门控循环单元(gru)是长短期记忆(lstm)网络的一种变体,其将lstm输入门和遗忘门合并为更新门,同时合并数据单元状态和隐层状态,实现了网络结构的简化。与lstm网络一样,gru能够捕获前文信息,处理变长序列,显著抑制梯度弥散及梯度爆炸等现象;又因其结构更为简单,模型参数更少,可以降低训练过程中的过拟合风险,在保证预测精度的基础上,提升收敛速度。morse电报任意时刻码字预测与其前后码之间均有重要关联,但gru网络只能单向感知按时间正序传递的前码信息,无法顾及到未来的码字。双向门控循环单元(bigru)同时训练两个方向相反、参数独立的gru网络,具有更强的上下文逻辑关系记忆和筛选能力,能更精准的预测当前报文。bigru每个序列输出都对应一个字符元素,实际情况中morse信号字长不确定且每字符对应时间长度不等,很难做字符对齐。ctc提出一种不需要对齐的损失函数计算方法,将其添加到最后一层bigru的输出层,减轻了网络预测不确定的压力,实现了端到端自动对齐输出。我们设置两层的bigru与ctc拼接,结构如图9所示,输入特征序列x1,x2,

,xn,可以直接输出预测报文信息。
[0150]
下面结合具体的示例对本实施例中的检测与识别方法作出进一步的说明。
[0151]
检测部分,连接终端与计算机,应用计算机实时录制音频数据,并每10s截断,依次送入检测系统。由于信噪比等数据无法具体得知,收集不同复杂程度的65段音频数据,通过能量分选方法,分离信号并提取四种特征,制作特征向量及标签,训练随机森林分类器,调整参数后,设置时频图的频率分辨率为6~9hz,可基本实现复杂环境下morse信号的检测。
[0152]
示例音频中共有四路morse信号及四路其他调制信号,morse信号的频点分别为2000、2100、2770、2800hz,其检测流程及结果输出如图10所示。
[0153]
由音频时域信号图及时频图可观察到,四路morse信号的信噪比都比较低,尤其2800hz处信号,存在邻频干扰且自身能量低,在音频时频图中根本观察不到,无法打框,目标检测方法失效。在少量音频样本的情况下,神经网络分类器学习不到充分特征,且需要较多训练时间,而随机森林分类器几乎不需要训练时间,能够应用少量训练数据评估各个特征在分类问题上的重要性,得到分类结果。实验表明,在复杂窄带环境下,本实施例中的能量检测法可以顺利检测出各种信噪比及邻频情况下的morse信号,输出的频点与原载频存
20db环境下,即使不断牺牲时间加宽图片,字准确率始终低于90%,达不到实用要求,故以-18db及以上信噪比为实验环境来选取合适尺寸。如表4所示,图片宽度为200时,译码准确率达到峰值,之后基本维持但耗时增加。200宽度为衡量准确率与算法耗时后的最优尺寸,计算对应的字符数量,得到输入图片每个最小单位(点的时长)至少需要包含两个像素点的结论。
[0164]
表4算法的精度与耗时
[0165][0166]
综上,本实施例提出基于ed-fe-ccbc结构的morse信号自动检测与识别方法,应用于复杂窄带信道,以电台音频为输入,实时输出morse信号报文。以仿真数据和真实数据进行实验,结果表明本文系统性能显著优于已有方法,解决了检测与识别工作在分辨率方面的矛盾问题,有效提高了低信噪比环境下的识别准确率,验证了其鲁棒性及实用性。在不知晓报文起止位置的情况下,自动接收电台信号,只能按时间截取音频,其首尾会存在断码,损失报文信息,未来将研究连续同频morse时频图的拼接与再分割问题,实现电台morse信号无损失实时接收。
[0167]
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献