一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

提高辐射源信号分选结果完整性和正确性的数据挖掘方法

2022-11-14 14:45:57 来源:中国专利 TAG:


1.本发明涉及雷达辐射源信号分选技术领域,特别是涉及一种提高辐射源信号分选结果完整性和正确性的数据挖掘方法。


背景技术:

2.雷达辐射源信号分选是电子对抗技术的重要环节之一,它是指将特定的某部雷达信号从混杂随机的信号流中分离出来的处理过程。早期针对雷达辐射源信号分选的算法有序列搜索法、设定参数量化容差的小盒匹配法、基于空间距离的多参数聚类法等,随着人工神经网络研究的深入,人工神经网络方面的成果如自组织神经网络、概率神经网络等也被应用于信号分选。然而,这些用于雷达辐射源信号分选的算法主要是基于对截获的辐射源原始脉冲数据的分析和处理,其分选结果的完整性和准确性主要依赖于算法本身,而缺少对原始脉冲数据进行数据挖掘的过程,因而导致雷达辐射源信号分选结果的完整性和正确性都有待提高。


技术实现要素:

3.针对现有技术存在的问题,本发明提供一种提高辐射源信号分选结果完整性和正确性的数据挖掘方法,以解决辐射源分选结果可能不完整、不正确的问题。
4.为实现上述目的,本发明采取如下的技术方案:
5.一种提高辐射源信号分选结果完整性和正确性的数据挖掘方法,包括以下步骤:
6.步骤一:根据辐射源的载频特征值rf和脉宽特征值pw确定筛选范围,并根据所述筛选范围对原始全脉冲数据进行筛选,得到筛选后的全脉冲数据;
7.步骤二:获取辐射源的pri特征类型,若所述pri特征类型为固定类型或者组变类型,则执行步骤三;若所述pri特征类型为参差类型,则执行步骤四;
8.步骤三:采用固定/组变挖掘方法对筛选后的全脉冲数据进行数据挖掘,得到挖掘后的样本数据;
9.步骤四:采用参差挖掘方法对筛选后的全脉冲数据进行数据挖掘,得到挖掘后的样本数据;
10.步骤五:根据设定的载频容差rf_tol和脉宽容差pw_tol判断挖掘后的样本数据中载频特征值rf和脉宽特征值pw的异常类型,并存储载频特征值rf和脉宽特征值pw的异常值。
11.与现有技术相比,本发明具有以下有益效果:
12.本发明提供了一种提高辐射源信号分选结果完整性和正确性的数据挖掘方法,该方法利用辐射源的pri特征类型,根据不同的pri特征类型,采用不同的数据挖掘方法进行数据挖掘,使其更准确的描述雷达实际发射波形,同时能够分析出全脉冲数据中的载频特征值和脉宽特征值的异常值,使分析结果更加准确地描述雷达信号的边界范围,根据此方法挖掘后分析结果,可以进一步提高雷达辐射源信号分选结果的完整性和正确性。
附图说明
13.图1为本发明所述的一种提高辐射源信号分选结果完整性和正确性的数据挖掘方法的流程图;
14.图2为本发明中固定/组变挖掘方法的流程图;
15.图3为本发明中参差挖掘方法的流程图。
具体实施方式
16.下面将结合附图及较佳实施例对本发明的技术方案进行详细描述。
17.如图1所示,本发明提供一种提高辐射源信号分选结果完整性和正确性的数据挖掘方法,该数据挖掘方法的步骤如下:
18.步骤一:首先根据辐射源的载频特征值rf和脉宽特征值pw确定筛选范围,并根据筛选范围对原始全脉冲数据进行筛选,得到筛选后的全脉冲数据。
19.在本步骤中,根据辐射源的载频特征值rf和脉宽特征值pw,分别计算载频特征值rf的最大值rf
max
和最小值rf
min
以及脉宽特征值pw的最大值pw
max
和最小值pw
min
,然后以大于rf
min-300mhz且小于rf
max
300mhz和大于pw
min-50μs且小于pw
max
50μs的范围作为筛选范围即(rf
min-300mhz,rf
max
300mhz)∩(pw
min-50μs,pw
max
50μs),根据筛选范围对原始全脉冲数据进行筛选,筛选出来的全脉冲数据就是该辐射源用来分选和挖掘的数据。
20.步骤二:获取辐射源的pri(脉冲重复时间间隔)特征类型,若pri特征类型为固定类型或者组变类型,则执行步骤三,采用固定/组变挖掘方法对筛选后的全脉冲数据进行数据挖掘,得到挖掘后的样本数据;若pri特征类型为参差类型,则执行步骤四,采用参差挖掘方法对筛选后的全脉冲数据进行数据挖掘,得到挖掘后的样本数据。
21.最后,步骤五:根据设定的载频容差rf_tol和脉宽容差pw_tol判断挖掘后的样本数据中载频特征值rf和脉宽特征值pw的异常类型,并存储载频特征值rf和脉宽特征值pw的异常值。例如,将大于rf
min-rf_tol且小于rf
max
rf_tol的载频特征值判定为rf异常值,异常类型设置为“rf超出范围”,将大于pw
min-pw_tol且小于pw
max
pw_tol的脉宽特征值判定为pw异常值,异常类型设置为“pw超出范围”,并对rf异常值和pw异常值进行存储。
22.下面对步骤三中的固定/组变挖掘方法和步骤四中的参差挖掘方法的具体步骤分别进行介绍。
23.固定/组变挖掘方法:
24.组变类型的pri序列的完整特征为:从{pri1,pri2,
……
prio}集合中任意抽取一个prii值,使其连续出现s次,再任意抽取一个prij值(j≠i),使其连续出现t次,s、t的个数大于等于1,且不固定。
25.当组变类型的pri序列不完整时,需要数据挖掘,以下是pri特征类型为固定类型或者组变类型时的数据挖掘步骤,如图2所示:
26.步骤31:根据辐射源的pri特征序列对筛选后的全脉冲数据进行序列搜索,并记录pri特征序列里的每个pri特征值出现的次数在集合q中,集合q是一组映射,其key是各个pri特征值,value是该pri特征值出现的次数。根据最原始pri特征序列(即从未被更新过的pri特征序列)获得的集合q记为集合q
old
。搜索后获得若干段样本数据,每段样本数据之间,就是要挖掘的区间。
27.筛选后的全脉冲数据的时间间隔为ta~tb,通过序列搜索,共获得n段样本数据,第n(n=1,2,

,n)段样本数据的时间间隔为t
n,a
~t
n,b
,其中下标n代表第n段样本数据,下标a和b分别代表时间间隔的起始和终止。
28.步骤32:根据各段样本数据获取挖掘区间,以下是获取挖掘区间的步骤:
29.(1)判断第1段样本数据的起始时刻t
1,a
是否与筛选后的全脉冲数据的起始时刻ta相等,若不相等,则将ta~t
1,a
记录为1个挖掘区间;
30.(2)判断第n段样本数据的终止时刻t
n,b
是否与筛选后的全脉冲数据的终止时刻tb相等,若不相等,则将t
n,b
~tb记录为1个挖掘区间;
31.(3)将t
n,b
~t
n 1,a
(n=1,2,

,n-1)即t
1,b
~t
2,a


,t
n-1,b
~t
n,a
记录为n-1个挖掘区间;
32.将步骤(1)、(2)、(3)中获得的挖掘区间共计为m个,其中第m(m=1,2,

,m)个挖掘区间的时间间隔为t
m,a
~t
m,b
,其中下标m代表第m个挖掘区间,下标a和b分别代表挖掘区间的时间间隔的起始和终止。
33.接下来开始循环遍历步骤32获得的m个挖掘区间,准备挖掘。
34.步骤33:在第m个挖掘区间里,以到达时间为时刻t
m,a
的脉冲作为要挖掘的第一个脉冲,以到达时间为时刻t
m,b
的脉冲作为要挖掘的最后一个脉冲,通过以下步骤对第m个挖掘区间进行数据挖掘:
35.(4)对在第m个挖掘区间的全脉冲数据求取j(j=1,2,3)级到达时间差δtoaj:
36.定义:j=1时,相邻两脉冲间的到达时间差值为一级到达时间差δtoa1,表达式如下:
37.δtoa1=toa
i 1

toai;i=1,2,

,n
m-1
ꢀꢀꢀ①
38.式

中,i代表区间内第i个脉冲,nm为脉冲总数,其中i是逐1累加的。
39.j=2时,间隔1个脉冲,两脉冲到达时间差值为二级到达时间差δtoa2,表达式如下:
40.δtoa2=toa
i 2

toai;i=1,3,

,n
m-2
ꢀꢀꢀ②
41.式

中,i代表区间内第i个脉冲,nm为脉冲总数,其中i是逐2累加的。
42.j=3时,间隔2个脉冲,两脉冲到达时间差值为三级到达时间差δtoa3,表达式如下:
43.δtoa3=toa
i 3

toai;i=1,4,

,n
m-3
ꢀꢀꢀ③
44.式

中,i代表区间内第i个脉冲,nm为脉冲总数,其中i是逐3累加的。
45.将一级到达时间差δtoa1、二级到达时间差δtoa2、三级到达时间差δtoa3统记为pri
i,j
,pri
i,j
表示第i j个脉冲与第i个脉冲的时间间隔。
46.(5)将pri
i,j
在容差范围内值相同的归为第k(k=1,2,

,k)组,其中k为最终划分的总组数,第k组的时间间隔统称为prik,其中每组是一个映射,其key是相同值的prik,value是prik统计出来出现的次数ck。统计出现次数最多的prik并记为预备挖掘值pri_s。
47.(6)根据预备挖掘值pri_s在此挖掘区间里进行序列搜索,若可以获得一段或多段连续的脉冲数据,称为距离验证数据,则将预备挖掘值pri_s做距离验证和大小验证,其中第一段距离验证数据里第一个脉冲数据的到达时间记为t_sa,最后一段距离验证数据里最后一个脉冲数据的到达时间记为t_sb。
48.在样本数据里,将t
m,a
与前一个脉冲的时间间隔记为pri_ya,将t
m,b
与后一个脉冲的时间间隔记为pri_yb。其中,若m=1,则pri_ya=0;若m=m,则pri_yb=0。
49.距离验证中的距离是指脉冲数据之间的到达时间差,大小验证中的大小指的是预备挖掘值pri_s数值的大小。先验证预备挖掘值pri_s的距离是否符合条件(

)、(

):
50.(

)t
m,a
与t_sa的差值不大于pri_ya数值10倍的大小;
51.(

)t
m,b
与t_sb的差值不大于pri_yb数值10倍的大小。
52.若预备挖掘值pri_s至少符合条件(

)和条件(

)中的一个,则距离验证成功,此时,如果只符合条件(

),则将pri_ya记为pri_y;如果只符合条件(

),则将pri_yb记为pri_y;如果条件(

)和条件(

)都符合,则将pri_ya和pri_yb里距离预备挖掘值pri_s最近的特征值记为pri_y。
53.接下来验证预备挖掘值pri_s的大小是否符合条件(

)、(

):
54.(

)预备挖掘值pri_s小于pri_y的5倍;
55.(

)预备挖掘值pri_s大于pri_y的0.2倍。
56.若预备挖掘值pri_s同时符合条件(

)、(

)两个条件,则大小验证成功,否则大小验证失败。若距离验证和大小验证均成功,则将预备挖掘值pri_s更新到pri特征序列里。如果验证没有成功,就将预备挖掘值pri_s从映射组删除,再重复步骤(5)、(6),直至完成第m个挖掘区间的数据挖掘。
57.步骤34:返回步骤31,将由步骤33更新后的pri特征序列再重新计算步骤31,即根据更新后的pri特征序列对筛选后的全脉冲数据重新进行序列搜索,将更新后的pri特征序列里的每个pri特征值出现的次数记录在集合q
new
中,并获得新的挖掘区间。
58.接下来利用挖掘前后pri特征值出现的次数做影响验证,即利用集合q
new
与集合q
old
做影响验证,其中影响验证是指更新后的pri特征序列在序列搜索时是否会影响到原pri特征值的搜索结果。
59.以下是利用集合q
new
与集合q
old
做影响验证的步骤:
60.验证集合q
new
与集合q
old
是否符合以下条件(

)、(

):
61.(

)在集合q
old
与集合q
new
存在相同key值时,集合q
new
对应的value大于等于集合q
old
对应的value;
62.(

)在集合q
new
存在的key值,而集合q
old
不存在相同的key值时,集合q
new
对应的value大于0。
63.若集合q
new
与集合q
old
同时满足条件(

)和条件(

),则影响验证成功,此时,以获得的新的挖掘区间更新由步骤32获得的m个挖掘区间,并继续步骤33进行数据挖掘,最终得到挖掘后的样本数据;若影响验证失败,则不更新挖掘区间,并选取下一个挖掘区间即第m 1个挖掘区间继续挖掘,最后直至挖掘不到数据后结束,最终得到挖掘后的样本数据。
64.参差挖掘方法
65.参差类型的pri序列的完整特征为,以{pri1,pri2,
……
prii……
prio}为有序集合,依次抽取,抽取结果可以简单表示为prii、pri
i 1
、pri
i 2
……
prio、pri1、pri2……
pri
i-1
。以上抽取结果循环出现。
66.当参差类型的pri序列不完整时,需要数据挖掘,以下是pri特征类型为参差类型时的数据挖掘步骤,如图3所示:
67.步骤41:根据辐射源的pri特征序列对筛选后的全脉冲数据进行序列搜索,获得若干段样本数据,当pri特征序列里的某一个pri特征值总是与下一个pri特征值相隔一个或多个脉冲数据,则将当前pri特征值在pri特征序列的索引记为挖掘索引,例如prii总是与pri
i 1
相隔一个脉冲数据,将prii在特征序列的索引i-1记为挖掘索引。挖掘索引可以是一个或多个,将这些挖掘索引记为挖掘序列。
68.步骤42:遍历挖掘序列,准备挖掘,选取其中一个挖掘索引,进行以下挖掘步骤:
69.(1)根据选取的挖掘索引对应的pri特征值,将该pri特征值记为pri_i,遍历样本数据,找到能计算出特征值pri_i的相邻两个脉冲pdw1、pdw2,由式

可知时间间隔是后一个脉冲的到达时间与前一个脉冲的到达时间的差值,此时将后一个脉冲pdw2的到达时间记为挖掘起始时刻toa
x
,在样本数据里,将脉冲pdw2之后相邻的下一个脉冲数据的到达时间记为挖掘终止时刻toay。
70.以挖掘起始时刻toa
x
为基准,挖掘终止时刻toay为界限,开始计算时间间隔δtoaj,表达式如下:
71.δtoaj=toa
x j

toa
x
;j=1,2,

,y-x
ꢀꢀꢀ④
72.(2)将时间间隔δtoaj由小到大,最多取3个值作为挖掘备用值,并且每个挖掘备用值必须满足以下条件(

):
73.(

)时间间隔δtoaj与特征值pri_i差值的绝对值小于等于特征值pri_i的0.3倍。
74.(3)经过步骤(1)、步骤(2)计算一次得到的挖掘备用值称为一组备用值,接着遍历样本数据,继续找到能计算出特征值pri_i的相邻脉冲,再经过步骤(1)、步骤(2)计算一次得到第二组备用值,以此类推,重复步骤(1)、步骤(2)计算多次,直至获得10组备用值。
75.(4)将这10组备用值在容差范围内值相同的归为第k(k=1,2,

,k)组,其中k为最终划分的总组数,第k组的时间间隔统称为prik,其中每组是一个映射,其key是相同值的prik,value是prik统计出来出现的次数ck。统计出现次数最多的prik记为预备挖掘值pri_s。
76.(5)接下来对预备挖掘值pri_s做连续验证:继续遍历样本数据,重复步骤(1)一次,按照步骤(1)中获得的时间间隔δtoaj由小到大,查找与预备挖掘值pri_s在容差内相等的δtoaj,若找到了,此为验证成功一次,重复步骤(1)多次,直至样本数据遍历结束,在此期间,若连续验证成功3次(不含3次)以上,则对预备挖掘值pri_s的连续验证成功。
77.步骤43:若对预备挖掘值pri_s的连续验证成功,则预备挖掘值pri_s为挖掘值,将预备挖掘值pri_s更新到pri特征序列里,并将计算出预备挖掘值pri_s的脉冲数据也更新到样本数据里,预备挖掘值pri_s在pri特征序列的索引设为新的挖掘索引,重复计算步骤42,看pri_s后是否还可以挖掘到新的挖掘值,直至挖掘不到新的挖掘值,即挖掘结束,最终得到挖掘后的样本数据。
78.若第一次挖掘时连续验证没有成功,则说明该挖掘索引下没有挖掘值,那么就继续遍历挖掘序列,选取下一个挖掘索引,重复计算步骤42,直至挖掘不到pri特征值,挖掘结束,最终得到挖掘后的样本数据。
79.本发明提供了一种提高辐射源信号分选结果完整性和正确性的数据挖掘方法,该方法利用辐射源的pri特征类型,根据不同的pri特征类型,采用不同的数据挖掘方法即固
定\组变挖掘方法或参差挖掘方法进行数据挖掘,使其更准确的描述雷达实际发射波形,同时能够分析出全脉冲数据中的载频特征值和脉宽特征值的异常值,使分析结果更加准确地描述雷达信号的边界范围,根据此方法挖掘后分析结果,可以进一步提高雷达辐射源信号分选结果的完整性和正确性。
80.下面给出一个应用本发明的实际的实施例。
81.下表为辐射源信息,如表1所示:
82.表1辐射源信息表
[0083][0084]
计算其载频特征值的最大值rf
max
和最小值rf
min
分别为3500mhz和3500mhz,脉宽特征值最大值pw
max
和最小值pw
min
分别为1.5μs和1.5μs,筛选载频在3200~3800mhz范围内、脉宽在0~51.5μs范围内的全脉冲数据,进行数据挖掘。筛选出的全脉冲数据如表2所示:
[0085]
表2全脉冲数据表
[0086]
[0087]
[0088][0089]
由表1可得pri特征序列{300,330},利用筛选后的全脉冲数据进行序列搜索,获得样本数据,样本数据如表3所示:
[0090]
表3样本数据表
[0091]
[0092]
[0093][0094]
pri特征值300μs和330μs应该是依次循环出现的,但从表3可以看出,pri特征值330μs并不是连续出现300μs的,几乎在每组pri特征值330μs和300μs出现时,中间总是相隔285μs这个间隔值,那么285μs就很有可能是我们要数据挖掘的挖掘值,以下就是参差挖掘的具体实施:
[0095]
步骤1:将330μs在pri特征序列的索引“1”记为挖掘索引。
[0096]
步骤2:通过步骤(1)、(2)计算可得发现的第一个挖掘起始时刻和终止时刻分别为toa
x
=819499.7μs、toay=819784.7μs,利用式

计算且必须满足条件(

),得到一组备用值为{285.0}。
[0097]
通过步骤(3)计算获得10组备用值,如表4所示:
[0098]
表4 10组备用值
[0099]
挖掘起始时刻toa
x
(μs)挖掘终止时刻toay(μs)备用值(μs)819499.7819784.7285.0820415.0820699.9284.9821329.9821614.9285.0822244.9822529.7284.8823159.7823444.7285.0824074.9824360.0285.1824990.0825274.9284.9825905.0826190.0285.0826820.3827105.3285.0827735.3828020.1284.8
[0100]
通过步骤(4)计算,将这10组备用值在容差范围内值相同的归为一个映射,映射组如表5所示:
[0101]
表5备用值映射组
[0102]
key(备用值)value(出现次数)285.010
[0103]
其中出现次数最多的间隔为pri_s=285.0。
[0104]
接着进行步骤(5),做连续验证,继续遍历样本数据,重复步骤(1)多次,将接下来的挖掘起始时刻与终止时刻全部找到,在每个挖掘起始时刻与终止时刻之间查找与pri_s在容差内相等的δtoaj,如表6所示:
[0105]
表6连续验证数据表
[0106]
挖掘起始时刻toa
x
(μs)挖掘终止时刻toay(μs)pri_s(μs)828650.0828935.0285.0
829564.7829849.7285.0830479.7830764.7285.0831394.9831680.3285.4
[0107]
从表6可以看到pri_s=285.0连续出现4次,表示连续验证成功。
[0108]
步骤3:pri_s=285.0为挖掘值,将其更新到pri特征序列里,更新后的pri特征序列为{300,330,285},重新进行序列搜索,获得新的样本数据,挖掘结束。
[0109]
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0110]
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献