一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于多移位算子和矩阵填充理论的数据恢复方法

2022-06-12 06:21:54 来源:中国专利 TAG:


1.本发明涉及压缩感知技术领域,尤其涉及一种基于多移位算子和矩阵填充理论的数据恢复方法。


背景技术:

2.在很多实际问题中,例如图像和视频处理、推荐系统、文本分析等等,待恢复的数据通常是用矩阵表示的,这使得对问题的理解、建模、处理和分析更为方便,然而这些数据经常面临缺失、损毁和噪声污染等问题,如何在这些情形下得到准确的数据,就是要解决的问题。
3.同时在低成本的商品传感器网络中,如空气温度传感器网络,由于传感器故障或通信故障而丢失数据是很常见的,这就要求对数据进行填充恢复,在数据恢复的方法中,现有的方法仅利用数据矩阵的低秩特性进行矩阵填充恢复,忽略了数据矩阵中行向量之间和列向量之间的相关性,从而不能达到最佳的数据恢复效果。


技术实现要素:

4.本发明的目的在于提供一种基于多移位算子和矩阵填充理论的数据恢复方法,旨在解决现有的数据恢复方法中未考虑矩阵中行向量之间和列向量之间的相关性导致的恢复效果不佳的技术问题。
5.为实现上述目的,本发明提供了一种基于多移位算子和矩阵填充理论的数据恢复方法,包括下列步骤:
6.建立基于多移位算子和矩阵填充理论的数据恢复方法模型;
7.利用非平滑正则项对所述数据恢复方法模型进行优化,获得目标函数;
8.设计广义迭代的分布式方法求解目标函数,交替迭代接近最优解。
9.其中,所述数据恢复方法模型建模为一个图g,对应采集到的数据为图信号矩阵。
10.其中,所述图信号矩阵中,图g可由行图gr=(vr,er,wr)和列图gc=(vc,ec,wc)组成,其中行图由顶点vr={1,....,m}、边和m
×
m阶邻接矩阵wr组成,列图以同样的方式定义。
11.其中,在利用非平滑正则项对所述数据恢复方法模型进行优化,获得目标函数的过程中,使用二次型全变差行向量和列向量的非平滑正则项将所述数据恢复方法模型等效改写,并通过kronecker积运算描述矩阵中每行之间和每列之间的相互关系。
12.其中,在设计广义迭代的分布式方法求解目标函数,交替迭代接近最优解的过程中,利用牛顿法进行更新,每次迭代求解目标函数的可微部分和不可微部分。
13.其中,所述基于多移位算子和矩阵填充理论的数据恢复方法,还包括验证步骤:
14.将解得的恢复信号矩阵与原始信号矩阵进行均方根误差参数计算,获得的均方根误差越小,数据恢复的效果就越好。
15.本发明提供了一种基于多移位算子和矩阵填充理论的数据恢复方法,采用多移位
算子来刻画数据矩阵中每个行向量之间、每个列向量之间的相关性,通过正则化每个行向量和列向量中非平滑性的总变化量,从而得到更加精确的数据恢复性能,且采集到的数据具有低秩特性,可使用矩阵填充技术对已知部分数据矩阵来恢复整个矩阵。多移位算子和矩阵填充理论的结合,在刻画数据矩阵中每行和每列相关性的同时刻画矩阵的低秩特性,从而能够较大程度提升数据的恢复性能。
附图说明
16.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
17.图1是本发明的一种基于多移位算子和矩阵填充理论的数据恢复方法的流程示意图。
具体实施方式
18.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
19.请参阅图1,本发明提出了一种基于多移位算子和矩阵填充理论的数据恢复方法,包括下列步骤:
20.s1:建立基于多移位算子和矩阵填充理论的数据恢复方法模型;
21.s2:利用非平滑正则项对所述数据恢复方法模型进行优化,获得目标函数;
22.s3:设计广义迭代的分布式方法求解目标函数,交替迭代接近最优解。
23.在利用非平滑正则项对所述数据恢复方法模型进行优化,获得目标函数的过程中,使用二次型全变差行向量和列向量的非平滑正则项将所述数据恢复方法模型等效改写,并通过kronecker积运算描述矩阵中每行之间和每列之间的相互关系。
24.在设计广义迭代的分布式方法求解目标函数,交替迭代接近最优解的过程中,利用牛顿法进行更新,每次迭代求解目标函数的可微部分和不可微部分。
25.所述基于多移位算子和矩阵填充理论的数据恢复方法,还包括验证步骤:
26.将解得的恢复信号矩阵与原始信号矩阵进行均方根误差参数计算,获得的均方根误差越小,数据恢复的效果就越好。
27.具体的,将网络建模为一个图g,采集到的数据可以看作一个图信号矩阵,每一行表示收集在一个节点i∈v上采集的所有数据。由于现实中复杂的环境,可能会有数据矩阵的缺失,故需要进行补全恢复工作。图信号矩阵数据恢复则是力图恢复图信号矩阵x∈r m
×n的低秩和最小总变差的先验信息中的缺失项。
28.图g可由行图gr=(vr,er,wr)和列图gc=(vc,ec,wc)组成,其中行图由顶点vr={1,....,m}、边和m
×
m阶邻接矩阵wr组成,列图以同样的方式定义。将x视为m维列向量的集合,用下标表示为x=[x1,...,xn];或将x视为n维行向量的集合,用下标表示为x=[(x1)
t
,...,(xm)
t
]
t
;列向量x1,...,xn是定义在顶点vc上的向量。
[0029]
以下从具体步骤作进一步的描述:
[0030]
步骤1:建立基于多移位算子和矩阵填充理论的数据恢复方法模型为:
[0031][0032]
其中x是需要恢复的低秩信号矩阵;y是部分可观测的信号矩阵;m是由可观测样本下标组成的集合;尽可能的接近于零,从而使得几乎可以完全恢复真正的低秩矩阵;是正则化每个列向量中非平滑性的总变化量,an是与列图相关联的归一化邻接矩阵;||
·
||
*
为核范数,指矩阵奇异值之和,用来凸近似秩约束,用来刻画图信号矩阵的低秩特性;α和β均为正则项参数。
[0033]
步骤2:根据步骤1建立的模型,对模型进行优化求解:
[0034]
用ρr(x)和ρc(x)分别表示二次型全变差s2(x)行向量和列向量的非平滑正则项。上述问题等效改写为:
[0035][0036]
其中ρr(x)控制列内平滑性,即沿行的惩罚,ρr(x)如下:
[0037][0038]
其中是行图gr的拉普拉斯算子,即且{(j,j

)∈er};表示kronecker算子,表示与m阶单位矩阵做kronecker积运算。
[0039][0040]
其中是列图gc的拉普拉斯算子,即且(j,j

)∈ec;表示与n阶单位矩阵做kronecker积运算。进一步,可以将和的kronecker积运算分别看作是两个移位算子。
[0041]
上述问题的目标函数可由可微子函数和不可微部分g(x)=β||x||
*
组成。用x=vec(x)表示矩阵x的矢量化形式,h(x)等价为:
[0042][0043]
其中qm∈r m
×
mn
是样本矩阵,且q
m x=xm。h(x)的梯度和hessian矩阵可以推导为:
[0044][0045][0046]
步骤3:设计广义迭代的分布式方法解决上述问题,每次迭代求解目标函数的可微部分和不可微部分,即利用牛顿法进行更新x和z。所提出算法的迭代可表示为:
[0047][0048]
x
m 1
=svt(z
m 1
)
[0049]
其中m≥0,pm是一系列逼近hessian矩阵逆的局部矩阵。svt是奇异值阈值算子
(singularvalue thresholding,简称svt),通过使用奇异值阈值算法求解x,将求得的x再赋值到式中求解z,x和z交替迭代过程中,不断被赋值,不断接近最优解。
[0050]
步骤4:将解得的恢复信号矩阵x与原始信号矩阵进行均方根误差(root mean squared error,rmse)参数计算,评估对比数据恢复效果的优良性,即均方根误差越小,数据恢复的效果就越好。
[0051]
进一步的,本发明提出了一个具体的仿真实施例进行验证说明:
[0052]
实施例输入的是海面温度网数据,取前100个节点数据作为原始数据x。并分别人为的破坏10%、20%、30%和40%的数据作为可观测到的数据y。且对不同正则化参数α,γ,β均取0.01。
[0053]
通过本技术方案模型,求解出矩阵补全恢复后的数据。为了评价数据恢复的准确性,本发明采用均方根误差作为恢复结果的评价指标,rmse如下式:
[0054][0055]
其中,是恢复数据矩阵的矢量化,是原始数据矩阵的矢量化,n
x
是向量长度。
[0056]
表1仿真实例实验中不同数据破坏百分比下的均方根误差结果
[0057][0058]
对比方法是标准的数据矩阵恢复方法,即s.t.pm(x)=pm(y)。通过上述表发现,恢复均方根误差都随着数据破坏率的减少而减少,而提出的方法总是优于对比方法。可见本方法优于上述对比方法。多移位算子和矩阵填充理论的结合,在刻画数据矩阵中每行和每列相关性的同时刻画矩阵的低秩特性,从而能够较大程度提升数据的恢复性能。
[0059]
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献