一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

光电混合非相干复值矩阵运算处理器及复值矩阵运算方法与流程

2022-02-21 07:58:16 来源:中国专利 TAG:


1.本发明属于集成光计算领域,更具体地,涉及一种光电混合非相干复值矩阵运算处理器及复值矩阵运算方法。


背景技术:

2.随着人工智能技术的快速发展,对高性能计算日益增长的需求推动了定制硬件的发展,以加速特定类别的计算。然而,随着电子晶体管的指数尺度达到摩尔定律所揭示的物理极限,基于电子硬件的处理器已经遇到了性能不可持续增长的瓶颈。光子处理器使用光子而不是电子进行计算,因此光计算可以通过克服电子固有的限制以显著加快计算速度。与集成电路不同,集成光路具有超宽带宽、高频和低能耗等优异特性,使得光计算方法成为人工智能加速器的一个可行且有竞争力的候选方法。
3.目前的集成光计算架构主要有级联马赫-增德尔干涉仪(mach-zehnder interferometers)网络和微环谐振器(microring resonators,mrr)阵列两类。这两类架构都是电学模块用于控制,光学模块用于计算加速。mzi网络是相干网络,保留光学相位信息,因此可以进行复数运算。但是,其传输矩阵需要依靠迭代算法来配置,不适合实时响应的矩阵计算,并且相比于谐振器件,mzi器件的功耗更大。mrr是结构紧凑的谐振器件,而且功耗也较低,适合用于大规模集成阵列。但是,mrr阵列的缺陷在于它是非相干网络,在光学计算时,只有强度信息,没有相位信息,因此不能进行复数运算,限制了其应用领域。因此,构建一个光电混合、基于非相干架构的、可以实现大规模复值矩阵运算的处理器是十分必要的。


技术实现要素:

4.针对现有技术的缺陷和改进需求,本发明提供了一种光电混合非相干复值矩阵运算处理器及复值矩阵运算方法,其目的在于,构建一个光电混合、基于非相干架构的、可以实现大规模复值矩阵运算的处理器。
5.为实现上述目的,按照本发明的一个方面,提供了一种光电混合非相干复值矩阵运算处理器,包括:
6.电子控制单元,用于生成携带有n维向量i0的待测微波信号;n为正整数;
7.数据输入单元,与电子控制单元相连,用于接收不同波长的n路光信号,并将向量i0中的n维信息分别编码到n路光信号的强度中,得到n路光载微波信号;
8.波分复用单元,用于将n路光载微波信号汇合为一路混合光信号;
9.光学复值矩阵运算单元,与电子控制单元相连,且包含由m行n列谐振器件构成的可调谐阵列,用于将混合光信号分为功率相等的m路信号并分别耦合至m行谐振器件中;n列谐振器件的谐振波长分别与n路光信号的波长对准,电子控制单元还用于将m
×
n的矩阵x0编码到各谐振器件的透过系数中,从而完成的o0=x0i0光学复值矩阵运算;m为正整数;
10.以及数据采集单元,与电子控制单元相连,用于采集光学复值矩阵运算的结果,转换为电信号后传输至电子控制单元;电子控制单元还用于存储矩阵运算结果以及对所存储
的矩阵运算结果进行加减运算。
11.本发明提供的光电混合非相干复值矩阵运算处理器,其用于实现光学复值矩阵运算的可调谐阵列由谐振器件构成,为一种非相干的架构;其利用电子控制单元对光学复值矩阵运算结果进行存储和加减运算,通过矩阵运算的分解,可以实现大规模的复值矩阵运算。因此,本发明所提供的是一种光电混合、基于非相干架构的、可以实现大规模复值矩阵运算的处理器,能够有效解决现有的光电混合非相干集成光计算方案无法进行大规模复值矩阵运算的问题。
12.在一些可选的实施例中,可调谐阵列中的谐振器件为微环谐振器。
13.在一些可选的实施例中,可调谐阵列中的谐振器件为可调谐mzi辅助的微环谐振器。
14.微环谐振器(mrr)和可调谐mzi辅助的微环谐振器(mzi-mrr)是结构紧凑的谐振器件,功耗低,适用于大规模集成阵列;本发明利用mrr或者mzi-mrr组成可调谐阵列,在进行运算时,功耗低、实时性高,且通用性强;尤其使用mzi-mrr时,由于mzi-mrr是一种基于结合mzi臂的新型微环结构,可以分别调节微环的消光比和谐振峰,极大地提高了其可重构性。
15.进一步地,数据采集单元包括m个平衡光电探测器,与m行谐振器件相对应;各平衡光电探测器均与电子控制单元相连;
16.平衡光电探测器用于探测对应行谐振器件直通端和下载端的输出的光功率,进行差分运算后转换为电信号。
17.进一步地,光学复值矩阵运算单元中的各器件均集成于硅基芯片上。
18.本发明将光学复值矩阵运算单元中的各器件均集成于硅基芯片上,由目前已经成熟的硅基工艺平台开发,与cmos工艺兼容,通用性强,具有大规模应用的潜力。
19.一种基于本发明提供的光电混合非相干复值矩阵运算处理器的复值矩阵运算方法,包括:
20.非负实数域矩阵运算步骤:利用电子控制单元将携带有n维向量i0的待测微波信号输入至数据输入单元,并将规模为m
×
n的矩阵x0编码到各谐振器件的透过系数中,以由数据采集单元输出矩阵运算结果o0=x0i0;i0和x0均属于非负实数域。
21.通过以上步骤,本发明可实现非负实数域的矩阵运算。
22.进一步地,本发明提供的复值矩阵运算方法,还包括:
23.全实数域矩阵运算步骤:将n维向量i拆分为包含所有正元素的n维向量i

和包含所有负元素绝对值的n维向量i-,利用非负数域矩阵运算步骤分别计算p=xi

和q=xi-,并通过差分运算计算矩阵运算结果o=xi=p-q;i属于实数域,x属于非负实数域,且x的规模为m
×
n。
24.通过以上步骤,本发明将将矩阵计算拆分为两次,分别是由包含所有正元素的向量i

和包含所有负元素绝对值的向量i-,作为输入的两个运算,再将两个输出向量送到电学计算部分进行减法,即可得到最终的真实输出,最终将传输矩阵和输出向量由非负域扩展到了全实数域。
25.进一步地,本发明提供的复值矩阵运算方法,还包括:
26.全复数域矩阵运算步骤:将n维向量i
p
拆分为实部real(i
p
)和虚部imag(i
p
),将m
×
n的矩阵x
p
拆分为实部real(x
p
)和虚部imag(x
p
),通过非负实数域矩阵运算步骤分别计算
real(x
p
)real(i
p
)、imag(x
p
)imag(i
p
)、imag(x
p
)real(i
p
)和real(x
p
)imag(i
p
),并通过加减运算分别得到矩阵运算结果o
p
=x
pip
的实部real(o
p
)=real(x
p
)real(i
p
)-imag(x
p
)imag(i
p
)和虚部imag(o
p
)=real(x
p
)imag(i
p
) imag(x
p
)real(i
p
),从而得到矩阵运算结果为o
p
=real(o
p
) i*imag(o
p
);i
p
和x
p
均属于全实数域。
27.通过以上步骤,本发明将矩阵运算拆分成四个光学矩阵向量积运算,即real(x
p
)real(i
p
)、imag(x
p
)imag(i
p
)、imag(x
p
)real(i
p
)和real(x
p
)imag(i
p
),以及两次电学的加减运算,因此,本发明只需在光域中分别计算这四个矩阵向量积,并在电域做加减运算即可实现复数矩阵运算,将矩阵运算扩展到了全复数域。
28.进一步地,本发明提供的复值矩阵运算方法,还包括:
29.大规模矩阵运算步骤:将向量i
l
拆分维度为n的分块,得到将矩阵x
l
拆分规模为m
×
n的分块,得到通过全复数域矩阵运算步骤分别计算x
kj
ij后,通过加法运算得到矩阵运算结果o
l
=x
lil
中的第k个分块为o
l
(k)=x
k1
i1 x
k2
i2

x
knin
,从而得到矩阵运算结果为i
l
和x
l
均属于全实数域,1≤k≤m,1≤j≤n。
30.通过以上步骤,本发明运用矩阵分块的原理,将矩阵的维度扩展问题化简成了多次低维度光学矩阵向量积乘法和多次电学加法,最终实现了大规模复值矩阵的运算。
31.进一步地,本发明提供的复值矩阵运算方法,用于实现离散沃尔什-哈德玛变换、离散余弦变换或离散傅里叶变换。
32.由于本发明构建了一个光电混合、基于非相干架构的、可以实现大规模复值矩阵运算的处理器,基于该处理器,本发明可正确实现离散沃尔什-哈德玛变换(walsh-hadamard transformation,wht)、离散余弦变换(discrete cosine transformation,dct)和离散傅里叶变换(discrete fourier transformation,dft)这三种典型的信号变换。
33.总体而言,通过本发明所构思的以上技术方案,能够取得以下有益效果:
34.(1)本发明提供的光电混合非相干复值矩阵运算处理器,其用于实现光学复值矩阵运算的可调谐阵列由谐振器件构成,为一种非相干的架构;其利用电子控制单元对光学复值矩阵运算结果进行存储和加减运算,通过矩阵运算的分解,可以实现大规模的复值矩阵运算。因此,本发明所提供的是一种光电混合、基于非相干架构的、可以实现大规模复值矩阵运算的处理器,能够有效解决现有的光电混合非相干集成光计算方案无法进行大规模复值矩阵运算的问题。
35.(2)本发明提供的光电混合非相干大规模复值矩阵运算处理器采用复值矩阵分解的方式,将输入向量和传输矩阵拆分为实部与虚部,在光域中计算矩阵向量积,并在电域做加减运算即可实现复值矩阵运算,从而拓展了该非相干矩阵运算处理器的运算域。
36.(3)本发明提供的光电混合非相干大规模复值矩阵运算处理器采用矩阵分块的方式,将矩阵的维度扩展问题等效为若干次光学矩阵向量积乘法和电学加法的组合,在规模受限的硬件条件下实现矩阵运算向更高维度扩展。
37.(4)本发明提供的光电混合非相干大规模复值矩阵运算处理器通过引入波分复用技术,可以实现多波长并行运算,原理上可以实现任意规模的传输矩阵,具备硬件上的拓展能力。
38.(5)本发明提供的光电混合非相干大规模复值矩阵运算处理器采用了一种基于结合mzi臂的新型微环结构,可以分别调节微环的消光比和谐振峰,极大地提高了其可重构性。
39.(6)本发明提供的光电混合非相干大规模复值矩阵运算处理器采用的所有片上集成器件均由目前已经成熟的硅基工艺平台开发,与cmos工艺兼容,通用性强,具有大规模应用的潜力。
附图说明
40.图1为本发明实施例提供的光电混合非相干复值矩阵运算处理器的结构示意图;
41.图2为本发明实施例提供的光电混合非相干复值矩阵运算处理器的实验装置图;
42.图3为本发明实施例提供的光学复值矩阵运算单元中mrr器件的示意图;其中,(a)为mrr器件结构示意图,(b)为微环谐振波长随微环电极功率的变化情况;
43.图4为本发明实施例提供的光电混合非相干复值矩阵运算处理器的矩阵运算向全复数域扩展的原理示意图;
44.图5为本发明实施例提供的光电混合非相干复值矩阵运算处理器的矩阵运算向更高维度扩展的原理示意图;
45.图6为本发明实施例提供的光电混合非相干复值矩阵运算处理器实现复值矩阵运算的结果;其中,(a)为测量得到的传输矩阵值,(b)为相应的理论传输矩阵值,(c)为实验得到的第i行矢量积输出值和误差值,(d)为误差绝对值的分布情况;
46.图7为本发明实施例提供的光电混合非相干复值矩阵处理器实现三种典型的信号变换的示意图;其中,(a)为wht变换的原始信号,(b)为偶对称dct变换的原始信号,(c)为前述序列一半的dct变换的原始信号,(d)为dft变换的原始信号,(e)为wht变换的结果和理论值,(f)为偶对称dct变换的结果和理论值,(g)为前述序列一半的dct变换的结果和理论值,(h)为dft变换的结果和理论值;
47.在所有附图中,相同的附图标记用来表示相同的元件或者结构,其中:
48.1-数据输入单元:
49.11-第一电光强度调制器;12-第二电光强度调制器;13-第三电光强度调制器;14-第四电光强度调制器;
50.2-波分复用单元:
51.3-光学复值矩阵运算单元:
52.31-输入耦合光栅;32、33、34、35、36、37、38、39-输出耦合光栅;6、7、8-mmi 3db分光器;
53.4-数据采集单元:
54.41、42、43、44-平衡光电探测器;
55.5-电子控制单元。
具体实施方式
56.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
57.在本发明中,本发明及附图中的术语“第一”、“第二”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
58.为了构建一个光电混合、基于非相干架构的、可以实现大规模复值矩阵运算的处理器,本发明提供的光电混合非相干复值矩阵运算处理器,如图1所示,包括:
59.电子控制单元5,用于生成携带有n维向量i0的待测微波信号;n为正整数;
60.数据输入单元1,与电子控制单元5相连,用于接收不同波长的n路光信号,并将向量i0中的n维信息分别编码到n路光信号的强度中,得到n路光载微波信号;
61.波分复用单元2,用于将n路光载微波信号汇合为一路混合光信号;
62.光学复值矩阵运算单元3,与电子控制单元5相连,且包含由m行n列谐振器件构成的可调谐阵列,用于将混合光信号分为功率相等的m路信号并分别耦合至m行谐振器件中;n列谐振器件的谐振波长分别与n路光信号的波长对准,电子控制单元5还用于将m
×
n的矩阵x0编码到各谐振器件的透过系数中,从而完成的o0=x0i0光学复值矩阵运算;m为正整数;
63.以及数据采集单元4,与电子控制单元5相连,用于采集矩阵运算结果,转换为电信号后传输至电子控制单元5;电子控制单元5还用于存储矩阵运算结果以及对所存储的矩阵运算结果进行加减运算;
64.上述光电混合非相干复值矩阵运算处理器,其用于实现光学复值矩阵运算的可调谐阵列由谐振器件构成,为一种非相干的架构;其利用电子控制单元对光学复值矩阵运算结果进行存储和加减运算,通过矩阵运算的分解,可将只能进行乘法和加法的光学矩阵运算扩展到了可以进行乘法、加法和减法,最终实现大规模的复值矩阵算运。因此,上述处理器,是一种光电混合、基于非相干架构的、可以实现大规模复值矩阵运算的处理器,能够有效解决现有的光电混合非相干集成光计算方案无法进行大规模复值矩阵运算的问题;
65.基于上述结构,本发明可实现维度为n的向量i0与规模为m
×
n的矩阵x0的矩阵向量积运算,最终得到维度为n的输出向量o0;其中,m和n可以是任意正整数,二者可以相等也可以不相等;为便于描述,以下实施例中,均以m=4,n=4为例进行说明。以下为实施例。
66.实施例1:
67.一种光电混合非相干复值矩阵运算处理器,如图1和图2所示,包括:数据输入单元1、波分复用单元2、光学复值矩阵运算单元3、数据采集单元4和电子控制单元5;
68.不同波长的连续光信号均在外部产生并输入该处理器,如图2所示,可选地,本实施例中,光信号均由多通道光源产生;由于输入向量i0的维度为4,相应地,从外部输入4个不同波长的光信号,4个波长分别是λ1、λ2、λ3、λ4,这四个光信号的强度相等;数据输入单元1用于将输入数据加载到光载波上,得到强度编码的光载微波信号,波分复用单元2将多路不
同波长的光载微波信号汇合为一路,电子控制单元5控制微波信号的加载和光学复值矩阵运算单元3中谐振器件的金属电极的电压,光学复值矩阵运算单元3用于在光学域执行非相干大规模复值矩阵运算,输出的运算结果光信号由数据采集单元4进行采集,并送入电子控制单元5进行处理,得到运算结果。
69.如图1所示,本实施例中,为了将输入向量i0的4个维度的信息分别加载到4个光信号的强度信息中,数据输入单元1具体包括四个电光强度调制器,即第一电光强度调制器11、第二电光强度调制器12、第三电光强度调制器13和第四电光强度调制器14,由电子控制单元5产生待测的微波信号,并在数据输入单元中的每一个电光强度调制器上分别加载相应的待测微波信号,因此输入的数据信息将被编码到光载微波信号的强度上,从而可以得到四路不同波长的编码了输入数据信息的光载微波信号。输入是一个4
×
1的向量i0=[i1,i2,i3,i4]
t
,4个电光强度调制器分别用于调制波长为λ1、λ2、λ3、λ4的光信号,其输入向量i0的元素i1,i2,i3,i4被分别强度编码在波长为λ1、λ2、λ3、λ4的光信号上,由此得到4路光载波信号。
[0070]
如图1所示,本实施例中,波分复用单元2包括波分复用器,通过波分复用技术将数据输入单元1输出的多路不同波长的光载波信号汇合在一起,并耦合到同一根光纤中进行传输,输出为一个包含了四个波长λ1、λ2、λ3、λ4的混合光信号,此混合光信号编码了输入向量i0=[i1,i2,i3,i4]
t
的信息,将被送入光学复值矩阵运算单元3。
[0071]
如图1所示,本实施例中,经波分复用单元2输出的编码了输入向量i0=[i1,i2,i3,i4]
t
的信息的混合光信号会经过输入耦合光栅31耦合进光学复值矩阵运算单元3内;光学复值矩阵运算单元3包括4
×
4规模的mrr阵列,为了将混合光信号分为功率相等的4路信号以分别耦合至4行mrr中,光学复值矩阵运算单元3中,在输入耦合光栅31和mrr阵列之间还包括由三个mmi 3db分光器6、7、8组成的分光模块,输入耦合光栅31输出的混合光信号通过mmi 3db耦合器6分成两路,其中一路通过mmi 3db耦合器7分成两路,分别经过mrr阵列的第1行和第2行后,从输出耦合光栅32、33和34、35从光学复值矩阵计算单元3输出;另一路通过mmi 3db耦合器8分成两路,分别经过mrr阵列的第3行和第4行后,从输出耦合光栅36、37和38、39从光学复值矩阵计算单元3输出。
[0072]
光学复值矩阵运算单元3是一个硅基芯片。在芯片上,编码了输入向量i0=[i1,i2,i3,i4]
t
数据的包含四个波长λ1、λ2、λ3、λ4的混合光信号被分成功率相等的4份,然后被分别输入4
×
4规模的可调谐mrr阵列的每一行。芯片上一共有4行mrr,每一行都有4个mrr,位于同一行的每一个mrr的谐振波长恰好分别与输入混合光信号的4个光波长λ1、λ2、λ3、λ4处精确对准,形成一一对应的运算关系。
[0073]
以下结合mrr的具体结构,对光学复值矩阵运算单元3实现矩阵运算的基本原理进行简要介绍。图3中的(a)为mrr的结构示意图,由于每个mrr的谐振波长都只与输入混合光信号中的某一个特定的波长对准,因此不会对其他波长的输入产生影响。如图3中的(a)所示,mrr是一种基于结合直波导的微环结构,由两根直波导和环形波导组成,环形波导上设置有金属电极。通过改变加在环形波导的金属电极上的电压或电流,可以改变该电极的温度,使得该波导的折射率发生改变,进而改变环形波导的环程相移,从而改变mrr的谐振峰位置,图3(b)反映了实现mrr谐振波长位置控制的过程,单个mrr的谐振峰带宽约为0.09nm,自由光谱范围(free spectral range,fsr)约为11nm;然后在环形波导电极上施加不同的
电压,以确定微环光谱响应的变化;这种电极的电阻为0.9kω。图3中的(b)展示了mrr的谐振波长漂移量随着移相器功率的变化。可以看出,当对金属电极施加的电压从1.1v变化到3.2v时,谐振波长的向长波方向漂移5.6nm。
[0074]
因此,通过建立mrr的透射光谱与矩阵元素值的映射关系,每一个mrr可以用于控制某一行的特定波长光信号的透射系数,此4
×
4规模的可调谐mrr阵列即可用于模拟4
×
4规模的传输矩阵。
[0075]
由于每一行中,mrr和输入光存在一一对应的关系,因此可以构成向量乘法。假设mrr是没有损耗的,mrr的直通端和下载端在无损情况下应该是互补的。由此第i行j列微环在其对应的波长λj处,其下载端对于入射光的透过系数为a
ij
,而其直通端对于入射光的透过系数为1-a
ij
。那么第i行下载端探测到的光功率,可以写作向量积的形式,即
[0076][0077]
把每一行的向量积概念推广到所有行,写成矩阵形式,可以得到下载端探测到的光功率
[0078][0079]
类似地,所有直通端探测到的光功率可以写作
[0080][0081]
由于a
ij
的理想取值范围是[0,1],因此,mrr的透过系数x
ij
=1-2a
ij
取值范围是[-1,1];最终,矩阵向量积的运算结果可表示为:
[0082][0083]
在实际应用中,可以通过对mrr的环形波导的金属电极上的电压或电流值进行调节,将mrr的透过系数调节至指定值;本实施例中,该调节通过电子控制单元5实现。
[0084]
如图1所示,为了采集由光学复值矩阵运算单元3输出的矩阵运算结果,本实施例中,数据采集单元4具体为平衡光电探测器阵列,包含4个平衡光电探测器41、42、43、44,与光学复值矩阵运算单元的8个输出端口相对应,用于采集光学复值矩阵运算的结果,并把结果转换为电信号,然后送入所述电子控制单元5,由电子控制单元5进行存储,并进行后续的加减运算。数据采集单元4中,每个平光光电探测器可同时探测到一行mrr阵列的直通端和下载端输出的光功率,并进行差分运算,之后将差分运算结果转换为电信号。
[0085]
本实施例中,电子控制单元5为电子计算机或现场可编程门阵列,用于提供携带输入数据的电信号、配置光学复值矩阵运算单元的参数、存储运算结果,以及根据处理器各个
单元的工作状态提供基于人工智能算法的实时反馈,以使得各个单元处于理想的工作状态。
[0086]
由于本实施例中,数据输入单元1中的电光强度调制器和光学复值矩阵运算单元芯片都是偏振敏感的,因此如图2所示,本实施例中,在数据输入单元前、后还分别连接有偏振控制器。
[0087]
应当说明的是,在图1和图2所示的架构下,本实施例中的一些器件也可替换为其他实现相同功能的器件,例如,在本发明其他的一些实施例中,输入耦合光栅31和输出耦合光栅32~39也可替换为硅基水平耦合器,用于和外部光纤进行耦合;又例如,在本发明其他的一些实施例中,数据采集单元也可以使用两个光电探测器分别探测同一行mrr器件的直通端和下载端输出的光功率;又例如,在本发明其他的一些实施例中,也可以将mrr器件替换为可调谐mzi辅助的微环谐振器(mzi-mrr)等其他非相干的谐振器件,mzi-mrr是一种基于结合mzi臂的新型微环结构,可以分别调节微环的消光比和谐振峰,极大地提高了其可重构性,关于mzi-mrr的具体介绍,可参考“widely tunable fractional-order photonic differentiator using a mach

zenhderinterferometer coupled microring resonator”中的描述,在此将不做赘述。
[0088]
实施例2:
[0089]
一种基于上述实施例1提供的光电混合非相干复值矩阵运算处理器的复值矩阵运算方法,包括:
[0090]
非负实数域矩阵运算步骤:利用电子控制单元将携带有n维向量i0的待测微波信号输入至数据输入单元,并将规模为m
×
n的矩阵x0编码到各谐振器件的透过系数中,以由数据采集单元输出矩阵运算结果o0=x0i0;i0和x0均属于非负实数域。
[0091]
通过以上步骤,本实施例可实现非负实数域的矩阵运算。
[0092]
输入向量的数据是由电光强度调制器进行强度编码得到,而且强度是非负的,因此输入向量依然是非负数,为了将传输矩阵和输出向量由非负实数域扩展到全实数域,将输入向量i分为包含所有正元素的向量i 和包含所有负元素绝对值向量i-,可以得到他们与i之间的关系:
[0093][0094]
i=i
-i-[0095]
由此可以得到两个非负的向量i 和i-,这两个向量均可以作为代表光强度的值;根据这个原则,可以将矩阵计算拆分为两次,分别是i 和i-作为输入的两个运算,得到的结果是p和q。两个输出向量将送到电学计算部分进行减法,得到最终的真实输出o。这样,就能够将一个实数域的矩阵向量积运算拆分成了两个非负域的光学矩阵向量积运算和一次电学的减法运算。这一过程可以用公式表示为:
[0096]
p=xi

,q=xi-[0097]
o=p-q=xi
[0098]
基于以上分析,本实施例进一步包括:
[0099]
全实数域矩阵运算步骤:将n维向量i拆分为包含所有正元素的n维向量i

和包含所有负元素绝对值的n维向量i-,利用非负数域矩阵运算步骤分别计算p=xi

和q=xi-,并
通过差分运算计算矩阵运算结果o=xi=p-q;i属于实数域,x属于非负实数域,且x的规模为m
×
n。
[0100]
为了说明的直观性,这里展示基于该原理获得的一组真实实验数据。输入向量为[1,-0.25,0.5,-1]
t
,根据前述的方法,将输入向量分为只包含非负元素的i

,其值为[1,0,0.5,0]
t
,和只包含非正元素绝对值的i-,其值为[0,0.25,0,1]t。芯片的传递矩阵x可以表示为
[0101][0102]
当分别输入两组输入时,可以得到两组输出p与q,两个结果相减可以得到输出向量;p和q的理论值分别为[1,0,-0.5,0.5]
t
和[0,0,1,-1]
t
,输出向量的理论值为[1,0.25,-1.5,1.5]
t
;经处理器计算得到的p和q的实际值分别是[1.00,-0.01,-0.49,0.47]
t
和[-0.01,0.21,1.00,-0.99]
t
,通过电脑进行减法后得到的实际输出向量值为[1.01,0.22,-1.49,1.47]
t
。通常使用余弦相似度来衡量向量空间中两个向量的相似程度,余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,对于向量x=(x1,x2,

,xn)和y=(y1,y2,

,yn),其余弦相似度公式为:
[0103][0104]
计算理论值和实际值的余弦相似度,结果为0.99876,与1很接近,说明实际值和理论值非常接近,也即是说,基于本实施例的全实数域矩阵运算步骤,本实施例能够准确实现全实数域的矩阵运算。
[0105]
本实施例还可以把矩阵运算向全复数域进行扩展。图4是矩阵运算向全复数域扩展的原理示意。复数包含实部和虚部,因此可以将输入向量和传输矩阵拆分为实部与虚部的和,并将实部与虚部的运算分开进行
[0106]op
=x
pip
=(real(x
p
) i*imag(x
p
))(real(i
p
) i*imag(i
p
))
[0107]
输出的计算拆分为实部和虚部两个部分,即
[0108]
real(o
p
)=real(x
p
)real(i
p
)-imag(x
p
)imag(i
p
)
[0109]
imag(o
p
)=real(x
p
)imag(i
p
) imag(x
p
)real(i
p
)
[0110]
按照上式,可将矩阵运算拆分成四个光学矩阵向量积运算,即real(x
p
)real(i
p
)、imag(x
p
)imag(i
p
)、imag(x
p
)real(i
p
)和real(x
p
)imag(i
p
),以及两次电学的加减运算,因此只需要在光域中分别计算这四个矩阵向量积,并在电域做加减运算即可实现复数运算。
[0111]
基于以上分析,本实施例进一步包括:
[0112]
全复数域矩阵运算步骤:将n维向量i
p
拆分为实部real(i
p
)和虚部imag(i
p
),将m
×
n的矩阵x
p
拆分为实部real(x
p
)和虚部imag(x
p
),通过非负实数域矩阵运算步骤分别计算real(x
p
)real(i
p
)、imag(x
p
)imag(i
p
)、imag(x
p
)real(i
p
)和real(x
p
)imag(i
p
),并通过加减运算分别得到矩阵运算结果o
p
=x
pip
的实部real(o
p
)=real(x
p
)real(i
p
)-imag(x
p
)imag(i
p
)和虚部imag(o
p
)=real(x
p
)imag(i
p
) imag(x
p
)real(i
p
),从而得到矩阵运算结果为o
p
=real(o
p
) i*imag(o
p
);i
p
和x
p
均属于全实数域。
[0113]
同样地,为了说明的直观性,在此展示基于该原理获得的一组真实实验数据。输入向量的值为i
p
=[1 0.25i,0.5i,0.5 1i,0]
t
,可以拆分为实部[1,0,0.5,0]
t
和虚部[0.25i,0.5i,1i,0]
t
。传输矩阵x
p
也被拆分为实部和虚部。其实部与虚部分别为
[0114][0115]
如图4所示,可以看到,乘法运算被拆分为四组,由上到下排列,其结果分别为p,q,r,s。p与q相减得到输出矩阵的实部,r与s相加得到输出矩阵的虚部,因此输出矩阵o
p
=(p-q) i(r s)。输出向量的理论值[-0.66-0.23i,1.23-0.54i,-2.21-0.28i,0.15-0.93i]
t
。输出向量的实验值在图中用二维坐标画出,最终得到的结果是[-0.57-0.36i,1.23-0.58i,-2.14-0.32i,0.18-0.95i]
t

[0116]
为了进一步扩大处理矩阵的规模,本实施例运用矩阵分块的原理,将矩阵的维度扩展问题化简成了多次低维度光学矩阵向量积乘法和多次电学加法,具体地,本实施例进一步包括:大规模矩阵运算步骤:将向量i
l
拆分维度为n的分块,得到将矩阵x
l
拆分规模为m
×
n的分块,得到通过全复数域矩阵运算步骤分别计算x
kj
ij后,通过加法运算得到矩阵运算结果o
l
=x
lil
中的第k个分块为o
l
(k)=x
k1
i1 x
k2
i2

x
knin
,从而得到矩阵运算结果为i
l
和x
l
均属于全实数域,1≤k≤m,1≤j≤n;
[0117]
图5展示了将4
×
4阶运算器其扩展为8
×
8阶运算器的过程;输入向量和输出向量均为8
×
1阶的向量,而传输矩阵为8
×
8阶的矩阵;为了将运算拆分为4
×
4阶的,以与实验的硬件匹配,输入和输出向量分别被分块成2个4
×
1向量;同时,传输矩阵则被分为4个4
×
4矩阵。根据矩阵分块的原理,显然可以得到如下公式
[0118][0119]
由此将矩阵的维度扩展问题化简成了4次光学矩阵向量积乘法和2次电学加法,其理论结果和实验结果绘制在三维条形图中,如图5所示。图5中,用柱状图来展示一组真实的实验数据。按照矩阵的方法拆解为四个运算后,分别测量得到四个输出向量实验值为p=x
11
i1,q=x
21
i1,r=x
12
i2,s=x
22
i2;整理这四个测量值为最终的输出,即则有ol
=[-0.43,-1.87,0.13,-0.98,-2.65,-0.66,-0.15,-2.4]
t
,将矩阵的阶数从4
×
4阶扩展为8
×
8阶,实现了矩阵运算规模的扩展。
[0120]
为了分析在大量数据计算中该系统的可靠性,加载了576组输入数据和传递矩阵,以获得统计性的结果,如图6所示;图6的(a)为测量得到的传输矩阵值;图6中的(b)为相应的理论传输矩阵值;图6中的(c)为实验得到的第i行矢量积输出值和误差值,图中数据点的横坐标为数据点编号,纵坐标表示输入向量和传递矩阵的第i行的矢量积图6中的(d)为误差绝对值的分布情况。根据图6所示的结果可以看出,误差绝对值超过一半在0~0.1范围内,绝大部分落在0~0.2范围内。由此说明,在大量运算中,本实施例提供的处理器仍具有较高的计算精度。
[0121]
实施例3:
[0122]
一种基于上述实施例2提供的复值矩阵运算方法的信号变换方法,该信号变换方法为以下三种典型的信号变换方法之一:为离散沃尔什-哈德玛变换(walsh-hadamard transformation,wht)、离散余弦变换(discrete cosine transformation,dct)和离散傅里叶变换。
[0123]
三种典型的信号变换方法的结果如图7所示,图7中,(a)为wht变换的原始信号,(b)为偶对称dct变换的原始信号;(c)为前述序列一半的dct变换的原始信号;(d)为dft变换的原始信号;(e)为wht变换的结果和理论值;(f)为偶对称dct变换的结果和理论值;(g)为前述序列一半的dct变换的结果和理论值;(h)为dft变换的结果和理论值。
[0124]
根据图7所示的结果可知,本实施例能够正确地实现此三种典型的信号变换。
[0125]
总体而言,本发明提供了一种光电混合非相干大规模矩阵运算处理器,通过复值矩阵分解的方式,将输入向量和传输矩阵拆分为实部与虚部,在光域中计算矩阵向量积,并在电域做加减运算即可实现复值矩阵运算,从而拓展了该非相干矩阵运算处理器的运算域。并且通过矩阵分块的方式,将矩阵的维度扩展问题等效为若干次光学矩阵向量积乘法和电学加法的组合,在规模受限的硬件条件下实现矩阵运算向更大规模扩展。通过引入波分复用技术,可以实现多波长并行运算,原理上可以实现任意规模的传输矩阵,具备硬件上的拓展能力。
[0126]
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献