一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于神经音频数据处理的子谱归一化的制作方法

2023-07-23 09:09:57 来源:中国专利 TAG:

技术特征:
1.一种计算机实现的方法,包括:接收音频输入;沿着所述音频输入的频率维度将所述音频输入分离成一个或多个子群;对每个子群执行归一化,针对至少第一子群的归一化独立于针对第二子群的归一化而被执行;以及至少部分地基于经归一化的子群来生成输出。2.如权利要求1所述的计算机实现的方法,其中所述归一化包括对子群中的一者或多者应用仿射变换,所述第一子群不同于所述第二子群。3.如权利要求2所述的计算机实现的方法,其中所应用的仿射变换的类型基于一个或多个超参数。4.如权利要求2所述的计算机实现的方法,其中所述仿射变换被应用于相同频率的子群。5.如权利要求2所述的计算机实现的方法,其中所述仿射变换被应用于所有子群。6.如权利要求1所述的计算机实现的方法,其中所述归一化选自包括批归一化、实例归一化和群归一化的群。7.如权利要求1所述的计算机实现的方法,其中所述输出包括所述音频输入的分类或对所述音频输入中包括的关键字的指示中的一者。8.一种装置,包括:存储器;以及耦合到所述存储器的至少一个处理器,所述至少一个处理器被配置成:接收音频输入;沿着所述音频输入的频率维度将所述音频输入分离成一个或多个子群;对每个子群执行归一化,针对至少第一子群的归一化独立于针对第二子群的归一化而被执行;以及至少部分地基于经归一化的子群来生成输出。9.如权利要求8所述的装置,其中所述至少一个处理器被进一步配置成将仿射变换应用于子群中的一者或多者。10.如权利要求9所述的装置,其中所应用的仿射变换的类型基于一个或多个超参数。11.如权利要求9所述的装置,其中所述至少一个处理器被进一步配置成将所述仿射变换应用于相同频率的子群。12.如权利要求9所述的装置,其中所述至少一个处理器被进一步配置成将所述仿射变换应用于所有子群。13.如权利要求8所述的装置,其中所述至少一个处理器被进一步配置成从包括批归一化、实例归一化和群归一化的群中选择所述归一化。14.如权利要求8所述的装置,其中所述输出包括所述音频输入的分类或对所述音频输入中包括的关键字的指示中的一者。15.一种设备,包括:用于接收音频输入的装置;用于沿着所述音频输入的频率维度将所述音频输入分离成一个或多个子群的装置;
用于对每个子群执行归一化的装置,针对至少第一子群的归一化独立于针对第二子群的归一化而被执行;以及用于至少部分地基于经归一化的子群来生成输出的装置。16.如权利要求15所述的设备,进一步包括用于将仿射变换应用于子群中的一者或多者的装置。17.如权利要求16所述的设备,其中所应用的仿射变换的类型基于一个或多个超参数。18.如权利要求16所述的设备,进一步包括用于将所述仿射变换应用于相同频率的子群的装置。19.如权利要求16所述的设备,进一步包括用于将所述仿射变换应用于所有子群的装置。20.如权利要求15所述的设备,进一步包括用于从包括批归一化、实例归一化和群归一化的群中选择所述归一化的装置。21.如权利要求15所述的设备,其中所述输出包括所述音频输入的分类或对所述音频输入中包括的关键字的指示中的一者。22.一种其上编码有程序代码的非瞬态计算机可读介质,所述程序代码由处理器执行并且包括:用于接收音频输入的程序代码;用于沿着所述音频输入的频率维度将所述音频输入分离成一个或多个子群的程序代码;用于对每个子群执行归一化的程序代码,针对至少第一子群的归一化独立于针对第二子群的归一化而被执行;以及用于至少部分地基于经归一化的子群来生成输出的程序代码。23.如权利要求22所述的非瞬态计算机可读介质,进一步包括用于将仿射变换应用于子群中的一者或多者的程序代码。24.如权利要求23所述的非瞬态计算机可读介质,其中所应用的仿射变换的类型基于一个或多个超参数。25.如权利要求23所述的非瞬态计算机可读介质,进一步包括用于将所述仿射变换应用于相同频率的子群的程序代码。26.如权利要求23所述的非瞬态计算机可读介质,进一步包括用于将所述仿射变换应用于所有子群的程序代码。27.如权利要求22所述的非瞬态计算机可读介质,进一步包括用于从包括批归一化、实例归一化和群归一化的群中选择所述归一化的程序代码。28.如权利要求22所述的非瞬态计算机可读介质,其中所述输出包括所述音频输入的分类或对所述音频输入中包括的关键字的指示中的一者。

技术总结
一种操作用于处理具有频率维度的数据的人工神经网络的计算机实现的方法,包括接收输入。音频输入可以沿着频率维度被分离成一个或多个子群。可以对每个子群执行归一化。针对第一子群的归一化独立于针对第二子群的归一化而执行。基于经归一化的子群生成输出(诸如关键字检测指示)。键字检测指示)。键字检测指示)。


技术研发人员:S
受保护的技术使用者:高通股份有限公司
技术研发日:2021.10.21
技术公布日:2023/7/22
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表