一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

多设备唤醒词检测的制作方法

2022-03-19 13:10:26 来源:中国专利 TAG:

技术特征:
1.一种选择用于音频处理的设备的方法,该方法包括:从包括至少第一麦克风的第一设备接收第一唤醒词置信度度量,第一唤醒词置信度度量与由第一设备确定的第一多个唤醒词置信度值的第一局部极大值对应;从包括至少第二麦克风的第二设备接收第二唤醒词置信度度量,第二唤醒词置信度度量与由第二设备确定的第二多个唤醒词置信度值的第二局部极大值对应;比较第一唤醒词置信度度量与第二唤醒词置信度度量;以及至少部分基于第一唤醒词置信度度量与第二唤醒词置信度度量的比较,选择用于后续音频处理的设备。2.如权利要求1所述的方法,还包括:从包括至少第三麦克风的第三设备接收第三唤醒词置信度度量,第三唤醒词置信度度量与由第三设备确定的第三多个唤醒词置信度值的第三局部极大值对应;比较第三唤醒词置信度度量与第一唤醒词置信度度量和第二唤醒词置信度度量;以及至少部分基于第一唤醒词置信度度量、第二唤醒词置信度度量与第三唤醒词置信度度量的比较,选择用于后续音频处理的设备。3.如权利要求1或权利要求2所述的方法,其中所述后续音频处理包括语音识别过程。4.如权利要求1-3中的任一项所述的方法,其中所述后续音频处理包括命令识别过程。5.如权利要求4所述的方法,还包括根据命令识别过程来控制选择的设备。6.如权利要求1-5中的任一项所述的方法,其中在确定唤醒词置信度值超过唤醒词检测开始阈值之后确定局部极大值。7.如权利要求6所述的方法,其中通过在先前的唤醒词置信度值已经超过唤醒词检测开始阈值之后检测唤醒词置信度值的减小来确定局部极大值。8.如权利要求6所述的方法,其中通过在先前的唤醒词置信度值已超过唤醒词检测开始阈值之后检测音频帧n的唤醒词置信度值与音频帧n-k的唤醒词置信度值相比的减小来确定局部极大值,其中k是整数。9.如权利要求6-8中的任一项所述的方法,还包括在第一设备、第二设备或另一设备的唤醒词置信度值以上升沿超过唤醒词检测开始阈值之后发起局部极大值确定时间间隔。10.如权利要求9所述的方法,还包括在第一设备、第二设备或另一设备的唤醒词置信度值降至低于唤醒词检测结束阈值之后终止局部极大值确定时间间隔。11.如权利要求1-10中的任一项所述的方法,其中:第一设备根据第一时钟域对由第一麦克风接收的音频数据进行采样;以及第二设备根据与第一时钟域不同的第二时钟域对由第二麦克风接收的音频数据进行采样。12.如权利要求1-11中的任一项所述的方法,其中该方法由被配置为至少部分执行后续音频处理的设备执行。13.如权利要求1-11中的任一项所述的方法,其中该方法由被配置为确定与多个唤醒词置信度值的局部极大值对应的唤醒词置信度度量的设备执行。14.如权利要求1-11中的任一项所述的方法,其中该方法由不被配置为执行后续音频处理的设备执行。15.一种选择用于音频处理的设备的方法,该方法包括:
由包括具有至少第一麦克风的第一麦克风系统的第一设备确定第一唤醒词置信度度量,其中确定第一唤醒词置信度度量包括:经由第一麦克风系统产生与检测到的声音对应的第一音频数据;基于第一音频数据确定第一多个唤醒词置信度值;确定第一多个唤醒词置信度值的第一局部极大值;以及基于第一局部极大值确定第一唤醒词置信度度量;从包括至少第二麦克风的第二设备接收第二唤醒词置信度度量,第二唤醒词置信度度量与由第二设备确定的第二多个唤醒词置信度值的第二局部极大值对应;比较第一唤醒词置信度度量与第二唤醒词置信度度量;以及至少部分基于第一唤醒词置信度度量与第二唤醒词置信度度量的比较,选择用于后续音频处理的设备。16.如权利要求15所述的方法,其中在确定唤醒词置信度值超过唤醒词检测开始阈值之后确定局部极大值。17.如权利要求15所述的方法,其中通过在先前的唤醒词置信度值已超过唤醒词检测开始阈值之后检测唤醒词置信度值的减小来确定局部极大值。18.如权利要求15所述的方法,其中通过在先前的唤醒词置信度值已超过唤醒词检测开始阈值之后检测音频帧n的唤醒词置信度值与音频帧n-k的唤醒词置信度值相比的减小来确定局部极大值,其中k是整数。19.如权利要求18所述的方法,还包括在第一设备、第二设备或另一设备的唤醒词置信度值以上升沿超过唤醒词检测开始阈值之后发起局部极大值确定时间间隔。20.如权利要求19所述的方法,其中局部极大值确定时间间隔在时刻a开始并且在时刻(a k)终止,时刻(a k)是第一设备和第二设备的唤醒词置信度值降至低于唤醒词检测结束阈值的时刻。21.如权利要求19所述的方法,其中局部极大值确定时间间隔在时刻a开始并在时刻(a k)终止,时刻(a k)是第一设备、第二设备或另一设备的唤醒词置信度值降至低于唤醒词检测结束阈值的时刻。22.如权利要求20或权利要求21所述的方法,其中唤醒词检测结束阈值小于或等于唤醒词检测开始阈值。23.如权利要求20所述的方法,还包括在已经达到k的最大值之后终止局部极大值确定时间间隔。24.如权利要求15-23中的任一项所述的方法,其中该方法由被配置为至少部分地执行后续音频处理的设备执行。25.如权利要求15-24中的任一项所述的方法,其中该方法由第一设备执行。26.如权利要求15-24中的任一项所述的方法,还包括从第一设备接收第一唤醒词置信度度量,其中该方法由不被配置为确定与多个唤醒词置信度值的局部极大值对应的唤醒词置信度度量的设备执行。27.一种装置,被配置为执行如权利要求1-26中的任一项所述的方法。28.一个或多个存储有软件的非暂态介质,所述软件包括用于控制一个或多个设备执行如权利要求1-26中的任一项所述的方法的指令。

技术总结
一种用于选择用于音频处理的设备的方法可以涉及从包括至少第一麦克风的第一设备接收第一唤醒词置信度度量并且从包括至少第二麦克风的第二设备接收第二唤醒词置信度度量。第一和第二唤醒词置信度度量可以与由第一设备确定的第一多个唤醒词置信度值的第一局部极大值和由第二设备确定的第二多个唤醒词置信度值的第二局部极大值对应。该方法可以包括将第一唤醒词置信度度量与第二唤醒词置信度度量进行比较并且至少部分基于第一唤醒词置信度度量与第二唤醒词置信度度量的比较来选择用于后续音频处理的设备。择用于后续音频处理的设备。择用于后续音频处理的设备。


技术研发人员:M
受保护的技术使用者:杜比实验室特许公司
技术研发日:2020.07.29
技术公布日:2022/3/18
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献