用于嘈杂的环境中的谈话隔离和安全性的使用深度神经网络动态频谱掩膜的参与者调谐过滤的制作方法

2022-07-14 03:27:53 来源：中国专利 TAG：

技术特征：
1.一种用于隔离和放大所选择的参与者之间的谈话的方法，所述方法包括：接收多个频谱掩膜，所述多个频谱掩膜中的每个频谱掩膜对应于包括在谈话中的所选择的一组参与者中的相应参与者；通过所述多个频谱掩模的加性叠加生成复合频谱掩模；以及将所述复合频谱掩膜应用于由麦克风所捕获的声音以滤除与所述复合频谱掩膜不匹配的声音并放大与所述复合频谱掩膜匹配的剩余声音。2.根据权利要求1所述的方法，进一步包括：将与所述复合频谱掩膜匹配的经放大的剩余声音传输到对应于所述谈话的参与者的音频输出设备。3.根据权利要求2所述的方法，进一步包括：执行所述谈话的实时字幕；以及在附接有所述音频输出设备的移动设备屏幕或智能眼镜之一上向所述谈话的参与者显示所述谈话的所述实时字幕，用于读取所述谈话的文本以及收听所述谈话。4.根据权利要求2所述的方法，其中所述音频输出设备邻近于所述谈话的所述参与者的耳朵。5.根据权利要求2所述的方法，进一步包括：将所述谈话的所述参与者的语音样本发送至云环境的深度神经网络服务器，用于生成对所述参与者个性化的频谱掩膜；以及从所述深度神经网络服务器接收对所述参与者个性化的所述频谱掩膜。6.根据权利要求5所述的方法，进一步包括：将对所述参与者个性化的所述频谱掩膜与对应于包括在所述谈话中的所选择的一组参与者的所述多个频谱掩膜进行组合以形成所述复合频谱掩膜；使用所述复合频谱掩膜过滤传入音频信号，以仅允许所选择的一组参与者和所述参与者之间的所述谈话保持在音频信号中；以及将仅包括所选择的一组参与者与所述参与者之间的所述谈话的所述音频信号传输到所述音频输出设备。7.根据权利要求6所述的方法，进一步包括：在对应于所述参与者和所选择的一组参与者的移动设备之间共享针对所述参与者个性化的所述频谱掩膜和对应于所选择的一组参与者的所述多个频谱掩膜，使得每个移动设备生成其自身的复合频谱掩膜以用于过滤到每个移动设备的传入音频信号。8.根据权利要求5所述的方法，其中基于所述参与者的偏好，将对所述谈话的参与者个性化的所述频谱掩膜从所述复合频谱掩膜中排除。9.根据权利要求1所述的方法，其中所选择的一组参与者指示谁被授权参与所述谈话。10.根据权利要求1所述的方法，其中所述方法由移动设备执行。11.根据权利要求10所述的方法，其中所述移动设备从对应于所述谈话中包括的所选择的一组参与者的移动设备无线地接收所述多个频谱掩膜。12.一种用于隔离和放大所选择的参与者之间的谈话的移动设备，所述移动设备包括：总线系统；存储设备，连接至所述总线系统，其中所述存储设备存储程序指令；以及
处理器，连接至所述总线系统，其中所述处理器执行所述程序指令以：接收多个频谱掩膜，所述多个频谱掩膜中的每个频谱掩膜对应于包括在谈话中的所选择的一组参与者中的相应参与者；通过所述多个频谱掩模的加性叠加生成复合频谱掩模；以及将所述复合频谱掩膜应用于由麦克风所捕获的声音以滤除与所述复合频谱掩膜不匹配的声音并放大与所述复合频谱掩膜匹配的剩余声音。13.根据权利要求12所述的移动设备，其中所述处理器进一步执行所述程序指令以：将与所述复合频谱掩膜匹配的经放大的剩余声音传输到对应于所述谈话的参与者的音频输出设备。14.根据权利要求13所述的移动设备，其中所述处理器进一步执行所述程序指令以：执行所述谈话的实时字幕；以及在附接有所述音频输出设备的移动设备屏幕或智能眼镜之一上向所述谈话的参与者显示所述谈话的所述实时字幕，用于读取所述谈话的文本以及收听所述谈话。15.根据权利要求13所述的移动设备，其中所述音频输出设备邻近于所述谈话的所述参与者的耳朵。16.根据权利要求13所述的移动设备，其中所述处理器进一步执行所述程序指令以：将所述谈话的所述参与者的语音样本发送至云环境的深度神经网络服务器，用于生成对所述参与者个性化的频谱掩膜；以及从所述深度神经网络服务器接收对所述参与者个性化的所述频谱掩膜。17.根据权利要求16所述的移动设备，其中所述处理器进一步执行所述程序指令以：将对所述参与者个性化的所述频谱掩膜与对应于包括在所述谈话中的所选择的一组参与者的所述多个频谱掩膜进行组合以形成所述复合频谱掩膜；使用所述复合频谱掩膜过滤传入音频信号，以仅允许所选择的一组参与者和所述参与者之间的所述谈话保持在音频信号中；以及将仅包括所选择的一组参与者与所述参与者之间的所述谈话的所述音频信号传输到所述音频输出设备。18.根据权利要求17所述的移动设备，其中所述处理器进一步执行所述程序指令以：在对应于所述参与者和所选择的一组参与者的移动设备之间共享针对所述参与者个性化的所述频谱掩膜和对应于所选择的一组参与者的所述多个频谱掩膜，使得每个移动设备生成其自身的复合频谱掩膜以用于过滤到每个移动设备的传入音频信号。19.一种用于隔离和放大所选择的参与者之间的谈话的计算机程序产品，所述计算机程序产品包括具有体现在其中的程序指令的计算机可读存储介质，所述程序指令可由移动设备执行以使所述移动设备执行方法，所述方法包括：接收多个频谱掩膜，所述多个频谱掩膜中的每个频谱掩膜对应于包括在谈话中的所选择的一组参与者中的相应参与者；通过所述多个频谱掩模的加性叠加生成复合频谱掩模；以及将所述复合频谱掩膜应用于由麦克风所捕获的声音以滤除与所述复合频谱掩膜不匹配的声音并放大与所述复合频谱掩膜匹配的剩余声音。20.根据权利要求19所述的计算机程序产品，进一步包括：
将与所述复合频谱掩膜匹配的经放大的剩余声音传输到对应于所述谈话的参与者的音频输出设备。21.根据权利要求20所述的计算机程序产品，进一步包括：执行所述谈话的实时字幕；以及在附接有所述音频输出设备的移动设备屏幕或智能眼镜之一上向所述谈话的参与者显示所述谈话的所述实时字幕，用于读取所述谈话的文本以及收听所述谈话。22.根据权利要求20所述的计算机程序产品，其中所述音频输出设备邻近所述谈话的所述参与者的耳朵。23.根据权利要求20所述的计算机程序产品，进一步包括：将所述谈话的所述参与者的语音样本发送至云环境的深度神经网络服务器，用于生成对所述参与者个性化的频谱掩膜；以及从所述深度神经网络服务器接收对所述参与者个性化的所述频谱掩膜。24.根据权利要求23所述的计算机程序产品，进一步包括：将对所述参与者个性化的所述频谱掩膜与对应于包括在所述谈话中的所选择的一组参与者的所述多个频谱掩膜进行组合以形成所述复合频谱掩膜；使用所述复合频谱掩膜过滤传入音频信号，以仅允许所选择的一组参与者和所述参与者之间的所述谈话保持在音频信号中；以及将仅包括所选择的一组参与者和所述参与者之间的所述谈话的所述音频信号传输到所述音频输出设备。25.根据权利要求24所述的计算机程序产品，进一步包括：在对应于所述参与者和所选择的一组参与者的移动设备之间共享针对所述参与者个性化的所述频谱掩膜和对应于所选择的一组参与者的所述多个频谱掩膜，使得每个移动设备生成其自身的复合频谱掩膜以用于过滤到每个移动设备的传入音频信号。

技术总结
提供了隔离和放大所选择的参与者之间的谈话。接收多个频谱掩膜。所述多个频谱掩膜中的每个频谱掩膜对应于包括在谈话中的所选择的一组参与者中的相应参与者。复合频谱掩模是通过多个频谱掩模的加性叠加生成的。该复合频谱掩膜被应用于由麦克风捕捉的声音，以滤除与该复合频谱掩膜不匹配的声音并放大与该复合频谱掩膜匹配的剩余声音。频谱掩膜匹配的剩余声音。频谱掩膜匹配的剩余声音。

技术研发人员：J
受保护的技术使用者：国际商业机器公司
技术研发日：2020.11.26
技术公布日：2022/7/12

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：声响串扰抑制装置和声响串扰抑制方法与流程

用于嘈杂的环境中的谈话隔离和安全性的使用深度神经网络动态频谱掩膜的参与者调谐过滤的制作方法

相关文献

最热文献