一种应用于人机交互中的远近场拾音方法与流程

2022-07-14 01:48:15 来源：中国专利 TAG：

技术特征：
1.一种应用于人机交互中的远近场拾音方法，其特征在于，包括如下步骤：s1、通过近场麦克风全向拾取近场声音信号生成近场声音数据、通过远场麦克风全向拾取远场声音信号生成远场声音数据；s2、噪音分析单元对所述近场声音数据和/或所述远场声音数据接收，采用预设特征库内的声音特性进行滤除，生成去噪声音数据；s3、预处理单元对所述去噪声音数据接收，并进行预处理，生成预处理声音数据；s4、主处理单元对所述预处理声音数据进行语音识别，生成指令数据；s5、输出单元对指令数据进行输出至终端。2.如权利要求1所述的应用于人机交互中的远近场拾音方法，其特征在于，所述预设特征库内的声音特性包括时间特性、波形特性、频谱特性。3.如权利要求2所述的应用于人机交互中的远近场拾音方法，其特征在于，若s2中采用时间特性作为所述声音特性进行滤除条件，则包括如下步骤：s21、判断所述近场声音数据和/或所述远场声音数据的时间长度是否满足进行滤除操作的预设时间长度，若不满足，则作为噪音滤除；若满足，则生成所述去噪声音数据。4.如权利要求2所述的应用于人机交互中的远近场拾音方法，其特征在于，若s2中采用波形特性作为所述声音特性进行滤除条件，则包括如下步骤：s22、判断所述近场声音数据和/或所述远场声音数据的波形振幅是否满足进行滤除操作的预设波形特征，若不满足，则作为噪音滤除；若满足，则生成所述去噪声音数据。5.如权利要求4所述的应用于人机交互中的远近场拾音方法，其特征在于，判断所述波形振幅是否满足进行滤除操作的预设波形特征，包括如下步骤：s221、采集所述近场声音数据和/或所述远场声音数据中位于0～2秒内的短波形振幅，判断是否满足进行滤除操作的预设波形特征，若不满足，则作为噪音滤除；若满足，则进行s222步骤,包括：s222、采集所述近场声音数据和/或所述远场声音数据中位于3～6秒内的长波形振幅，判断是否满足进行滤除操作的预设波形特征，若不满足，则作为噪音滤除；若满足，则生成所述去噪声音数据。6.如权利要求2所述的应用于人机交互中的远近场拾音方法，其特征在于，若s2中采用频谱特性作为所述声音特性进行滤除条件，则包括如下步骤：s23、判断所述近场声音数据和/或所述远场声音数据的频谱强度是否满足进行滤除操作的预设频谱特征，若不满足，则作为噪音滤除；若满足，则生成所述去噪声音数据。7.如权利要求1所述的应用于人机交互中的远近场拾音方法，其特征在于，所述s3中还包括：增益单元，所述预处理单元对所述去噪声音数据进行预处理后并经所述增益单元进行增益，生成所述预处理声音数据。8.如权利要求1所述的应用于人机交互中的远近场拾音方法，其特征在于，所述s5中还包括：
通信单元，所述输出单元与通信单元连接，通过所述通信单元将所述指令数据进行压缩后发送至所述终端。

技术总结
一种应用于人机交互中的远近场拾音方法，包括如下步骤：通过近场麦克风全向拾取近场声音信号生成近场声音数据、通过远场麦克风全向拾取远场声音信号生成远场声音数据；噪音分析单元对近场声音数据和/或远场声音数据接收，采用预设特征库内的声音特性进行滤除，生成去噪声音数据；预处理单元对去噪声音数据接收，并进行预处理，生成预处理声音数据；主处理单元对预处理声音数据进行语音识别，生成指令数据；输出单元对指令数据进行输出至终端。本发明可以使语音指令输入不受距离影响，提高指令输入的稳定性；同时，降低环境噪音对指令输入的影响，提高指令输入的准确性，保证指令操作的正常执行。的正常执行。的正常执行。

技术研发人员：严小天刘文彪刘鲁峰刘琳
受保护的技术使用者：青岛虚拟现实研究院有限公司
技术研发日：2022.03.12
技术公布日：2022/7/12

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种应用于人机交互中的远近场拾音方法与流程

相关文献

最热文献