一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

控制语音的识别方法及目标角色的控制方法、相关装置与流程

2022-02-20 04:15:05 来源:中国专利 TAG:

技术特征:
1.一种控制语音的识别方法,其特征在于,所述方法包括:获取语音数据流中的目标语音分段;获取所述目标语音分段对应的信号强度的变化趋势;响应于所述信号强度的变化趋势满足预设条件,确定所述目标语音分段为控制语音。2.根据权利要求1所述的控制语音的识别方法,其特征在于,所述获取语音数据流中的目标语音分段,包括:利用语音采集设备采集所述语音数据流;将所述语音数据流中的背景音进行过滤,得到所述语音数据流中的目标语音分段。3.根据权利要求2所述的控制语音的识别方法,其特征在于,所述将所述语音数据流中的背景音进行过滤,得到所述语音数据流中的目标语音分段,包括:以设定长度的时间窗口对所述语音数据流进行划分,得到多个语音分段;对所述多个语音分段的至少部分语音分段进行语音活动检测,得到所述至少部分语音分段对应的振幅峰值;将所述振幅峰值大于预设幅值的语音分段作为所述目标语音分段。4.根据权利要求2所述的控制语音的识别方法,其特征在于,所述将所述语音数据流中的背景音进行过滤,得到所述语音数据流中的目标语音分段,包括:提取所述语音数据流中的若干个关键点;获取每个关键点的振幅,将包含所述振幅大于预设阈值的关键点的语音分段作为所述目标语音分段,或,获取每个关键点对应的包含该关键点的语音分段的振幅峰值,将所述振幅峰值大于预设幅值的语音分段作为所述目标语音分段。5.根据权利要求1-4任一项所述的控制语音的识别方法,其特征在于,在所述获取所述目标语音分段对应的信号强度的变化趋势之前,所述方法还包括:对每个所述目标语音分段中的语音信号进行预加重处理,并获取每个经所述预加重处理后的所述目标语音分段对应的信号强度。6.根据权利要求1-5任一项所述的控制语音的识别方法,其特征在于,所述获取所述目标语音分段对应的信号强度的变化趋势,包括:确定当前所述目标语音分段与前一所述目标语音分段之间的信号强度比率;所述响应于所述信号强度的变化趋势满足预设条件,确定所述目标语音分段为控制语音,包括:响应于所述信号强度比率大于预设阈值,则确定当前所述目标语音分段为控制语音。7.一种目标角色的控制方法,其特征在于,所述方法包括:获取语音采集设备采集的所述语音数据流;确定所述语音数据流中的目标控制语音;基于所述目标控制语音控制所述目标角色;其中,所述目标控制语音通过权利要求1至6任一项所述的控制语音的识别方法确定。8.根据权利要求7所述的目标角色的控制方法,其特征在于,所述方法还包括:预先建立标准语音数据库,以形成目标控制指令与语音特征的对应关系;所述基于所述目标控制语音控制所述目标角色,包括:获取所述目标控制语音的目标语音特征;
根据所述对应关系和所述目标语音特征,确定所述目标控制语音的目标控制指令;根据所述目标控制语音的目标控制指令,控制所述目标角色执行相应的操作。9.根据权利要求7或8所述的目标角色的控制方法,其特征在于,所述方法还包括:预先设置多个目标控制指令,所述多个目标控制指令对应控制不同的目标角色;所述基于所述目标控制语音控制所述目标角色,包括:确定所述目标控制语音对应的目标控制指令,控制与所述目标控制指令相对应的目标角色。10.一种控制语音的识别装置,其特征在于,包括:语音获取模块,所述语音获取模块用于获取语音数据流中的目标语音分段;计算模块,所述计算模块用于获取所述目标语音分段对应的信号强度的变化趋势;确定模块,所述确定模块用于响应于所述信号强度的变化趋势满足预设条件,确定所述目标语音分段为控制语音。11.一种目标角色的控制装置,其特征在于,包括:数据获取模块,所述数据获取模块用于获取语音采集设备采集的所述语音数据流;识别模块,所述识别模块用于利用控制语音的识别方法确定所述语音数据流中的目标控制语音;控制模块,所述控制模块用于基于所述目标控制语音控制所述目标角色;其中,所述目标控制语音通过权利要求1至6任一项所述的控制语音的识别方法确定。12.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述处理器用于执行所述存储器中存储的程序指令,以实现权利要求1至6任一项所述的控制语音的识别方法,或权利要求7至9任一项所述的目标角色的控制方法。13.一种计算机可读存储介质,其上存储有程序指令,其特征在于,所述程序指令被处理器执行时实现权利要求1至6任一项所述的控制语音的识别方法,或权利要求7至9任一项所述的目标角色的控制方法。

技术总结
本申请公开了一种控制语音的识别方法及目标角色的控制方法、相关装置,其中,控制语音的识别方法包括:获取语音数据流中的目标语音分段;获取所述目标语音分段对应的信号强度的变化趋势;响应于所述信号强度的变化趋势满足预设条件,确定所述目标语音分段为控制语音。上述方案,能够快速识别出控制语音。能够快速识别出控制语音。能够快速识别出控制语音。


技术研发人员:张正明 李诚
受保护的技术使用者:上海商汤智能科技有限公司
技术研发日:2021.09.03
技术公布日:2022/1/7
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献