农林渔牧食品/饮料服装/饰品纺织/造纸医疗/保健机械/机床家具/门窗喷涂/染料道路/铁路

摄影/光学乐器/声学照明/工业冶金/铸造安全/消防建筑/工具控制/调节计算,推算其他产品

热搜：真空泵封装包装食品玩具

首页 > 乐器,声学设备的制造及制作,分析技术 > 正文

语音信息处理方法及设备与流程

2021-08-31 17:45:00 来源：中国专利 TAG：语音方法申请设备信息

技术特征：

1.一种语音信息处理方法，其特征在于，所述方法包括：

获取第一语音信息；

在基于判决条件确定所述第一语音信息为有效的语音控制指令的情况下，执行所述第一语音信息指示的操作，其中，所述判决条件为基于所述第一语音信息产生时所在的环境情况调整得到。

2.根据权利要求1所述的方法，其特征在于，所述第一语音信息产生时所在的环境情况包括如下的一项或多项：

截止至所述设备获取到该第一语音信息的第二预设时长内的说话人数，所述第一语音信息产生时预设范围内的人数，所述第一语音信息的置信度，或所述第一语音信息的信噪比。

3.根据权利要求1或2所述的方法，其特征在于，所述判决条件为基于所述第一语音信息产生时所在的环境情况调整得到，包括：

所述判决条件为基于所述环境情况以及设备的持续聆听时长调整得到。

4.根据权利要求3所述的方法，其特征在于，所述判决条件为基于所述环境情况以及设备的持续聆听时长调整得到，包括：

所述判决条件为基于所述环境情况、所述持续聆听时长以及历史语音信息的情况调整得到。

5.根据权利要求1或2所述的方法，其特征在于，所述判决条件为基于所述第一语音信息产生时所在的环境情况调整得到，包括：

所述判决条件为基于所述环境情况以及历史语音信息的情况调整得到。

6.根据权利要求4或5所述的方法，其特征在于，所述历史语音信息的情况包括如下中的一种或多种：

获取所述第一语音信息时与最近一次获取到有效语音信息之间的第一时间间隔；

获取所述第一语音信息时与最近一次获取到无效语音信息之间的第二时间间隔；

获取到所述第一语音信息前第一预设时长内有效语音信息和无效语音信息的占比；

所述第一语音信息与最近一次获取到的有效语音信息的语义的第一关联度；

所述第一语音信息与最近一次获取到的无效语音信息的语义的第二关联度；

第一语音信息与设备最近一次获取到的有效语音信息的第三关联度；

截止至获取到所述第一语音信息时设备与用户语音对话的状态；

所述第一语音信息与历史有效语音信息的声学特征的第一相似度；

所述第一语音信息与历史无效语音信息的声学特征的第二相似度。

7.根据权利要求1至6任一项所述的方法，其特征在于，

在所述环境情况指示所述第一语音信息有效的概率大于无效的概率的情况下，所述判决条件的灵敏度被调高；

在所述环境情况指示所述第一语音信息有效的概率小于无效的概率的情况下，所述判决条件的灵敏度被调低。

8.根据权利要求3或4所述的方法，其特征在于，所述设备的持续聆听时长越长所述判决条件的灵敏度被调得越低。

9.根据权利要求4至6任一项所述的方法，其特征在于，所述历史语音信息的情况包括获取所述第一语音信息时与最近一次获取到有效语音信息之间的第一时间间隔；

所述第一时间间隔越长所述判决条件的灵敏度被调得越低。

10.根据权利要求4至6任一项所述的方法，其特征在于，所述历史语音信息的情况包括获取所述第一语音信息时与最近一次获取到无效语音信息之间的第二时间间隔；

所述第二时间间隔越长所述判决条件的灵敏度被调得越低。

11.根据权利要求4至6任一项所述的方法，其特征在于，所述历史语音信息的情况包括获取所述第一语音信息时与最近一次获取到有效语音信息之间的第一时间间隔，以及包括获取所述第一语音信息时与最近一次获取到无效语音信息之间的第二时间间隔；

在所述第一时间间隔小于所述第二时间间隔的情况下，所述判决条件的灵敏度被调高。

12.根据权利要求4至6任一项所述的方法，其特征在于，所述历史语音信息的情况包括获取到所述第一语音信息前第一预设时长内有效语音信息和无效语音信息的占比；

在所述有效语音信息的占比大于所述无效语音信息的占比的情况下，所述判决条件的灵敏度被调高；

在所述有效语音信息的占比小于所述无效语音信息的占比的情况下，所述有效语音信息的占比呈上升趋势，所述判决条件的灵敏度被调高；所述有效语音信息的占比呈下降趋势，所述判决条件的灵敏度被调低。

13.根据权利要求4至6任一项所述的方法，其特征在于，所述历史语音信息的情况包括截止至获取到所述第一语音信息时设备与用户语音对话的状态；

在所述设备与用户语音对话的状态存在的情况下，所述判决条件的灵敏度被调高。

14.一种语音信息处理装置，其特征在于，所述装置包括：

获取单元，用于获取第一语音信息；

执行单元，用于在基于判决条件确定所述第一语音信息为有效的语音控制指令的情况下，执行所述第一语音信息指示的操作，其中，所述判决条件为基于所述第一语音信息产生时所在的环境情况调整得到。

15.根据权利要求14所述的装置，其特征在于，所述第一语音信息产生时所在的环境情况包括如下的一项或多项：

截止至所述设备获取到该第一语音信息的第二预设时长内的说话人数，所述第一语音信息产生时预设范围内的人数，所述第一语音信息的置信度，或所述第一语音信息的信噪比。

16.根据权利要求14或15所述的装置，其特征在于，所述判决条件为基于所述第一语音信息产生时所在的环境情况调整得到，包括：

所述判决条件为基于所述环境情况以及设备的持续聆听时长调整得到。

17.根据权利要求16所述的装置，其特征在于，所述判决条件为基于所述环境情况以及设备的持续聆听时长调整得到，包括：

所述判决条件为基于所述环境情况、所述持续聆听时长以及历史语音信息的情况调整得到。

18.根据权利要求14或15所述的装置，其特征在于，所述判决条件为基于所述第一语音信息产生时所在的环境情况调整得到，包括：

所述判决条件为基于所述环境情况以及历史语音信息的情况调整得到。

19.根据权利要求17或18所述的装置，其特征在于，所述历史语音信息的情况包括如下中的一种或多种：

获取所述第一语音信息时与最近一次获取到有效语音信息之间的第一时间间隔；

获取所述第一语音信息时与最近一次获取到无效语音信息之间的第二时间间隔；

获取到所述第一语音信息前第一预设时长内有效语音信息和无效语音信息的占比；

所述第一语音信息与最近一次获取到的有效语音信息的语义的第一关联度；

所述第一语音信息与最近一次获取到的无效语音信息的语义的第二关联度；

第一语音信息与设备最近一次获取到的有效语音信息的第三关联度；

截止至获取到所述第一语音信息时设备与用户语音对话的状态；

所述第一语音信息与历史有效语音信息的声学特征的第一相似度；

所述第一语音信息与历史无效语音信息的声学特征的第二相似度。

20.根据权利要求14至19任一项所述的装置，其特征在于，

在所述环境情况指示所述第一语音信息有效的概率大于无效的概率的情况下，所述判决条件的灵敏度被调高；

在所述环境情况指示所述第一语音信息有效的概率小于无效的概率的情况下，所述判决条件的灵敏度被调低。

21.根据权利要求16或17所述的装置，其特征在于，所述设备的持续聆听时长越长所述判决条件的灵敏度被调得越低。

22.根据权利要求17至19任一项所述的装置，其特征在于，所述历史语音信息的情况包括获取所述第一语音信息时与最近一次获取到有效语音信息之间的第一时间间隔；

所述第一时间间隔越长所述判决条件的灵敏度被调得越低。

23.根据权利要求17至19任一项所述的装置，其特征在于，所述历史语音信息的情况包括获取所述第一语音信息时与最近一次获取到无效语音信息之间的第二时间间隔；

所述第二时间间隔越长所述判决条件的灵敏度被调得越低。

24.根据权利要求17至19任一项所述的装置，其特征在于，所述历史语音信息的情况包括获取所述第一语音信息时与最近一次获取到有效语音信息之间的第一时间间隔，以及包括获取所述第一语音信息时与最近一次获取到无效语音信息之间的第二时间间隔；

在所述第一时间间隔小于所述第二时间间隔的情况下，所述判决条件的灵敏度被调高。

25.根据权利要求17至19任一项所述的装置，其特征在于，所述历史语音信息的情况包括获取到所述第一语音信息前第一预设时长内有效语音信息和无效语音信息的占比；

在所述有效语音信息的占比大于所述无效语音信息的占比的情况下，所述判决条件的灵敏度被调高；

在所述有效语音信息的占比小于所述无效语音信息的占比的情况下，所述有效语音信息的占比呈上升趋势，所述判决条件的灵敏度被调高；所述有效语音信息的占比呈下降趋势，所述判决条件的灵敏度被调低。

26.根据权利要求17至19任一项所述的装置，其特征在于，所述历史语音信息的情况包括截止至获取到所述第一语音信息时设备与用户语音对话的状态；

在所述设备与用户语音对话的状态存在的情况下，所述判决条件的灵敏度被调高。

27.一种设备，其特征在于，所述设备包括处理器和存储器，其中，所述存储器用于存储计算机程序，所述处理器用于执行所述存储器中存储的计算机程序，使得所述设备执行如权利要求1至13任一项所述的方法。

28.一种芯片系统，其特征在于，所述芯片系统应用于电子装置；芯片系统包括接口电路和处理器；接口电路和处理器通过线路互联；接口电路用于从电子装置的存储器接收信号，并向处理器发送信号，信号包括存储器中存储的计算机指令；当处理器执行该计算机指令时，芯片系统执行如权利要求1至13任一项所述的方法。

29.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现权利要求1至13任意一项所述的方法。

30.一种计算机程序产品，其特征在于，所述计算机程序产品被处理器执行时，权利要求1至13任意一项所述的方法将被执行。

技术总结
本申请实施例公开了一种语音信息处理方法及设备，该方法包括：获取第一语音信息；在基于判决条件确定该第一语音信息为有效的语音控制指令的情况下，执行该第一语音信息指示的操作，其中，该判决条件为基于该第一语音信息产生时所在的环境情况调整得到。本申请能够在不同的智能语音交互场景中提高有效语音识别的准确率，降低无效语音的误触发率。

技术研发人员：杨世辉;聂为然
受保护的技术使用者：华为技术有限公司
技术研发日：2021.04.20
技术公布日：2021.08.31

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：回声分离方法、装置及存储介质与流程

语音信息处理方法及设备与流程

相关文章

最热文献