一种语音有效性的检测方法、装置及设备与流程

2022-02-20 12:40:31 来源：中国专利 TAG：

1.本发明实施例涉及数据处理技术领域，尤其涉及一种语音有效性的检测方法、装置及设备。

背景技术：

2.随着智能语音交互技术的迅速发展，在车辆内加入智能语音交互系统，以便于驾驶人员可以在手不离开方向盘的情况下，可以通过语音更容易地控制车辆设备和查询生活信息。
3.发明人在实现本发明的过程中，发现现有的智能语音交互过程中存在如下缺陷：在智能语音交互过程中，存在因为车辆行驶噪音，其他用户的语音干扰信号，周围音频播放器播放的语音干扰信号等等。这些干扰信号经常导致语音交互过程中断，或者，产生错误的语音响应。

技术实现要素：

4.本发明实施例提供一种语音有效性的检测方法、装置及设备，以准确、快速地确定在智能语音交互过程中采集的语音信号的有效性。
5.第一方面，本发明实施例提供了一种语音有效性的检测方法，包括：
6.采集当前时刻的第一语音信号；
7.确定所述第一语音信号的语义置信度及所述第一语音信号与第二语音信号的相关度；其中，所述语义置信度用于表征语音信号的有效性，所述第二语音信号为上一个时刻采集的语音信号；
8.根据所述语义置信度和所述相关度，确定所述第一语音信号的有效性。
9.第二方面，本发明实施例还提供了一种语音有效性的检测装置，包括：
10.采集模块，用于采集当前时刻的第一语音信号；
11.第一确定模块，用于确定所述第一语音信号的语义置信度及所述第一语音信号与第二语音信号的相关度；其中，所述语义置信度用于表征语音信号的有效性，所述第二语音信号为上一个时刻采集的语音信号；
12.第二确定模块，用于根据所述语义置信度和所述相关度，确定所述第一语音信号的有效性。
13.第三方面，本发明实施例提供了一种设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如本发明实施例提供的语音有效性的检测方法。
14.第四方面，本发明实施例还提供了一种计算机存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明任意实施例所提供的语音有效性的检测方法。
15.本发明实施例提供的语音有效性的检测方案，采集当前时刻的第一语音信号；确定所述第一语音信号的语义置信度及所述第一语音信号与第二语音信号的相关度；其中，
所述语义置信度用于表征语音信号的有效性，所述第二语音信号为上一个时刻采集的语音信号；根据所述语义置信度和所述相关度，确定所述第一语音信号的有效性。通过采用上述技术方案，可以准确、快速地确定在智能语音交互过程中采集的语音信号的有效性，有效减少了智能语音交互过程中由于周围干扰信号的影响导致语音交互中断或产生错误响应的情况发生。
附图说明
16.图1是本发明实施例一提供的一种语音有效性的检测方法的流程图；
17.图2是本发明实施例二提供的一种语音有效性的检测方法的流程图；
18.图3是本发明实施例三提供的一种语音有效性的检测方法的流程图；
19.图4是本发明实施例四提供的一种语音有效性的检测装置的示意图；
20.图5为本发明实施例六提供的设备的结构示意图。
具体实施方式
21.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。
22.另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理，但是其中的许多操作可以被并行地、并发地或者同时实施。此外，各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
23.实施例一
24.图1是本发明实施例一提供的一种语音有效性的检测方法的流程图，本实施例可适用于对智能语音交互过程中语音的有效性进行检测的情况，该方法可以由语音有效性的检测装置来执行，该装置可以由软件和/或硬件的方式来实现，并一般可集成在设备中。相应的，如图1所示，该方法包括如下操作：
25.步骤101、采集当前时刻的第一语音信号。
26.示例性的，在智能语音交互过程中，采集当前时刻的第一语音信号。其中，智能语音交互可以包括在会议室的多人对话的语音交互，还可以包括在车载系统中语音交互。需要说明的是，本发明实施例对智能语音交互的应用场景不做限定。示例性的，通过麦克风阵列采集当前时刻的语音信号，并将采集的当前时刻的语音信号作为第一语音信号。其中，麦克风阵列可以由多个麦克风组成。
27.步骤102、确定所述第一语音信号的语义置信度及所述第一语音信号与第二语音信号的相关度；其中，所述语义置信度用于表征语音信号的有效性，所述第二语音信号为上一个时刻采集的语音信号。
28.在本发明实施例中，采集到当前时刻的第一语音信号后，确定第一语音信号的语义置信度，其中，语义置信度可以间接反映采集的第一语音信号的有效性。示例性的，获取预先收集的不同语音交互场景下的有效语音数据集，遍历各个有效语音数据集，将第一语
音信息与各个有效语音数据集进行匹配，以确定第一语音信息与有效语音数据集的有效语音数据的相似度，将最大相似度作为第一语音信号的语义置信度。
29.可选的，确定所述第一语音信号的语义置信度，包括：将所述第一语音信号转换为第一文字信息；将所述第一文字信息输入至预先训练的语义理解模型中；其中，所述语义理解模型基于对有效文字信息呈现的规律生成，所述有效文字信息为有效语音信号转换的文字；根据所述语义理解模型的输出结果确定所述第一语音信号的语义置信度。这样设置的好处在于，可以准确、快速地确定出第一语音信号的语义置信度。
30.示例性的，语义理解模型可以理解为对文字信息进行分析后可快速确定出文字信息的语义置信度的机器学习模型。在语义理解模型训练阶段，获取大量的样本文字数据集，其中，样本文字数据集中的文字数据可以是由语音信号转换过来的文字信息，在样本文字数据集中可包括正样本文字数据集和负样本文字数据集，正样本文字数据集中的文字数据是由有效语音信号转换而来的文字信息，负样本文字数据集中的文字数据是由无效语音信号转换而来的文字信息。然后根据正负样本文字数据对样本文字数据集进行样本标记，将标记后的样本文字数据集输入至机器学习模型中，生成语义理解模型。将第一语音信号转换为第一文字信息，并将第一文字信息输入至训练好的语义理解模型中，语义理解模型对第一文字信息进行综合分析后，输出对第一文字信息的分析结果，并将语义理解模型对第一文字信息的分析结果作为第一语音信号的语义置信度。其中，语义置信度越高，表示语音信息的有效性越高。在本发明实施例中，语义置信度的取值范围为0-1，若语义置信度大于0.99，可将第一语音信号作为有效语音信号，而若语义置信度小于0.5时，说明语音信号中包含噪声的干扰信号概率较大，而若语音置信度处于0.3-0.99的范围内时，说明语音信号中包含其他用户的语音干扰信号的概率较大。
31.在本发明实施例中，在语音交互的过程中，用户输入的语音数据通常都具有一定的相关性，例如：在车载系统的语音交互过程中，用户通过车载语音交互系统唤醒导航功能时，用户通常不会输入与导航不想关的百科搜索等相关语音信息，因此，可进一步根据当前时刻采集的第一语音信号与上一时刻采集的第二语音信号的相关性，判断第一语音信号的有效性。可选的，确定所述第一语音信号与第二语音信号的相关度，包括：获取上一时刻采集的第二语音信号，并将所述第二语音信号转换为第二文字信息；将所述第一语音信号转换为第三文字信息；计算所述第二文字信息与所述第三文字信息的相关度，并将所述第二文字信息与所述第三文字信息的相关度作为所述第一语音信号与第二语音信号的相关度。示例性的，将当前时刻采集的语音信号和上一时刻采集的语音信号分别转换为对应的文字信息，并计算两文字信息间的相关度。例如，可将两文字信息均输入至预先训练的相关度计算模型中，根据相关度计算模型的输出结果确定两文字信息的相关度。
32.步骤103、根据所述语义置信度和所述相关度，确定所述第一语音信号的有效性。
33.在本发明实施例中，根据第一语音信号的语义置信度和第一语音信号与第二语音信号的相关度，确定第一语音信号的有效性。示例性的，可以判断第一语音信号的语义置信度是否大于预设置信度阈值，同时第一语音信号与第二语音信号的相关度是否大于预设相关度阈值，若是，则可将第一语音信号确定为有效语音信号，否则，将第一语音信号确定为无效语音信号。又示例性的，根据第一语音信号的语义置信度和第一语音信号与第二语音信号的相关度，计算第一语音信号的有效性进行打分，根据打分结果判断第一语音信号是
否为有效语音信号。
34.可选的，根据所述语义置信度和所述相关度，确定所述第一语音信号的有效性，包括：根据所述语义置信度和所述相关度计算所述第一语音信号的有效性分数；根据所述有效性分数确定所述第一语音信号的有效性。示例性的，根据如下线性回归公式计算第一语音信号的有效性分数：y＝β0 β1x1 β2x2，其中，y表示第一语音信号的有效性分数，β0、β1、β2为线性回归系数，x1表示第一语音信号的语义置信度，x2表示第一语音信号和第二语音信号的相关度。当第一语音信号的有效性分数大于预设分数阈值时，可将第一语音信号确定为有效语音信号，当第一语音信号的有效性分数小于预设分数阈值时，可将第一语音信号确定为无效语音信号。
35.本发明实施例提供的语音有效性的检测方法，采集当前时刻的第一语音信号；确定所述第一语音信号的语义置信度及所述第一语音信号与第二语音信号的相关度；其中，所述语义置信度用于表征语音信号的有效性，所述第二语音信号为上一个时刻采集的语音信号；根据所述语义置信度和所述相关度，确定所述第一语音信号的有效性。通过采用上述技术方案，可以准确、快速地确定在智能语音交互过程中采集的语音信号的有效性，有效减少了智能语音交互过程中由于周围干扰信号的影响导致语音交互中断或产生错误响应的情况发生。
36.在一些实施例中，在根据所述语义置信度和所述相关度，确定所述第一语音信号的有效性之前，还包括：确定所述第一语音信号和所述第二语音信号的方向来源的一致度；根据所述语义置信度和所述相关度，确定所述第一语音信号的有效性，包括：根据所述语义置信度、所述相关度及所述一致度，确定所述第一语音信号的有效性。
37.示例性的，在智能语音交互过程中，用户输入的有效语音信号的声音来源和上一时刻输入的语音信号的声音来源通常是一致的。因此，语音信号的声音来源也是影响语音信号有效性的一个重要因素。例如，如果采集的当前时刻的第一语音信号与上一时刻采集的第二语音信号的声音来源一致，则说明当前时刻采集的第一语音信号为有效语音信号的可能性较大，而如果当前时刻采集的第一语音信号与上一时刻采集的第二语音信号的声音来源不同，则说明当前时刻采集的第一语音信号为无效语音信号的可能性较大。因此，确定第一语音信号和第二语音信号的方向来源的一致度，当第一语音信号和第二语音信号的方向来源相同时，可将第一语音信号和第二语音信号的方向来源的一致度确定为1；而当第一语音信号和第二语音信号的方向来源不同时，可将第一语音信号和第二语音信号的方向来源的一致度确定为0。示例性的，在车载系统的语音交互过程中，可通过麦克风阵列确定第一语音信号和第二语音信号是否来着车内同一音区，以确定第一语音信号和第二语音信号的方向来源的一致度。其中，对于不同的车辆，车内音区的分布也不同。例如，对于双人座的车辆而言，车内音区可以分为主驾音区以及副驾音区；对于四人座的车辆而言，车内音区可以分为主驾音区、副驾音区、后排左音区以及后排右音区；对于七人座的车辆而言，车内音区可以分为主驾音区、副驾音区、中间第一音区、中间第二音区、后排第一音区、后排第二音区以及后排第三音区。当第一语音信号和第二语音信号来自车内同一音区，则可将第一语音信号和第二语音信号的方向来源的一致度确定为1；而当第一语音信号和第二语音信号来自车内不同音区，则可将第一语音信号和第二语音信号的方向来源的一致度确定为0。
38.在本发明实施例中，根据第一语音信号的语义置信度、第一语音信号和第二语音
信号的相关度及一致度，确定第一语音信号的有效性。例如，可以判断第一语音信号的语义置信度是否大于预设置信度阈值，第一语音信号与第二语音信号的相关度是否大于预设相关度阈值，同时第一语音信号与第二语音信号的方向来源的一致度是否大于预设一致度阈值，若是，则可将第一语音信号确定为有效语音信号，否则，将第一语音信号确定为无效语音信号。又示例性的，根据第一语音信号的语义置信度、第一语音信号与第二语音信号的相关度及一致度，对第一语音信号的有效性进行打分，根据打分结果判断第一语音信号是否为有效语音信号。例如，根据如下线性回归公式计算第一语音信号的有效性分数：y＝β0 β1x1 β2x2 β3x3，其中，y表示第一语音信号的有效性分数，β0、β1、β2、β3为线性回归系数，x1表示第一语音信号的语义置信度，x2表示第一语音信号和第二语音信号的相关度，x3表示第一语音信号和第二语音信号的方向来源的一致度。当第一语音信号的有效性分数大于预设分数阈值时，可将第一语音信号确定为有效语音信号，当第一语音信号的有效性分数小于预设分数阈值时，可将第一语音信号确定为无效语音信号。
39.在一些实施例中，在根据所述语义置信度、所述相关度及所述一致度，确定所述第一语音信号的有效性之前，还包括：确定所述第一语音信号的有效长度；根据所述语义置信度、所述相关度及所述一致度，确定所述第一语音信号的有效性，包括：根据所述语义置信度、所述相关度、所述一致度及所述有效长度，确定所述第一语音信号的有效性。
40.示例性的，在智能语音交互过程中，用户输入的有效语音信号的通常不会太长，也不会太短，例如，通常用户输入的有效语音信号中包含3-15个字符，因此，语音信号的长度也是影响语音信号有效性的一个重要因素。例如，如果采集的语音信号太短(例如，语音信号中只包含1-2个字符)，说明该语音信号为噪声的可能性较大，而如果采集的语音信号太长(例如，语音信号中包含的字符个数大于15)，说明该语音信号为多用户间的对话语音扥干扰信号的可能性较大。因此，在本发明实施例中，确定第一语音信号的有效长度，根据第一语音信号的语义置信度、第一语音信号与第二语音信号的相关度、方向来源的一致度以及第一语音信号的有效长度，确定第一语音信号的有效性。
41.其中，可将第一语音信号的采集时长作为第一语音信号的有效长度，也可确定第一语音信号中的空语音(没有任何语音信息)持续时长，将第一语音信号的采集时长与空语音的持续时长的差作为第一语音信号的有效长度，还可将第一语音信号中包含的字符数量作为第一语音信号的有效长度。可选的，确定所述第一语音信号的有效长度，包括：将所述第一语音信号转换为第四文字信息；确定所述第四文字信息中包含的字符数量，并将所述字符数量作为所述第一语音信号的有效长度。需要说明的是，本发明实施例对第一语音信号的有效长度的定义方式不做限定。
42.在本发明实施例中，根据第一语音信号的语义置信度、第一语音信号和第二语音信号的相关度、方向来源的一致度以及第一语音信号的有效长度，确定第一语音信号的有效性。例如，可以判断第一语音信号的语义置信度是否大于预设置信度阈值，第一语音信号与第二语音信号的相关度是否大于预设相关度阈值，第一语音信号与第二语音信号的方向来源的一致度是否大于预设一致度阈值，同时第一语音信号的有效长度是否大于预设长度阈值，若是，则可将第一语音信号确定为有效语音信号，否则，将第一语音信号确定为无效语音信号。又示例性的，根据第一语音信号的语义置信度、第一语音信号与第二语音信号的相关度、方向来源的一致度以及第一语音信号的有效长度，对第一语音信号的有效性进行
打分，根据打分结果判断第一语音信号是否为有效语音信号。例如，根据如下线性回归公式计算第一语音信号的有效性分数：y＝β0 β1x1 β2x2 β3x3 β4x4，其中，y表示第一语音信号的有效性分数，β0、β1、β2、β3为线性回归系数，x1表示第一语音信号的语义置信度，x2表示第一语音信号和第二语音信号的相关度，x3表示第一语音信号和第二语音信号的方向来源的一致度，x4表示第一语音信号的有效长度。当第一语音信号的有效性分数大于预设分数阈值时，可将第一语音信号确定为有效语音信号，当第一语音信号的有效性分数小于预设分数阈值时，可将第一语音信号确定为无效语音信号。
43.在一些实施例中，在确定所述第一语音信号的有效性之后，还包括：当确定所述第一语音信号为有效语音信号时，响应所述第一语音信号。这样设置的好处在于，可以有效减少智能语音交互过程中由于周围干扰信号的影响导致语音交互中断或产生错误响应的情况发生。示例性的，当确定第一语音信号为有效语音信号时，对第一语音信号对应的语音控制指令进行响应。例如，在车载系统的语音交互过程中，根据第一语音信号对应的语音控制指令对车载系统进行控制。
44.实施例二
45.图2是本发明实施例二提供的一种语音有效性的检测方法的流程图，本实施例以上述实施例为基础进行具体化，在本实施例中，给出了根据第一语音信号的语义置信度和第一语音信号与第二语音信号的相关度，确定第一语音信号的有效性的具体实施方式。相应的，如图2所示，本实施例的方法可以包括：
46.步骤201、采集当前时刻的第一语音信号。
47.步骤202、将第一语音信号转换为第一文字信息。
48.步骤203、将第一文字信息输入至预先训练的语义理解模型中。
49.其中，语义理解模型基于对有效文字信息呈现的规律生成，有效文字信息为有效语音信号转换的文字。
50.步骤204、根据语义理解模型的输出结果确定第一语音信号的语义置信度。
51.其中，语义置信度用于表征语音信号的有效性。
52.步骤205、获取上一时刻采集的第二语音信号，并将第二语音信号转换为第二文字信息。
53.步骤206、计算第一文字信息与第二文字信息的相关度，并将第一文字信息与第二文字信息的相关度作为第一语音信号与第二语音信号的相关度。
54.步骤207、根据语义置信度和相关度计算第一语音信号的有效性分数。
55.步骤208、根据有效性分数确定第一语音信号的有效性。
56.需要说明的是，本发明实施例对步骤203-步骤204与步骤205-步骤206的执行顺序不做限定，可以先执行步骤203-步骤204，后步骤205-步骤206，也可先执行步骤205-步骤206，后步骤203-步骤204，还可同时执行步骤203-步骤204与步骤205-步骤206。
57.本发明实施例提供的语音有效性的检测方法，根据当前时刻采集的第一语音信号的语义置信度及第一语音信号与上一时刻采集的第二语音信号的相关度，确定第一语音信号的有效性，不仅可以准确、快速地确定在智能语音交互过程中采集的语音信号的有效性，而且还有效减少了智能语音交互过程中由于周围干扰信号的影响导致语音交互中断或产生错误响应的情况发生，提高了用户体验。
58.实施例三
59.图3是本发明实施例三提供的一种语音有效性的检测方法的流程图，本实施例以上述实施例为基础进行具体化，在本实施例中，给出了根据第一语音信号的语义置信度、第一语音信号与第二语音信号的相关度、方向来源的一致度及第一语音信号的有效长度，确定第一语音信号的有效性的具体实施方式。相应的，如图3所示，本实施例的方法可以包括：
60.步骤301、采集当前时刻的第一语音信号。
61.步骤302、将第一语音信号转换为第一文字信息。
62.步骤303、将第一文字信息输入至预先训练的语义理解模型中。
63.其中，语义理解模型基于对有效文字信息呈现的规律生成，有效文字信息为有效语音信号转换的文字。
64.步骤304、根据语义理解模型的输出结果确定第一语音信号的语义置信度。
65.其中，语义置信度用于表征语音信号的有效性。
66.步骤305、获取上一时刻采集的第二语音信号，并将第二语音信号转换为第二文字信息。
67.步骤306、计算第一文字信息与第二文字信息的相关度，并将第一文字信息与第二文字信息的相关度作为第一语音信号与第二语音信号的相关度。
68.步骤307、确定第一语音信号和第二语音信号的方向来源的一致度。
69.步骤308、确定第一文字信息中包含的字符数量，并将字符数量作为第一语音信号的有效长度。
70.步骤309、根据语义置信度、相关度、一致度及有效长度，计算第一语音信号的有效性分数。
71.示例性的，在车载系统的语音交互过程中，上一时刻采集的第二语音信号为“打开空调”，当前时刻采集的第一语音信号为“将空调温度调到26度”，且第一语音信号和第二语音信号均来自车内同一音区(如均来自主驾驶音区)，另外，通过语义理解模型确定第一语音信号的语义置信度为0.99。显然，x1＝0.99，第一语音信号和第二语音信号均涉及到空调，第一语音信号和第二语音信号的相关度为1，即x2＝1，第一语音信号和第二语音信号的方向来源一致度为1，即x3＝1，第一语音信号中共包含10个字符，因此，第一语音信号的有效长度为10，为了方便计算，将第一语音信号的有效长度进行归一化处理后，将第一语音信号的有效长度归一化为0.95，即x3＝0.95。其中，在y＝β0 β1x1 β2x2 β3x3 β4x4中，β0＝0,β1＝0.2,β2＝0.4,β3＝0.3,β4＝0.3，因此，计算出的第一语音信号的相关性分数为y＝0 0.2*1 0.4*0.95 0.3*0.99 0.3*1＝1.177。
72.步骤310、判断有效性分数是否大于预设分数阈值，若是，则执行步骤311，否则，执行步骤312。
73.示例性的，若预设分数阈值设置为0.87，显然，第一语音信号的相关性分数大于预设分数阈值，此时，可将第一语音信号确定为有效语音信号；若预设分数阈值设置为1.2，显然，第一语音信号的相关性分数小于预设分数阈值，此时，可将第一语音信号确定为无效语音信号。
74.步骤311、确定第一语音信号为有效语音信号，并响应第一语音信号。
75.步骤312、确定第一语音信号为无效语音信号，并拒绝对第一语音信号的响应。
76.需要说明的是，本发明实施例对步骤303-步骤304、步骤305-步骤306、步骤307及步骤308的执行顺序不做限定，可以同时执行以上步骤，也可以按照任一组合的先后顺序执行上述步骤。
77.本发明实施例提供的语音有效性的检测方法，在智能语音交互的过程中，根据当前时刻采集的第一语音信号的语义置信度、第一语音信号与上一时刻采集的第二语音信号的相关度、方向来源的一致度及第一语音信号的有效长度，计算第一语音信号的有效性分数，根据有效性分数判断第一语音信号是否为有效语音信号，并对有效语音信号进行响应，不仅可以准确、快速地确定在智能语音交互过程中采集的语音信号的有效性，而且还有效减少了智能语音交互过程中由于周围干扰信号的影响导致语音交互中断或产生错误响应的情况发生，提高了用户体验。
78.实施例四
79.图4是本发明实施例四提供的一种语音有效性的检测装置的示意图，如图4所示，所述装置包括：采集模块401、第一确定模块402及第二确定模块403，其中：
80.采集模块401，用于采集当前时刻的第一语音信号；
81.第一确定模块402，用于确定所述第一语音信号的语义置信度及所述第一语音信号与第二语音信号的相关度；其中，所述语义置信度用于表征语音信号的有效性，所述第二语音信号为上一个时刻采集的语音信号；
82.第二确定模块403，用于根据所述语义置信度和所述相关度，确定所述第一语音信号的有效性。
83.本发明实施例提供的语音有效性的检测装置，采集当前时刻的第一语音信号；确定所述第一语音信号的语义置信度及所述第一语音信号与第二语音信号的相关度；其中，所述语义置信度用于表征语音信号的有效性，所述第二语音信号为上一个时刻采集的语音信号；根据所述语义置信度和所述相关度，确定所述第一语音信号的有效性。通过采用上述技术方案，可以准确、快速地确定在智能语音交互过程中采集的语音信号的有效性，有效减少了智能语音交互过程中由于周围干扰信号的影响导致语音交互中断或产生错误响应的情况发生。可选的，所述第一确定模块，用于：
84.将所述第一语音信号转换为第一文字信息；
85.将所述第一文字信息输入至预先训练的语义理解模型中；其中，所述语义理解模型基于对有效文字信息呈现的规律生成，所述有效文字信息为有效语音信号转换的文字；
86.根据所述语义理解模型的输出结果确定所述第一语音信号的语义置信度。
87.可选的，所述第一确定模块，用于：
88.获取上一时刻采集的第二语音信号，并将所述第二语音信号转换为第二文字信息；
89.将所述第一语音信号转换为第三文字信息；
90.计算所述第二文字信息与所述第三文字信息的相关度，并将所述第二文字信息与所述第三文字信息的相关度作为所述第一语音信号与第二语音信号的相关度。
91.可选的，所述第二确定模块，用于：
92.根据所述语义置信度和所述相关度计算所述第一语音信号的有效性分数；
93.根据所述有效性分数确定所述第一语音信号的有效性。
94.可选的，所述装置还包括：
95.第三确定模块，用于在根据所述语义置信度和所述相关度，确定所述第一语音信号的有效性之前，确定所述第一语音信号和所述第二语音信号的方向来源的一致度；
96.所述第二确定模块，包括：
97.确定单元，用于根据所述语义置信度、所述相关度及所述一致度，确定所述第一语音信号的有效性。
98.可选的，所述装置还包括：
99.第四确定模块，用于在根据所述语义置信度、所述相关度及所述一致度，确定所述第一语音信号的有效性之前，确定所述第一语音信号的有效长度；
100.所述确定单元，用于：
101.根据所述语义置信度、所述相关度、所述一致度及所述有效长度，确定所述第一语音信号的有效性。
102.可选的，所述第四确定模块，用于：
103.将所述第一语音信号转换为第四文字信息；
104.确定所述第四文字信息中包含的字符数量，并将所述字符数量作为所述第一语音信号的有效长度。
105.可选的，所述装置还包括：
106.响应模块，用于在确定所述第一语音信号的有效性之后，当确定所述第一语音信号为有效语音信号时，响应所述第一语音信号。
107.实施例五
108.本发明实施例还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行语音有效性的检测方法，该方法包括：
109.采集当前时刻的第一语音信号；
110.确定所述第一语音信号的语义置信度及所述第一语音信号与第二语音信号的相关度；其中，所述语义置信度用于表征语音信号的有效性，所述第二语音信号为上一个时刻采集的语音信号；
111.根据所述语义置信度和所述相关度，确定所述第一语音信号的有效性。
112.存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括：安装介质，例如cd-rom、软盘或磁带装置；计算机系统存储器或随机存取存储器，诸如dram、ddrram、sram、edoram，兰巴斯(rambus)ram等；非易失性存储器，诸如闪存、磁介质(例如硬盘或光存储)；寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外，存储介质可以位于程序在其中被执行的第一计算机系统中，或者可以位于不同的第二计算机系统中，第二计算机系统通过网络(诸如因特网)连接到第一计算机系统。第二计算机系统可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。
113.当然，本发明实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的语音有效性的检测操作，还可以执行本发明任意实施例所提
供的语音有效性的检测方法中的相关操作。
114.实施例六
115.本发明实施例提供了一种设备，该终端中可集成本发明实施例提供的语音有效性的检测装置。图5为本发明实施例提供的一种设备的结构框图。设备500可以包括：存储器501，处理器502及存储在存储器501上并可在处理器运行的计算机程序，所述处理器502执行所述计算机程序时实现如本发明实施例所述的语音有效性的检测方法。
116.本发明实施例中提供的设备，采集当前时刻的第一语音信号；确定所述第一语音信号的语义置信度及所述第一语音信号与第二语音信号的相关度；其中，所述语义置信度用于表征语音信号的有效性，所述第二语音信号为上一个时刻采集的语音信号；根据所述语义置信度和所述相关度，确定所述第一语音信号的有效性。通过采用上述技术方案，可以准确、快速地确定在智能语音交互过程中采集的语音信号的有效性，有效减少了智能语音交互过程中由于周围干扰信号的影响导致语音交互中断或产生错误响应的情况发生。
117.上述实施例中提供的语音有效性的检测装置、存储介质及设备可执行本发明任意实施例所提供的语音有效性的检测方法，具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节，可参见本发明任意实施例所提供的语音有效性的检测方法。
118.注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：文本的有声播放方法、装置和终端设备与流程

一种语音有效性的检测方法、装置及设备与流程

相关文献

最热文献