基于机顶盒的远场拾音唤醒控制方法、系统、设备及介质与流程

2022-09-03 17:13:32 来源：中国专利 TAG：

1.本发明涉及机顶盒的技术领域，尤其是涉及一种基于机顶盒的远场拾音唤醒控制方法、系统、设备及介质。

背景技术：

2.目前，随着人工智能技术的发展，通过语音识别获取用户对设备的控制指令，从而通过语音就可以实现人机交互。随着近场语音识别的日渐成熟，人们对复杂音源环境下对语音的识别提出了新的更高的要求，远场语音识别技术应运而生。
3.现有的通过语音来控制机顶盒的方式主要分为近场跟远场两种，近场语音需要按住遥控器的语音录入按钮来输入机顶盒操控命令，而现有的远场语音机顶盒虽然可以不依赖于遥控器，直接通过机顶盒的收音模块发出控制语音就可以通过语音的方式控制机顶盒，并且通过语音控制机顶盒进行工作的方式还对一些不便于用手操作的残疾人士或者一些对智能设备不了解的老人带来了极大的便利，然而在声音嘈杂的环境下不容易在众多的声音中识别出机顶盒的控制语音或者在人员和机顶盒的收音装置距离较远的情况下容易产生回音或者捕捉到的语音音量过小，从而不易捕捉到机顶盒实际响应的控制命令。
4.针对上述中的相关技术，发明人认为存在有在声音嘈杂环境或者距离机顶盒位置较远的情况下，机顶盒控制命令的识别度不高的缺陷。

技术实现要素：

5.为了提高对机顶盒控制命令的识别准确率，本技术提供一种基于机顶盒的远场拾音唤醒控制方法、系统、设备及介质。
6.本技术的上述发明目的一是通过以下技术方案得以实现的：提供一种基于机顶盒的远场拾音唤醒控制方法，所述基于机顶盒的远场拾音唤醒控制方法包括：实时获取若干路原始声音数据中的有效声音片段作为待处理声音数据，并通过高保真协议传输至麦克风；对所述待处理声音数据进行杂音清洗处理，得到目标声音数据，其中，所述目标声音数据包括控制麦克风切换数据传输协议的协议切换指令；当识别到所述协议切换指令时，控制所述麦克风切换为通过机顶盒低功耗协议传输数据，并识别所述目标声音数据中的机顶盒控制命令，所述机顶盒控制命令包括唤醒指令和控制指令；当识别到唤醒指令时，将所述唤醒指令通过机顶盒低功耗协议传输至机顶盒，以便控制机顶盒进入唤醒状态；当识别到控制指令时，将所述控制指令通过机顶盒低功耗协议传输至唤醒状态下的机顶盒，以便控制机顶盒切换工作状态。
7.通过采用上述技术方案，在声音嘈杂的环境中或者距离收音装置距离过远，导致
麦克风阵列捕获到的声音数据不够清晰，从而导致对若干路原始声音数据中携带的机顶盒控制命令语音识别不清晰时，将携带有机顶盒控制命令的声音片段作为待处理声音数据，以便于剔除不含有机顶盒控制命令的声音片段，并通过高保真协议将待处理声音数据传输至麦克风，以便更好地对拾取到的原始声音数据进行处理，提高对机顶盒控制命令的识别准确率，再通过深度学习算法对待处理声音数据进行数据训练，并将不符合机顶盒控制命令的杂音剔除，从而保留携带机顶盒控制命令的声音数据作为目标声音数据，以便通过目标声音数据对机顶盒进行控制，具体的，根据唤醒指令控制机顶盒进入唤醒状态，并根据控制指令控制唤醒状态下的机顶盒切换工作状态，根据识别到的机顶盒控制命令来控制麦克风切换数据传输方式，并通过机顶盒低功耗协议将对应的机顶盒控制命令信号发送至机顶盒，从而降低信号传输的功耗，符合机顶盒低功耗的需求，通过机顶盒控制命令信号控制机顶盒切换至相应的工作状态，以及通过对原始声音数据的杂音清洗来提高对机顶盒控制命令的识别准确率。
8.本技术在一较佳示例中可以进一步配置为：所述实时获取若干路原始声音数据中的有效声音片段作为待处理声音数据，并通过高保真协议传输至麦克风，具体包括：根据麦克风阵列拾取到的若干路原始声音数据对每路原始声音数据进行声源定位，得到每路原始声音数据对应的声源位置；对同一声源位置的每路原始声音数据与预先训练好的远场拾音模型分别进行拟合处理，得到携带有机顶盒控制命令的有效声音片段作为待处理声音数据。
9.通过采用上述技术方案，由于在声音嘈杂的环境下或用户距离麦克风阵列的距离过远，导致的混响、混音或者回音情况，从而导致麦克风阵列捕获到的原始声音数据不够清晰，则需要对每路原始声音数据的声源进行声源定位，来获取每路原始声音数据对应的声源位置，有助于根据声源位置来对混响或者有回音的杂音数据进行清洗，并通过对同一声源位置的每路原始声音数据与预先训练好的远场拾音模型分别进行拟合处理，将与远场拾音模型的拟合度最优的原始声音数据作为待处理声音数据，有助于通过远场拾音模型来获取原始声音数据中携带有机顶盒控制命令的有效声音片段，有助于提高对机顶盒控制命令的识别准确率。
10.本技术在一较佳示例中可以进一步配置为：所述根据所述麦克风阵列拾取到的若干路原始声音数据对每路原始声音数据的声源进行定位，得到每路原始声音数据对应的声源位置，具体包括：对携带有相同声音内容的每路所述原始声音数据进行计算，得到每路所述原始声音数据到达麦克风阵列的估计时间差；根据所述估计时间差对每个所述原始声音数据到达麦克风每个阵列的距离进行计算；根据计算结果选取距离最小的原始声音数据的声源位置作为目标声源位置，以便根据所述目标声源位置获取对应的机顶盒控制命令。
11.通过采用上述技术方案，由于麦克风阵列是由多个声学传感器组成的，同一声音传输到不同声学传感器的到达时间存在时间差，因此根据预设的时延估计算法对同一声源位置的多个原始声音数据进行计算，得到每个原始声音到达麦克风阵列的估计时间差，有助于根据估计时间差来估计每个原始声音到达每个声学传感器的到达时间，并通过预计时
间差与当前的声音传播速度进行计算，从而得到每个原始声音从声源位置到达麦克风阵列的距离，有助于根据距离的远近对每个声源位置进行排序，由于声音是以声波的形式向四面八方传播的，在传播的途中可能会因为遇到物体如墙壁等而产生折射，从而导致麦克风阵列接收到的相同内容的声音数据存在时间差，因此选取距离最小的原始声音数据的声源位置作为目标声源位置，有助于根据目标声源位置来获取原始声音数据中携带的机顶盒控制命令，从而提高对机顶盒控制命令的识别准确率。
12.本技术在一较佳示例中可以进一步配置为：所述对携带有相同声音内容的每路所述原始声音数据进行计算，得到每路所述原始声音数据到达麦克风阵列的估计时间差，还包括：将每路原始声音数据划分为若干个携带有声学特征的最小声学单元；将若干路原始声音数据的最小声学单元分别进行声学特征比对；根据比对结果判断每路所述原始声音数据是否携带有相同声音内容；若是，则选取所述最小声学单元匹配程度最高的待处理声音数据进行时延估计运算，得到每路原始声音数据到达麦克风不同阵列的估计时间差。
13.通过采用上述技术方案，由于同一个声源发出的原始声音在传播的途中可能会因为遇到墙壁等物体而产生多个有时间差的原始声音数据，如原始声音在传播的过程中产生了回音或混响，则需要将每路原始声音数据划分成携带有声学特征的最小声学单元，有助于通过最小声学单元的比对判断原始声音数据之间是否携带相同声音内容，并根据比对结果选取最小声学单元匹配程度最高的原始声音数据作为待处理声音数据来进行时延估计运算，从而得到每路原始声音数据到达麦克风阵列的估计时间差，从而剔除最小声学单元匹配程度低于待处理声音数据的原始声音数据，从而提高对原始声音数据中的机顶盒控制命令信息的识别准确率。
14.本技术在一较佳示例中可以进一步配置为：所述对同一声源位置的每路原始声音数据与预先训练好的远场拾音模型分别进行拟合处理，得到携带有机顶盒控制命令的有效声音片段作为待处理声音数据，具体包括：对每路原始声音数据进行转码解析，得到可被机顶盒识别的原始文本数据；将每个所述原始文本数据分别与预设的机顶盒控制命令进行关键词匹配；根据匹配结果选取原始声音数据中与机顶盒控制命令关键词匹配程度最高的声音片段作为待处理声音数据。
15.通过采用上述技术方案由于墙壁的折射或者多声源比较靠近的时候，可能同一句语音由于回音获取相邻声源的干扰而产生多个干扰声音数据，不利于对用户发出的实际控制语音的获取，因此通过同一声源位置发出的若干个原始声音数据与预先训练好的远场拾音模型进行拟合处理，具体的，为符合机顶盒低功耗传输协议，将原始声音数据转换为可被机顶盒识别的原始文本数据，通过文本格式的数据传输符合机顶盒低功耗协议的数据传输需求，并通过原始文本数据与预设的机顶盒控制命令进行关键词匹配，有助于根据匹配结果来判断原始声音数据中是否携带有机顶盒控制命令，并选取与机顶盒控制命令匹配程度最高的声音片段作为待处理声音数据，从而剔除不携带机顶盒控制命令的声音片段，提高对机顶盒控制命令的识别准确率。
16.本技术在一较佳示例中可以进一步配置为：所述对所述待处理声音数据进行杂音
清洗处理，得到目标声音数据，具体包括：将每个所述待处理声音数据划分为包含机顶盒关键词声学特征的最小发音单元；将所述最小发音单元与预设的机顶盒控制命令关键词进行匹配，并根据匹配结果判断所述待处理声音数据中是否含有机顶盒控制命令；若否，则剔除所述不包含机顶盒控制命令的待处理声音数据；若是，则将包含有机顶盒控制命令的待处理声音数据作为目标声音数据。
17.通过采用上述技术方案，由于麦克风阵列拾取到的若干个原始声音中存在干扰机顶盒控制命令识别的干扰声音，如其它声源发出的干扰声音或者声音在传播过程中产生的混响或者房间里产生的回音等，因此需要对待处理声音数据进行杂音清洗，来获取携带机顶盒控制命令的目标声音数据，以便通过目标声音数据来识别到机顶盒控制命令，减少其它干扰声音数据对机顶盒控制命令的干扰，根据待处理声音数据的最小发音单元与预设的机顶盒控制命令关键词的匹配结果，来判断待处理声音数据中是否携带有机顶盒控制命令，若否，则剔除不包含机顶盒控制命令的待处理声音数据，以便于针对携带机顶盒控制命令的待处理声音数据进行识别，减少其它声音数据的干扰，从而提高对机顶盒控制命令的识别准确率。
18.本技术在一较佳示例中可以进一步配置为：所述基于机顶盒的远场拾音唤醒控制方法还包括：根据所述原始声音数据中携带的人员声纹数据与预设的机顶盒用户声纹数据进行声纹特征比对；根据比对结果判断当前用户是否为特定的机顶盒用户；若否，则通过机顶盒低功耗协议向所述机顶盒发送锁定信号，以便控制机顶盒切换至锁定状态，防止当前用户查看机顶盒的展示内容。
19.通过采用上述技术方案，在通过语音来控制机顶盒进行工作的过程中，由于在一些重要场合，如一些机密的展会或者会议上，机顶盒展示的内容比较机密不便于任意人员都进行查看时，由于每个人的声带张力以及声音频率等声纹参数的不同，声纹具有唯一性，因此可以通过设置声纹来控制机顶盒只对特定用户进行解锁，若声纹数据与预设的机顶盒用户声纹数据不匹配，则向机顶盒发送锁定信号，从而控制机顶盒进行锁定，防止除特定用户之外的其它人员查看机顶盒的展示内容，提高机顶盒的保密性。
20.本技术的上述发明目的二是通过以下技术方案得以实现的：提供一种基于机顶盒的远场拾音唤醒控制系统，所述机顶盒的远场拾音唤醒控制系统包括：数据获取模块，用于实时获取若干路原始声音数据中的有效声音片段作为待处理声音数据，并通过高保真协议传输至麦克风；数据处理模块，用于对所述待处理声音数据进行杂音清洗处理，得到目标声音数据，其中，所述目标声音数据包括用于唤醒机顶盒的唤醒指令和用于切换机顶盒工作状态的控制指令；数据唤醒模块，用于当识别到唤醒指令时，控制所述麦克风切换为通过机顶盒低功耗协议传输数据，并将所述唤醒指令通过机顶盒低功耗协议传输至机顶盒，以便控制机顶盒进入唤醒状态；
数据控制模块，用于当识别到控制指令时，将所述控制指令通过机顶盒低功耗协议传输至唤醒状态下的机顶盒，以便控制机顶盒切换工作状态。
21.通过采用上述技术方案，在通过语音控制机顶盒进行工作的过程中，从麦克风阵列拾取到的若干路原始声音数据中，获取携带有机顶盒控制命令的有效声音片段作为待处理声音数据，有助于剔除其它干扰声音数据，将待处理声音数据通过高保真协议传输至麦克风，通过麦克风的高保真协议能够更好的保留待处理声音数据中携带的机顶盒控制命令信息，通过数据处理模块对待处理声音数据进行杂音清洗，有助于减少其它声音数据对识别机顶盒控制命令的干扰，从而得到携带有机顶盒控制命令的目标声音数据，并通过机顶盒低功耗协议将机顶盒控制指令传输至机顶盒，降低机顶盒运行成本，从而在符合机顶盒低功耗的需求下，提高对机顶盒控制命令的识别准确率。
22.本技术的上述目的三是通过以下技术方案得以实现的：一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述基于机顶盒的远场拾音唤醒控制方法的步骤。
23.本技术的上述目的四是通过以下技术方案得以实现的：一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述基于机顶盒的远场拾音唤醒控制方法的步骤。
24.综上所述，本技术包括以下至少一种有益技术效果：1、通过高保真协议将待处理声音数据传输到麦克风，能够更好地保留待处理声音数据中携带的机顶盒控制命令信息，通过对待处理声音数据的杂音清洗处理来获取原始声音数据中的机顶盒控制命令数据，排除其它声音数据对识别机顶盒控制命令的干扰，并根据唤醒指令将麦克风切换为机顶盒低功耗协议传输，并通过机顶盒低功耗协议将机顶盒控制命令信号传输至机顶盒，符合机顶盒低功耗需求，从而提高对机顶盒控制命令的识别准确率；2、通过对最小声学单元的比对判断原始声音数据之间是否携带有相同的声音内容，并对携带相同声音内容的原始声音数据进行声源定位，有助于通过声源位置来获取目标声音数据，并对同一声源位置的多个原始声音数据与预设的远场拾音模型进行拟合，得到拟合程度最优的声音数据作为目标声音数据，降低其它声音数据对携带有机顶盒控制命令的声音数据的干扰，从而提高对机顶盒控制命令的识别准确率；3、根据当前用户的声纹特征与预设的机顶盒用户的声纹特征的比对结果，判断当前用户是否为机顶盒特定用户，当声纹特征比对成功时才开启机顶盒进行工作，防止在重要场合不相关人员对机顶盒机密内容的随意查看，提高机顶盒的保密性。
附图说明
25.图1是本技术一实施例中基于机顶盒的远场拾音唤醒控制方法的实现流程图。
26.图2是本技术一实施例中的远场拾音唤醒控制方法的步骤s10的实现流程图。
27.图3是本技术一实施例中的远场拾音唤醒控制方法的步骤s101的实现流程图。
28.图4是本技术一实施例中的远场拾音唤醒控制方法的步骤s201的实现流程图。
29.图5是本技术一实施例中的远场拾音唤醒控制方法的步骤s102的实现流程图。
30.图6是本技术一实施例中的远场拾音唤醒控制方法的步骤s20的实现流程图。
31.图7是本技术一实施例中的远场拾音唤醒控制方法的另一实现流程图。
32.图8是本技术一实施例中基于机顶盒的远场拾音唤醒控制系统的实现流程图。
具体实施方式
33.以下结合附图对本技术作进一步详细说明。
34.在一实施例中，如图1所示，本技术公开了一种基于机顶盒的远场拾音唤醒控制方法，具体包括如下步骤：s10：实时获取若干路原始声音数据中的有效声音片段作为待处理声音数据，并通过高保真协议传输至麦克风。
35.本实施例中，在声音嘈杂的环境中或者距离收音装置距离过远，导致麦克风阵列捕获到的声音数据不够清晰或者有较多干扰声音，从而导致对原始声音数据中携带的机顶盒控制命令识别准确率较低，因此将携带有机顶盒控制命令的声音片段或者疑似携带有机顶盒控制命令的声音片段作为待处理声音数据，以便于剔除未携带有机顶盒控制命令的声音片段，如一些不相关的谈论声或者开关门的较大噪声，并通过高保真协议将待处理声音数据传输至麦克风，高保真协议能够更好地保留原始声音数据中携带的机顶盒控制语音，从而能够更好地对拾取到的原始声音数据进行处理，提高对机顶盒控制命令的识别准确率。
36.具体的，结合图2，步骤s10具体包括以下步骤：s101：根据麦克风阵列拾取到的若干路原始声音数据对每路原始声音数据进行声源定位，得到每路原始声音数据对应的声源位置。
37.本实施例中，由于在声音嘈杂的环境下或用户距离麦克风阵列的距离过远，导致的混响、混音或者回音情况，从而导致麦克风阵列捕获到的原始声音数据不够清晰，则需要对每路原始声音数据的声源进行声源定位，来获取每路原始声音数据对应的声源位置，有助于根据声源位置来对混响或者有回音的杂音数据进行清洗。本实施例中，通过对延时时间差的计算对声源位置进行定位，需要说明的是，也可以通过波束形成算法或者谱图估计算法来进行声源定位。
38.具体的，结合图3，步骤s101具体包括以下步骤：s201：对携带有相同声音内容的每路原始声音数据进行计算，得到每路原始声音数据到达麦克风阵列的估计时间差。
39.本实施例中，由于麦克风阵列是由多个声学传感器组成的，同一声音传输到不同声学传感器的到达时间存在时间差，因此根据预设的时延估计算法对同一声源位置的多个原始声音数据进行计算，得到每个原始声音到达麦克风阵列的估计时间差，有助于根据估计时间差来估计每个原始声音到达每个声学传感器的到达时间。
40.具体的，结合图4，步骤s201具体包括以下步骤：s301：将每路原始声音数据划分为若干个携带有声学特征的最小声学单元。
41.具体的，将声音中的每一个单词设置为声学特征，如“唤醒机顶盒”可以根据声音中的单词划分为“唤”、“醒”、“机”、“顶”、“盒”作为最小声学单元。
42.s302：将若干路原始声音数据的最小声学单元分别进行声学特征比对。
43.具体的，将麦克风阵列接收到的若干路原始声音数据的最小声学特征分别进行比对，若比对一致，则增加对应最小声学特征的权重，如“唤醒机顶盒”与“切换机顶盒”之间的声学特征比对结果为“机”、“顶”、“盒”一致，则分别增加对应的最小单元的权重。
44.s303：根据比对结果判断每路原始声音数据是否携带有相同声音内容。
45.具体的，根据比对结果判断每路原始声音数据中是否携带有相同声音内容，由于声音是以声波的方式向四周进行扩散传播的，因此同一声源发出的一句声音通过扩散传播并被麦克风阵列接收的过程中存在时间差，即麦克风阵列接收到的部分原始声音数据中携带着相同声音内容，因此，通过最小声学单元的比对来判断原始声音数据之间是否存在相同声音内容，若最小声学单元比对结果一致，则说明原始声音数据之间携带了相同的声音内容。
46.s304：若是，则选取最小声学单元匹配程度最高的待处理声音数据进行时延估计运算，得到每路原始声音数据到达麦克风不同阵列的估计时间差。
47.具体的，根据权重的不同选取最小声学单元匹配程度最高的待处理声音数据作为时延估计运算的参数，通过深度机器学习算法对不同权重的参数进行数据训练，并基于训练结果对声音内容相同的多个待处理声音数据进行非线性拟合，根据拟合结果得到目标声源位置发出原始声音到达麦克风阵列的最小时间差，并根据最小时间差于其它各路原始声音数据进行比对来获取每路原始声音数据到达麦克风阵列的估计时间差。
48.s305：若否，则剔除对应的原始声音数据。
49.具体的，若原始声音数据之间的声音内容不相同，则说明原始声音数据的声源不相同，则剔除声音内容不相同的原始声音数据，避免对含有机顶盒控制命令的原始声音数据的获取。
50.s202：根据估计时间差对每个原始声音数据到达麦克风每个阵列的距离进行计算。
51.具体的，由于麦克风阵列是由多个声学传感器组成的，同一声音传输到不同声学传感器的到达时间存在时间差，通过预计时间差与当前的声音传播速度进行计算，从而得到每个原始声音从声源位置到达麦克风阵列的距离，有助于根据距离的远近对每个声源位置进行排序。
52.s203：根据计算结果选取距离最小的原始声音数据的声源位置作为目标声源位置，以便根据目标声源位置获取对应的机顶盒控制命令。
53.具体的，由于声音是以声波的形式向四面八方传播的，在传播的途中可能会因为遇到物体如墙壁等而产生折射，从而导致麦克风阵列接收到的相同内容的声音数据存在时间差，因此选取距离最小的原始声音数据的声源位置作为目标声源位置，有助于根据目标声源位置来获取原始声音数据中携带的机顶盒控制命令，从而提高对机顶盒控制命令的识别准确率。
54.s102：对同一声源位置的每路原始声音数据与预先训练好的远场拾音模型分别进行拟合处理，得到携带有机顶盒控制命令的有效声音片段作为待处理声音数据。
55.具体的，结合图5，步骤s102具体包括以下步骤：s401：对每路原始声音数据进行转码解析，得到可被机顶盒识别的原始文本数据。
56.具体的，将每路原始声音数据划分为多个包含声学特征的数据帧，通过mel倒谱系
数与每个数据帧进行运算，得到包含声音信息的声学特征向量，将每个声学特征向量与预先训练好的声学模型进行解析，得到携带声音信息的目标音素，其中，声学模型由若干个原始声音数据的声学特征向量进行预先训练得到，将每个目标音素与预先存储的语言模型进行匹配，得到可被机顶盒识别的原始文本数据。需要说明的是，还可以通过线性预测倒谱系数算法对数据帧进行运算，可以根据实际需要进行设置，不局限于本实施例中的一种。
57.s402：将每个原始文本数据分别与预设的机顶盒控制命令进行关键词匹配。
58.具体的，将每个原始文本数据分别与预设的机顶盒控制命令进行关键词匹配，如机顶盒控制命令包括“唤醒机顶盒”和“切换机顶盒”，若原始文本数据中包含“唤醒机顶盒”或者“切换机顶盒”的关键字，则说明原始文本数据所对应的原始声音数据中携带有机顶盒控制命令，则剔除其它干扰声音数据，以便减少对机顶盒控制命令的识别干扰。
59.s403：根据匹配结果选取原始声音数据中与机顶盒控制命令关键词匹配程度最高的声音片段作为待处理声音数据。
60.具体的，当原始文本数据中含有“唤醒机顶盒”或者“切换机顶盒”关键词时，将对应的原始声音数据作为待处理声音数据，当原始文本数据中只有“机顶盒”与预设机顶盒控制命令相匹配时，说明原始声音数据中可能包含有机顶盒控制命令，因为在原始声音传播的过程中可能出现数据丢失或者麦克风识别不清的情况，因此将对应的原始声音数据作为备选的待处理声音数据，根据匹配程度的高低选取匹配程度最高的声音片段作为待处理声音数据。
61.s20：对待处理声音数据进行杂音清洗处理，得到目标声音数据，其中，目标声音数据包括控制麦克风切换数据传输协议的协议切换指令。
62.具体的，结合图6，步骤s20具体包括以下步骤：s501：将每个待处理声音数据划分为包含机顶盒关键词声学特征的最小发音单元。
63.具体的，例如，机顶盒关键词设置为“唤醒机顶盒”和“切换机顶盒”，则将每个待处理声音数据根据机顶盒关键词划分为包含“唤”、“醒”、“机”、“顶”、“盒”或者“切”、“换”、“机”、“顶”、“盒”中的一个关键词的最小发音单元，并将不包含机顶盒关键词的待处理声音数据剔除。
64.s502：将最小发音单元与预设的机顶盒控制命令关键词进行匹配，根据匹配结果判断待处理声音数据中是否含有机顶盒控制命令。
65.具体的，如，将每个待处理声音数据的若干个最小发音单元与预设的“唤醒机顶盒”和“切换机顶盒”命令进行匹配，当“唤醒机顶盒”或者“切换机顶盒”的关键词匹配一致时，即说明对应的待处理声音数据中包含机顶盒控制命令，当“唤醒机顶盒”或者“切换机顶盒”的关键词匹配不完全一致时，说明待处理声音数据中不包含机顶盒控制命令，或者待处理声音数据在传输过程中出现数据丢失，导致机顶盒控制命令不完整，需要重新发出机顶盒控制命令的语音。
66.s503：若否，则剔除不包含机顶盒控制命令的待处理声音数据。
67.具体的，当待处理声音数据的最小发音单元与“唤醒机顶盒”或者“切换机顶盒”的关键词匹配不完全一致时，说明待处理声音数据中不包含机顶盒控制命令，或者待处理声音数据在传输过程中出现数据丢失，导致机顶盒控制命令不完整，则剔除不包含机顶盒控
制命令的待处理声音数据，并提醒用户重新发出机顶盒控制命令的语音。
68.s504：若是，则将包含有机顶盒控制命令的待处理声音数据作为目标声音数据。
69.具体的，当“唤醒机顶盒”或者“切换机顶盒”的关键词匹配一致时，即说明对应的待处理声音数据中包含机顶盒控制命令，则将包含有机顶盒控制命令的待处理声音数据作为目标声音数据，以便于提高对目标声音数据中的机顶盒控制命令的识别准确性。
70.s30：当识别到协议切换指令时，控制麦克风切换为通过机顶盒低功耗协议传输数据，并识别目标声音数据中的机顶盒控制命令，机顶盒控制命令包括唤醒指令和控制指令。
71.具体的，当识别到对麦克风数据传输协议进行切换的协议切换指令时，控制麦克风切换为通过机顶盒低功耗协议传输数据，并切换后的机顶盒低功耗协议在麦克风与机顶盒之间进行数据传输，当麦克风处于机顶盒低功耗传输协议状态下，识别目标声音数据中携带的机顶盒控制命令，其中，机顶盒控制命令包括用于唤醒机顶盒进行工作的唤醒指令和用于控制机顶盒进行工作状态切换的控制指令。
72.s40：当识别到唤醒指令时，将唤醒指令通过机顶盒低功耗协议传输至机顶盒，以便控制机顶盒进入唤醒状态。
73.具体的，当识别到机顶盒的唤醒指令时，通过机顶盒低功耗协议进行麦克风与机顶盒之间的数据传输，符合机顶盒的低功耗需求，从而降低机顶盒的使用成本，将唤醒指令转换为符合机顶盒低功耗协议的数据格式，并通过机顶盒低功耗协议传输至机顶盒，以便机顶盒根据唤醒指令从休眠状态切换至唤醒状态，或者控制机顶盒从其它工作作态切换至等待下一控制指令的唤醒状态。
74.s50：当识别到控制指令时，将控制指令通过机顶盒低功耗协议传输至唤醒状态下的机顶盒，以便控制机顶盒切换工作状态。
75.具体的，当识别到机顶盒的控制指令时，将机顶盒的控制指令转换为符合机顶盒低功耗协议的数据格式，并通过机顶盒低功耗协议传输至唤醒状态下的机顶盒，即机顶盒处于唤醒状态下时才接收对工作状态进行切换的控制指令，避免接收到生活谈话中与控制指令相同关键词的错误信号，对机顶盒工作状态的错误切换，影响用户使用体验，机顶盒在唤醒状态下才响应对应的控制指令，从而根据控制指令切换机顶盒的工作状态，如控制机顶盒从a频道切换至b频道。
76.本实施例中，在声音嘈杂的环境中或者距离收音装置距离过远，导致麦克风阵列捕获到的声音数据不够清晰，从而导致对若干路原始声音数据中携带的机顶盒控制命令语音识别不清晰时，将携带有机顶盒控制命令的声音片段作为待处理声音数据，以便于剔除不含有机顶盒控制命令的声音片段，并通过高保真协议将待处理声音数据传输至麦克风，以便更好地对拾取到的原始声音数据进行处理，提高对机顶盒控制命令的识别准确率，再通过深度学习算法对待处理声音数据进行数据训练，并将不符合机顶盒控制命令的杂音剔除，从而保留携带机顶盒控制命令的声音数据作为目标声音数据，以便通过目标声音数据对机顶盒进行控制，具体的，根据唤醒指令控制机顶盒进入唤醒状态，并根据控制指令控制唤醒状态下的机顶盒切换工作状态，根据识别到的机顶盒控制命令来控制麦克风切换数据传输方式，并通过机顶盒低功耗协议将对应的机顶盒控制命令信号发送至机顶盒，从而降低信号传输的功耗，符合机顶盒低功耗的需求，通过机顶盒控制命令信号控制机顶盒切换至相应的工作状态，以及通过对原始声音数据的杂音清洗来提高对机顶盒控制命令的识别
准确率。
77.在一实施例中，如图7所示，基于机顶盒的远场拾音唤醒控制方法还包括以下步骤：s601：根据原始声音数据中携带的人员声纹数据与预设的机顶盒用户声纹数据进行声纹特征比对。
78.具体的，由于每个人的发音腔，如声带张力和声音频率都是不相同的，具有唯一性，因此通过聚类分析算法对人员声纹数据中的声波谱图与预存的机顶盒用户声波谱图进行比对分析，并根据分析结果找出与人员声波谱图最相似的机顶盒用户声波谱图，并将近似的人员声纹数据和最近似的机顶盒用户声波谱图数据作为参数，通过预先训练好的高斯混合模型进行匹配，其中，高斯混合模型是由若干机顶盒用户的声纹数据预先进行训练得到的，根据匹配结果判断当前用户是否为特定的机顶盒用户。
79.s602：根据比对结果判断当前用户是否为特定的机顶盒用户。
80.具体的，若声纹特征比对结果一致，则判断当前用户为特定的机顶盒用户，可以对机顶盒进行解锁，若声纹特征比对结果不一致，则判断当前用户为其它用户，则控制机顶盒进行锁定，防止其它用户对机顶盒展示内容的随意查看。
81.s603：若否，则通过机顶盒低功耗协议向机顶盒发送锁定信号，以便控制机顶盒切换至锁定状态，防止当前用户查看机顶盒的展示内容。
82.具体的，若声纹特征比对不一致，则说明当前用户不是特定的机顶盒用户，此时通过机顶盒低功耗协议向机顶盒发送锁定信号，机顶盒根据接收到到的锁定信号切换至锁定状态，防止当前用户查看机顶盒的展示内容，提高机顶盒的保密性。
83.s604：若是，则获取原始声音数据中的机顶盒控制命令，以便根据特定机顶盒用户的语音来对机顶盒进行解锁并展示对应的内容。
84.具体的，若声纹特征比对一致，说明当前用户为特定机顶盒用户，将机顶盒切换至解锁状态，并根据当前用户发出的原始声音数据中携带的机顶盒控制命令，进行相应的机顶盒工作状态的切换。
85.本实施例中，在通过语音来控制机顶盒进行工作的过程中，由于在一些重要场合，如一些机密的展会或者会议上，机顶盒展示的内容比较机密不便于任意人员都进行查看时，可以通过设置声纹来控制机顶盒只对特定用户进行解锁，若声纹数据与预设的机顶盒用户声纹数据不匹配，则向机顶盒发送锁定信号，从而控制机顶盒进行锁定，防止除特定用户之外的其它人员查看机顶盒的展示内容，提高机顶盒的保密性。
86.应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本技术实施例的实施过程构成任何限定。
87.在一实施例中，提供一种基于机顶盒的远场拾音唤醒控制系统，该基于机顶盒的远场拾音唤醒控制系统与上述实施例中基于机顶盒的远场拾音唤醒控制方法一一对应。如图8所示，该基于机顶盒的远场拾音唤醒控制系统包括数据获取模块、数据处理模块、数据唤醒模块和数据控制模块。各功能模块详细说明如下：数据获取模块，用于实时获取若干路原始声音数据中的有效声音片段作为待处理声音数据，并通过高保真协议传输至麦克风。
88.数据处理模块，用于对待处理声音数据进行杂音清洗处理，得到目标声音数据，其中，目标声音数据包括用于唤醒机顶盒的唤醒指令和用于切换机顶盒工作状态的控制指令。
89.数据唤醒模块，用于当识别到唤醒指令时，控制麦克风切换为通过机顶盒低功耗协议传输数据，并将唤醒指令通过机顶盒低功耗协议传输至机顶盒，以便控制机顶盒进入唤醒状态。
90.数据控制模块，用于当识别到控制指令时，将控制指令通过机顶盒低功耗协议传输至唤醒状态下的机顶盒，以便控制机顶盒切换工作状态。
91.本实施例中，在通过语音控制机顶盒进行工作的过程中，从麦克风阵列拾取到的若干路原始声音数据中，获取携带有机顶盒控制命令的有效声音片段作为待处理声音数据，有助于剔除其它干扰声音数据，将待处理声音数据通过高保真协议传输至麦克风，通过麦克风的高保真协议能够更好的保留待处理声音数据中携带的机顶盒控制命令信息，通过数据处理模块对待处理声音数据进行杂音清洗，有助于减少其它声音数据对识别机顶盒控制命令的干扰，从而得到携带有机顶盒控制命令的目标声音数据，并通过机顶盒低功耗协议将机顶盒控制指令传输至机顶盒，降低机顶盒运行成本，从而在符合机顶盒低功耗的需求下，提高对机顶盒控制命令的识别准确率。
92.关于基于机顶盒的远场拾音唤醒控制系统的具体限定可以参见上文中对于基于机顶盒的远场拾音唤醒控制方法的限定，在此不再赘述。上述基于机顶盒的远场拾音唤醒控制系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。
93.在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于机顶盒的远场拾音唤醒控制方法。
94.在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述基于机顶盒的远场拾音唤醒控制方法。
95.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器（rom）、可编程rom（prom）、电可编程rom（eprom）、电可擦除可编程rom（eeprom）或闪存。易失性存储器可包括随机存取存储器（ram）或者外部高速缓冲存储器。作为说明而非局限，ram以多种形式可得，诸如静态ram（sram）、动态ram（dram）、同步dram（sdram）、双数据率sdram（ddrsdram）、增强型sdram（esdram）、同步链路（synchlink） dram（sldram）、存储器总线（rambus）直接ram
（rdram）、直接存储器总线动态ram（drdram）、以及存储器总线动态ram（rdram）等。
96.所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。
97.以上所述实施例仅用以说明本技术的技术方案，而非对其限制；尽管参照前述实施例对本技术进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围，均应包含在本技术的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于大数据分析的媒体数据处理方法与流程

基于机顶盒的远场拾音唤醒控制方法、系统、设备及介质与流程

相关文献

最热文献