语音唤醒方法、装置、电子设备、存储介质及产品与流程

2022-06-22 18:58:21 来源：中国专利 TAG：

1.本发明涉及音频处理技术领域，特别是涉及一种语音唤醒方法、装置、电子设备、存储介质及产品。

背景技术：

2.人工智能(artificial intelligence，ai)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。随着人工智能技术的不断发展，人工智能唤醒的应用越来越广泛，越来越多的智能设备，例如智能音箱、智能电视等都配置了语音唤醒功能。
3.现有的语音唤醒方法为，智能设备持续接收用户发送的语音，对上述语音执行同一解码操作，并将语音每间隔预设时长分割为一个音频段，然后以每一个音频段为一个单元进行解码，得到每个音频段对应的文本信息，进而检测每个音频段对应的文本信息中是否存在唤醒词。
4.然而，上述对输入语音进行强行分段的方式可能导致设备中的解码模块接收到的音频段不是连续的语句，从而导致设备误唤醒或者设备未执行唤醒操作，这降低了智能设备执行唤醒操作的准确性。

技术实现要素：

5.本发明实施例的目的在于提供一种语音唤醒方法、装置、电子设备、存储介质及产品，解决执行唤醒操作的效率较低的技术问题。具体技术方案如下：
6.在本发明实施例的第一方面，首先提供了一种语音唤醒方法，包括：
7.当接收到目标语音时，每间隔预设时间将所述目标语音中的一个音频段输入至预设的声学模型，得到每个音频段对应的路径标识信息和路径置信度；所述路径标识信息用于表征对应的音频段在预设的字典图中的文本路径，所述路径置信度为对应的音频段的文本路径的概率值，所述目标语音包括至少一个音频段；
8.基于所述每个音频段对应的路径标识信息和路径置信度，确定所述目标语音对应的目标文本路径；
9.在所述字典图中对所述目标文本路径进行查询，得到所述目标文本路径对应的文本信息；
10.在所述文本信息存在预设的唤醒词的情况下，执行唤醒操作。
11.在本发明实施例的第二方面，还提供了一种语音唤醒装置，包括：
12.处理模块，用于当接收到目标语音时，每间隔预设时间将所述目标语音中的一个音频段输入至预设的声学模型，得到每个音频段对应的路径标识信息和路径置信度；所述路径标识信息用于表征对应的音频段在预设的字典图中的文本路径，所述路径置信度为对应的音频段的文本路径的概率值，所述目标语音包括至少一个音频段；
13.确定模块，用于基于所述每个音频段对应的路径标识信息和路径置信度，确定所
述目标语音对应的目标文本路径；
14.查询模块，用于在所述字典图中对所述目标文本路径进行查询，得到所述目标文本路径对应的文本信息；
15.执行模块，用于在所述文本信息存在预设的唤醒词的情况下，执行唤醒操作。
16.在本发明实施例的第三方面，还提供了一种电子设备，所述电子设备中存储有计算机程序，当其在计算机上运行时，使得计算机执行上述任一实施例所述的语音唤醒方法。
17.在本发明实施例的第四方面，还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述任一实施例所述的语音唤醒方法。
18.在本发明实施的第五方面，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述任一实施例所述的语音唤醒方法。
19.本发明实施例中，当接收到目标语音时，每间隔预设时间将目标语音中的一个音频段输入至预设的声学模型，得到每个音频段对应的路径标识信息和路径置信度，其中，路径标识信息用于表征对应的音频段在预设的字典图中的文本路径。，通过将目标语音中的每个音频段每间隔预设时间输入至声学模型进行解码操作，确保得到的每个文本路径对应的音频段是连续的语句，以此避免触发误唤醒操作或未执行唤醒操作，提高语音唤醒的效率。进一步的，根据每个音频段对应的路径标识信息和路径置信度，确定目标文本路径，在字典图中对目标文本路径进行查询，得到目标文本路径对应的文本信息，在文本信息存在预设的唤醒词的情况下，执行唤醒操作。由于上述目标文本路径是基于每个音频段对应的路径置信度确定的具备较高路径置信度的文本路径，因此可以提高执行唤醒操作的准确率。
附图说明
20.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
21.图1为本发明实施例中语音唤醒方法的流程示意图；
22.图2为本发明实施例中语音唤醒装置的结构示意图；
23.图3为本发明实施例中一种电子设备的结构示意图。
具体实施方式
24.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。
25.为便于理解整体技术方案，以下对本发明的相关技术内容进行说明。
26.在相关技术中，语音唤醒设备包括声学模型和解码器，将用户输入的语音持续的输入至声学模型中，使用该声学模型对输入语音进行处理，得到输入语音对应的路径标识信息，并对输入语音进行分段。随后，将上述路径标识信息输入至解码器中进行解码，使用解码器在预设的字典图中对该路径标识信息进行查询，得到每个语音段对应的文本信息，进而在文本信息存在唤醒词的情况下，执行唤醒操作。
27.然而，在上述过程中，只使用声学模型对输入语音执行一次处理，且将语音强行分段，这会导致分段得到的音频段对应的文本信息可能不是连续的语句，从而导致设备误唤
醒或者设备未执行唤醒操作，这降低了智能设备执行唤醒操作的效率。
28.为了解决上述可能存在的技术问题，本发明实施例提供了一种语音唤醒方法，将输入语音划分为至少两个音频段，并每间隔预设时间将每个音频段按照输入顺序输入至声学模型中，得到每个音频段对应的路径标识信息，以此确保每个音频段对应的文本信息是连续的语句，避免触发误唤醒操作或未执行唤醒操作，提高语音唤醒的效率。
29.请参阅图1，图1为本发明实施例中语音唤醒方法的流程图。本发明实施例提供的语音唤醒方法包括：
30.s101，当接收到目标语音时，每间隔预设时间将所述目标语音中的一个音频段输入至预设的声学模型，得到每个音频段对应的路径标识信息和路径置信度。
31.本发明实施例提供的语音唤醒方法可以应用于语音唤醒设备，上述目标语音可以是用户输入的语音，或者语音唤醒设备从外部下载的语音。
32.本步骤中，在接收到目标语音的情况下，每间隔预设时间将所述目标语音中的一个音频段输入至预设的声学模型，得到每个音频段对应的路径标识信息和路径置信度。其中，该路径标识信息与音频段一一对应，且路径置信度与音频段一一对应。可选地，可以按照目标语音的输入顺序，将目标语音的每个音频段输入至声学模型。
33.上述声学模型可以是马尔科夫模型、基于神经网络的模型或者其他类型的模型，在此不做具体限定。
34.应理解，上述路径标识信息包括多个转换id，上述转换id表征音频段中的每个音素在预设的字典图中节点；上述路径标识信息用于表征对应的音频段在预设的字典图中的文本路径。
35.应理解，字典图可以是有穷状态转换(finite state transducer)图，上述fst图是一个有向无环图。字典图包括多个节点，以及每个节点对应的文字，可选地实施方式为，确定字典图中与多个转换id对应的节点，使用这些节点组成一个文本路径，基于每个节点对应的文字，确定该文本路径对应的文本信息，将该文本信息确定为该音频端对应的文本信息。
36.应理解，上述路径置信度为路径标识信息中每个转换id对应的选中概率值的和值，上述路径置信度为对应的音频段的文本路径的概率值。
37.为便于理解，请参阅以下示例：
38.假设一音频段对应的路径标识信息包括4个转换id，且这4个转换id分别表征字典图中的节点1、节点2、节点3和节点4，则可以确定路径标识信息表征的文本路径为“节点1至节点2至节点3至节点4”。若字典图中节点1对应的选中概率值为0.5，节点2对应的选中概率值为0.3，节点2对应的选中概率值为0.2，节点2对应的选中概率值为0.4，则可以确定路径置信度为0.5、0.3、0.2和0.4的和值，即1.4。
39.s102，基于所述每个音频段对应的路径标识信息和路径置信度，确定所述目标语音对应的目标文本路径。
40.本步骤中，在得到每个音频段对应的路径标识信息和路径置信度后，可以根据每个音频段对应的路径标识信息和路径置信度，从多个路径标识信息表征的文本路径中选择出最优的文本路径，将该最优的文本路径确定为目标文本路径。
41.具体的如何确定目标语音对应的目标文本路径的技术方案，请参阅后续实施例。
42.s103，在字典图中对所述目标文本路径进行查询，得到所述目标文本路径对应的文本信息。
43.如上所述，文本路径是由多个转换id构成的在字典图上的路径。本步骤中，在确定目标文本路径之后，在字典图中查询目标文本路径包括的转换id，得到该目标文本路径对应的节点，将每个节点表征的文字组成文本信息，并将该文本信息确定为目标文本路径对应的文本信息。
44.s104，在所述文本信息存在预设的唤醒词的情况下，执行唤醒操作。
45.本步骤中，预先设置有唤醒词。在文本信息包括预设的唤醒词的情况下，执行唤醒操作。
46.例如，唤醒词为“小智”，若目标文本路径对应的文本信息为“小智帮我打开电视”，由于文本信息中存在唤醒词“小智”，因此语音唤醒设备执行唤醒操作，且上述唤醒操作可以是开机操作或其他操作。
47.应理解，在文本信息不存在预设的唤醒词的情况下，不执行唤醒操作。
48.本发明实施例中，当接收到目标语音时，每间隔预设时间将目标语音中的一个音频段输入至预设的声学模型，得到每个音频段对应的路径标识信息和路径置信度，其中，路径标识信息用于表征对应的音频段在预设的字典图中的文本路径。通过将目标语音中的每个音频段每间隔预设时间输入至声学模型进行解码操作，确保得到的每个文本路径对应的音频段是连续的语句，以此避免触发误唤醒操作或未执行唤醒操作，提高语音唤醒的效率。。进一步的，根据每个音频段对应的路径标识信息和路径置信度，确定目标文本路径，在字典图中对目标文本路径进行查询，得到目标文本路径对应的文本信息，在文本信息存在预设的唤醒词的情况下，执行唤醒操作。由于上述目标文本路径是基于每个音频段对应的路径置信度确定的具备较高路径置信度的文本路径，因此可以提高执行唤醒操作的准确率。
49.以下，具体说明如何确定目标语音对应的目标文本路径：
50.可选地，所述基于所述每个音频段对应的路径标识信息和路径置信度，确定所述目标语音对应的目标文本路径包括：
51.在只存在1个最大路径置信度的情况下，将所述最大路径置信度对应的音频段的文本路径确定为所述目标文本路径。
52.如上所述，路径置信度为对应的文本路径中每个节点的选中概率值的和值。本实施例中，在得到每个音频段对应的路径置信度之后，确定最大路径置信度，应理解，路径置信度对应的数值越高，说明该路径置信度对应的文本路径与目标语音越匹配，越能反映目标语音对应的文本信息。
53.进一步的，若只存在1个最大路径置信度，则将最大路径置信度对应的文本路径确定为目标文本路径。
54.为便于理解，请参阅以下示例：
55.目标语音被划分为4个音频段，第1个音频段对应的路径置信度为4，对应的文本路径为“节点1至节点2至节点3至节点4”；第2个音频段对应的路径置信度为2，对应的文本路径为“节点1至节点3至节点5至节点6”；第3个音频段对应的路径置信度为1.8，对应的文本路径为“节点1至节点4至节点5至节点7”；第4个音频段对应的路径置信度为2.6，对应的文
本路径为“节点1至节点5至节点6至节点8”，则确定最大路径置信度为4，将第1个音频段对应的文本路径确定“节点1至节点2至节点3至节点4”确定为目标文本路径。
56.本实施例中，在只存在1个最大路径置信度的情况下，将该最大路径置信度对应的音频段的文本路径，确定为目标文本路径，对除目标文本路径之外的文本路径进行剪枝，进而通过目标文本路径得到与目标语音最为匹配的文本信息，以此提高执行唤醒操作的准确率。
57.在其他实施例中，可以基于每个文本路径对应的路径置信度和包括的文本节点的数量，进行剪枝操作。示例性的，对路径置信度小于第一预设阈值，且文本节点的数量大于第二预设阈值的文本路径进行剪枝操作。
58.可选地，所述基于所述每个音频段对应的路径标识信息和路径置信度，确定所述目标语音对应的目标文本路径包括：
59.在存在至少2个最大路径置信度的情况下，将每个最大路径置信度对应的音频段，确定为候选音频段；
60.获取每个候选音频段对应的文本路径包括的文本节点的数量；
61.将文本节点数量最少的文本路径，确定为所述目标文本路径。
62.本实施例中，若存在多个最大路径置信度，则将每个路径置信度对应的音频段，确定为候选音频段。进一步的，获取每个候选音频段对应的文本路径包括的文本节点的数量，将文本节点数量最少的文本路径，确定为目标文本路径。
63.应理解，若2个文本路径对应的路径置信度相同，但一个文本路径包含的文本节点数量多于另一个文本路径包含的文本节点数量，表示该文本路径中每个节点对应的平均选中概率值较低，该文本路径表征的文本信息不是最与目标语音匹配的文本信息。为便于理解，请参阅以下示例：
64.目标语音存在2个最大路径置信度，其中，一个最大路径置信度对应的第一文本路径为“节点1至节点2至节点3至节点4”，另一个最大路径置信度对应的第二文本路径为“节点1至节点3至节点4至节点5至节点7”，第一文本路径包括的节点数量为4，第二文本路径包括的节点数量为5，则将第一文本路径确定为目标文本路径。本实施例中，在存在多个最大路径置信度的情况下，将包括文本节点数量最小的文本路径确定为目标文本路径，对除目标文本路径之外的文本路径进行剪枝，进而通过目标文本路径得到与目标语音最为匹配的文本信息，以此提高执行唤醒操作的准确率。
65.可选地，所述基于所述每个音频段对应的路径标识信息和路径置信度，确定所述目标语音对应的目标文本路径包括：
66.对音频段集合中的各个目标音频段进行路径置信度补偿，得到每个目标音频段补偿后的路径置信度；
67.将最大路径置信度对应的音频段的文本路径，确定为所述目标文本路径。
68.上述目标音频段对应的文本路径包括的文本节点数量大于或小于预设节点数量阈值，且目标音频段为音频段集合中的音频段，可选地，上述预设节点数量阈值可以是多个音频段对应的文本路径中包括的最大节点数量，也可以是预先设置的节点数量阈值。
69.本实施例中对每个目标音频段进行路径置信度补偿，得到每个目标音频段补偿后的路径置信度，具体的对目标音频段进行路径置信度进行补偿的技术方案，请参阅后续实
施例。
70.在对目标音频段进行路径置信度补偿后，将最大路径置信度对应的文本路径确定为目标文本路径。
71.在一可选地实施例中，若在对目标音频段进行路径置信度补偿后，存在多个最大路径置信度，则可以将最大路径置信度对应的文本路径中，包括节点数量最小的文本路径，确定为目标文本路径。
72.可选地，所述对音频段集合中的各个目标音频段进行路径置信度补偿，得到每个目标音频段补偿后的路径置信度包括：
73.对于任意一个第一目标音频段，将所述第一目标音频段的路径置信度加上第一置信度，得到所述第一目标音频段补偿后的路径置信度；
74.对于任意一个第二目标音频段，将所述第二目标音频段的路径置信度减去第二置信度，得到所述第二目标音频段补偿后的路径置信度。
75.其中，音频段集合包括第一目标音频段和第二目标音频段，第一目标音频段包括的文本节点数量小于预设节点数量阈值，第二目标音频段包括的文本节点数量大于预设节点数量阈值。
76.其中，第一置信度与第一差值相关联，第一差值为所述预设节点数量阈值与第一目标音频段包括的文本节点数量之间的差值；第二置信度与第二差值相关联，第二差值为第一目标音频段包括的文本节点数量与预设节点数量阈值之间的差值。
77.为便于理解，请参阅以下示例：
78.音频段集合包括4个音频段，其中，第1个音频段对应的路径置信度为4，对应的节点数量为4；第2个音频段对应的路径置信度为2，对应的节点数量为3；第3个音频段对应的路径置信度为5，对应的节点数量为7；第4个音频段对应的路径置信度为1，对应的节点数量为2。
79.设置上述预设节点数量阈值为5，并设置1个节点对应的补偿路径置信度为0.5。则第1个音频段、第2个音频段和第4个音频段为第一目标音频段，第3个音频段为第二目标音频段。
80.补偿后的第1个音频段对应的路径置信度为4.5，补偿后的第2个音频段对应的路径置信度为3，补偿后的第3个音频段对应的路径置信度为4，补偿后的第4个音频段对应的路径置信度为2.5。
81.由于第1个音频段对应的路径置信度为最大路径置信度，因此将第1个音频段对应的文本路径，确定为目标文本路径。
82.本实施例中，对包括节点数量不为预设节点数量阈值的目标音频段进行路径置信度补偿，并比较补偿后的各音频段对应的路径置信度，将最大路径置信度对应的文本路径确定为目标文本路径，对除目标文本路径之外的文本路径进行剪枝，进而通过目标文本路径得到与目标语音最为匹配的文本信息，以此提高执行唤醒操作的准确率。
83.可选地，所述将所述目标语音对应的至少两个音频段按照预设顺序输入至预设的声学模型包括：
84.使用预设的滑窗对所述目标语音进行分段处理，得到至少两个音频段；
85.每间隔预设时长，按照预设顺序，将一个所述音频段输入至预设的声学模型。
86.本实施例中，在接收到目标语音之后，使用预设的滑窗对所述目标语音进行分段处理，将目标语音划分为至少两个音频段，其中，每个音频段对应的时长相同。应理解，可以将一个音频段视为一帧语音信号，即在接收到目标语音的情况下，将目标语音划分为至少两帧语音信号。
87.每间隔预设时长，按照预设顺序，将一个音频段输入至预设的声学模型。可选地，可以设置每个音频段对应的时长为10毫秒，在一可选地应用场景中，语音唤醒设备每间隔10毫秒将目标语音输入至声学模型。可选地，上述预设顺序为目标语音的输入顺序。
88.如图2所示，本发明实施例还提供了一种语音唤醒装置200，所述语音唤醒装置200包括：
89.处理模块201，用于当接收到目标语音时，每间隔预设时间将所述目标语音中的一个音频段输入至预设的声学模型，得到每个音频段对应的路径标识信息和路径置信度；
90.确定模块202，用于基于所述每个音频段对应的路径标识信息和路径置信度，确定所述目标语音对应的目标文本路径；
91.查询模块203，用于在所述字典图中对所述目标文本路径进行查询，得到所述目标文本路径对应的文本信息；
92.执行模块204，用于在所述文本信息存在预设的唤醒词的情况下，执行唤醒操作。
93.可选地，所述确定模块202，具体用于：
94.在只存在1个最大路径置信度的情况下，将所述最大路径置信度对应的音频段的文本路径确定为所述目标文本路径。
95.可选地，所述确定模块202，还具体用于：
96.在存在至少2个最大路径置信度的情况下，将每个最大路径置信度对应的音频段，确定为候选音频段；
97.获取每个候选音频段对应的文本路径包括的文本节点的数量；
98.将文本节点数量最少的文本路径，确定为所述目标文本路径。
99.可选地，所述确定模块202，还具体用于：
100.对音频段集合中的各个目标音频段进行路径置信度补偿，得到每个目标音频段补偿后的路径置信度；所述目标音频段对应的文本路径包括的文本节点数量大于或小于预设节点数量阈值；
101.将最大路径置信度对应的音频段的文本路径，确定为所述目标文本路径。
102.可选地，所述确定模块202，还具体用于：
103.对于任意一个第一目标音频段，将所述第一目标音频段的路径置信度加上第一置信度，得到所述第一目标音频段补偿后的路径置信度；所述第一置信度与第一差值相关联，所述第一差值为所述预设节点数量阈值与所述第一目标音频段包括的文本节点数量之间的差值；
104.对于任意一个第二目标音频段，将所述第二目标音频段的路径置信度减去第二置信度，得到所述第二目标音频段补偿后的路径置信度；所述第二置信度与第二差值相关联，所述第二差值为所述第一目标音频段包括的文本节点数量与所述预设节点数量阈值之间的差值。
105.可选地，所述处理模块201，具体用于：
106.使用预设的滑窗对所述目标语音进行分段处理，得到至少两个音频段；
107.每间隔预设时长，按照预设顺序，将一个所述音频段输入至预设的声学模型。
108.本发明实施例中，当接收到目标语音时，每间隔预设时间将目标语音中的一个音频段输入至预设的声学模型，得到每个音频段对应的路径标识信息和路径置信度，其中，路径标识信息用于表征对应的音频段在预设的字典图中的文本路径。，通过将目标语音中的每个音频段每间隔预设时间输入至声学模型进行解码操作，确保得到的每个文本路径对应的音频段是连续的语句，以此避免触发误唤醒操作或未执行唤醒操作，提高语音唤醒的效率。进一步的，根据每个音频段对应的路径标识信息和路径置信度，确定目标文本路径，在字典图中对目标文本路径进行查询，得到目标文本路径对应的文本信息，在文本信息存在预设的唤醒词的情况下，执行唤醒操作。由于上述目标文本路径是基于每个音频段对应的路径置信度确定的具备较高路径置信度的文本路径，因此可以提高执行唤醒操作的准确率。
109.本发明实施例还提供了一种电子设备，如图3所示，包括处理器301、通信接口302、存储器303和通信总线304，其中，处理器301，通信接口302，存储器303通过通信总线304完成相互间的通信。
110.其中，存储器303，用于存放计算机程序；
111.处理器301，用于执行存储器303上所存放的程序时，所述计算机程序被所述处理器301执行时，用于当接收到目标语音时，每间隔预设时间将所述目标语音中的一个音频段输入至预设的声学模型，得到每个音频段对应的路径标识信息和路径置信度；
112.基于所述每个音频段对应的路径标识信息和路径置信度，确定所述目标语音对应的目标文本路径；
113.在所述字典图中对所述目标文本路径进行查询，得到所述目标文本路径对应的文本信息；
114.在所述文本信息存在预设的唤醒词的情况下，执行唤醒操作。
115.所述计算机程序被所述处理器301执行时，还用于在只存在1个最大路径置信度的情况下，将所述最大路径置信度对应的文本路径，确定为所述目标文本路径。
116.所述计算机程序被所述处理器301执行时，还用于在存在至少2个最大路径置信度的情况下，将每个最大路径置信度对应的音频段，确定为候选音频段；
117.获取每个候选音频段对应的文本路径包括的文本节点的数量；
118.将文本节点数量最少的文本路径，确定为所述目标文本路径。
119.所述计算机程序被所述处理器301执行时，还用于对音频段集合中的各个目标音频段进行路径置信度补偿，得到每个目标音频段补偿后的路径置信度；
120.将最大路径置信度对应的音频段的文本路径，确定为所述目标文本路径。
121.所述计算机程序被所述处理器301执行时，还用于对于任意一个第一目标音频段，将所述第一目标音频段的路径置信度加上第一置信度，得到所述第一目标音频段补偿后的路径置信度；
122.对于任意一个第二目标音频段，将所述第二目标音频段的路径置信度减去第二置信度，得到所述第二目标音频段补偿后的路径置信度。
123.所述计算机程序被所述处理器301执行时，还用于使用预设的滑窗对所述目标语
音进行分段处理，得到至少两个音频段；
124.每间隔预设时长，按照预设顺序，将一个所述音频段输入至预设的声学模型。
125.本发明实施例中，当接收到目标语音时，每间隔预设时间将目标语音中的一个音频段输入至预设的声学模型，得到每个音频段对应的路径标识信息和路径置信度，其中，路径标识信息用于表征对应的音频段在预设的字典图中的文本路径。，通过将目标语音中的每个音频段每间隔预设时间输入至声学模型进行解码操作，确保得到的每个文本路径对应的音频段是连续的语句，以此避免触发误唤醒操作或未执行唤醒操作，提高语音唤醒的效率。进一步的，根据每个音频段对应的路径标识信息和路径置信度，确定目标文本路径，在字典图中对目标文本路径进行查询，得到目标文本路径对应的文本信息，在文本信息存在预设的唤醒词的情况下，执行唤醒操作。由于上述目标文本路径是基于每个音频段对应的路径置信度确定的具备较高路径置信度的文本路径，因此可以提高执行唤醒操作的准确率。
126.上述电子设备提到的通信总线可以是外设部件互连标准(peripheral component interconnect，简称pci)总线或扩展工业标准结构(extended industry standard architecture，简称eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。
127.通信接口用于上述终端与其他设备之间的通信。
128.存储器可以包括随机存取存储器(random access memory，简称ram)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。
129.上述的处理器可以是通用处理器，包括中央处理器(central processing unit，简称cpu)、网络处理器(network processor，简称np)等；还可以是数字信号处理器(digital signal processing，简称dsp)、专用集成电路(application specific integrated circuit，简称asic)、现场可编程门阵列(field－programmable gate array，简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
130.在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述实施例中任一实施例所述的语音唤醒方法。
131.在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一实施例所述的语音唤醒方法。
132.在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者
是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，dvd)、或者半导体介质(例如固态硬盘solid state disk(ssd))等。
133.需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
134.本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
135.以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于人工智能的自然语言处理方法及系统与流程

语音唤醒方法、装置、电子设备、存储介质及产品与流程

相关文献

最热文献