语音处理方法、装置、计算机可读存储介质及计算机设备与流程

2021-09-15 01:24:00 来源：中国专利 TAG：语音计算机装置可读方法

1.本发明涉及语音处理技术领域，具体涉及一种语音处理方法、装置、计算机可读存储介质及计算机设备。

背景技术：

2.近年来，随着互联网技术以及物联网技术的不断发展，兴起了一股智能家居的发展热潮，智能家居可以极大地提升家居生活的安全性、便利性以及舒适性。
3.在智能家居中，语音识别技术的使用也非常广泛，语音识别技术可以将数字语音转换为计算机可以理解的文字，使得智能家居的控制模块可以像人一样“听懂”控制命令。从而可以实现对智能家居的无接触式控制，进一步提升智能家居控制的便利性。
4.然而，目前对智能家居进行语音控制的过程是采用对话的方式进行语音控制，其语音处理的效率较低，影响用户的使用体验。

技术实现要素：

5.本技术实施例提供一种语音处理方法、装置、计算机可读存储介质及计算机设备，该方法可以通过包含唤醒词和命令词的语音同时唤醒智能家居控制模块并实现对智能家居系统的控制，提升了语音处理的效率，进而提升了智能家居系统的控制效率。
6.本技术第一方面提供一种语音处理方法，包括：
7.获取语音信息；
8.对所述语音信息进行语音识别，得到识别结果；
9.当所述识别结果中存在与预设唤醒词匹配的词条时，进入唤醒状态；
10.在所述唤醒状态下提取所述识别结果中的预设命令词；
11.根据所述预设命令词生成控制指令，并根据所述控制指令对智能家居系统进行控制。
12.相应的，本技术第二方面提供一种语音处理装置，装置包括：
13.获取单元，用于获取语音信息；
14.识别单元，用于对所述语音信息进行语音识别，得到识别结果；
15.唤醒单元，用于当所述识别结果中存在与预设唤醒词匹配的词条时，进入唤醒状态；
16.提取单元，用于在所述唤醒状态下提取所述识别结果中的预设命令词；
17.控制单元，用于根据所述预设命令词生成控制指令，并根据所述控制指令对智能家居系统进行控制。
18.在一些实施例中，所述唤醒单元，包括：
19.切分子单元，用于将所述识别结果切分为多个词条；
20.唤醒子单元，用于当所述多个词条中存在与预设唤醒词匹配的词条时，进入唤醒状态。
21.在一些实施例中，所述切分子单元，包括：
22.获取模块，用于获取预设唤醒词的词条长度；
23.第一切分模块，用于按照所述词条长度对所述识别结果进行切分，得到多个词条。
24.在一些实施例中，所述唤醒单元，包括：
25.获取子单元，用于当所述识别结果中存在与预设唤醒词匹配的词条时，获取当前运行状态；
26.切换子单元，用于当所述当前运行状态为待机状态时，将运行状态切换为唤醒状态。
27.在一些实施例中，所述装置还包括：
28.切换单元，用于当在预设时间段内未接收到与预设命令词匹配的识别结果时，将运行状态切换为待机状态。
29.在一些实施例中，所述提取单元，包括：
30.确定子单元，用于当检测到所述识别结果中存在与预设命令词集合中的命令词相匹配的目标词条时，确定所述目标词条为预设命令词；
31.提取子单元，用于提取所述预设命令词。
32.在一些实施例中，所述确定子单元，包括：
33.第二切分模块，用于将所述识别结果切分为多个词条；
34.匹配模块，用于将所述多个词条分别与预设命令词集合中的命令词进行匹配；
35.确定模块，用于当存在与所述预设命令词集合中的命令词相匹配的目标词条时，确定所述目标词条为预设命令词。
36.本技术第三方面还提供一种计算机可读存储介质，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本技术第一方面所提供的语音处理方法的步骤。
37.本技术第四方面提供一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可以在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现本技术第一方面所提供的语音处理方法的步骤。
38.本技术第五方面提供一种计算机程序产品或计算机程序，所述计算机程序产品或计算机程序包括计算机指令，所述计算机指令存储在存储介质中。计算机设备的处理器从存储介质读取所述计算机指令，处理器执行所述计算机指令，使得所述计算机设备执行第一方面所提供的语音处理方法的步骤。
39.本技术实施例提供的语音处理方法，通过获取语音信息；对语音信息进行语音识别，得到识别结果；当识别结果中存在与预设唤醒词匹配的词条时，进入唤醒状态；在唤醒状态下提取识别结果中的预设命令词；根据预设命令词生成控制指令，并根据控制指令对智能家居系统进行控制。以此，可以通过一次性说出唤醒词和命令词，同时实现对智能家居系统的控制装置的唤醒以及对智能家居系统的控制，提高了语音处理的效率，进而提升了智能家居系统的控制效率。
附图说明
40.为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使
用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
41.图1是本技术提供的语音处理的一个场景示意图；
42.图2是本技术提供的语音处理方法的流程示意图；
43.图3是本技术提供的语音处理装置的结构示意图；
44.图4是本技术提供的终端的结构示意图。
具体实施方式
45.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
46.本发明实施例提供一种语音处理方法、装置、计算机可读存储介质及计算机设备。其中，该语音处理方法可以使用于语音处理装置中。该语音处理装置可以集成在计算机设备中，该计算机设备可以是终端也可以是服务器。其中，终端可以为手机、平板电脑、笔记本电脑、智能电视、穿戴式智能设备、个人计算机(pc，personal computer)等设备。服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、网络加速服务 (content delivery network，cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
47.请参阅图1，为本技术提供的语音处理的场景示意图；如图所示，计算机设备获取语音信息，然后对获取到的语音信息进行语音识别，得到识别结果，具体地，识别结果可以以文字形式进行表示。然后，检测识别结果中是否存在与预设唤醒词匹配的词条，当识别结果中存在与预设唤醒词匹配的词条时，智能家居系统的控制装置进入唤醒状态。然后，在唤醒状态中，继续从识别结果中提取出预设命令词，再根据该预设命令词生成控制指令，最后根据该控制指令对智能家居系统进行控制。
48.需要说明的是，图1所示的语音处理的场景示意图仅仅是一个示例，本技术实施例描述的语音处理场景是为了更加清楚地说明本技术的技术方案，并不构成对于本技术提供的技术方案的限定。本领域普通技术人员可知，随着语音处理的演变和新业务场景的出现，本技术提供的技术方案对于类似的技术问题，同样适用。
49.基于上述实施场景以下分别进行详细说明。
50.本技术实施例将从语音处理装置的角度进行描述，该语音处理装置可以集成在计算机设备中。其中，计算机设备可以是终端或服务器，如图2 所示，为本技术提供的语音处理方法的流程示意图，该方法包括：
51.步骤101，获取语音信息。
52.其中，本技术提供的语音处理方法可以应用于搭载语音识别以及语音控制模块的人工智能系统中。该人工智能系统包括但不限于蓝牙音箱、采用语音进行控制的智能家居系统。在本技术实施例中，以采用语音进行控制的智能家居系统为例进行详细介绍。
53.其中，在上述智能家居系统中，会为智能家居系统配置控制装置，通过该控制装置可以对智能家居系统中的任意电气设备进行控制。例如，可以通过该控制装置控制灯的开关、控制电动窗帘的开关、控制电视机的开关、调节冰箱或者空调的温度等。该控制装置可以是终端的形式独立存在，例如智能手机；也可以集成在智能家居中的某个或某一些电气设备例如智能电视或智能音箱中。当该控制装置为智能手机时，用户可以通过智能手机中展示的控制页面实现对智能家居系统的控制，也可以对向智能手机中输入语音信息实现对智能家居系统的控制。当控制装置集成在智能家居中的某个电气设备中时，也可以向其发送语音信息以实现对智能家居系统的控制。
54.目前，通过向控制装置发送语音信息以实现对智能家居系统的控制时，一般需要先向控制装置发送包含唤醒词的语音信息以唤醒智能家居系统的控制装置。待智能家居系统的控制装置被唤醒并反馈已经进入唤醒状态的语音信息后，用户再次向控制装置发送包含命令词的语音信息，智能家居系统的控制装置在接收到包含命令词的语音信息后，对其中的命令词进行提取并根据该命令词对智能家居系统进行控制。
55.具体地，在实际使用时，为提升用户的使用体验，智能家居系统的控制装置一般以一个虚拟人物的身份存在，例如“小白”。当用户需要通过小白对智能家居系统进行控制时，一般会先说“小白，你好”，或者直接说“小白”，其中“小白”便为该智能家居系统的控制装置对应的唤醒词。当小白接收到这段语音信息后，便对该语音信息进行语音识别，当识别到语音信息中包含“小白”这个唤醒词时，便将自身的运行模式调整为唤醒模式并反馈语音信息，例如“哎”或者“你好”。然后，继续接收用户的语音信息，例如“打开电视”。小白接收到该语音信息后，对该语音信息进行识别，并从识别结果中提取出“打开电视”这个命令词。然后，小白便根据该命令词对电视机的状态进行控制，从而实现电视机的开启。在一些情况下，小白在控制开启电视机前还可以反馈语音信息，例如“好的”，或者“好的，这就为您打开电视机”等。
56.在上述情况中，都需要先向智能家居系统的控制装置输入唤醒语音信息以唤醒智能家居系统的控制装置，然后在智能家居系统的控制装置给出反馈信息后再向智能家居的控制模块发送命令语音信息以通过智能家居系统的控制装置对智能家居系统进行语音控制，该过程效率较低。
57.为解决上述语音控制智能家居系统效率低的问题，本技术提供一种语音处理方法。下面对本技术提供的语音处理方法进行详细介绍。
58.首先，当智能家居系统的控制装置未获取到语音信息时，智能家居系统的控制装置保持待机状态。在待机状态中，智能家居系统的控制装置并非处于休眠状态，而是处于一个低能耗的状态，在低能耗状态下，可以持续以低功耗方式进行语音信息的获取，以便能够及时检测到语音信息。当检测到获取到语音信息时，便开始转变为持续性对语音信息进行获取，以获取到完整的语音信息。
59.步骤102，对语音信息进行语音识别，得到识别结果。
60.其中，本技术中的智能家居系统的控制装置至少包括如下几个模块：语音信息获取模块，该模块可以获取到用户的语音信息，并将语音信息转化为电信号，输出至语音识别处理模块，作为语音识别处理模块的输入；语音识别处理模块，用于对输入的信号，即由语音信息转化得到的电信号进行识别，以及根据识别得到的识别结果进行相应的处理；控制
模块，用于对智能家居系统中的电气设备进行控制。
61.在语音信息获取模块获取到语音信息后，将该语音信息转化为相应的电信号并输出至语音识别处理模块。语音识别处理模块在接收到语音信息获取模块发送的电信号后，对该电信号进行识别，得到识别结果。
62.步骤103，当识别结果中存在与预设唤醒词匹配的词条时，进入唤醒状态。
63.其中，当对获取到的语音信息进行语音识别得到识别结果后。检测识别结果中是否存在唤醒词，例如当唤醒词为“小白”时，检测该识别结果中是否存在“小白”这样的词条。当识别结果中存在“小白”词条时，将智能家居系统的控制装置的运行状态切换为唤醒状态。在唤醒状态下，智能家居系统的控制装置时刻对用户的语音信息进行获取并对获取到的语音信息进行识别。若识别结果中不存在“小白”这个唤醒词条，则智能家居系统的控制装置仍保持待机状态，并持续以低功耗方式进行语音信息的获取，以避免能源的浪费。在本技术中，与相关技术不同的是，在检测到识别结果中存在预设唤醒词并切换为唤醒状态后，智能家居系统的控制装置并不反馈语音信息，而是继续对识别结果进行进一步的命令词检测。
64.在一些实施例中，在唤醒状态下，为了提升对获取到的语音信息的识别结果的准确性，可以在获取到语音信息后，对获取到的语音信息进行增强处理。然后，再对增强处理后的语音信息进行识别，得到更为准确的识别结果。
65.在一些实施例中，所述当识别结果中存在与预设唤醒词匹配的词条时，进入唤醒状态，包括：
66.1、将识别结果切分为多个词条；
67.2、当多个词条中存在与预设唤醒词匹配的词条时，进入唤醒状态。
68.其中，在本技术实施例中，检测识别结果中是否存在预设唤醒词，可以将识别结果进行切分，得到多个词条。然后再将切分得到的词条逐一与预设唤醒词进行匹配，当多个词条中存在与预设唤醒词匹配的词条时，控制智能家居系统的控制装置进入唤醒状态。
69.其中，将切分得到的词条逐一与预设唤醒词进行匹配，可以是分别计算切分得到的每一词条与预设唤醒词之间的文本相似度，当存在与预设唤醒词之间的文本相似度达到预设阈值的词条时，控制智能家居系统的控制装置进入唤醒状态。
70.在一些实施例中，将识别结果切分为多个词条，包括：
71.1.1、获取预设唤醒词的词条长度；
72.1.2、按照词条长度对识别结果进行切分，得到多个词条。
73.其中，词条长度可以为汉字的字数，也可以为其他语种的文字的数量。例如当唤醒词为“小白”时，那么可以获取到预设唤醒词的词条长度为2 个汉字。获取到预设唤醒词的词条长度后，按照该词条长度对识别结果进行切分，得到多个词条。其中，可以理解的是，切分得到的多个词条的词条长度都是与预设唤醒词的词条长度相同。进一步地，按照词条长度对识别结果进行切分，并非机械地将识别结果按照词条长度划分成多个词条。具体地，例如，当识别结果为“小白冷光色”时，若此时的词条长度为2 个汉字，那么切分得到的词条为“小白”、“白冷”、“冷光”以及“光色”这些词条。如此则可以保证无论预设唤醒词出现在识别结果的任意位置，都可以识别出识别结果中的预设唤醒词。例如，当识别结果为“冷光色小白”时，也可以识别出其中的预设唤醒词“小白”。
74.在一些实施例中，当识别结果中存在与预设唤醒词匹配的词条时，进入唤醒状态，包括：
75.a、当识别结果中存在与预设唤醒词匹配的词条时，获取当前运行状态；
76.b、当当前运行状态为待机状态时，将运行状态切换为唤醒状态。
77.其中，在本技术实施例中，由于用户既可以在待机状态下对语音信息进行获取，也可以在唤醒状态下对语音信息进行获取。因此，在本技术实施例中，可以在检测到识别结果中存在与预设唤醒词匹配的词条时，对智能家居系统的控制装置当前的运行状态进行获取，若此时的运行状态为待机状态，则将智能家居系统的控制装置的运行状态切换为唤醒状态。反之，若智能家居系统的控制装置当前的运行状态为唤醒状态，则不对智能家居系统的控制装置当前运行状态作调整。
78.或者，在一些实施例中，当获取到语音信息时，先对智能家居系统的控制装置的运行状态进行获取，若确定当前运行状态为唤醒状态时，则无需检测识别结果中是否存在预设唤醒词；若当前运行状态为待机状态时，再检测识别结果中是否存在预设唤醒词。
79.在一些实施例中，本技术提供的语音处理方法还包括：
80.当在预设时间段内未接收到语音信息时，将运行状态切换为待机状态。
81.其中，当检测到语音信息中存在预设唤醒词时，对智能家居系统的控制装置进行唤醒，使得智能家居系统的控制装置处于唤醒状态。在唤醒状态中，智能家居系统的控制装置持续获取语音信息，并对语音信息进行语音识别，以从语音信息中提取出命令词并根据命令词对智能家居系统进行控制。由于在唤醒状态下，智能家居系统的控制装置会持续进行语音获取以及识别，处于一个高功耗的状态。然而用户并非时时刻刻需要对智能家居进行语音控制，一般用户对智能家居系统进行控制会集中在回到家时、睡觉起以及早上起床时这几个时间段，在其他时间段一般都是一些零星的控制指令。因此，当智能家居系统的控制装置在唤醒状态中获取语音信息时，还会对未获取到语音信息的时间段进行检测，当检测到在预设长度的时间段内未获取到语音信息时，则将智能家居系统的控制装置的运行状态再切换为待机状态。
82.在一些实施例中，若在唤醒状态下，智能家居系统的控制状态对获取到的语音信息进行识别后未发现识别结果中存在命令词时，也会对持续时间进行累计，当持续时间达到预设时间段时，将智能家居系统的控制装置的运行状态切换为待机状态。即若在预设时间段内未能检测到命令词，就将智能家居系统的控制装置的运行状态切换为待机状态。
83.步骤104，在唤醒状态下提取识别结果中的预设命令词。
84.其中，在智能家居系统的控制装置的运行状态切换为唤醒状态之后，可以进一步检测识别结果中是否存在预设的命令词。此处预设的命令词可以是一个也可以是多个。一般情况下，预设命令词为多个；而且，对于不同的电气设备，还可以具有不同的命令词。例如，对电动窗帘进行控制的命令词可以为“打开窗帘”或者“关闭窗帘”，对电视机进行控制的命令词可以为“打开电视机”、“关闭电视机”、“调高电视音量”或者“切换电视频道”等。
85.由于一般情况下预设命令词较多，检测识别结果中是否存在预设命令词的检测工作需要进行较大量的计算量，因此检测过程中耗费能量较高，需要在唤醒状态下执行。当在唤醒状态下检测到识别结果中存在预设命令词时，对该预设命令词进行提取。
86.在一些实施例中，在唤醒状态下提取识别结果中的预设命令词，包括：
87.1、当检测到识别结果中存在与预设命令词集合中的命令词相匹配的目标词条时，确定目标词条为预设命令词；
88.2、提取预设命令词。
89.其中，在本技术实施例中，可以为智能家居系统的控制装置设置预设命令词集合。然后，将识别结果与预设命令词集合中每一命令词进行逐一匹配，得到一个或多个与命令词集合中的命令词相匹配的目标词条。确定这些匹配的目标词条为预设命令词。
90.在一些实施例中，当检测到识别结果中存在与预设命令词集合中的命令词相匹配的目标词条时，确定目标词条为预设命令词，包括：
91.1.1、将识别结果切分为多个词条；
92.1.2、将多个词条分别与预设命令词集合中的命令词进行匹配；
93.1.3、当存在与预设命令词集合中的命令词相匹配的目标词条时，确定目标词条为预设命令词。
94.其中，在本技术实施例中，也可以将识别结果进行切分，再将切分得到的词条与预设命令词集合中的命令词进行匹配，确定相匹配的目标词条为预设命令词。其中，此处的切分不再以一个设定的长度进行切分，而是以多个长度进行切分。例如，当识别结果为中文文本时，可以分别以一个中文文字为长度进行切分、两个中文文字为长度进行切分、多个中文文字为长度进行切分等，得到多个词条组成的词条集合。然后，在将该词条集合与预设的命令词集合进行匹配。
95.在一些实施例中，在唤醒模式下可以重新对获取到的语音信息进行语音识别，得到一个新的识别结果。
96.其中，在唤醒模式下对获取到的语音信息进行语音识别，可以包括：
97.a、对获取到的语音信息进行语音增强处理，得到语音增强处理后的语音信息；
98.b、对语音增强处理后的语音信息进行识别，得到新的识别结果。
99.其中，由于获取语音信息时智能家居系统的控制装置还处于待机状态，在待机状态下，智能家居系统的控制装置处于低能耗的状态，其对语音的采集和处理的能力较弱。由于一般情况下唤醒词为一个单一的词而且较为固定，因此采用待机状态下获取到的语音信息的识别结果以足以进行唤醒词的检测。而对识别结果中的命令词的检测的难度较大，因为一方面语音信息中可以包含多个命令词，另一方面命令词的数量繁多，不同的电气设备会对应不同的命令词，而且对于同一电气设备也会具有多个不同的命令词。因此，对于命令词的检测，需要采集相对清晰的语音信息，并进行更为高效的语音处理。因此，在本技术中，在智能家居系统的控制装置切换为唤醒状态后，会对获取到的语音信息进行再次增强识别，具体地，对获取到的语音信息进行增强处理，再对增强处理后的语音信息进行识别，以得到更为准确的识别结果。
100.其中，语音增强处理，可以从噪声背景中提取有用的语音信号，抑制、降低噪声干扰。也就是可以从含噪语音中提取尽可能纯净的原始语音，从而降低噪音对语音识别过程的干扰。具体地，语音增强处理方法包括但不限于噪声对消法、谐波增强法等。
101.在一些实施例中，在唤醒状态下提取识别结果中的预设命令词，包括：
102.a、在唤醒状态下获取预设唤醒词在语音信息中所处的位置信息；
103.b、根据位置信息将语音信息划分为第一语音片段和第二语音片段，第一语音片段
为预设唤醒词对应的语音片段；
104.c、从第二语音片段中提取出预设命令词。
105.在本实施例中，由于本技术提供的语音处理方法中，获取的语音信息会包括唤醒词和命令词。在根据识别结果确定了唤醒词后，可以确定唤醒词对应的语音片段。然后将唤醒词对应的语音片段去除，只保留唤醒词之外的语音片段。然后对唤醒词之外的语音片段进行增强处理后再进行语音识别，从而得到更为准确的命令词相关的识别结果。
106.具体地，唤醒词可以处于语音信息中的头部位置，例如“小白打开电视机”；唤醒词也可以处于语音信息的尾部位置，例如“打开电视机小白”；唤醒词也可以处于语音信息的中间位置，例如“关闭窗帘小白打开电视机”。其中，对于上述任意一个语音信息，在确定了唤醒词“小白”在语音信息中的位置信息后，便可以将语音信息划分为“小白”对应的第一语音片段，以及“小白”以外的语音信息对应的第二语音片段。可以理解的是，预设命令词一定处于第二语音片段中，不会处于第一语音片段中。如此可以直接从第二语音片段中进行预设命令词的提取，排除了唤醒词的干扰，从而可以进一步提升预设命令词的提取效率。
107.步骤105，根据预设命令词生成控制指令，并根据控制指令对智能家居系统进行控制。
108.其中，在唤醒状态下从识别结果中提取出预设命令词后，根据该预设命令词生成控制指令。其中，该控制指令包括被控对象以及针对被控对象的具体控制操作。被控对象可以为一个或多个电气设备，具体可以根据预设命令词的数量以及内容进行确定。
109.因此，在本技术实施例中，当获取到语音信息时，直接根据语音信息进行唤醒词和命令词的识别。若识别到唤醒词则唤醒智能家居系统的控制装置并进一步根据识别到的命令词对智能家居系统进行控制；若未识别到唤醒词则不唤醒智能家居系统的控制装置，也不对智能家居系统进行控制。若识别到唤醒词但未识别到命令词，则唤醒智能家居系统的控制装置并持续进行语音获取以及命令词的识别。相对于目前的技术，本技术在识别到唤醒词后无需停止识别操作并反馈唤醒结果，可以提高语音处理的效率。
110.根据上述描述可知，本技术实施例提供的语音处理方法，通过获取语音信息；对语音信息进行语音识别，得到识别结果；当识别结果中存在与预设唤醒词匹配的词条时，进入唤醒状态；在唤醒状态下提取识别结果中的预设命令词；根据预设命令词生成控制指令，并根据控制指令对智能家居系统进行控制。以此，可以通过一次性说出唤醒词和命令词，同时实现对智能家居控制模块的唤醒以及对智能家居系统的控制，提高了语音处理的效率，进而提升了智能家居系统的控制效率。
111.为了更好地实施以上方法，本发明实施例还提供一种语音处理装置，该语音处理装置可以集成在终端中。
112.例如，如图3所示，为本技术实施例提供的语音处理装置的结构示意图，该语音处理装置可以包括获取单元201、识别单元202、唤醒单元203、提取单元204以及控制单元205，如下：
113.获取单元201，用于获取语音信息；
114.识别单元202，用于对语音信息进行语音识别，得到识别结果；
115.唤醒单元203，用于当识别结果中存在与预设唤醒词匹配的词条时，进入唤醒状态；
116.提取单元204，用于在唤醒状态下提取识别结果中的预设命令词；
117.控制单元205，用于根据预设命令词生成控制指令，并根据控制指令对智能家居系统进行控制。
118.在一些实施例中，唤醒单元，包括：
119.切分子单元，用于将识别结果切分为多个词条；
120.唤醒子单元，用于当多个词条中存在与预设唤醒词匹配的词条时，进入唤醒状态。
121.在一些实施例中，切分子单元，包括：
122.获取模块，用于获取预设唤醒词的词条长度；
123.第一切分模块，用于按照词条长度对识别结果进行切分，得到多个词条。
124.在一些实施例中，唤醒单元，包括：
125.获取子单元，用于当识别结果中存在与预设唤醒词匹配的词条时，获取当前运行状态；
126.切换子单元，用于当当前运行状态为待机状态时，将运行状态切换为唤醒状态。
127.在一些实施例中，本技术实施例提供的语音处理装置还包括：
128.切换单元，用于当在预设时间段内未接收到语音信息时，将运行状态切换为待机状态。
129.在一些实施例中，提取单元，包括：
130.确定子单元，用于当检测到识别结果中存在与预设命令词集合中的命令词相匹配的目标词条时，确定目标词条为预设命令词；
131.提取子单元，用于提取预设命令词。
132.在一些实施例中，确定子单元，包括：
133.第二切分模块，用于将识别结果切分为多个词条；
134.匹配模块，用于将多个词条分别与预设命令词集合中的命令词进行匹配；
135.确定模块，用于当存在与预设命令词集合中的命令词相匹配的目标词条时，确定目标词条为预设命令词。
136.具体实施时，以上各个单元可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个单元的具体实施可参见前面的方法实施例，在此不再赘述。
137.根据上述描述可知，本技术实施例提供的语音处理方法，通过获取单元201获取语音信息；识别单元202对语音信息进行语音识别，得到识别结果；当识别结果中存在与预设唤醒词匹配的词条时，唤醒单元203控制进入唤醒状态；提取单元204在唤醒状态下提取识别结果中的预设命令词；控制单元205根据预设命令词生成控制指令，并根据控制指令对智能家居系统进行控制。以此，可以通过一次性说出唤醒词和命令词，同时实现对智能家居系统的控制装置的唤醒以及对智能家居系统的控制，提高了语音处理的效率，进而提升了智能家居系统的控制效率。
138.本技术实施例还提供一种计算机设备，该计算机设备可以为终端，如图4所示，该终端可以包括射频(rf，radio frequency)电路301、包括有一个或一个以上计算机可读存储介质的存储器302、输入单元303、显示单元304、传感器305、音频电路306、无线保真(wifi，wireless fidelity)模块307、包括有一个或者一个以上处理核心的处理器308、以
及电源309等部件。本领域技术人员可以理解，图4中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：
139.rf电路301可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，交由一个或者一个以上处理器308处理；另外，将涉及上行的数据发送给基站。通常，rf电路301包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(sim， subscriber identity module)卡、收发信机、耦合器、低噪声放大器(lna， low noise amplifier)、双工器等。此外，rf电路301还可以通过无线通信与网络和其他设备通信。无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(gsm，global system of mobile communication)、通用分组无线服务(gprs，general packet radio service)、码分多址 (cdma，code division multiple access)、宽带码分多址(wcdma， wideband code division multiple access)、长期演进(lte，long termevolution)、电子邮件、短消息服务(sms，short messaging service)等。
140.存储器302可用于存储软件程序以及模块，处理器308通过运行存储在存储器302的软件程序以及模块，从而执行各种功能应用以及信息互动。存储器302可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据终端的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器302可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器302还可以包括存储器控制器，以提供处理器308和输入单元303对存储器302的访问。
141.输入单元303可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地，在一个具体的实施例中，输入单元303可包括触敏表面以及其他输入设备。触敏表面，也称为触摸显示屏或者触控板，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触敏表面可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器308，并能接收处理器308发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面，输入单元303还可以包括其他输入设备。具体地，其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
142.显示单元304可用于显示由用户输入的信息或提供给用户的信息以及终端的各种图形用户接口，这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元304可包括显示面板，可选的，可以采用液晶显示器(lcd，liquid crystal display)、有机发光二极管(oled， organic light
‑
emitting diode)等形式来配置显示面板。进一步的，触敏表面可覆盖显示面板，当触敏表面检测到在其上或附近的触摸操作后，传送给处理器308以确定触摸事件的类型，随后处理器308根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图4中，触敏表面与显示面板是作为两个独立的部件来实现输入和输入
功能，但是在某些实施例中，可以将触敏表面与显示面板集成而实现输入和输出功能。
143.终端还可包括至少一种传感器305，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板的亮度，接近传感器可在终端移动到耳边时，关闭显示面板和/或背光。作为运动传感器的一种，重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于终端还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。
144.音频电路306、扬声器，传声器可提供用户与终端之间的音频接口。音频电路306可将接收到的音频数据转换后的电信号，传输到扬声器，由扬声器转换为声音信号输出；另一方面，传声器将收集的声音信号转换为电信号，由音频电路306接收后转换为音频数据，再将音频数据输出处理器308 处理后，经rf电路301以发送给比如另一终端，或者将音频数据输出至存储器302以便进一步处理。音频电路306还可能包括耳塞插孔，以提供外设耳机与终端的通信。
145.wifi属于短距离无线传输技术，终端通过wifi模块307可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图4示出了wifi模块307，但是可以理解的是，其并不属于终端的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。
146.处理器308是终端的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器302内的软件程序和/或模块，以及调用存储在存储器302内的数据，执行终端的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器308可包括一个或多个处理核心；优选的，处理器308可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器308中。
147.终端还包括给各个部件供电的电源309(比如电池)，优选的，电源可以通过电源管理系统与处理器308逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源309还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
148.尽管未示出，终端还可以包括摄像头、蓝牙模块等，在此不再赘述。具体在本实施例中，终端中的处理器308会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器302中，并由处理器 308来运行存储在存储器302中的应用程序，从而实现各种功能：
149.获取语音信息；对语音信息进行语音识别，得到识别结果；当识别结果中存在与预设唤醒词匹配的词条时，进入唤醒状态；在唤醒状态下提取识别结果中的预设命令词；根据预设命令词生成控制指令，并根据控制指令对智能家居系统进行控制。
150.应当说明的是，本技术实施例提供的计算机设备与上文实施例中的方法属于同一构思，以上各个操作的具体实施可参见前面的实施例，在此不作赘述。
151.本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存
储介质中，并由处理器进行加载和执行。
152.为此，本发明实施例提供一种计算机可读存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以执行本发明实施例所提供的任一种方法中的步骤。例如，该指令可以执行如下步骤：
153.获取语音信息；对语音信息进行语音识别，得到识别结果；当识别结果中存在与预设唤醒词匹配的词条时，进入唤醒状态；在唤醒状态下提取识别结果中的预设命令词；根据预设命令词生成控制指令，并根据控制指令对智能家居系统进行控制。
154.以上各个操作的具体实施可参见前面的实施例，在此不再赘述。
155.其中，该计算机可读存储介质可以包括：只读存储器(rom，read onlymemory)、随机存取记忆体(ram，random access memory)、磁盘或光盘等。
156.由于该计算机可读存储介质中所存储的指令，可以执行本发明实施例所提供的任一种方法中的步骤，因此，可以实现本发明实施例所提供的任一种方法所能实现的有益效果，详见前面的实施例，在此不再赘述。
157.其中，根据本技术的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在存储介质中。计算机设备的处理器从存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述图2的各种可选实现方式中提供的方法。
158.以上对本发明实施例所提供的一种语音处理方法、装置、计算机可读存储介质及计算机设备进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上，本说明书内容不应理解为对本发明的限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：语音转换方法、装置、终端及存储介质与流程

语音处理方法、装置、计算机可读存储介质及计算机设备与流程

相关文章

最热文献