语音识别方法、服务器以及电子设备与流程

2022-03-09 06:17:46 来源：中国专利 TAG：

1.本技术实施例涉及语音识别技术。更具体地讲，涉及一种语音识别方法、服务器以及电子设备。

背景技术：

2.智能语音交互技术正在逐渐成为智能电视、智能冰箱等智能家居产品的标准配置。智能语音交互场景下，用户通过语音操控智能电视、智能冰箱等，实现看视频、听音乐、查天气、电视控制等一系列操作。
3.相关技术中，智能语音交互时，可以首先通过语音识别模块将用户输入的语音数据识别为文本，再通过语义分析模块对该文本进行词法、句法、语义分析，从而理解用户意图对应的语音指令，并将语音指令下发到终端设备，由终端设备进行执行或展示。
4.然而，当用户输入的语音数据不包含完整的用户意图时，通常无法基于语音数据识别出对应的语音指令，从而造成输入的语音数据无响应，降低了语音识别的智能化水平，影响用户体验。

技术实现要素：

5.本技术示例性的实施方式提供一种语音识别方法、服务器以及电子设备，以提升语音识别的智能化水平。
6.第一方面，本技术实施例提供一种语音识别方法，包括：
7.接收电子设备发送的待识别的语音数据；
8.若未识别出所述语音数据对应的语音指令，则提取所述语音数据中的语音关键词；
9.根据历史语音数据，确定所述语音关键词相关的语音指令；
10.将所述语音关键词相关的语音指令对应的至少一个备选的用户意图信息发送给所述电子设备。
11.本技术一些实施例中，所述根据历史语音数据，确定所述语音关键词相关的语音指令，包括：
12.从数据库中的所有用户的历史语音数据中，检索所述语音关键词相关的语音指令。
13.本技术一些实施例中，所述根据历史语音数据，确定所述语音关键词相关的语音指令，还包括：
14.确定输入所述语音数据的当前用户；
15.从数据库中的所述当前用户的历史语音数据中，检索所述语音关键词相关的语音指令。
16.本技术一些实施例中，若所述语音关键词为动词，则所述检索所述语音关键词相关的语音指令，包括：
17.通过前缀检索算法，从所述历史语音数据中检索出以所述语音关键词为前缀的语音指令。
18.本技术一些实施例中，所述根据历史语音数据，确定所述语音关键词相关的语音指令，包括：
19.根据设备连接信息，在所述历史语音数据中筛选出所述语音关键词相关的语音指令。
20.本技术一些实施例中，所述将所述语音关键词相关的语音指令对应的至少一个备选的用户意图信息发送给所述电子设备，所述方法还包括：
21.确定所述语音关键词相关的语音指令的历史请求次数；
22.根据所述历史请求次数将所述语音关键词相关的语音指令由大到小进行排序；
23.根据所述语音关键词相关的语音指令的排序，确定预设数量的语音关键词相关的语音指令对应的至少一个备选的用户意图信息；
24.将所述至少一个备选的用户意图发送给所述电子设备。
25.第二方面，本技术实施例提供一种语音识别方法，包括:
26.接收用户输入的语音数据，所述语音数据中缺少组成用户意图的必要关键词；
27.向服务器发送所述语音数据；
28.接收所述服务器发送的至少一个备选的用户意图信息，所述用户意图信息与所述语音数据中的语音关键词相关的语音指令对应，所述语音关键词相关的语音指令是从历史语音数据中确定的。
29.本技术一些实施例中，在所述接收所述服务器发送的用户意图信息之后，所述方法还包括：
30.在显示界面上显示所述至少一个备选的用户意图信息。
31.第三方面，本技术实施例提供一种服务器，所述服务器包括：
32.存储器和处理器；
33.所述存储器用于存储可执行程序，所述处理器被配置为：
34.接收电子设备发送的待识别的语音数据；
35.若未识别出所述语音数据对应的语音指令，则提取所述语音数据中的语音关键词；
36.根据历史语音数据，确定所述语音关键词相关的语音指令；
37.将所述语音关键词相关的语音指令对应的至少一个备选的用户意图信息发送给所述电子设备。
38.本技术一些实施例中，所述处理器具体被配置为：
39.从数据库中的所有用户的历史语音数据中，检索所述语音关键词相关的语音指令。
40.本技术一些实施例中，所述处理器具体被配置为：
41.确定输入所述语音数据的当前用户；
42.从数据库中的所述当前用户的历史语音数据中，检索所述语音关键词相关的语音指令。
43.本技术一些实施例中，若所述语音关键词为动词，则所述处理器具体被配置为：
44.通过前缀检索算法，从所述历史语音数据中检索出以所述语音关键词为前缀的语音指令。
45.本技术一些实施例中，所述处理器具体被配置为：
46.根据设备连接信息，在所述历史语音数据中筛选出所述语音关键词相关的语音指令。
47.本技术一些实施例中，所述处理器具体被配置为：
48.确定所述语音关键词相关的语音指令的历史请求次数；
49.根据所述历史请求次数将所述语音关键词相关的语音指令由大到小进行排序；
50.根据所述语音关键词相关的语音指令的排序，确定预设数量的语音关键词相关的语音指令对应的至少一个备选的用户意图信息；
51.将所述至少一个备选的用户意图信息发送给所述电子设备。
52.第四方面，本技术实施例提供一种电子设备，所述电子设备包括：
53.通信器，用于与服务器进行数据通信，接收服务器发送的数据，以及向服务器发送数据；
54.与所述通信器连接的控制器，所述控制器被配置为：
55.接收用户输入的语音数据，所述语音数据中缺少组成用户意图的必要关键词；
56.向服务器发送所述语音数据；
57.接收所述服务器发送的至少一个备选的用户意图信息，所述用户意图信息与所述语音数据中的语音关键词相关的语音指令对应，所述语音关键词相关的语音指令是从历史语音数据中确定的。
58.本技术一些实施例中，所述控制器还被配置为：
59.在显示界面上显示所述至少一个备选的用户意图信息。
60.第四方面，本发明还提供一种存储有计算机指令的非瞬时计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现第一方面中任意一种可能的方法。
61.第五方面，本发明还提供一种存储有计算机指令的非瞬时计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现第二方面中任意一种可能的方法。
62.本技术实施例提供的语音识别方法、服务器以及电子设备，该语音识别方法包括：接收电子设备发送的待识别的语音数据；若未识别出语音数据对应的语音指令，则提取语音数据中的语音关键词；根据历史语音数据，确定语音关键词相关的语音指令；将语音关键词相关的语音指令对应的至少一个备选的用户意图信息发送给电子设备。与现有技术相比，本技术实施例通过在未识别出语音数据对应的语音指令时，将语音关键词相关的语音指令对应的至少一个备选的用户意图信息发送给电子设备，以便电子设备显示备选的用户意图信息，从而提高了语音识别的智能化水平。
附图说明
63.为了更清楚地说明本技术实施例或相关技术中的实施方式，下面将对实施例或相关技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申
请的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。
64.图1中示例性示出了根据一些实施例的电子设备与控制装置之间操作场景的示意图；
65.图2示例性示出了根据一些实施例的一种语音识别方法的流程示意图；
66.图3示例性示出了根据一些实施例的确定用户意图的示意图；
67.图4示例性示出了根据一些实施例的一种语音识别方法的信令交互图；
68.图5示例性示出了根据一些实施例的另一种语音识别方法的流程示意图；
69.图6示例性示出了根据一些实施例的再一种语音识别方法的流程示意图；
70.图7示例性示出了根据一些实施例的一种电子设备的界面示意图；
71.图8示例性示出了根据一些实施例的另一种电子设备的界面示意图；
72.图9示例性示出了根据一些实施例的服务器的结构示意图；
73.图10示例性示出了根据一些实施例的电子设备的结构示意图。
具体实施方式
74.为使本技术的目的、实施方式和优点更加清楚，下面将结合本技术示例性实施例中的附图，对本技术示例性实施方式进行清楚、完整地描述，显然，所描述的示例性实施例仅是本技术一部分实施例，而不是全部的实施例。
75.基于本技术描述的示例性实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本技术所附权利要求保护的范围。此外，虽然本技术中公开内容按照示范性一个或几个实例来介绍，但应理解，可以就这些公开内容的各个方面也可以单独构成一个完整实施方式。
76.需要说明的是，本技术中对于术语的简要说明，仅是为了方便理解接下来描述的实施方式，而不是意图限定本技术的实施方式。除非另有说明，这些术语应当按照其普通和通常的含义理解。
77.本技术中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体，而不必然意味着限定特定的顺序或先后次序，除非另外注明(unless otherwise indicated)。应该理解这样使用的用语在适当情况下可以互换，例如能够根据本技术实施例图示或描述中给出那些以外的顺序实施。
78.此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖但不排他的包含，例如，包含了一系列组件的产品或设备不必限于清楚地列出的那些组件，而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
79.本技术中使用的术语“模块”，是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合，能够执行与该元件相关的功能。
80.本技术中使用的术语“遥控器”，是指电子设备(如本技术中公开的电子设备)的一个组件，通常可在较短的距离范围内无线控制电子设备。一般使用红外线和/或射频(rf)信号和/或蓝牙与电子设备连接，也可以包括wifi、无线usb、蓝牙、动作传感器等功能模块。例如：手持式触摸遥控器，是以触摸屏中用户界面取代一般遥控装置中的大部分物理内置硬键。
81.本技术中使用的术语“手势”，是指用户通过一种手型的变化或手部运动等动作，
用于表达预期想法、动作、目的/或结果的用户行为。
82.图1中示例性示出了根据实施例中电子设备与控制装置之间操作场景的示意图。如图1中示出，用户可通过移动终端300和控制装置100操作电子设备200。
83.在一些实施例中，控制装置100可以是遥控器，遥控器和电子设备的通信包括红外协议通信或蓝牙协议通信，及其他短距离通信方式等，通过无线或其他有线方式来控制电子设备200。用户可以通过遥控器上按键，语音输入、控制面板输入等输入用户指令，来控制电子设备200。如：用户可以通过遥控器上音量加减键、频道控制键、上/下/左/右的移动按键、语音输入按键、菜单键、开关机按键等输入相应控制指令，来实现控制电子设备200的功能。
84.在一些实施例中，也可以使用移动终端、平板电脑、计算机、笔记本电脑、和其他智能设备以控制电子设备200。例如，使用在智能设备上运行的应用程序控制电子设备200。该应用程序通过配置可以在与智能设备关联的屏幕上，在直观的用户界面(ui)中为用户提供各种控制。
85.在一些实施例中，移动终端300可与电子设备200安装软件应用，通过网络通信协议实现连接通信，实现一对一控制操作的和数据通信的目的。如：可以实现用移动终端300与电子设备200建立控制指令协议，将遥控控制键盘同步到移动终端300上，通过控制移动终端300上用户界面，实现控制电子设备200的功能。也可以将移动终端300上显示音视频内容传输到电子设备200上，实现同步显示功能。
86.如图1中还示出，电子设备200还与服务器400通过多种通信方式进行数据通信。可允许电子设备200通过局域网(lan)、无线局域网(wlan)和其他网络进行通信连接。服务器400可以向电子设备200提供各种内容和互动。示例的，电子设备200通过发送和接收信息，以及电子节目指南(epg)互动，接收软件程序更新，或访问远程储存的数字媒体库。服务器400可以是一个集群，也可以是多个集群，可以包括一类或多类服务器。通过服务器400提供视频点播和广告服务等其他网络服务内容。
87.电子设备200，可以液晶显示器、oled显示器、投影电子设备。具体电子设备类型，尺寸大小和分辨率等不作限定，本领技术人员可以理解的是，电子设备200可以根据需要做性能和配置上一些改变。
88.电子设备200除了提供广播接收电视功能之外，还可以附加提供计算机支持功能的智能网络电视功能，包括但不限于，网络电视、智能电视、互联网协议电视(iptv)等。
89.下面对于本技术实施例涉及的语音交互过程进行说明。
90.在语音交互过程中，服务器在接收到终端设备发送的语音数据后，首先通过语音识别，得到语音数据对应的文本数据，随后，基于文字数据理解用户意图，最后，根据用户的意图，确定出对应的语音指令。
91.其中，语音识别主要包括训练和识别两个部分。训练通常是离线完成的，对预先收集好的海量语音、语言数据库进行信号处理和知识挖掘，获取语音识别系统所需要的“声学模型”和“语言模型”；而识别过程通常是在线完成的，对用户实时的语音进行自动识别。识别过程通常又可以分为“前端”和“后端”两大模块：“前端”模块主要的作用是进行端点检测(去除多余的静音和非说话声)、降噪、特征提取等；“后端”模块的作用是利用训练好的“声学模型”和“语言模型”对用户说话的特征向量进行统计模式识别(又称“解码”)，得到其包
含的文字信息，此外，后端模块还存在一个“自适应”的反馈模块，可以对用户的语音进行自学习，从而对“声学模型”和“语音模型”进行必要的“校正”，进一步提高识别的准确率。
92.用户意图的理解可以通过用户意图分类模型和目标转移概率矩阵实现。用户意图分类模型可以通过训练对文字数据的用户意图进行分类类别。目标转移概率矩阵是根据语音数据转换成的文字数据的上文确定该文字数据所属的某个意图类别的概率。即目标转移概率矩阵不关心当前的文字数据属于哪个意图类别，只获取上一个文字数据属于哪个意图类别。根据上一个文字数据的意图类别，预测下一个的文字数据属于各个意图类别的概率。在理解用户意图后，可以基于用户意图和语音指令之间的映射关系，确定对应的语音指令。
93.智能语音交互技术正在逐渐成为智能电视、智能冰箱等智能家居产品的标准配置。智能语音交互场景下，用户通过语音操控智能电视、智能冰箱等，实现看视频、听音乐、查天气、电视控制等一系列操作。相关技术中，智能语音交互时，可以首先通过语音识别模块将用户输入的语音数据识别为文本，再通过语义分析模块对该文本进行词法、句法、语义分析，从而理解用户意图对应的语音指令，并将语音指令下发到终端设备，由终端设备进行执行或展示。然而，当用户输入的语音数据不包含完整的用户意图时，通常无法基于语音数据识别出对应的语音指令，从而造成对于输入的语音数据无响应，降低了语音识别的智能化水平，影响用户体验。
94.为解决上述问题，本技术实施例提供一种语音识别方法以及服务器，当未识别出语音数据对应的语音指令时，通过确定出语音数据中的语音关键词相关的语音指令，来确定备选的用户意图，以便电子设备显示备选的用户意图，从而提高了语音识别的智能化水平。
95.可以理解，上述语音识别方法可以通过本技术实施例提的服务器实现。下面以集成或安装有相关执行代码的服务器为例以具体地实施例对本技术实施例的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。
96.图2示例性示出了根据一些实施例的一种语音识别方法的流程示意图，本实施例涉及的是如何进行语音识别的具体过程。其中，本实施例的执行主体为服务器。如图2所示，该方法包括：
97.s301、接收电子设备发送的待识别的语音数据。
98.在本技术实施例中，当用户需要进行语音识别时，可以通过向电子设备输入语音数据，从而使得电子设备将待识别的语音数据发送给服务器，以供服务器进行语音识别。
99.应理解，本技术实施例对于电子设备的类型不做限制，示例性的，电子设备可以为显示设备、智能音箱等。
100.s302、若未识别出语音数据对应的语音指令，则提取语音数据中的语音关键词。
101.在本步骤中，当服务器接收电子设备发送的待识别的语音数据后，可以对待识别的语音数据进行识别，若未识别出语音数据对应的语音指令，则提取语音数据中的语音关键词。
102.需要说明的是，本技术实施例对于服务器如何识确定语音数据对应的用户意图不做限制，可以依次通过中文分词、词性标注和依存句法分析，来确定待识别的语音数据的用户意图，从而确定出对应的语音指令。
103.其中，中文分词是语音分词是语音识别的核心。由于词是最小的能够独立活动的有意义的语言成分，分词是自然语言处理第一步。区别于英文每个词通过空格或者标点符号分割开，中文中很难对词的边界进行界定。相关技术中，中文分词可以基于规则、统计、理解三种方式进行。在一些实施例中，可以基于规则进行中文分词，以词库为依据，使用正向最大匹配算法，进行分词。示例性的，“单田芳的隋唐演义”可以分词为“单田芳”、“的”和“隋唐演义”。
104.针对词性标注，其是以词的特点作为划分词类的依据，是一种分类方法，是自然语言处理的预处理环节之一。相关技术中，词性标注方法是基于规则、统计或理解进行的。在一些实施例中，可以依托于词库基于规则的标注方法进行词性标注。示例性的，“单田芳的隋唐演义”，进行词性标注后可以为：{单田芳-单田芳[actor]}，{的-的[funcwordstructaux]}，隋唐演义-隋唐演义[title]}。
[0105]
针对依存句法分析，可以理解为在依存句法中，句法结构本质上包含的词和词对之间的关系。其中，一个依存关系连接两个词，一个是核心词(head)一个是修饰词(dependant)。依存句法分析结果的一种典型表示形式为依存句法树，其中的标注关系包括：主谓关系sbv，动宾关系vob，间宾关系iob，前置宾语fob，兼语dbl，定中关系att，状中关系adv，动补关系cmp，并列关系coo，介宾关系pob，左附加关系lad，右附加关系rad，独立结构is，核心关系hed。
[0106]
在一些实施例中，通过基于统计的和基于规则的方式，可以生成对应意图的依存句法树，用于描述各个词语之间的关系，分析识别句中的语法成分。将用户意图同句法做一对多的映射以及相应的权重，对输入的词列表逐行进行句法匹配，将匹配成功的列表进行权重分析，提取最合适的用户意图作为结果，从而基于提取出的用户意图确定对应的语音指令。
[0107]
需要说明的是，在一些实施例中，由于用户表达不全或语音采集设备故障等原因，语音数据中可能缺少组成用户意图的必要关键词，导致用户输入的语音数据不完整。此时，在服务器对不完整的语音数据进行识别时，可能不误理解用户意图，进而导致无法确定出对应的语音指令，此时可以提取不完整的语音数据中剩余存在的关键词。
[0108]
应理解，在本技术实施例中涉及的不完整的语音数据，可以理解为用户输入的语音数据中仅包含有待执行的动作但不包含待执行的对象，或者仅包含有待执行的对象但不包含待执行的动作，从而无法组合成语音指令的语音数据。示例性的，用户输入的语音数据被识别为“打开”，其仅包含待执行的动作，但不包含待执行的对象，因此无法识别出该语音数据对应的语音指令，从而需要提取语音数据中的语音关键词。
[0109]
应理解，在本技术实施例对于语音数据中的语音关键词的类型不做限制，在一些实施例中，语音关键词可以为动词，例如“打开”、“关闭”、“暂停”等。在另一些实施例中，语音关键词可以为名词，例如“空调”、“卧室灯”、“电视”等设备名称，或者也可以为“xxx游戏”、“xx音乐”等应用名称，或者还可以为“中央一台”、“电影频道”等频道名称。
[0110]
s303、根据历史语音数据，确定语音关键词相关的语音指令。
[0111]
在本步骤中，当服务器提取语音数据中的语音关键词后，可以根据历史语音数据，确定语音关键词相关的语音指令。
[0112]
应理解，本技术实施例对于如何根据历史语音数据，确定语音关键词相关的语音
指令不做限制，在一些实施例中，服务器可以从数据库中的所有用户的历史语音数据中，检索语音关键词相关的语音指令。在另一些实施例中，服务器可以先确定输入语音数据的当前用户，再从数据库中的当前用户的历史语音数据中，检索语音关键词相关的语音指令。
[0113]
需要说明的是，本技术实施例对于如何检索语音关键词相关的语音指令也不做限制，在一些实施例中，若语音关键词为动词，则服务器可以通过前缀检索算法，从历史语音数据中检索出以语音关键词为前缀的语音指令。
[0114]
其中，前缀检索算法是通过es(分布式全文搜索框架)主键，检索数据库中以语音关键词开头的所有语言数据。上述数据库可以为电子设备对应的数据库，存储该电子设备发送给服务器的历史语音数据，该数据库中可以基于不同用户，将历史语音数据分类存储。
[0115]
在一些实施例中，服务器还可以根据设备连接信息，在历史语音数据中筛选出语音关键词相关的语音指令。
[0116]
其中，该设备连接信息中包含有与电子设备连接的电子设备的信息。示例性的，设备连接信息可以包括电子设备和空调的连接关系、电子设备和卧室灯的连接关系等。
[0117]
示例性的，若设备连接信息中包含有与电子设备连接的“卧室灯”，则在历史语音数据确定语音关键词相关的语音指令时，可以进行筛选，仅确定出与“卧室灯”相关的语音指令，例如语音指令“打开卧室灯”。
[0118]
s304、将语音关键词相关的语音指令对应的至少一个备选的用户意图信息发送给电子设备。
[0119]
在本步骤中，当服务器根据历史语音数据，确定语音关键词相关的语音指令后，可以将语音关键词相关的语音指令对应的至少一个备选的用户意图信息发送给电子设备。
[0120]
应理解，本技术实施例对于如何将语音关键词相关的语音指令对应的用户意图信息发送给电子设备不做限制，在一些实施例中，服务器可以先确定语音关键词相关的语音指令的历史请求次数。其次，服务器可以根据历史请求次数将语音关键词相关的语音指令由大到小进行排序。再次，服务器可以根据语音关键词相关的语音指令的排序，确定预设数量的语音关键词相关的语音指令对应的备选用户意图信息。最后，服务器可以将用户意图信息发送给电子设备。
[0121]
应理解，上述历史请求次数可以反映语音关键词相关的语音指令的使用频率，从而将使用频率更高的语音关键词相关的语音指令展示给用户，从而提高语音关键词补全的成功率。
[0122]
需要说明的是，本技术实施例还可以基于语音关键词相关的语音指令的确定方式，分别对语音关键词相关的语音指令进行排序。即，可以对基于所有用户的历史语音数据中检索出的语音关键词相关的语音指令和基于当前用户的历史语音数据中检索出的语音关键词相关的语音指令分别进行排序。
[0123]
相应的，本技术实施例对于预设数量也不做限制，可以根据实际情况具体设置。在一些实施例中，也可以基于语音关键词相关的语音指令的确定方式，分别设置对应的预设数量。
[0124]
示例性的，图3示例性示出了根据一些实施例的确定用户意图的示意图。如图3所示，针对对应语音关键词“打开”，基于所有用户的历史语音数据中检索出的语音关键词相关的语音指令中，可以取历史请求次数最高的3个“打开中央一台”、“打开xxx游戏”和“打开
历史记录”语音指令对应的用户意图信息。基于当前用户的历史语音数据中检索出的语音关键词相关的语音指令中，也取历史请求次数最高的3个“打开空调”、“打开电影频道”和“打开卧室灯”语音指令对应的用户意图信息。通过该方式，可以从两个侧面推测备选的用户意图信息。后续的，可以将上述两种方式确定的6个备选的用户意图信息均发送给电子设备。
[0125]
本技术实施例提供的语音识别方法，首先服务器接收电子设备发送的待识别的语音数据。其次，若未识别出语音数据对应的语音指令，服务器则提取语音数据中的语音关键词。再次，服务器根据历史语音数据，确定语音关键词相关的语音指令。最后，服务器将语音关键词相关的语音指令对应的至少一个备选的用户意图信息发送给电子设备。与现有技术相比，本技术实施例通过在未识别出语音数据对应的语音指令时，将语音关键词相关的语音指令对应的至少一个备选的用户意图信息发送给电子设备，以便电子设备显示备选的用户意图信息，从而提高了语音识别的智能化水平。
[0126]
在上述实施例的基础上，下面对于电子设备和服务器的交互过程进行说明。图4示例性示出了根据一些实施例的一种语音识别方法的信令交互图，如图4所示，该方法包括：
[0127]
s401、电子设备接收用户输入的待识别的语音数据，语音数据中缺少组成用户意图的必要关键词；
[0128]
s402、电子设备将待识别的语音数据发送给服务器。
[0129]
s403、若未识别出语音数据对应的语音指令，服务器则提取语音数据中的语音关键词。
[0130]
s404、服务器根据历史语音数据，确定语音关键词相关的语音指令。
[0131]
s405、服务器将语音关键词相关的语音指令对应的至少一个备选的用户意图信息发送给电子设备。
[0132]
s406、电子设备在显示界面上显示至少一个备选的用户意图信息。
[0133]
s401-s406的技术名词、技术效果、技术特征，以及可选实施方式，可参照图2所示的s301-s304理解，对于重复的内容，在此不再累述。
[0134]
在上述实施例的基础上，下面对于服务器如何确定语音关键词相关的语音指令的过程进行说明。图5示例性示出了根据一些实施例的另一种语音识别方法的流程示意图，如图5所示，该方法包括：
[0135]
s501、接收电子设备发送的待识别的语音数据。
[0136]
s502、若未识别出语音数据对应的语音指令，则提取语音数据中的语音关键词。
[0137]
s503、从数据库中的所有用户的历史语音数据中，检索语音关键词相关的语音指令。
[0138]
s504、确定输入语音数据的当前用户。
[0139]
s505、从数据库中的当前用户的历史语音数据中，检索语音关键词相关的语音指令。
[0140]
s506、确定语音关键词相关的语音指令的历史请求次数。
[0141]
s507、根据历史请求次数将语音关键词相关的语音指令由大到小进行排序。
[0142]
s508、根据语音关键词相关的语音指令的排序，确定预设数量的语音关键词相关的语音指令对应的至少一个备选的用户意图信息。
[0143]
s509、将至少一个备选的用户意图信息发送给电子设备。
[0144]
s501-s409的技术名词、技术效果、技术特征，以及可选实施方式，可参照图2所示的s301-s304理解，对于重复的内容，在此不再累述。
[0145]
在上述实施例的基础上，下面对于电子设备侧如何与服务器进行交互进行说明。图6示例性示出了根据一些实施例的再一种语音识别方法的流程示意图，本实施例的执行主体为电子设备，如图6所示，该方法包括：
[0146]
s601、接收用户输入的语音数据，语音数据中缺少组成用户意图的必要关键词。
[0147]
s602、向服务器发送语音数据。
[0148]
s603、接收服务器发送的至少一个备选的用户意图信息，用户意图信息与语音数据中的语音关键词相关的语音指令对应，语音关键词相关的语音指令是从历史语音数据中确定的。
[0149]
s604、在显示界面上显示至少一个备选的用户意图信息。
[0150]
在一些实施例中，电子设备接收到服务器发送的语音数据对应的至少一个备选的用户意图信息后，还可以在电子设备上显示备选的用户意图信息，以提示用户。
[0151]
需要说明的是，在本技术实施例中，当电子设备显示备选的用户意图信息时，可以进入免唤醒状态，并向用户进行提示，以便及时接收用户选择的用户意图信息，并生成相应的语音指令。
[0152]
示例性的，图7示例性示出了根据一些实施例的一种电子设备的界面示意图。图8示例性示出了根据一些实施例的另一种电子设备的界面示意图。如图7所示，用户在输入“打开”时，服务器无法确定该语音数据对应的语音指令，此时，在图7所示的界面上，可以显示提示信息“您想打开什么呢”，并且显示“打开”相关的备选的用户意图信息“打开空调”、“打开电影频道”、“打开卧室灯”、“打开中央一台”、“打开xxx游戏”、“打开历史记录”。当用户基于显示的用户意图信息再次进行语音输入时，电子设备跳转至如图8所示的界面，显示用户再次输入的语音数据“打开电源频道/打开第二个”和电子设备的回复“好的，已为您打开电源频道”，并执行相应语音指令。
[0153]
图9示例性示出了根据一些实施例的服务器的结构示意图。该服务器可以通过软件、硬件或者两者的结合实现，以执行上述实施例中服务器侧的的语音识别方法。如图9所示，该服务器700包括：存储器701和处理器702。
[0154]
存储器701用于存储可执行程序，处理器702被配置为：
[0155]
接收电子设备发送的待识别的语音数据；
[0156]
若未识别出语音数据对应的语音指令，则提取语音数据中的语音关键词；
[0157]
根据历史语音数据，确定语音关键词相关的语音指令；
[0158]
将语音关键词相关的语音指令对应的至少一个备选的用户意图信息发送给电子设备。
[0159]
在本技术一些实施例中，处理器702具体被配置为：
[0160]
从数据库中的所有用户的历史语音数据中，检索语音关键词相关的语音指令。
[0161]
在本技术一些实施例中，处理器702具体被配置为：
[0162]
确定输入语音数据的当前用户；
[0163]
从数据库中的当前用户的历史语音数据中，检索语音关键词相关的语音指令。
[0164]
在本技术一些实施例中，若语音关键词为动词，则处理器702具体被配置为：
[0165]
通过前缀检索算法，从历史语音数据中检索出以语音关键词为前缀的语音指令。
[0166]
本技术一些实施例中，处理器702具体被配置为：
[0167]
根据设备连接信息，在历史语音数据中筛选出语音关键词相关的语音指令。
[0168]
在本技术一些实施例中，处理器702具体被配置为：
[0169]
确定语音关键词相关的语音指令的历史请求次数；
[0170]
根据历史请求次数将语音关键词相关的语音指令由大到小进行排序；
[0171]
根据语音关键词相关的语音指令的排序，确定预设数量的语音关键词相关的语音指令对应的至少一个备选的用户意图信息；
[0172]
将至少一个备选的用户意图信息发送给电子设备。
[0173]
本技术实施例提供的服务器，可以执行上述方法实施例中服务器侧的语音识别动作，其实现原理和技术效果类似，在此不再赘述。
[0174]
图10示例性示出了根据一些实施例的电子设备的结构示意图。该服务器可以通过软件、硬件或者两者的结合实现，以执行上述实施例中服务器侧的的语音识别方法。如图10所示，该电子设备800包括：通信器801和控制器802。
[0175]
通信器801，用于与服务器进行数据通信，接收服务器发送的数据，以及向服务器发送数据；
[0176]
控制器802与通信器801连接，控制器802被配置为：
[0177]
接收用户输入的语音数据，语音数据中缺少组成用户意图的必要关键词；
[0178]
向服务器发送语音数据；
[0179]
接收服务器发送的至少一个备选的用户意图信息，用户意图信息与语音数据中的语音关键词相关的语音指令对应，语音关键词相关的语音指令是从历史语音数据中确定的。
[0180]
本技术一些实施例中，控制器802还被配置为：
[0181]
在显示界面上显示至少一个备选的用户意图信息。
[0182]
本技术实施例提供的电子设备，可以执行上述方法实施例中电子设备侧的的语音识别动作，其实现原理和技术效果类似，在此不再赘述。
[0183]
本技术实施例还提供一种程序，该程序在被处理器执行时用于执行以上方法实施例提供的语音识别方法。
[0184]
本技术实施例还提供一种程序产品，例如计算机可读存储介质，该程序产品中存储有指令，当其在计算机上运行时，使得计算机执行上述方法实施例提供的语音识别方法。
[0185]
在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时，全部或部分地产生根据本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机
可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，dvd)、或者半导体介质(例如固态硬盘solid state disk(ssd))等。
[0186]
最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种语音降噪方法、装置、存储介质及设备与流程

语音识别方法、服务器以及电子设备与流程

相关文献

最热文献