农林渔牧食品/饮料服装/饰品纺织/造纸医疗/保健机械/机床家具/门窗喷涂/染料道路/铁路

摄影/光学乐器/声学照明/工业冶金/铸造安全/消防建筑/工具控制/调节计算,推算其他产品

热搜：真空泵封装包装食品玩具

首页 > 乐器,声学设备的制造及制作,分析技术 > 正文

终端设备的语音处理方法、终端设备及可读存储介质与流程

2021-08-27 13:36:00 来源：中国专利 TAG：终端设备语音可读方法存储介质

本发明涉及语音处理技术领域，尤其涉及一种终端设备的语音处理方法、终端设备及可读存储介质。

背景技术：

基于语音控制技术，用户无需操作遥控器，只需语音输入就可以实现对终端设备的控制(如，控制电视音量、控制空调温度等)，方便又实用。

然而，现有的语音控制方案中，当远场语音控制功能处于开启状态时，终端设备会对任意用户所发出的语音指令作出响应，如此，在一些特定的应用场景下，因无法有针对性的响应指定用户的语音指令，会导致终端设备容易出现误操作。例如，大人观看电视节目时，小孩觉得远场语音好玩，在旁边呼叫语音指令(如，小维小维，我要看西游记动画片)，会使电视退出当前的电视节目，导致电视出现误操作。

技术实现要素：

本发明主要目的在于提供一种终端设备的语音处理方法、终端设备及可读存储介质，旨在提高终端设备的控制操作的准确性。

为实现上述目的，本发明提供一种终端设备的语音处理方法，所述方法包括以下步骤：

接收语音信号；

获取所述终端设备当前的语音控制模式；

根据所述语音信号获取发送所述语音信号的用户的身份信息；

在所述身份信息与所述语音控制模式支持的预设身份信息匹配时，对所述语音信号进行处理。

可选地，所述获取所述终端设备当前的语音控制模式的步骤之后，还包括：

若所述语音控制模式为通用语音控制模式，则在所述语音信号中存在预设唤醒词时，对所述预设唤醒词对应的语音信号进行处理；

若所述语音控制模式为定制语音控制模式，则执行所述根据所述语音信号获取发送所述语音信号的用户的身份信息的步骤。

可选地，所述获取所述终端设备当前的语音控制模式的步骤之前，还包括：

接收语音控制模式设置指令；

根据所述语音控制模式设置指令设置所述语音控制模式。

可选地，所述根据所述语音控制模式设置指令设置所述语音控制模式的步骤之后，还包括：

若所述语音控制模式为定制语音控制模式，则显示所述定制语音控制模式对应的操作提示信息；

接收根据所述操作提示信息输入的语音信息；

根据所述语音信息获取发送所述语音信息的用户的身份信息；

以发送所述语音信息的用户的身份信息作为所述定制语音控制模式对应的预设身份信息。

可选地，所述获取所述终端设备当前的语音控制模式的步骤包括：

获取接收到所述语音信号的时间点；

根据所述时间点确定所述语音控制模式。

可选地，所述对所述语音信号进行处理的步骤包括：

将所述语音信号发送至连接的目标终端，以供目标终端根据所述语音信号执行相应的操作；

或者，识别所述语音信号中的控制信息，将所述控制信息发送至连接的目标终端，以供所述目标终端响应接收到的所述控制信息。

可选地，所述识别所述语音信号中的控制信息的步骤，包括：

识别所述语音信号中的预设唤醒词；

根据所述预设唤醒词获取发送所述预设唤醒词的用户的声纹信息；

根据所述声纹信息识别所述语音信号中的所述控制信息。

可选地，所述根据所述声纹信息从所述语音信号中识别所述控制信息的步骤包括：

若存在多个所述声纹信息，则获取所述声纹信息对应的语音信号的响度；

根据所述响度从多个所述语音信号中确定目标语音信号，并确定目标语音信号对应的目标声纹信息；

根据所述目标声纹信息识别所述语音信号中的所述控制信息。

此外，为实现上述目的，本发明还提供一种终端设备，所述终端设备包括存储器、处理器及存储在所述处理器上并可在处理器上运行的终端设备的语音处理程序，所述处理器执行所述终端设备的语音处理程序时实现如上所述的终端设备的语音处理方法的步骤。

此外，为实现上述目的，本发明还提供一种可读存储介质，所述可读存储介质上存储有终端设备的语音处理程序，所述终端设备的语音处理程序被处理器执行时实现如上所述的终端设备的语音处理方法的步骤。

本发明实施例中，通过接收语音信号，并获取终端设备当前的语音控制模式，然后根据语音信号获取发送语音信号的用户的身份信息，并在所获取的身份信息与语音控制模式支持的预设身份信息匹配时，对语音信号进行处理，可以避免对语音控制模式不支持的用户的语音信号进行处理，导致终端设备出现误操作。如此，以发送语音信号的用户的身份信息与语音控制模式支持的预设身份信息匹配作为对语音信号进行处理的前提条件，可以针对性地对语音控制模式支持的用户的语音信号进行处理，以提高语音信号处理的准确性，提升用户体验感。

附图说明

图1为本发明实施例方案涉及的硬件运行环境的终端设备结构示意图；

图2是本发明终端设备的语音处理方法第一实施例的流程示意图；

图3为本发明终端设备的语音处理方法第二实施例的流程示意图；

图4为本发明终端设备的语音处理方法第三实施例的流程示意图；

图5为本发明终端设备的语音处理方法第四实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明的主要解决方案是：接收语音信号；获取所述终端设备当前的语音控制模式；根据所述语音信号获取发送所述语音信号的用户的身份信息；在所述身份信息与所述语音控制模式支持的预设身份信息匹配时，对所述语音信号进行处理。

由于现有的语音控制方案中，当远场语音控制功能处于开启状态时，终端设备会对任意用户所发出的语音指令作出响应，而无法有针对性的响应指定用户的语音指令，容易导致终端设备出现误操作，无法满足用户的定制化需求。因而，本发明提出的上述解决方案，旨在在不同应用场景下针对不同用户的语音指令进行响应，避免终端设备出现误操作。

参照图1，图1为本发明实施例方案涉及的硬件运行环境的终端设备结构示意图。

如图1所示，该终端设备可以包括：通信总线1002，处理器1001，例如cpu，用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器，也可以是稳定的存储器(non-volatilememory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的终端设备结构并不构成对终端设备的限定，可以包括比图示更多或更少的部件，或组合某些部件，或者不同的部件布置。

在图1所示的终端设备中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的终端设备的语音处理程序，并执行以下终端设备的语音处理方法各实施例的相关步骤。

基于上述终端设备结构提出本发明终端设备的语音处理方法的第一实施例。参照图2，本实施例中，所述终端设备的语音处理方法包括以下步骤：

步骤s10：接收语音信号；

需要说明的是，本实施例中的终端设备可以是具有语音控制功能的第一类终端设备，如电视机、ai音箱等，或者是，可对连接的终端设备进行控制且具有语音控制功能的第二类终端设备，如遥控器、智能家居的中控系统等。

在终端设备开启语音控制功能后，终端设备的语音采集装置(如，麦克风、语音采集器等)便可对周围环境中的语音信号进行实时采集。所接收的语音信号可包括单个用户发送的语音信号，也可包括多个用户发送的语音信号。

为了提高语音处理的有效性，在识别到所接收的语音信号包括终端设备的有效语音信息时，才会进行下一步处理，以提高语音控制的有效性。所述有效语音信息可以是终端设备对应的唤醒词(如，小维小维)，也可以是终端设备对应的关键词(如，温度、频道等)，还可以是语音信号的来源信息(如指定的app)等。

例如，对于需要唤醒词唤醒的终端设备，在接收的语音信号中存在终端设备的预设唤醒词时，认为所接收的语音信号包括终端设备的有效语音信息，否则，认为所接收的语音信号不包括终端设备的有效语音信息，此时不会进行下一步处理，以避免资源浪费。对于可基于关键词实现控制的终端设备，在语音信号中存在预设关键词时，认为所接收的语音信号包括终端设备的有效语音信息。如，对于智能家居的中控系统，在识别到“温度”、“℃”等关键词时，可实现对空调的控制，在识别到“播放”“音乐”等关键词时，可实现对音箱的控制等；对于可通过指定工具实现控制的终端设备，若识别到语音信号的来源为指定工具，则认为所接收的语音信号包括终端设备的有效语音信息。如，在手机安装的空调遥控器软件内输入的语音信息，可实现对空调遥控器软件绑定的空调的控制。

步骤s20：获取所述终端设备当前的语音控制模式；

不同语音控制模式可支持的用户的身份信息不同。因而，当所接收的语音信号为终端设备当前的语音控制模式支持的用户发送的语音信号，且该语音信号中存在终端设备对应的有效语音信息时，才能实现对终端设备的有效控制，避免终端设备出现误操作。于是，在确认所接收到的语音信号包括终端设备对应的有效语音信息时，还需要进一步获取终端设备当前的语音控制模式，以确认发送语音信号的用户是否为终端设备当前的语音控制模式支持的用户。

其中，获取终端设备当前的语音控制模式的方式可以是：根据用户的操作指令确定终端设备当前的语音控制模式，如，在接收到语音信号之前，若用户在通过语音或按键等方式将终端设备的语音控制模式设置为家长控制模式，则可以获取到终端当前的语音控制模式为家长控制模式。当然，若终端设备开机之后未接收到关于语音控制模式的操作指令，则终端设备当前的语音控制模式为系统默认的语音控制模式，如，通用语音控制模式；还可以根据具体的场景信息获取终端设备当前的语音控制模式，例如，当场景中只识别到家长没有识别到孩童时，可认为终端设备当前的语音控制模式为家长控制模式；当场景中只识别到孩童没有识别到家长时，可认为终端设备当前的语音控制模式为孩童控制模式；或者，当场景中同时存在家长和孩童时，若家长距离终端设备较近，则可认为终端设备当前的语音控制模式为家长控制模式；若孩童距离终端设备较近，则可认为终端设备当前的语音控制模式为孩童控制模式等。

一实施例中，获取终端设备当前的语音控制模式的方式还可以是：根据接收到语音信号的时间点获取终端设备当前的语音控制模式。具体地，可根据用户的历史使用数据确定用户的语音控制习惯，进而可根据语音控制习惯自动生成不同时间段与语音控制模式的对应关系，如此，根据该对应关系即可确定终端设备在不同时间段对应的语音控制模式；还可由用户自行设置不同时间段对应的语音控制模式，进而根据预先设置的不同时间段与语音控制模式的对应关系确定终端设备当前的语音控制模式。如，在18点至20点为孩童的学习时，可将终端设备的语音控制模式设置为家长控制模式，而在20点至21点，可将终端设备的语音控制模式设置为孩童控制模式。

需要说明的是，本实施例中终端设备的语音控制模式可包括通用语音控制模式、个人语音控制模式和自定义语音控制模式等，由于不同终端设备对应可支持的语音控制模式不同，此处仅作列举不作具体限定。其中，通用语音控制模式下，可以以终端设备对应的唤醒词作为通用语音控制模式支持的用户的身份信息，也即，发送的语音信息中包含终端设备对应的唤醒词的用户均可以作为语音控制模式支持的用户；个人语音控制模式下可包括不同家庭成员对应的语音控制子模式，如，家长控制模式和孩童控制模式等，可由用户在个人语音控制模式下进一步自行选择等；自定义语音控制模式下，用户可以自定义不同的语音控制模式，不同语音控制模式对应的用户的身份信息，以及不同语音控制模式对应的控制时间点与场景信息等。

另外，不同语音控制模式可支持的用户的身份信息，可预先将不同语音控制模式与其支持的用户的身份信息进行关联存储，使得在获取到终端设备当前的语音控制模式后，可以获取到与终端设备当前的语音控制模式关联存储的身份信息，也即，可以获取到终端设备当前的语音控制模式支持的预设身份信息。其中，同一语音控制模式可对应单个用户的身份信息，也可对应两个或两个以上的用户的身份信息。为了实现对不同语音控制模式对应的用户的身份信息的区分，可为不同语音控制模式设置不同的用户信息数据库，以将不同语音控制模式对应的用户的身份信息存储至相应的用户数据库中，实现对不同语音控制支持的用户的身份信息的区分。如此，针对不同的语音控制模式可从不同的用户数据库中进行用户身份信息的调用，以确保数据调用的准确性与有效性。

步骤s30：根据所述语音信号获取发送所述语音信号的用户的身份信息；

要确认发送语音信号的用户是否为终端设备当前的语音控制模式支持的用户，还需要获取发送语音信号的用户的身份信息。而不同用户的身份信息可通过不同用户的声纹信息进行区分，可通过对接收到的语音信号进行声纹识别提取所述语音信号中的声纹特征信息，然后将所提取的声纹特征信息与预先存储的声纹特征信息库中不同用户的声纹特征信息特征进行比对，进而可根据比对结果获取发送语音信号的用户的身份信息。所提取的声纹特征信息包括但不限于发送语音信号的用户的性别信息、年龄信息、情绪状态信息以及语言版本信息等。

其中，声纹特征信息库中预先存储有不同身份信息对应的声纹特征信息，且声纹特征信息库可以在本地建立，也可以在服务器建立。若声纹特征信息库存储于终端设备本地，则在对接收的语音信号进行声纹识别之后，可以直接从本地调用声纹特征信息库进行特征比对，以获取发送语音信号的用户的身份信息；若声纹特征信息库存储于服务器，则需要将所提取的声纹特征信息以音频文件的格式进行存储，然后发送至服务器，由服务器遍历声纹特征信息库以查找与所提取的声纹特征信息匹配的用户的身份信息。当然，在其他实施例中，声纹特征信息库也可以是存储于与终端设备链接的目标终端，如电视机、音箱等。

在根据语音信号获取发送语音信号的用户的身份信息时，具体可以是根据语音信号中的唤醒词或关键词等有效语音信息进行语音识别以获取发送语音信号的用户的身份信息，也可以是根据完整的语音信号获取发送语音信号的用户的身份信息。

需要说明的是，这里对获取终端设备当前的语音控制模式的步骤和根据语音信号获取发送语音信号的用户的身份信息的步骤的执行顺序不作具体限定，可以是按照预设顺序先后执行也可以是同时执行。

步骤s40：在所述身份信息与所述语音控制模式支持的预设身份信息匹配时，对所述语音信号进行处理；

在获取发送语音信号的用户的身份信息时，可从语音控制模式对应的用户信息数据库中查询终端设备当前的语音控制模式支持的预设身份信息。然后，将发送语音信号的用户的身份信息与终端设备当前的语音控制模式支持的预设身份信息进行比对，进而根据比对结果确定是否执行对接收的语音信号进行处理的步骤。具体地，若发送语音信号的用户的身份信息包含于终端设备当前的语音控制模式支持的预设身份信息，则认为发送语音信号的用户的身份信息与终端设备当前的语音控制模式支持的预设身份信息匹配。当发送语音信号的用户的身份信息与终端设备当前的语音控制模式支持的预设身份信息匹配时，说明发送语音信号的用户为当前的语音控制模式所支持的用户。此时，认为满足对语音信号进行处理的前提条件，可对语音信号进行处理。而当发送语音信号的用户的身份信息与终端设备当前的语音控制模式支持的预设身份信息不匹配时，则不对该语音信号进行处理，防止误操作。

对语音信号进行处理具体可以是：对语音信号进行识别以获取语音信号中的控制信息；也可以是对语音信号进行转发，将语音信号转发至与终端设备连接的目标终端，以实现对目标终端的控制；还可以是先对语音信号进行识别获取语音信号中的控制信息，然后对语音信号中的控制信息进行转发，将控制信息转发至与终端设备连接的目标终端，以实现对目标终端的控制等。在对语音信号进行处理时，接收语音信号的终端设备类型不同，对应的处理方式也会有所不同。例如，若接收语音信号的终端设备为第一类设备，则对应的处理方式可以是对语音信号进行识别后，获取语音信号中的控制信息，根据该控制信息做出相应的响应；若接收语音信号的终端设备为第二类设备，则对应的处理方式可以是直接将语音信号转发至与终端设备连接的目标终端(如电视机)，也可以是识别语音信号中的控制信息后，将所识别的控制信息发送至与与终端设备连接的目标终端等。

本实施例通过将发送语音信号的用户的身份信息与终端设备当前的语音控制模式支持的预设身份信息进行匹配，使得存在多个用户的语音信号时，可以有针对性的对语音控制模式支持的用户发送的语音信号进行处理，避免存在语音控制模式不支持的用户的语音信号时，对该语音信号进行处理，导致终端设备出现误操作。也即，通过将发送语音信号的用户的身份信息与终端设备当前的语音控制模式支持的预设身份信息进行匹配，能够有针对性地满足不同用户在应用场景下的语音控制需求，进而提高语音处理的准确性。

基于上述实施例提出本发明终端设备的语音处理方法的第二实施例。参照图3，本实施例中，所述终端设备的语音处理方法包括以下步骤：

步骤s10：接收语音信号；

步骤s20：获取所述终端设备当前的语音控制模式；

步骤s21：若所述语音控制模式为通用语音控制模式，则在所述语音信号中存在预设唤醒词时，对所述预设唤醒词对应的语音信号进行处理；

步骤s31：若所述语音控制模式为定制语音控制模式，则根据所述语音信号获取发送所述语音信号的用户的身份信息；

步骤s32：在所述身份信息与所述定制语音控制模式支持的预设身份信息匹配时，对所述语音信号进行处理。

本实施例中终端设备支持的语音控制模式可包括通用语音控制模式和定制语音控制模式，不同的语音控制模式对应的进行语音信号处理的前提条件不同。

具体地，在接收到语音信号并获取到终端设备当前的语音控制模式之后，若终端设备当前的语音控制模式为通用语音控制模式，则只要语音信号中包含终端设备对应的预设唤醒词，就可以唤醒终端设备，而无需获取发送语音信号的用户的身份信息。此时，可对预设唤醒词对应的语音信号进行处理以实现对终端设备或与终端设备连接的目标终端的控制。于是，在终端设备当前的语音控制模式为通用语音控制模式时，可先对接收的语音信号进行识别，以确认语音信号中是否存在可以唤醒终端设备的预设唤醒词。若语音信号中存在预设唤醒词，可对预设唤醒词进行声纹识别，以根据所识别的声纹信息匹配与该预设唤醒词一起构成语音控制指令的控制信息。例如，在该语音信号中存在“小维小维”的唤醒词时，可以根据该发送“小维小维”这一唤醒词的用户的声纹信息进一步确认该用户的控制信息，防止识别到小孩说的唤醒词后，小孩说出“我要看动画片”的同时，妈妈说“我要看电影”，而错误的对妈妈的控制指令做出响应。

在终端设备当前的语音控制模式为定制语音控制模式时，为了有针对性的响应指定用户的语音指令，可预先为定制语音控制模式设置支持的预设身份信息。进而，在对语音信号进行处理之前，需要确认发送语音信号的用户是否当前语音控制模式所支持的用户。也即，在终端设备当前的语音控制模式为定制语音控制模式时，需要根据语音信号线获取发送语音信号的用户的身份信息，进而在发送语音信号的用户的身份信息与语音控制模式支持的预设身份信息匹配时，对语音信号进行处理。

本实施例中，在通用语音控制模式下，若语音信号中存在预设唤醒词，就对预设唤醒词对应的语音信号进行处理，而在定制语音控制模式下，若发送语音信号的用户的身份信息与语音控制模式支持的预设身份信息匹配，才对语音信号进行处理，也即，不同的语音控制模式可对应不同的进行语音信号处理的条件，使得可以有针对性地满足用户在不同应用场景下的语音控制需求，提高语音控制的灵活性。

基于上述实施例提出本发明终端设备的语音处理方法的第三实施例。参照图4，本实施例中，所述终端设备的语音处理方法包括以下步骤：

步骤s01：接收语音控制模式设置指令；

步骤s02：根据所述语音控制模式设置指令设置所述终端设备当前的语音控制模式；

步骤s10：接收语音信号；

步骤s20：获取所述终端设备当前的语音控制模式；

步骤s30：根据所述语音信号获取发送所述语音信号的用户的身份信息；

步骤s40：在所述身份信息与所述语音控制模式支持的预设身份信息匹配时，对所述语音信号进行处理。

本实施例中，在终端设备开机后，用户可以根据自身需求设置终端设备的语音控制模式，以便终端设备根据所设置的语音控制模式进行语音识别与语音处理，从而有针对性对相应用户的语音指令做出响应。

具体地，对于第一类设备，用户可以通过终端设备的遥控设备触发语音控制模式设置指令，或者在终端设备上以按键或语音等的方式触发语音控制模式设置指令，或者在终端设备的显示界面上以触控等方式触发语音控制模式设置指令，或者是以语音输入的方式触发语音控制模式设置指令等。对于第二类设备，用户可以直接在终端设备上进行按键操作以触发语音控制模式设置指令；也可以是以语音输入的方式触发语音控制模式设置指令等。

终端设备在接收到语音控制模式设置指令之后，可根据该语音控制模式设置指令设置终端设备当前的语音控制模式。例如，用户可以选择通用语音控制模式，进而可以生成通用语音控制模式设置指令以将终端设备的语音控制模式设置为通用语音控制模式，或者，用户可以选择定制语音控制模式，进而生成定制语音控制模式设置指令以将终端设备的语音控制模式设置为定制语音控制模式。于是，在获取终端设备当前的语音控制模式时，可以先检测是否有接收到语音控制模式设置指令，若未接收到语音控制模式设置指令，则认为终端设备当前的语音控制模式为系统默认设置的语音控制模式；若接收到语音控制模式设置指令，则需要确定语音控制模式设置指令的指令类型，进而根据该指令类型确定终端设备当前的语音控制模式。如，若接收到通用语音控制模式设置指令，则确定终端设备当前的语音控制模式为通用语音控制模式；若接收到定制语音控制模式设置指令，则确定终端设备当前的语音控制模式为定制语音控制模式。

在将终端设备当前的语音控制模式设置为定制语音控制模式时，为了满足用户的定制需求，可由用户自定义设置定制语音控制模式支持的预设身份信息。于是，一实施例中，在用户将终端设备当前的语音控制模式设置为定制语音控制模式时，可对应显示定制语音控制模式对应的操作提示信息，以提示用户输入语音信息，所述操作提示信息可以是在终端设备的显示界面上进行显示，或者是在与终端设备连接的目标终端上进行显示，当然，也可以是以语音等方式输出该操作提示信息，此处不作具体限定。例如，可在终端设备或与终端设备连接的目标终端的显示界面上显示：请说一段话，例如“小维，小维”“今天天气怎么样”等，或者直接语音输出：请说一段话，例如“小维，小维”“我想听刘德华的歌”等。

接着，用户可根据所显示的操作提示信息触发确认指令以进入语音采集状态，采集用户根据所显示的操作提示信息所输入的语音信息。终端设备在接收到根据提示信息输入的语音信息时，可对该语音信息进行识别，以获取该语音信息的声纹信息，进而以该声纹信息作为发送语音信息的用户的身份信息，将该身份信息存储至定制语音控制模式对应的用户信息数据库中，以发送语音信息的用户的身份信息作为定制语音控制模式对应的预设身份信息。如此，在发送语音信号的用户的身份信息与存储于定制语音控制模式对应的用户信息数据库中的预设身份信息匹配时，终端设备才会对该语音信号进行处理。这里，在录入语音信息时，可以是录入单个用户的语音信息，也可以是录入多个用户的语音信息，对应地，定制语音控制模式对应的预设身份信息可以是单个用户的身份信息，也可以是多个用户的身份信息，可由用户根据自身需求进行设置，以最大程度的满足不同用户的语音控制需求。

本实施例通过接收语音控制模式设置指令，根据语音控制模式设置指令设置语音控制模式，使得终端设备的语音控制模式能够满足用户在不同应用场景下的用户需求。也即，用户可以根据自身需求设置终端设备的语音控制模式，以提高语音控制的灵活性。

基于上述实施例提出本发明终端设备的语音处理方法的第四实施例。参照图5，本实施例中，所述终端设备的语音处理方法包括以下步骤：

步骤s10：接收语音信号；

步骤s20：获取所述终端设备当前的语音控制模式；

步骤s30：根据所述语音信号获取发送所述语音信号的用户的身份信息；

步骤s41：在所述身份信息与所述语音控制模式支持的预设身份信息匹配时，将所述语音信号发送至连接的目标终端，以供目标终端根据所述语音信号执行相应的操作；

步骤s42：在所述身份信息与所述语音控制模式支持的预设身份信息匹配时，识别所述语音信号中的控制信息，将所述控制信息发送至连接的目标终端，以供所述目标终端响应接收到的所述控制信息。

本实施例中的终端设备尤指可支持语音控制且可对与该终端设备连接的目标终端进行控制的第二类设备，也即，终端设备作为目标终端的控制设备，可对目标终端进行控制。

为了实现对目标终端的控制，一方面，在对语音信号进行处理时，可将语音信号发送至与终端设备连接的目标终端，然后由目标终端对该语音信号进行识别以获取该语音信号中的控制信息后，根据该控制信息执行相应的操作，以实现对目标终端的控制。另一方面，可由终端设备识别语音信号中的控制信息后，将控制信息发送至与终端设备连接的目标终端，然后目标终端可以对所接收到的控制信息做出响应，以实现对目标终端的控制。具体可根据终端设备和目标终端的不同有针对性地选择，此处不做具体限定。

其中，在识别语音信号中的控制信息时，具体可以是：先识别语音信号中的预设唤醒词，然后对该唤醒词进行声纹识别获取到发送该预设唤醒词的用户的声纹信息，再根据该声纹信息从语音信号中识别出接收到预设唤醒词的预设时间内该用户发送的语音信息，所识别出的语音信息即为该用户发送的控制信息。

另外，根据预设唤醒词获取发送预设唤醒词的用户的声纹信息之后，倘若获取到多个声纹信息，则说明存在多个身份信息与终端设备当前的语音控制模式支持的预设身份信息匹配的用户，此时，可通过语音信号的响度匹配到距离终端设备最近的用户发送的控制信息。

具体地，在根据预设唤醒词获取到多个声纹信息时，可进一步获取各声纹信息对应的用户的语音信号的响度。具体可以是：先识别各声纹信息对应的语音信号的声压级和频率，然后根据声压级和频率确定各语音信号的响度。在获取到各语音信号的响度之后，可根据不同语音信号的响度从多个语音信号中确定目标语音信号。具体可以是：将响度最大的语音信号作为目标语音信号。通常情况下，响度越大说明用户距离终端设备越近，响度越小说明用户距离终端设备越远，也即，将距离终端设备最近的用户发送的语音信号作为目标语音信号。

接着，在确定目标语音信号之后，可对目标语音信号进行语音识别，以确定目标语音信号对应的目标声纹信息。具体可以是：直接对目标语音信号进行声纹识别，得到目标语音信号对应的声纹信息，也可以是先识别目标语音信号中的预设唤醒词，进而根据预设唤醒词获取发送预设唤醒词的用户的声纹信息作为目标声纹信息等。在确定目标语音信号对应的目标声纹信息之后，可根据目标声纹信息从语音信号中识别出接收到预设唤醒词的预设时间内该用户发送的语音信息，以该语音信息即为该用户发送的控制信息。

本实施例通过将语音信号发送至与终端设备连接的目标终端，以供目标终端根据语音信号执行相应的操作的方式，或者，通过识别语音信号中的控制信息，将控制信息发送至与终端设备连接的目标终端，以供目标终端响应接收到的控制信息的方式，使得可以通过终端设备实现对目标终端的控制，如此，不仅可以实现对终端设备的控制还可以实现对目标终端的控制，使得用户可以通过终端设备对目标终端的进行远程控制，提高了终端控制的便利性。

此外，本发明实施例还提供一种可读存储介质，所述可读存储介质上存储有终端设备的语音处理程序，所述终端设备的语音处理程序被处理器执行时实现如上所述的终端设备的语音处理方法的步骤。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，电视，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：监室对讲机声纹识别方法、系统及存储器与流程

终端设备的语音处理方法、终端设备及可读存储介质与流程

相关文章

最热文献