一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

设备的控制方法和装置、存储介质及电子装置与流程

2022-07-02 09:13:19 来源:中国专利 TAG:


1.本发明涉及计算机领域,具体而言,涉及一种设备的控制方法和装置、存储介质及电子装置。


背景技术:

2.随着社会科技的进步,生活场景中,部署的设备种类越来越多,功能也越来越复杂,人们希望可以出现更加便捷的技术来配置每个成员对设备的控制权限。现有技术中,在用户对设备进行语音控制时,需要首先将每个用户的身份信息手动录入到设备中,才能根据每个用户的权限对设备进行相应的控制,这种复杂的方式给用户控制设备的过程带来很大的不便。
3.针对相关技术中,设备控制过程复杂度较高等问题,尚未提出有效的解决方案。


技术实现要素:

4.本发明实施例提供了一种设备的控制方法和装置、存储介质及电子装置,以至少解决相关技术中,设备控制过程复杂度较高等问题。
5.根据本发明实施例的一个实施例,提供了一种设备的控制方法,包括:
6.通过目标声纹识别模型对第一设备采集到的语音控制指令的声纹特征进行识别,得到所述语音控制指令对应的目标声纹信息;
7.根据目标声纹信息权限集,确定所述目标声纹信息对应的目标权限,其中,所述目标声纹信息权限集用于为目标场景记录具有对应关系的声纹特征和控制权限,所述控制权限用于指示不允许对应的声纹特征对所述目标场景中部署的一个或者多个设备执行的操作;
8.根据所述目标权限对所述语音控制指令进行处理。
9.可选的,在所述通过目标声纹识别模型对第一设备采集到的语音控制指令的声纹特征进行识别之前,所述方法还包括:
10.获取所述一个或者多个设备采集到的所述目标场景中的声音数据;
11.使用所述声音数据对初始识别模型进行训练,得到所述目标声纹识别模型以及所述目标场景中的声纹特征;
12.依据所述目标场景中的声纹特征生成所述目标声纹信息权限集。
13.可选的,所述使用所述声音数据对初始识别模型进行训练,得到所述目标声纹识别模型以及所述目标场景中的声纹特征,包括:
14.将所述声音数据输入所述初始识别模型,得到所述初始识别模型输出的识别结果;
15.使用所述识别结果对所述初始识别模型的模型参数进行调整,直至所述识别结果收敛;
16.将使得所述识别结果收敛的识别模型确定为所述目标声纹识别模型,并记录收敛
的识别结果作为所述目标场景中的声纹特征。
17.可选的,所述依据所述目标场景中的声纹特征生成所述目标声纹信息权限集,包括:
18.向所述目标场景对应的管理帐号发送权限设置提示,其中,所述权限设置提示用于提示所述管理帐号为所述目标场景中的声纹特征设置控制权限;
19.根据所述管理帐号执行的权限设置操作生成具有对应关系的声纹特征和控制权限,得到所述目标声纹信息权限集。
20.可选的,所述根据所述管理帐号执行的权限设置操作生成具有对应关系的声纹特征和控制权限,得到所述目标声纹信息权限集,包括:
21.向所述管理帐号发送声纹确认请求,其中,所述声纹确认请求用于请求所述管理帐号从所述目标场景中的声纹特征中确认所述管理帐号所对应的声纹特征;
22.将所述管理帐号响应所述声纹确认请求返回的声纹特征确定为所述管理帐号所对应的目标声纹特征;
23.根据采集到的具有所述目标声纹特征的目标语音设置指令生成具有对应关系的声纹特征和控制权限,得到所述目标声纹信息权限集,其中,所述权限设置操作包括所述目标语音设置指令。
24.可选的,所述根据采集到的具有所述目标声纹特征的语音设置指令生成具有对应关系的声纹特征和控制权限,得到所述目标声纹信息权限集,包括:
25.采集语音设置指令,其中,所述语音设置指令用于通过语音设置权限;
26.将所述语音设置指令所具有的声纹特征与所述目标声纹特征进行匹配;
27.在所述语音设置指令所具有的声纹特征与所述目标声纹特征匹配一致的情况下,将所述语音设置指令确定为所述目标语音设置指令。
28.可选的,所述根据所述目标权限对所述语音控制指令进行处理,包括:
29.在所述目标权限中不包括目标操作的情况下,控制第二设备执行所述语音控制指令,其中,所述语音控制指令用于控制所述第二设备执行所述目标操作;
30.在所述目标权限中包括所述目标操作的情况下,丢弃所述语音控制指令。
31.根据本发明实施例的另一个实施例,还提供了一种设备的控制装置,包括:识别模块,用于通过目标声纹识别模型对第一设备采集到的语音控制指令的声纹特征进行识别,得到所述语音控制指令对应的目标声纹信息;
32.确定模块,用于根据目标声纹信息权限集,确定所述目标声纹信息对应的目标权限,其中,所述目标声纹信息权限集用于为目标场景记录具有对应关系的声纹特征和控制权限,所述控制权限用于指示不允许对应的声纹特征对所述目标场景中部署的一个或者多个设备执行的操作;
33.处理模块,用于根据所述目标权限对所述语音控制指令进行处理。
34.根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述设备的控制方法。
35.根据本发明实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行
上述的设备的控制方法。
36.在本发明实施例中,通过目标声纹识别模型对第一设备采集到的语音控制指令的声纹特征进行识别,得到语音控制指令对应的目标声纹信息;根据目标声纹信息权限集,确定目标声纹信息对应的目标权限,其中,目标声纹信息权限集用于为目标场景记录具有对应关系的声纹特征和控制权限,控制权限用于指示不允许对应的声纹特征对目标场景中部署的一个或者多个设备执行的操作;根据目标权限对语音控制指令进行处理,即由于目标声纹识别模型是通过目标场景中部署的一个或者多个设备采集目标场景中的声音数据对初始识别模型进行训练得到的,因此对出现在目标场景中的声音进行分辨和识别的过程是由声纹识别模型的训练过程和使用过程自动完成的,无需手动向设备中录入用户的声纹,身份等信息,使用训练后的目标声纹识别模型能够对目标场景中的设备(比如第一设备)采集到的语音控制指令进行识别,从而得到该语音控制指令对应的目标声纹,再根据目标声纹对应的设备的控制权限(即目标声纹信息权限集)对采集到的语音控制指令进行相应的处理,使得设备的控制过程减少了用户手动录入和设置用户信息的过程,能够自动对目标场景中的声音进行识别并根据识别结果完成相应的设备控制操作。采用上述技术方案,解决了相关技术中,设备控制过程复杂度较高等问题,实现了降低了设备控制过程复杂度的技术效果。
附图说明
37.此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
38.图1是本发明实施例的一种设备的控制方法的计算机终端的硬件结构框图;
39.图2是根据本发明实施例的设备的控制方法的流程图;
40.图3是根据本发明实施例的声音数据采集过程的示意图;
41.图4是根据本发明实施例的识别模型训练过程的流程图;
42.图5是根据本发明实施例的目标声纹信息权限集的存储过程的示意图;
43.图6是根据本发明实施例的控制权限app设置界面的示意图;
44.图7是根据本发明实施例的确认请求界面的示意图;
45.图8是根据本发明实施例的权限设置过程的流程图;
46.图9是根据本发明实施例的设备的控制过程的示意图;
47.图10是根据本发明实施例的一种设备的控制装置的结构框图。
具体实施方式
48.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
49.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用
的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
50.本发明实施例所提供的方法实施例可以在计算机终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本发明实施例的一种设备的控制方法的计算机终端的硬件结构框图。如图1所示,计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)和用于存储数据的存储器104,在一个示例性实施例中,上述计算机终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机终端的结构造成限定。例如,计算机终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示等同功能或比图1所示功能更多的不同的配置。
51.存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的设备的控制方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
52.传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(network interface controller,简称为nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(radio frequency,简称为rf)模块,其用于通过无线方式与互联网进行通讯。
53.在本实施例中提供了一种设备的控制方法,应用于上述计算机终端,图2是根据本发明实施例的设备的控制方法的流程图,该流程包括如下步骤:
54.步骤s202,通过目标声纹识别模型对第一设备采集到的语音控制指令的声纹特征进行识别,得到所述语音控制指令对应的目标声纹信息;
55.步骤s204,根据目标声纹信息权限集,确定所述目标声纹信息对应的目标权限,其中,所述目标声纹信息权限集用于为目标场景记录具有对应关系的声纹特征和控制权限,所述控制权限用于指示不允许对应的声纹特征对所述目标场景中部署的一个或者多个设备执行的操作;
56.步骤s206,根据所述目标权限对所述语音控制指令进行处理。
57.通过上述步骤,由于目标声纹识别模型是通过目标场景中部署的一个或者多个设备采集目标场景中的声音数据对初始识别模型进行训练得到的,因此对出现在目标场景中的声音进行分辨和识别的过程是由声纹识别模型的训练过程和使用过程自动完成的,无需手动向设备中录入用户的声纹,身份等信息,使用训练后的目标声纹识别模型能够对目标
场景中的设备(比如第一设备)采集到的语音控制指令进行识别,从而得到该语音控制指令对应的目标声纹,再根据目标声纹对应的设备的控制权限(即目标声纹信息权限集)对采集到的语音控制指令进行相应的处理,使得设备的控制过程减少了用户手动录入和设置用户信息的过程,能够自动对目标场景中的声音进行识别并根据识别结果完成相应的设备控制操作。采用上述技术方案,解决了相关技术中,设备控制过程复杂度较高等问题,实现了降低了设备控制过程复杂度的技术效果。
58.在上述步骤s202提供的技术方案中,目标声纹识别模型可以对目标场景的用户的声纹特征进行识别,比如,在家庭生活场景中,目标声纹识别模型可以识别出每个家庭成员的声纹特征,识别出采集到的语音控制指令对应的声纹特征属于哪一位家庭成员。
59.可选地,在本实施例中,在目标场景中第一设备可以但不限于为多个,比如,在家庭生活场景中,第一设备可以是音箱或者电视等等,以保证语音控制指令的采集可以范围覆盖整个目标场景,比如,在家庭环境中,客厅的电视虽然可以作为第一设备,但是可能由于空间原因无法采集到在卧室发出的语音控制指令,那么,可以在卧室也部署一个音箱作为另一个第一设备,从而保证整个家庭环境的任何地点都可以采集到语音控制指令。
60.在一个示例性实施例中,在所述通过目标声纹识别模型对第一设备采集到的语音控制指令的声纹特征进行识别之前,还包括:获取所述一个或者多个设备采集到的所述目标场景中的声音数据;使用所述声音数据对初始识别模型进行训练,得到所述目标声纹识别模型以及所述目标场景中的声纹特征;依据所述目标场景中的声纹特征生成所述目标声纹信息权限集。
61.可选地,目标场景可以但不限于包括任何部署了智能设备并对智能设备的使用权限有权限设置需求的场景,比如:智能家庭场景,智能办公场景,智能教室场景和智能仓库场景等等。
62.可选地,在本实施例中,一个或者多个设备可以但不限于包括任何可以采集声音数据并且支持远程控制的电子设备,比如:烤箱,洗衣机,音箱和电视等等。
63.在一个示例性实施例中,可以但不限于通过以下方式使用所述声音数据对初始识别模型进行训练,得到所述目标声纹识别模型以及所述目标场景中的声纹特征:将所述声音数据输入所述初始识别模型,得到所述初始识别模型输出的识别结果;使用所述识别结果对所述初始识别模型的模型参数进行调整,直至所述识别结果收敛;将使得所述识别结果收敛的识别模型确定为所述目标声纹识别模型,并记录收敛的识别结果作为所述目标场景中的声纹特征。
64.可选地,在本实施例中,目标声纹识别模型的训练过程可以但不限于是通过目标场景中部署的一个或者多个设备采集所述目标场景中的声音数据对初始识别模型进行训练得到的,比如,在家庭生活场景部署之初,初始识别模型刚开始无法准确识别家庭成员的声纹特征,通过家庭生活场景部署的一个或者多个设备在使用过程中采集家庭成员的声音数据,并使用采集到的声音数据对初始训练模型进行一段时间的训练,可以得到能够区别出每个家庭成员声纹特征的目标声纹识别模型,也就是说,目标声纹识别模型是通过自主采集声音数据进行模型训练得到的模型,不需要用户多次录入家庭成员的声音数据,避免了用户复杂的操作。
65.可选地,在本实施例中,目标声纹识别模型可以但不限于是通过目标场景中部署
的一个或者多个设备采集所述目标场景中的声音数据对初始识别模型进行训练得到的,控制指令用于控制第二设备执行目标操作,一个或者多个设备包括所述第一设备和所述第二设备。
66.可选地,在本实施例中,图3是根据本发明实施例的声音数据采集过程的示意图,如图3所示,家庭环境中存在烤箱,空调,音箱和电视等设备,可以通过上述设备采集家庭环境中用户的声音数据,声音数据可以包含家庭环境中的所有成员的声音数据,也就是说,爸爸,妈妈和小孩的声音数据都可以被采集到,并上传到设备对应的服务器。在服务器上使用采集到的声音数据对初始识别模型进行训练,得到能够对采集到的语音控制指令进行声纹识别的目标声纹识别模型。
67.可选地,在本实施例中,初始识别模型可以但不限于包括识别模型,也就是说,通过采集到的声音数据训练初始识别模型,初始识别模型可以对多个声音数据进行识别,也就是说,可以但不限于使用采集得到的用户a、用户b和用户c的声音数据对初始识别模型进行训练,初始识别模型会识别声音数据中每个声音数据的声纹特征,可以将声音数据分为3类,分别对应用户a、用户b和用户c。
68.可选地,在本实施例中,图4是根据本发明实施例的识别模型训练过程的流程图,如图4所示,可以但不限于通过以下方式使用所述声音数据对识别模型进行训练,得到所述目标声纹识别模型:将所述声音数据输入所述识别模型,得到所述识别模型输出的识别结果;使用所述识别结果对所述识别模型的模型参数进行调整,直至所述识别结果收敛;将使得所述识别结果收敛的识别模型确定为所述目标声纹识别模型,并记录收敛的识别结果作为所述目标场景中的声纹特征。
69.可选地,在本实施例中,识别模型可以但不限于使用层次聚类算法进行训练,也就是说,不要求我们指定聚类的数量,比如,在使用采集得到的用户a、用户b和用户c的声音数据对初始识别模型进行训练的过程中,不需要我们指定识别模型将声音数据分为3类,层次聚类算法可以识别多个声音数据的声纹特征,可以根据声纹特征的相似度和差别,将声音数据自主的分为3类。
70.在一个示例性实施例中,可以但不限于通过以下方式依据所述目标场景中的声纹特征生成所述目标声纹信息权限集:向所述目标场景对应的管理帐号发送权限设置提示,其中,所述权限设置提示用于提示所述管理帐号为所述目标场景中的声纹特征设置控制权限;根据所述管理帐号执行的权限设置操作生成具有对应关系的声纹特征和控制权限,得到所述目标声纹信息权限集。
71.可选地,在本实施例中,控制权限可以但不限于为指示目标声纹不允许对一个或者多个设备执行的操作,比如:不允许小孩打开烤箱,不允许小孩打开电视内置游戏,从而能够通过为每个家庭成员设置的控制权限防止某些家庭成员控制不允许其控制的某些设备,或者,还能够防止有时候语音控制指令识别错误而执行错误的设备操作。
72.在一个示例性实施例中,可以但不限于通过以下方式根据所述管理帐号执行的权限设置操作生成具有对应关系的声纹特征和控制权限,得到所述目标声纹信息权限集:向所述管理帐号发送声纹确认请求,其中,所述声纹确认请求用于请求所述管理帐号从所述目标场景中的声纹特征中确认所述管理帐号所对应的声纹特征;将所述管理帐号响应所述声纹确认请求返回的声纹特征确定为所述管理帐号所对应的目标声纹特征;根据采集到的
具有所述目标声纹特征的目标语音设置指令生成具有对应关系的声纹特征和控制权限,得到所述目标声纹信息权限集,其中,所述权限设置操作包括所述目标语音设置指令。
73.可选地,在本实施例中,可以但不限于通过以下方式向所述管理帐号发送声纹确认请求,比如,在家庭生活场景中,在识别模型对家庭场景中的声纹特征进行识别之后,可以但不限于记录收敛的识别结果:用户a、用户b和用户c,如果用户a为管理账号对应的声纹特征,可以但不限于向用户a发送权限设置提示,提示用户a对家庭生活场景中的用户a、用户b和用户c的声纹特征设置对应的控制权限。
74.可选地,在本实施例中,图5是根据本发明实施例的目标声纹信息权限集的存储过程的示意图,如图5所示,目标声纹信息权限集可以但不限于为记录目标场景中具有对应关系的声纹特征和控制权限,其中,所述目标声纹信息权限集可以但不限于存储在数据库中,数据库可以但不限于是redis数据库,可以快速获取声纹信息权限集,,避免对响应时间有过大的影响。redis数据库可以但不限于存储了多个场景分别对应的权限列表。通过收集用户的声纹,根据声纹特征区分用户,根据用户的配置来进行权限限制,然后将配置完成的目标声纹信息权限集通过服务器存储至数据库中,在后续需要调用目标声纹信息权限集的情况下,使用服务器在数据库中调用目标声纹信息权限集即可,其中,可以使用redis数据库,实现快速的获取声纹信息权限集对整体响应时间有很小的影响。
75.可选地,在本实施例中,图6是根据本发明实施例的控制权限app设置界面的示意图,如图6所示,管理账号可以但不限于通过app界面1选择需要设置权限的用户,比如选择了用户b,然后通过app界面2为用户b设置声纹特征对应的控制权限,包括但不限于禁止打开电视游戏,禁止打开洗护设备,禁止打开厨房设备等。
76.可选地,在本实施例中,可以但不限于收集并存储各个声纹,并对目标场景中的声纹特征进行命名,以便用户区分声纹。
77.在一个示例性实施例中,可以但不限于通过以下方式根据采集到的具有所述目标声纹特征的语音设置指令生成具有对应关系的声纹特征和控制权限,得到所述目标声纹信息权限集:采集语音设置指令,其中,所述语音设置指令用于通过语音设置权限;将所述语音设置指令所具有的声纹特征与所述目标声纹特征进行匹配;在所述语音设置指令所具有的声纹特征与所述目标声纹特征匹配一致的情况下,将所述语音设置指令确定为所述目标语音设置指令。
78.可选地,在本实施例中,可以但不限于通过以下方式将所述语音设置指令所具有的声纹特征与所述目标声纹特征进行匹配,以便后续管理帐号通过语音来设置各个声纹特征的权限:向所述管理帐号发送声纹确认请求,其中,所述声纹确认请求用于请求所述管理帐号从所述目标场景中的声纹特征中确认所述管理帐号所对应的声纹特征;将所述管理帐号响应所述声纹确认请求返回的声纹特征确定为所述管理帐号所对应的目标声纹特征。
79.可选地,在本实施例中,向管理帐号发送声纹确认请求可以确定目标场景的管理帐号对应的声纹特征,之后管理帐号才可以通过语音对目标场景中的声纹进行权限设置操作,比如,图7是根据本发明实施例的确认请求界面的示意图,如图7所示,在家庭生活场景中,在识别模型对家庭场景中的声纹特征进行识别之后,可以但不限于记录收敛的识别结果:用户a、用户b和用户c,之后向管理帐号发送声纹确认请求“请勾选管理帐号对应的声纹”,可以将识别结果发送给管理帐号,管理账号可以在app界面3上选择用户a作为管理帐
号对应的声纹特征,那么在家庭生活场景中只有用户a的声纹才可以对用户a、用户b和用户c进行权限设置操作。
80.在一个示例性实施例中,图8是根据本发明实施例的权限设置过程的流程图,如图8所示,可以但不限于通过以下方式根据所述管理帐号执行的权限设置操作生成具有对应关系的声纹特征和控制权限,得到所述目标声纹信息权限集:采集语音设置指令,其中,所述语音设置指令用于通过语音设置权限;将所述语音设置指令所具有的声纹特征与所述目标声纹特征进行匹配;在所述语音设置指令所具有的声纹特征与所述目标声纹特征进行匹配一致的情况下,将所述语音设置指令确定为所述管理帐号执行的权限设置操作;按照所述管理帐号执行的权限设置操作生成具有对应关系的声纹特征和控制权限,得到所述目标声纹信息权限集。
81.可选地,在本实施例中,在采集到用于配置目标场景中的声纹特征对应的控制权限的语音设置指令的情况下,首先可以匹配语音设置指令和管理帐号对应的声纹特征,在确定语音设置指令对应的声纹特征为管理帐号对应的目标声纹特征的情况下,按照语音设置指令对各个声纹特征的控制权限进行设置,比如,在家庭生活场景中,采集到用于控制用户c禁止打开烤箱的语音设置指令,识别语音设置指令对应的声纹特征属于用户a,在匹配用户a为管理帐号对应的目标声纹特征的情况下,按照语音设置指令生成具有对应关系的声纹特征(用户c)和控制权限(禁止打开烤箱),得到上述目标声纹信息权限集。
82.在上述步骤s204提供的技术方案中,根据目标声纹信息权限集,确定所述目标声纹信息对应的目标权限,其中,所述目标声纹信息权限集用于为目标场景记录具有对应关系的声纹特征和控制权限,所述控制权限用于指示不允许对应的声纹特征对所述目标场景中部署的一个或者多个设备执行的操作。
83.可选地,在本实施例中,可以但不限于通过以下方式根据目标声纹信息权限集,确定所述目标声纹信息对应的目标权限:在识别出目标声纹信息之后,将目标声纹信息和目标声纹信息权限集进行匹配,得到目标声纹信息对应的目标权限,比如,在识别到用户a的声纹信息之后,将用户a的声纹信息在目标声纹信息权限集中进行匹配,得到用户a的声纹信息对应的目标权限是“禁止打开烤箱”。
84.在上述步骤s206提供的技术方案中,根据所述目标权限对所述语音控制指令进行处理。
85.可选地,在本实施例中,语音控制指令可以但不限于包括对目标场景中的一个或者多个设备进行控制,比如,打开电视,打开空调等等。
86.在一个示例性实施例中,可以但不限于通过以下方式根据所述目标权限对所述语音控制指令进行处理:在所述目标权限中不包括目标操作的情况下,控制第二设备执行所述语音控制指令,其中,所述语音控制指令用于控制所述第二设备执行所述目标操作;在所述目标权限中包括所述目标操作的情况下,丢弃所述语音控制指令。
87.可选地,在本实施例中,第一设备采集到的语音控制指令可以但不限于为用于控制第二设备执行目标操作的指令,并且第二设备可以但不限于包括第一设备,也就是说,第一设备采集到的指令可能是控制其他设备的指令,也可能是控制本设备的指令,比如,音箱采集到的指令可以是控制空调设备开启的指令,也可以是控制音箱本身音量大小的指令等等。第一设备可以但不限于包括任何具备声音数据采集功能,并可以将声音数据上传到服
务器的设备,比如音箱和电视等等。
88.可选地,在本实施例中,目标权限可以是非空集和空集,目标权限是非空集的情况可以但不限于指目标声纹信息权限集存在目标声纹,并且,目标声纹存在对应的权限限制的情况;目标权限是空集的情况可以但不限于指目标声纹信息权限集存在目标声纹,并且,目标声纹不存在对应的权限限制的情况,比如:在家庭环境中,家长a可能没有设置目标权限,那么目标声纹信息权限集中存在家长a的声纹,但是家长a的声纹未设置相关的权限限制,那么,家长a的声纹对应的目标权限是空集。
89.可选地,在本实施例中,在所述目标权限中不包括目标操作的情况下,可以控制第二设备执行该语音控制指令;其中,目标权限中不包括目标操作的情况可以但不限于为以下之一:
90.情况一,语音控制指令对应的声纹特征在目标声纹信息权限集中不存在;
91.情况二,语音控制指令对应的声纹特征在目标声纹信息权限集中存在,但是声纹特征对应的目标权限不包括目标操作。
92.可选地,在本实施例中,在目标权限中包括目标操作的情况下,可以丢弃该语音控制指令。目标权限中包括目标操作的情况可以但不限于为语音控制指令对应的声纹特征在目标声纹信息权限集中存在,并且声纹特征对应的目标权限包括目标操作的情况。
93.为了更好的理解上述设备的控制方法的过程,以下再结合可选实施例对上述设备的控制的实现方法流程进行说明,但不用于限定本发明实施例的技术方案。
94.在本实施例中提供了一种设备的控制方法,图9是根据本发明实施例的设备的控制过程的示意图,如图9所示,具体如下步骤:
95.步骤s901:用户配置声纹权限,可以通过管理帐号对目标声纹配置目标权限,比如:用户a的声纹禁止打开烤箱;
96.步骤s902:将声纹对应的权限存入redis,比如:将用户a的声纹和对应的权限“禁止打开烤箱”存入redis数据库;
97.步骤s903:语音交互,采集到打开烤箱的语音指令;
98.步骤s904:解析出该用户的意图,通过语音识别模块,识别出语音指令的意图是打开烤箱,即识别出采集到的语音控制指令为打开烤箱;
99.步骤s905:对比redis中存储的声纹权限,将语音指令对应的声纹和redis中存储的声纹权限进行匹配,判断语音指令对应的声纹是否存在“禁止打开烤箱”的权限;
100.步骤s906:redis中存储的声纹权限存在指令对应的意图的情况下,限制该声纹的指令执行,比如,识别到声纹对应的用户为用户a,并且在redis中存储的用户a声纹存在对应的“禁止打开烤箱”的权限,那么禁止该声纹控制打开烤箱的操作;
101.步骤s907:redis中存储的声纹权限不存在指令对应的意图的情况下,正确执行指令,比如,识别到声纹对应的用户为用户b,并且在redis中存储的用户b声纹不存在对应的“禁止打开烤箱”的权限,那么允许该声纹控制打开烤箱的操作。
102.通过以上的实施方式,可以通过收集用户的声纹,根据声纹特征区分用户,根据用户的配置来进行权限限制,通过使用redis可以快速的获取声纹信息权限集对整体响应时间有很小的影响。
103.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施
例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
104.图10是根据本发明实施例的一种设备的控制装置的结构框图;如图10所示,包括:
105.识别模块1002,用于通过目标声纹识别模型对第一设备采集到的语音控制指令的声纹特征进行识别,得到所述语音控制指令对应的目标声纹信息;
106.确定模块1004,用于根据目标声纹信息权限集,确定所述目标声纹信息对应的目标权限,其中,所述目标声纹信息权限集用于为目标场景记录具有对应关系的声纹特征和控制权限,所述控制权限用于指示不允许对应的声纹特征对所述目标场景中部署的一个或者多个设备执行的操作;
107.处理模块1006,用于根据所述目标权限对所述语音控制指令进行处理。
108.通过上述实施例,由于目标声纹识别模型是通过目标场景中部署的一个或者多个设备采集目标场景中的声音数据对初始识别模型进行训练得到的,因此对出现在目标场景中的声音进行分辨和识别的过程是由声纹识别模型的训练过程和使用过程自动完成的,无需手动向设备中录入用户的声纹,身份等信息,使用训练后的目标声纹识别模型能够对目标场景中的设备(比如第一设备)采集到的语音控制指令进行识别,从而得到该语音控制指令对应的目标声纹,再根据目标声纹对应的设备的控制权限(即目标声纹信息权限集)对采集到的语音控制指令进行相应的处理,使得设备的控制过程减少了用户手动录入和设置用户信息的过程,能够自动对目标场景中的声音进行识别并根据识别结果完成相应的设备控制操作。采用上述技术方案,解决了相关技术中,设备控制过程复杂度较高等问题,实现了降低了设备控制过程复杂度的技术效果。
109.在一个示例性实施例中,所述装置还包括:
110.获取模块,用于在所述通过目标声纹识别模型对第一设备采集到的语音控制指令的声纹特征进行识别之前,获取所述一个或者多个设备采集到的所述目标场景中的声音数据;
111.训练模块,用于使用所述声音数据对初始识别模型进行训练,得到所述目标声纹识别模型以及所述目标场景中的声纹特征;
112.生成模块,用于依据所述目标场景中的声纹特征生成所述目标声纹信息权限集。
113.在一个示例性实施例中,所述训练模块,包括:
114.输入单元,用于将所述声音数据输入所述初始识别模型,得到所述初始识别模型输出的识别结果;
115.调整单元,用于使用所述识别结果对所述初始识别模型的模型参数进行调整,直至所述识别结果收敛;
116.确定单元,用于将使得所述识别结果收敛的识别模型确定为所述目标声纹识别模型,并记录收敛的识别结果作为所述目标场景中的声纹特征。
117.在一个示例性实施例中,所述生成模块,包括:
118.发送单元,用于向所述目标场景对应的管理帐号发送权限设置提示,其中,所述权
限设置提示用于提示所述管理帐号为所述目标场景中的声纹特征设置控制权限;
119.生成单元,用于根据所述管理帐号执行的权限设置操作生成具有对应关系的声纹特征和控制权限,得到所述目标声纹信息权限集。
120.在一个示例性实施例中,所述生成单元,用于:
121.向所述管理帐号发送声纹确认请求,其中,所述声纹确认请求用于请求所述管理帐号从所述目标场景中的声纹特征中确认所述管理帐号所对应的声纹特征;
122.将所述管理帐号响应所述声纹确认请求返回的声纹特征确定为所述管理帐号所对应的目标声纹特征;
123.根据采集到的具有所述目标声纹特征的目标语音设置指令生成具有对应关系的声纹特征和控制权限,得到所述目标声纹信息权限集,其中,所述权限设置操作包括所述目标语音设置指令。
124.在一个示例性实施例中,生成单元,用于:
125.采集语音设置指令,其中,所述语音设置指令用于通过语音设置权限;
126.将所述语音设置指令所具有的声纹特征与所述目标声纹特征进行匹配;
127.在所述语音设置指令所具有的声纹特征与所述目标声纹特征匹配一致的情况下,将所述语音设置指令确定为所述目标语音设置指令。
128.在一个示例性实施例中,所述处理模块,包括:
129.控制单元,用于在所述目标权限中不包括目标操作的情况下,控制第二设备执行所述语音控制指令,其中,所述语音控制指令用于控制所述第二设备执行所述目标操作;
130.丢弃单元,用于在所述目标权限中包括所述目标操作的情况下,丢弃所述语音控制指令。
131.本发明的实施例还提供了一种存储介质,该存储介质包括存储的程序,其中,上述程序运行时执行上述任一项的方法。
132.可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:
133.s1,通过目标声纹识别模型对第一设备采集到的语音控制指令的声纹特征进行识别,得到所述语音控制指令对应的目标声纹信息;
134.s2,根据目标声纹信息权限集,确定所述目标声纹信息对应的目标权限,其中,所述目标声纹信息权限集用于为目标场景记录具有对应关系的声纹特征和控制权限,所述控制权限用于指示不允许对应的声纹特征对所述目标场景中部署的一个或者多个设备执行的操作;
135.s3,根据所述目标权限对所述语音控制指令进行处理。
136.本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
137.可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
138.可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
139.s1,通过目标声纹识别模型对第一设备采集到的语音控制指令的声纹特征进行识
别,得到所述语音控制指令对应的目标声纹信息;
140.s2,根据目标声纹信息权限集,确定所述目标声纹信息对应的目标权限,其中,所述目标声纹信息权限集用于为目标场景记录具有对应关系的声纹特征和控制权限,所述控制权限用于指示不允许对应的声纹特征对所述目标场景中部署的一个或者多个设备执行的操作;
141.s3,根据所述目标权限对所述语音控制指令进行处理。
142.可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(read-only memory,简称为rom)、随机存取存储器(random access memory,简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
143.可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
144.显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
145.以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献