一种用于专业安防机器人的声纹识别与语音交互系统的制作方法

2022-12-20 22:32:48 来源：中国专利 TAG：

1.本发明涉及人工智能领域，具体而言，涉及一种用于专业安防机器人的声纹识别与语音交互系统。

背景技术：

2.机器人是自动执行工作的机器装置。它既可以接受人类指挥，又可以运行预先编排的程序，是为降低人们工作力度和强度发明智能精密工具，用以代替常规机器设备不能做的事。
3.随着人工智能技术的发展，语音识别技术也发展很快，识别正确率越来越高，成本越来越低。现有技术中的声纹识别应用，首先需要建立用户的声纹特征库，然后，在声纹识别阶段，通过采集用户输入的语音，并提取其中的声纹特征，之后，将提取的声纹特征与预先建立的声纹特征库中的声纹特征进行声纹特征比对，从而确定身份识别是否通过。而声纹特征库的建立直接影响声纹识别的效率，如果声纹特征库中存储的用户声纹数量过少，会导致安防机器人安全性降低；采集大量声纹信息建立声纹特征库，又会降低建立声纹特征库的效率。
4.现有的智能安防机器人，对于声纹识别准确度不够，且不能根据实时情况作出相对应的措施，使得人们使用的过程中并不如理想中方便。所以如何设计一种用于专业安防机器人的声纹识别与语音交互系统，成为我们当前要解决的问题。

技术实现要素：

5.本发明的目的在于提供一种用于专业安防机器人的声纹识别与语音交互系统，其能够解决以往智能机器人对声纹识别准确度不够的问题，从而使得安防机器人能更清楚的理解人们的语言，并对于其他声源也能准确识别。
6.本发明的实施例是这样实现的：
7.第一方面，本技术实施例提供一种用于专业安防机器人的声纹识别与语音交互系统，其包括声纹识别模块，用于获取被识别人员的语音信息，并提取被识别人员的语音中的声纹；分析处理模块，用于对识别区域的环境音进行处理，对获取的被识别人员的声纹进行分析；回波消除模块，用于对分析后的被识别人员声纹进行线性回波消除；语音交互模块，用于对基于被识别人员和声纹信息库的更新操作，和/或执行安防机器人的控制操作。
8.在本发明的一些实施例中，上述声纹识别模块还包括：响应子模块，用于响应于安防机器人采集到针对感知信息的反馈语音，确定反馈语音中的待识别声纹信息。
9.在本发明的一些实施例中，上述声纹识别模块还包括：组件子模块，包括麦克风和声音传感器，麦克风为ami电容麦克风。
10.在本发明的一些实施例中，上述分析处理模块包括：匹配子模块，用于响应于安防机器人中存储的声纹信息库中有与被识别人员的语音中的声纹对应的声纹信息。
11.在本发明的一些实施例中，上述还包括：将被识别人员的语音中的声纹与注册声
纹信息库中与声纹匹配对象对应的注册声纹信息进行声纹匹配，确定进行声纹匹配得到的匹配结果。
12.在本发明的一些实施例中，上述语音交互模块还包括：声纹未匹配子模块，用于响应于安防机器人采集到针对声纹信息库内未注册声纹匹配对象的感知信息的反馈语音，确定反馈语音中的待识别声纹信息，然后将确定的待识别声纹信息传送至声纹识别模块。
13.在本发明的一些实施例中，上述还包括：更新信息库子模块，用于响应于未注册声纹匹配对象指示未注册声纹匹配对象的待识别声纹信息与注册声纹信息库中的注册声纹信息匹配成功，执行基于待识别声纹信息对注册声纹信息库的更新。
14.在本发明的一些实施例中，上述语音交互模块包括：警报子模块，用于语音交互模块位于安防机器人本体内部核心位置，警报控制器为双向控制器。
15.在本发明的一些实施例中，上述包括：用于存储计算机指令的至少一个存储器；与上述存储器通讯的至少一个处理器，其中当上述至少一个处理器执行上述计算机指令时，上述至少一个处理器使上述系统执行：声纹识别模块、分析处理模块、回波消除模块及语音交互模块。
16.第二方面，本技术实施例提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如一种用于专业安防机器人的声纹识别与语音交互系统中任一项的系统。
17.相对于现有技术，本发明的实施例至少具有如下优点或有益效果：
18.解决了以往智能机器人对声纹识别准确度不够的问题，从而使得安防机器人能更清楚的理解人们的语言，并对于其他声源也能准确识别和定位，方便设备对突发事件的处理应对。该用于安防机器人的声纹识别与语音交互系统安防机器人内置有gps定位装置，解决了以往智能安防机器人发出警报后人们到位速度迟缓的问题，从而使得人们对警报位置有精准的详细位置定位，且配合麦克风阵列可直接定位不同声源的位置，提高了人们对警报时间的处理效率。解决了以往机器人语音解释不清楚时影响人们体验的问题，从而提高了人们的使用体验。
附图说明
19.为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。
20.图1为本发明实施例提供的一种用于专业安防机器人的声纹识别与语音交互系统模块示意图；
21.图2为本发明实施例提供的一种用于专业安防机器人的声纹识别与语音交互系统详细模块示意图；
22.图3为本发明实施例提供的一种电子设备。
23.图标：10-声纹识别模块；11-响应子模块；12组件子模块；20-分析处理模块；21-匹配子模块；30-回波消除模块；40-语音交互模块；41-声纹未匹配子模块；42-更新信息库子模块；43-警报子模块；101-存储器；102-处理器；103-通信接口。
具体实施方式
24.为使本技术实施例的目的、技术方案和优点更加清楚，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本技术一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。
25.因此，以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围，而是仅仅表示本技术的选定实施例。基于本技术中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
26.应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。
27.需要说明的是，术语“包括”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、系统、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、系统、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、系统、物品或者设备中还存在另外的相同要素。
28.下面结合附图，对本技术的一些实施方式作详细说明。在不冲突的情况下，下述的各个实施例及实施例中的各个特征可以相互组合。
29.实施例1
30.请参阅图1，图1为本发明实施例提供的一种用于专业安防机器人的声纹识别与语音交互系统示意图，其如下所示：
31.声纹识别模块10，用于获取被识别人员的语音信息，并提取被识别人员的语音中的声纹；
32.分析处理模块20，用于对识别区域的环境音进行处理，对获取的被识别人员的声纹进行分析；
33.回波消除模块30，用于对分析后的被识别人员声纹进行线性回波消除；
34.语音交互模块40，用于对基于被识别人员和声纹信息库的更新操作，和/或执行安防机器人的控制操作。
35.在一些实施方式中，获取被识别人员的语音信息，提取被识别人员的语音中的声纹。对识别区域的环境音进行处理，分析输出提取的被识别人员的声纹，声纹识别模块10可为收音设备，声纹识别模块10可在识别区内设置不止一个，用于对识别区内不同位置的人员进行语音获取。
36.在一些实施方式中，将环境音向声纹识别模块10输出，声纹识别模块10提取环境音中的特征音声纹识别模块10将特征音向分析处理模块20输出。
37.环境音为识别区内除被识别人员的语音，包括周围人员的语音、杂音等。声纹识别模块10提取环境音中的特征音，特征音为指定声纹。声纹识别模块10将环境音中的指定声纹提取向分析处理模块20输出。作为本发明的一种优选方式，特征数据库内存储有异常特征音，分析处理模块20获取声纹识别模块10输出的特征音，若特征音与特征数据库内的特征比对成功，则将被识别人员标记为合规人员。异常特征音为识别特征之一，其为被识别人
员的识别特征之一。
38.在一些实施方式中，在对待识别声纹信息进行整体匹配时，根据反馈语音针对的当前声纹匹配对象是否已经注册对应的声纹信息，采用不同策略选择注册声纹信息库中存储的注册声纹信息，用于与待识别声纹信息进行匹配。下面对反馈语音针对的当前声纹匹配对象已经注册对应的声纹信息，和未注册对应的声纹信息两种情况下的整体匹配方案分别举例说明。将待识别声纹信息与安防机器人中存储的注册声纹信息库中的注册声纹信息进行声纹匹配，确定进行声纹匹配得到的匹配结果，包括：响应于安防机器人中存储的注册声纹信息库中有与声纹匹配对象对应的注册声纹信息，将待识别声纹信息与注册声纹信息库中与声纹匹配对象对应的注册声纹信息进行声纹匹配，确定进行声纹匹配得到的匹配结果。
39.实施例2
40.请参阅图2，图2为本发明实施例提供的一种用于专业安防机器人的声纹识别与语音交互系统详细模块示意图，其如下所示：
41.声纹识别模块10还包括：
42.响应子模块11，用于响应于安防机器人采集到针对感知信息的反馈语音，确定反馈语音中的待识别声纹信息。
43.组件子模块12，包括麦克风和声音传感器，麦克风为ami电容麦克风。
44.分析处理模块20包括：
45.匹配子模块21，用于响应于安防机器人中存储的声纹信息库中有与被识别人员的语音中的声纹对应的声纹信息。将被识别人员的语音中的声纹与注册声纹信息库中与声纹匹配对象对应的注册声纹信息进行声纹匹配，确定进行声纹匹配得到的匹配结果。
46.语音交互模块40还包括：
47.声纹未匹配子模块41，用于响应于安防机器人采集到针对声纹信息库内未注册声纹匹配对象的感知信息的反馈语音，确定反馈语音中的待识别声纹信息，然后将确定的待识别声纹信息传送至声纹识别模块。
48.更新信息库子模块42，用于响应于未注册声纹匹配对象指示未注册声纹匹配对象的待识别声纹信息与注册声纹信息库中的注册声纹信息匹配成功，执行基于待识别声纹信息对注册声纹信息库的更新。
49.警报子模块43，用于语音交互模块位于安防机器人本体内部核心位置，警报控制器为双向控制器。
50.在一些实施方式中，将待识别声纹信息与安防机器人中存储的注册声纹信息库中的注册声纹信息进行声纹匹配，确定进行声纹匹配得到的匹配结果，包括：响应于安防机器人中存储的注册声纹信息库中没有与声纹匹配对象对应的注册声纹信息，将待识别声纹信息与安防机器人中存储的注册声纹信息库中任意一条或多条注册声纹信息进行声纹匹配，确定进行声纹匹配得到的匹配结果。通过计算注册声纹信息与待识别声纹信息的相似度的方式，确定声纹匹配结果。例如，若注册声纹信息与待识别声纹信息的相似度大于预设相似度阈值，则可以认为注册声纹信息与待识别声纹信息匹配成功，否则，认为注册声纹信息与待识别声纹信息匹配失败。对于声纹匹配对象是否已经注册声纹信息的不同情况，可以设置不同的相似度阈值，以降低声纹信息对应的文本内容对声纹信息相似度计算的影响。例
如，当声纹匹配对象已经注册声纹信息时，待识别声纹信息与该声纹匹配对象对应的注册声纹信息进行相似度比对，则可以设置预设相似度阈值为第一阈值；当声纹匹配对象未注册声纹信息时，待识别声纹信息与任意一条注册声纹信息进行相似度比对，则可以设置预设相似度阈值为第二阈值，其中，第一阈值大于第二阈值。
51.本技术的一些实施例中，注册声纹信息库中的注册声纹信息包括原始注册阶段存储的注册声纹信息，还可以包括声纹认证阶段通过对注册声纹信息库进行更新维护时存储的注册声纹信息。
52.如图3所示，本技术实施例提供一种电子设备，其包括存储器101，用于存储一个或多个程序；处理器102。当一个或多个程序被处理器102执行时，实现如上述第一方面中任一项的系统。
53.还包括通信接口103，该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接，以实现数据的传输或交互。例如，这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块，处理器102通过执行存储在存储器101内的软件程序及模块，从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
54.其中，存储器101可以是但不限于，随机存取存储器101(random access memory，ram)，只读存储器101(read only memory，rom)，可编程只读存储器101(programmable read-only memory，prom)，可擦除只读存储器101(erasable programmable read-only memory，eprom)，电可擦除只读存储器101(electric erasable programmable read-only memory，eeprom)等。
55.处理器102可以是一种集成电路芯片，具有信号处理能力。该处理器102可以是通用处理器102，包括中央处理器102(central processing unit，cpu)、网络处理器102(network processor，np)等；还可以是数字信号处理器102(digital signal processing，dsp)、专用集成电路(application specific integrated circuit，asic)、现场可编程门阵列(field－programmable gate array，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
56.在本技术所提供的实施例中，应该理解到，所揭露的系统，也可以通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本技术的多个实施例的系统、系统和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
57.另外，在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。
58.另一方面，本技术实施例提供一种计算机可读存储介质，其上存储有计算机程序，
该计算机程序被处理器102执行时实现如上述第一方面中任一项的系统。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本技术各个实施例所述系统的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器101(rom，read-only memory)、随机存取存储器101(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
59.综上所述，本技术实施例提供的一种用于专业安防机器人的声纹识别与语音交互系统，解决了以往智能机器人对声纹识别准确度不够的问题，从而使得安防机器人能更清楚的理解人们的语言，并对于其他声源也能准确识别和定位，方便设备对突发事件的处理应对。该用于安防机器人的声纹识别与语音交互系统安防机器人内置有gps定位装置，解决了以往智能安防机器人发出警报后人们到位速度迟缓的问题，从而使得人们对警报位置有精准的详细位置定位，且配合麦克风阵列可直接定位不同声源的位置，提高了人们对警报时间的处理效率。解决了以往机器人语音解释不清楚时影响人们体验的问题，从而提高了人们的使用体验。
60.以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。
61.对于本领域技术人员而言，显然本技术不限于上述示范性实施例的细节，而且在不背离本技术的精神或基本特征的情况下，能够以其它的具体形式实现本技术。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本技术的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本技术内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：语音交互方法、智能终端及存储介质与流程

一种用于专业安防机器人的声纹识别与语音交互系统的制作方法

相关文献

最热文献