一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于多麦克风阵列节点的分布式语音唤醒系统的制作方法

2021-07-16 20:07:00 来源:中国专利 TAG:唤醒 语音 地说 系统 阵列


1.本发明涉及语音唤醒系统领域,更具体地说,本发明涉及一种基于多麦克风阵列节点的分布式语音唤醒系统。


背景技术:

2.语音识别指代通过分析语音信号并将分析的语音信号与构图的数据库组合,将语音信号转换为字符串或识别语言含义内容。
3.在语音识别技术中,语音识别模型分析输入的语音数据,提取特征,并测量与先前收集的语音模型数据库的相似性,以将最相似的一个转换为文本或命令。
4.语音识别技术是一种模式识别过程。因为每个人的语音、发音和语调不同,所以传统的语音识别技术会从尽可能多的人中收集语音数据,从中提取共同特征,并生成参考模式。
5.然而,现有的语音识别系统在进行唤醒时,其语音获取途径单一,不能获取有效的唤醒命令,导致系统唤醒的成功率不一。在不同的使用环境下具有很大的偏差,实用性低。


技术实现要素:

6.为实现上述目的,本发明提供如下技术方案:一种基于多麦克风阵列节点的分布式语音唤醒系统,包括依次相连的客户端、资源管理服务器和识别服务器,所述客户端还连接有用于捕获唤醒语音的麦克风阵列,麦克风阵列由多个麦克风分布式排列组成,所述识别服务器还连接有声音处理模块,用于对唤醒语音进行识别和处理;
7.所述声音处理模块包括与识别服务器连接的声音信道,所述声音信道连接有端点检测、特征提取、声学模型、语音模型和识别搜索。
8.在一个优选地实施方式中,所述客户端向资源管理服务器发送连接请求,所述资源管理服务器从所有的识别服务器中寻找一个空闲的,然后向该识别服务器发送分配请求。
9.在一个优选地实施方式中,所述识别服务区寻找一个空闲的连接,回应分配成功消息给资源管理服务服务器,所述资源管理服务器把识别服务器的信息回应给客户端。
10.在一个优选地实施方式中,所述客户端与识别服务区建立连接,开始识别操作。
11.在一个优选地实施方式中,所述麦克风阵列采集的唤醒语音信息通过客户端发送至识别服务器,并通过声音信道进入至声音处理模块中。
12.在一个优选地实施方式中,所述端点检测接收唤醒语音信息,将语音信息声音帧中两端端点处的杂音、静音和起始段删除,生成唤醒语音帧段;
13.所述特征提取用于从唤醒语音帧段中提取包含唤醒词的特征段;
14.所述声学模型具体为采用语音训练模型生成的唤醒模型,为特征提取获得的特征段提供对比样本,判断唤醒词是否复合唤醒标准;
15.所述识别搜索用于从声学模型中获取与特征。
16.本发明的技术效果和优点:
17.通过设定一定数量的麦克风阵列,获取语音唤醒系统中的唤醒关键词,对系统进行唤醒,能大幅度提升语音唤醒系统的效率,在不同的使用环境下也可保证系统唤醒的几率,降低出现唤醒失误的现象,提升了系统的实用性。
附图说明
18.图1为本发明的系统框架结构示意图。
具体实施方式
19.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
20.如图1所示的一种基于多麦克风阵列节点的分布式语音唤醒系统,包括依次相连的客户端、资源管理服务器和识别服务器,所述客户端还连接有用于捕获唤醒语音的麦克风阵列,麦克风阵列由多个麦克风分布式排列组成,所述识别服务器还连接有声音处理模块,用于对唤醒语音进行识别和处理;
21.所述声音处理模块包括与识别服务器连接的声音信道,所述声音信道连接有端点检测、特征提取、声学模型、语音模型和识别搜索;
22.所述客户端向资源管理服务器发送连接请求,所述资源管理服务器从所有的识别服务器中寻找一个空闲的,然后向该识别服务器发送分配请求;
23.所述识别服务区寻找一个空闲的连接,回应分配成功消息给资源管理服务服务器,所述资源管理服务器把识别服务器的信息回应给客户端;
24.所述客户端与识别服务区建立连接,开始识别操作;
25.所述麦克风阵列采集的唤醒语音信息通过客户端发送至识别服务器,并通过声音信道进入至声音处理模块中;
26.所述端点检测接收唤醒语音信息,将语音信息声音帧中两端端点处的杂音、静音和起始段删除,生成唤醒语音帧段;
27.所述特征提取用于从唤醒语音帧段中提取包含唤醒词的特征段;
28.所述声学模型具体为采用语音训练模型生成的唤醒模型,为特征提取获得的特征段提供对比样本,判断唤醒词是否复合唤醒标准;
29.所述识别搜索用于从声学模型中获取与特征段相近似的唤醒模型信息,并通过语音模型进行对比,并根据结果进行唤醒;
30.在上述的基础上,与客户端连接的麦克风阵列会均匀的摆放至运营场所中,根据场所的大小、场景中人数的多少、需要进行的操作指令复杂程度,呈线性增长布置麦克风阵列的数量;
31.设定场景大小为a,场景中人数为α,接收的操作指令数量为β,麦克风阵列的数量为b,则b=(α β)*(1 c);
32.其中,c为识别服务器处于待机的数量,采用c 1,是防止出现待机服务器数量为0
的情况;
33.客户端向资源管理服务器发送连接请求,资源管理服务器从所有的识别服务器中寻找一个空闲的,然后向该识别服务器发送分配请求,识别服务区寻找一个空闲的连接,回应分配成功消息给资源管理服务服务器,资源管理服务器把识别服务器的信息回应给客户端,客户端与识别服务区建立连接,开始识别操作;
34.当麦克风阵列获语音信息时,语音信息会传输至识别服务器中,语音信息会分割为逐帧状态的语音帧,端点检测将语音帧两端的杂音帧、静音帧和起始段删除,生成可处理识别的唤醒语音帧段;
35.通过特征提取将唤醒语音帧段中的唤醒词读取,利用声学模型和语音模型,将唤醒词进行读取,完成系统的唤醒。
36.最后应说明的几点是:首先,在本申请的描述中,需要说明的是,除非另有规定和限定,术语“安装”、“相连”、“连接”应做广义理解,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变,则相对位置关系可能发生改变;
37.其次:本发明公开实施例附图中,只涉及到与本公开实施例涉及到的结构,其他结构可参考通常设计,在不冲突情况下,本发明同一实施例及不同实施例可以相互组合;
38.最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜