一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于人工智能的语音交互指导系统及方法与流程

2021-09-07 21:41:00 来源:中国专利 TAG:人工智能 交互 语音 语音识别 指导


1.本发明涉及语音识别技术领域,更具体而言,涉及一种基于人工智能的语音交互指导系统及方法。


背景技术:

2.基于人工智能的语音交互指导系统是一种可通过人工语音进行控制产品工作或者指导人员学习的系统,属于常用的语音交互系统,相比传统的功能按键交互的方式语音交互系统更加具备了便捷性;
3.现有的基于人工智能的语音交互指导系统存在着一定的不足之处有待改善,首先,现有的基于人工智能的语音交互指导系统在接收音频信号的时候,音频请求和文本请求全部通过一个数据库进行处理,导致严重影响请求数据处理速度,而且不具备搜索功能,无法通过广域网进行搜索,请求数据处理范围小;其次,现有的基于人工智能的语音交互指导系统不具备翻译功能,当语言不通的时候,无法对音频信号和数字信号进行翻译,功能性差。
4.因此,有必要对现有技术进行改进。


技术实现要素:

5.为了克服现有技术中存在的不足,提供一种具备搜索功能和翻译功能的基于人工智能的语音交互指导系统及方法。
6.为了解决上述技术问题,本发明采用的技术方案为:
7.一种基于人工智能的语音交互指导系统,包括mic语音输入模块、预处理模块、特征提取模块、对比匹配模块、声学数据库、文本数据库和处理模块,mic语音输入模块、预处理模块、特征提取模块、对比匹配模块、处理模块依次连接,声学数据库和文本数据库均与对比匹配模块连接;
8.所述mic语音输入模块用于接收语音信号;
9.所述预处理模块用于对mic语音输入模块接收的语音信号进行预处理;
10.所述特征提取模块用于对预处理后的语音信号进行特征提取;
11.所述对比匹配模块用于将提取的语音信号特征与声学数据库、文本数据库进行对比、匹配;
12.所述声学数据库用于储存音频数据;
13.所述文本数据库用于储存文本数据;
14.所述处理模块用于处理输出的音频数据和文本数据。
15.进一步的,还包括翻译模块,翻译模块与处理模块连接,所述翻译模块包括文本接收模块、音频接收模块、iot通讯模块和翻译服务器,文本接收模块和音频接收模块均与iot通讯模块连接,iot通讯模块与翻译服务器连接。
16.进一步的,所述翻译模块连接有语音输出模块和文本输出模块。
17.进一步的,所述声学数据库和文本数据库均包括搜索引擎,所述特征提取模块与声学数据库、文本数据库之间均通过人工神经网络通信连接。
18.一种基于人工智能的语音交互指导方法,包括:
19.s1:mic语音输入模块接收到音频信号,通过预处理模块预处理后传输至特征提取模块;
20.s2:特征提取模块提取音频数据中的特征,传输至对比匹配模块,同时通过人工神经网络传输至声学数据库和文本数据库;
21.s3:对比匹配模块根据接收的数据,通过声学数据库和文本数据库进行对比匹配信号,同时配合搜索引擎搜索音频信号需求信息;
22.s4:处理后的数据通过处理模块转换为电信号,传输至翻译模块;
23.s5:翻译模块将数据翻译后的文本信号以及音频信号分别通过语音输出模块和文本输出模块输出。
24.进一步的,所述s5中,数据翻译模块具体处理步骤包括:
25.s51:文本接收模块接收处理模块处理后的文本数据;
26.s52:音频接收模块接收处理模块处理后的音频信息;
27.s53:文本数据和音频数据通过iot通讯模块传输至翻译服务器;
28.s54:翻译服务器将文本数据和音频数据翻译后通过iot通讯模块转回到语音交互指导系统,文本信息通过文本输出模块输出,音频数据通过语音输出模块输出。
29.进一步的,所述s1中,预处理包括:
30.s11、端点检测,通过区分不同段的信号来达到区划语音的开头与结尾,在语音识别之前设置双门的门限λ,然后分别计算每个时刻的语音能量,若该能量大于门限阈值,则新生成门限序列为1,反之则为0,从而得到门限序列后,将其点乘原始语音序列,得到有效语音序列,语音能量的计算公式为:
31.λ=10log(∑χ
i
2),
32.其中χ
i
为第i点的语音广义分贝值;
33.s12、预加重,在语音信息的处理阶段预先添加与原始语音高频信号,通过叠加之后,原始语音信息在高频和低频段的能量相当,使得识别效率明显提升;
34.s13、去加重,采用相反的负能量信号将添加的高频成分去掉,从而还原原来的信号分布,有效提高声音信号的信噪比;
35.s14、声道转换。
36.本发明与现有技术相比所具有的有益效果为:
37.1、本发明将声学数据库与文本数据库分开设置,在接收音频信号的时候,音频请求和文本请求能够分开通过声学数据库和文本数据库进行处理,大大的增加了请求数据处理速度,而且具备搜索功能,可通过广域网进行搜索,提高了请求数据的处理范围;
38.2、本发明通过设置翻译模块,文本接收模块接收处理模块处理后的文本数据,音频接收模块接收处理模块处理后的音频信息,文本数据和音频数据通过iot通讯模块传输至翻译服务器,翻译服务器将文本数据和音频数据翻译后通过iot通讯模块转回到语音交互指导系统,文本信息通过lcd输出,音频数据通过语音输出推动扬声器输,具备翻译功能,能够在语言不通的时候,对音频以及需要输出的文本进行翻译,大大的提高了整个人工智
能交互指导系统的功能性。
附图说明
39.下面将通过附图对本发明的具体实施方式做进一步的详细说明。
40.图1为本发明语音交互系统的系统框图;
41.图2是本发明翻译模块的系统框图。
具体实施方式
42.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
43.实施例:
44.如图1至图2所示,一种基于人工智能的语音交互指导系统,包括mic语音输入模块、预处理模块、特征提取模块、对比匹配模块、声学数据库、文本数据库、处理模块和翻译模块,mic语音输入模块、预处理模块、特征提取模块、对比匹配模块、处理模块和翻译模块依次连接,声学数据库和文本数据库均与对比匹配模块连接;
45.所述mic语音输入模块用于接收语音信号;
46.所述预处理模块用于对mic语音输入模块接收的语音信号进行预处理;
47.所述特征提取模块用于对预处理后的语音信号进行特征提取;
48.所述对比匹配模块用于将提取的语音信号特征与声学数据库、文本数据库进行对比、匹配;
49.所述声学数据库用于储存音频数据;
50.所述文本数据库用于储存文本数据;
51.所述处理模块用于处理输出的音频数据和文本数据。
52.所述翻译模块包括文本接收模块、音频接收模块、iot通讯模块和翻译服务器,文本接收模块和音频接收模块均与iot通讯模块连接,iot通讯模块与翻译服务器连接。
53.所述翻译模块连接有语音输出模块和文本输出模块,语音输出模块包括功放和扬声器,所述文本输出模块包括lcd屏幕。
54.所述声学数据库和文本数据库均包括搜索引擎,所述特征提取模块与声学数据库、文本数据库之间均通过人工神经网络通信连接。
55.一种基于人工智能的语音交互指导方法,其特征在于:包括:
56.s1:mic语音输入模块接收到音频信号,通过预处理模块预处理后传输至特征提取模块,预处理包括:
57.s11、端点检测,通过区分不同段的信号来达到区划语音的开头与结尾,在语音识别之前设置双门的门限λ,然后分别计算每个时刻的语音能量,若该能量大于门限阈值,则新生成门限序列为1,反之则为0,从而得到门限序列后,将其点乘原始语音序列,得到有效语音序列,语音能量的计算公式为:
58.λ=10log(∑χ
i
2),
59.其中χ
i
为第i点的语音广义分贝值;
60.s12、预加重,在语音信息的处理阶段预先添加与原始语音高频信号,通过叠加之后,原始语音信息在高频和低频段的能量相当,使得识别效率明显提升;
61.s13、去加重,采用相反的负能量信号将添加的高频成分去掉,从而还原原来的信号分布,有效提高声音信号的信噪比;
62.s14、声道转换。
63.s2:特征提取模块提取音频数据中的特征,传输至对比匹配模块,同时通过人工神经网络传输至声学数据库和文本数据库;
64.s3:对比匹配模块根据接收的数据,通过声学数据库和文本数据库进行对比匹配信号,同时配合搜索引擎搜索音频信号需求信息;
65.s4:处理后的数据通过处理模块转换为电信号,传输至翻译模块;
66.s5:翻译模块将数据翻译后的文本信号以及音频信号分别通过语音输出模块和文本输出模块输出;
67.具体处理步骤包括:
68.s51:文本接收模块接收处理模块处理后的文本数据;
69.s52:音频接收模块接收处理模块处理后的音频信息;
70.s53:文本数据和音频数据通过iot通讯模块传输至翻译服务器;
71.s54:翻译服务器将文本数据和音频数据翻译后通过iot通讯模块转回到语音交互指导系统,文本信息通过文本输出模块输出,音频数据通过语音输出模块输出。
72.上面仅对本发明的较佳实施例作了详细说明,但是本发明并不限于上述实施例,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化,各种变化均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜