一种基于语音识别与指令匹配的智能大屏控制方法与流程

2022-12-10 00:44:30 来源：中国专利 TAG：

1.本发明涉及人工智能技术领域，具体为一种基于语音识别与指令匹配的智能大屏控制方法。

背景技术：

2.语音识别作为一种常用的人机交互技术，可以广泛应用于各类电子产品中，以其自然方便的交互方式获得了市场的青睐，逐渐成为了智能产品时代的主流交互控制方式之一。其中，命令词识别是语音识别中非常重要的一个方面，用于识别语音信号中的命令词，从而可以根据命令词执行相应的命令。
3.命令词识别需要在使用较少的内存和计算量的情况下，保持较高的识别率以及较低的误识别情况。然而，目前的命令词识别设备无法在满足内存和计算量的同时达到很高的性能，导致命令词识别率和命令词误报率难以满足使用需求。

技术实现要素：

4.为了解决上述技术问题，本发明提出了一种基于语音识别与指令匹配的智能大屏控制方法，可以有效提高命令词识别率，降低命令词误报率，有效提升了处理性能。
5.为实现上述目的，本发明提供如下技术方案：一种基于语音识别与指令匹配的智能大屏控制方法，包括云端服务器和安装有智能app软件的电子设备，其特征在于：所述电子设备内设置有语音唤醒模块、输入模块、语音识别模块、语音命令模块、语义分析模块、语音合成模块和程序控制模块：
6.所述输入模块与语音识别模块连接，用于通过mic输入用户控制语音；
7.所述语音识别模块包括在线语音识别模块、离线语音识别模块；
8.所述语音命令模块根据接收到的命令语音的请求，对命令语音进行判断并确定语音命令词和控制功能的对应关系；
9.所述语义分析模块与语音命令模块相连接；
10.所述语音合成模块与语义分析模块相连接并进行语音的输出。
11.所述输入模块监测到语音指令通过与语音识别模块相连接将语音传送至语音识别模块，所述语音识别模块使用预设的非标准语音识别模型识，得到m个关键词，m为大于零的整数；
12.在m大于1时，提取所有关键词的词义，并结合所有关键词在音命令中的前后顺序关系，在任两个相邻的关键词之间填充助词，得到预测文本并传送至语音命令模块。
13.所述在线语音识别模块用于通过云端服务器对输入模块监测到的语音进行语音识别得到语音输出信息；
14.所述离线语音识别模块用于通过神经网络rnn模型对输入模块监测到的语音进行语音识别得到语音输出信息。
15.所述语音唤醒模块在预设时间内未收到用户控制语音时，所述输入模块、语音识
别模块、语音命令模块、语义分析模块、语音合成模块和程序控制模块进入休眠状态，当再次使用时，通过所述唤醒模块，利用特定唤醒词将处于休眠状态的输入模块、语音识别模块、语音命令模块、语义分析模块、语音合成模块和程序控制模块唤醒进入待命状态。
16.所述在线语音识别模块通过tpc/ip协议获取输入模块监测后的语音；针对监测的语音进行自然语言处理识别出用户的意图；针对用户的意图进行意图识别，确定用户的意图的合理性；当用户的意图合理时，根据所述用户的意图进行资源访问，获得目标资源，并将所述目标资源传输至中央处理单元，所述中央处理单元针对所述目标资源进行交互信息输出，得到语音输出信息，所述语音命令模块对语音输出信息进行判断。
17.所述离线语音识别模块在通过神经网络rnn模型对监测到的语音进行语音识别得到语音输出信息时，针对监测到的语音进行特征提取，获得监测到的语音特征，然后根据监测到的语音特征进行模型训练和模型识别，根据所述语音特征在所模型存储单元中进行模型匹配，得到优化神经网络rnn模型，并根据失真判决准则进行识别判断，得到语音输出信息，所述语音命令模块对语音输出信息进行判断。
18.与现有技术相比，本发明的有益效果是：
19.本发明提出了一种基于语音识别与指令匹配的智能大屏控制方法，无需手动打开应用，通过语音交互功能实现app的开启应用，语音交互功能操作简，实现语音信息传输的同时，减少手机的内存负荷，实现功能上的语音识别，提高输入效率，降低成本单，在语音命令不符合标准时对命令进行预测识别，可以提高命令识别的准确率，通过量子深度学习识别可以快速地得到控制指令，从而在复杂种类的语音命令环境下，能够保证识别的准确性和及时性。
具体实施方式
20.通过具体实施例对本发明的技术方案做进一步说明。
21.本发明提出的一种基于语音识别与指令匹配的智能大屏控制方法，云端服务器和安装有智能app软件的电子设备，其特征在于：所述电子设备内设置有语音唤醒模块、输入模块、语音识别模块、语音命令模块、语义分析模块、语音合成模块和程序控制模块；
22.本发明中输入模块与语音识别模块连接，用于通过mic输入用户控制语音；
23.本发明中语音识别模块包括在线语音识别模块、离线语音识别模块；
24.本发明中语音命令模块根据接收到的命令语音的请求，对命令语音进行判断并确定语音命令词和控制功能的对应关系；
25.本发明中语义分析模块与语音命令模块相连接；
26.本发明中语音合成模块与语义分析模块相连接并进行语音的输出。
27.本发明中输入模块监测到语音指令通过与语音识别模块相连接将语音传送至语音识别模块，所述语音识别模块使用预设的非标准语音识别模型识，得到m个关键词，m为大于零的整数；
28.本发明中在m大于1时，提取所有关键词的词义，并结合所有关键词在音命令中的前后顺序关系，在任两个相邻的关键词之间填充助词，得到预测文本并传送至语音命令模块。
29.本发明中在线语音识别模块用于通过云端服务器对输入模块监测到的语音进行
语音识别得到语音输出信息；
30.本发明中离线语音识别模块用于通过神经网络rnn模型对输入模块监测到的语音进行语音识别得到语音输出信息。
31.本发明中语音唤醒模块在预设时间内未收到用户控制语音时，所述输入模块、语音识别模块、语音命令模块、语义分析模块、语音合成模块和程序控制模块进入休眠状态，当再次使用时，通过所述唤醒模块，利用特定唤醒词将处于休眠状态的输入模块、语音识别模块、语音命令模块、语义分析模块、语音合成模块和程序控制模块唤醒进入待命状态。
32.本发明中在线语音识别模块通过tpc/ip协议获取输入模块监测后的语音；针对监测的语音进行自然语言处理识别出用户的意图；针对用户的意图进行意图识别，确定用户的意图的合理性；当用户的意图合理时，根据所述用户的意图进行资源访问，获得目标资源，并将所述目标资源传输至中央处理单元，所述中央处理单元针对所述目标资源进行交互信息输出，得到语音输出信息，所述语音命令模块对语音输出信息进行判断。
33.本发明中离线语音识别模块在通过神经网络rnn模型对监测到的语音进行语音识别得到语音输出信息时，针对监测到的语音进行特征提取，获得监测到的语音特征，然后根据监测到的语音特征进行模型训练和模型识别，根据所述语音特征在所模型存储单元中进行模型匹配，得到优化神经网络rnn模型，并根据失真判决准则进行识别判断，得到语音输出信息，所述语音命令模块对语音输出信息进行判断。
34.通过特定唤醒词将处于休眠状态的输入模块、语音识别模块、语音命令模块、语义分析模块、语音合成模块和程序控制模块唤醒进入待命状态，输入模块与语音识别模块之间通过mic输入用户控制语音，所述在线语音识别模块通过tpc/ip协议获取输入模块监测后的语音；得到m个关键词，m为大于零的整数；在m大于1时，提取所有关键词的词义，并结合所有关键词在音命令中的前后顺序关系，在任两个相邻的关键词之间填充助词，得到预测文本；针对预测文本；识别出用户的意图；针对用户的意图进行意图识别，确定用户的意图的合理性；当用户的意图合理时，根据所述用户的意图进行资源访问，获得目标资源，并将所述目标资源传输至中央处理单元，所述中央处理单元针对所述目标资源进行交互信息输出，得到语音输出信息，所述语音命令模块对语音输出信息进行判断，或者根据离线语音识别模块在通过神经网络rnn模型对监测到的语音进行语音识别得到语音输出信息时，针对监测到的语音进行特征提取，获得监测到的语音特征，然后根据监测到的语音特征进行模型训练和模型识别，根据所述语音特征在所模型存储单元中进行模型匹配，得到优化神经网络rnn模型，并根据失真判决准则进行识别判断，得到语音输出信息，所述语音命令模块对语音输出信息进行判断，语音命令模块根据语音识别模块输出的信息进行判断与程序控制模块相连接进行命令输出和执行，语义分析模块通过语音识别模块输出的信息与语音音命令模块的指令选择进行分析输送至语音合成模块；语音合成模块进行语音的输出。
35.上述具体实施例仅仅是本发明的几种优选的实施例，基于本发明的技术方案和上述实施例的相关启示，本领域技术人员可以对上述具体实施例做出多种替代性的改进和组合。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：对发话设备进行控制的方法、服务器、发话设备以及程序与流程

一种基于语音识别与指令匹配的智能大屏控制方法与流程

相关文献

最热文献