基于大数据的语音识别方法、系统、设备及存储介质与流程

2021-10-09 12:05:00 来源：中国专利 TAG：语音识别实施方法数据设备

技术特征：
1.基于大数据的语音识别方法，其特征在于，所述的语音识别方法包括以下步骤：至少选择一条完整语义的长音频，将当前长音频分割得到多条短音频，并按照时间顺序构成任务队列；基于服务器中预设的第二音频识别模型对所述任务队列中的多条短音频一一进行识别，得到多个短音频识别结果，对所述多个短音频识别结果进行唤醒检测，若所述短音频识别结果中存在唤醒词，则从所述短音频识别结果中提取含有唤醒词的目标短音频识别结果；获取目标用户热词集，基于所述目标用户热词集对所述目标短音频识别结果进行候选拓展，得到候选识别结果，显示所述候选识别结果。2.根据权利要求1所述的基于大数据的语音识别方法，其特征在于，在所述至少选择一条完整语义的长音频的步骤之前，所述的语音识别方法还包括：获取目标用户发出的原始音频数据，基于本地的第一音频识别模型，对所述原始音频数据进行完整性分析；在所述原始音频数据中存在至少一条完整语义的音频时，发送所述完整语义的音频至服务器，并将当前具有完整语义的音频作为长音频。3.根据权利要求2所述的基于大数据的语音识别方法，其特征在于，在所述基于本地的第一音频识别模型，对所述原始音频数据进行完整性分析的步骤之前，所述的语音识别方法还包括对所述原始音频数据进行预处理的步骤；其中，所述对所述原始音频数据进行预处理的步骤具体包括：对所述原始音频数据进行降噪处理。4.根据权利要求2所述的基于大数据的语音识别方法，其特征在于，在所述基于本地的第一音频识别模型，对所述原始音频数据进行完整性分析的步骤之前，所述的语音识别方法还包括对所述原始音频数据进行预处理的步骤；其中，所述对所述原始音频数据进行预处理的步骤具体包括：对所述原始音频数据进行解混响处理。5.根据权利要求3或4所述的基于大数据的语音识别方法，其特征在于，所述将当前长音频分割得到多条短音频的步骤具体包括：根据预先建立的静音模型，利用深度学习算法对长音频的每帧语音进行识别，以识别静音帧；将达到预设的长静音阈值的帧作为切分点将长音频切分为多个有效短音频。6.根据权利要求5所述的基于大数据的语音识别方法，其特征在于，所述基于服务器中预设的第二音频识别模型对所述任务队列中的多条短音频一一进行识别，得到多个短音频识别结果的步骤具体包括：调取服务器中预设的第二音频识别模型；将任务队列中的短音频输入所述第二音频识别模型中，以得到短音频的识别结果，所述短音频的识别结果包括音频识别结果和相应的置信度；判断音频识别结果的置信度是否达到置信度阈值，若达到置信度阈值，则将当前的音频识别结果作为最终识别结果。7.根据权利要求6所述的基于大数据的语音识别方法，其特征在于，所述获取目标用户
热词集的步骤具体包括：获取目标用户的历史音频识别文本数据；基于历史音频识别文本数据所包含词的特征从历史音频识别文本数据中抽取候选热词，得到候选热词集；基于候选热词集在大数据词库中匹配与每一个候选热词对应的扩展词；根据扩展词从所述候选热词集中过剔除非热词，得到目标用户的热词集。8.基于大数据的语音识别系统，其特征在于，所述的语音识别系统包括：音频分割单元，用于至少选择一条完整语义的长音频，将当前长音频分割得到多条短音频，并按照时间顺序构成任务队列；音频识别单元，用于基于服务器中预设的第二音频识别模型对所述任务队列中的多条短音频一一进行识别，得到多个短音频识别结果；唤醒检测单元，用于对所述多个短音频识别结果进行唤醒检测，若所述短音频识别结果中存在唤醒词，则从所述短音频识别结果中提取含有唤醒词的目标短音频识别结果；结果拓展单元，用于获取目标用户热词集，基于所述目标用户热词集对所述目标短音频识别结果进行候选拓展，得到候选识别结果，显示所述候选识别结果。9.基于大数据的语音识别设备，其特征在于，所述语音识别设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1
‑
7任一所述语音识别方法的步骤。10.存储介质，其特征在于，所述的存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如权利要求1
‑
7任一所述语音识别方法的步骤。

技术总结
本发明实施例适用于语音识别技术领域，提供了基于大数据的语音识别方法、系统、设备及存储介质，在本发明实施例提供的语音识别方法中，通过将长音频分割得到多条短音频；基于服务器中预设的第二音频识别模型对所述任务队列中的多条短音频一一进行识别，得到多个短音频识别结果，对所述多个短音频识别结果进行唤醒检测，若所述短音频识别结果中存在唤醒词，则从所述短音频识别结果中提取含有唤醒词的目标短音频识别结果；获取目标用户热词集，基于所述目标用户热词集对所述目标短音频识别结果进行候选拓展，得到候选识别结果，能够有效解决现有方案不仅无法为用户提供便利，反而会给用户带来不必要的麻烦的问题。会给用户带来不必要的麻烦的问题。

技术研发人员：杨兵海
受保护的技术使用者：杨兵海
技术研发日：2021.06.28
技术公布日：2021/10/8

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种便于轻松调节背带长度的圆背吉他的制作方法

基于大数据的语音识别方法、系统、设备及存储介质与流程

相关文章

最热文献