一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种语音媒体处理用语音转文字识别系统的制作方法

2022-11-16 11:20:58 来源:中国专利 TAG:

技术特征:
1.一种语音媒体处理用语音转文字识别系统,其特征在于,包括:语音输入模块,其与外部终端连接,用于将外部终端语音媒体内的需要转文字的语音数据进行输入;语音转化模块,其与语音输入模块连接,用于将已经输入的语音数据进行拼音转化,并通过搜索词库,将拼音组成文字语句;词库存储模块,其与语音转化模块连接,用于储存文字词汇;场景判断模块,其与语音转化模块连接,用于进行场景训练,并对比已经转化的文字语句,判断文字是否需要纠错,然后根据场景填充符号;文字输出模块,其与场景判断模块和外部终端连接,用于将已经填充好符号的文字语句输出至外部终端语音媒体中。2.根据权利要求1所述的语音媒体处理用语音转文字识别系统,其特征在于,所述语音转化模块包括音节分离单元、词库对接单元、字符拼接单元和停顿处理单元;所述音节分离单元用于接收语音数据,并将语音数据根据音节进行拆分,并转化成拼音;所述词库对接单元分别与音节分离单元、词库存储模块以及场景判断模块连接,用于将已经转化的拼音在词库中搜索,挑选同音的文字及词汇;所述字符拼接单元分别与词库对接单元以及场景判断模块连接,用于与与历史场景对比,辅助词库对接单元挑选出符合当前场景的文字及词汇,并将其拼接为完整的语句;所述停顿处理单元与字符拼接单元连接,用于将已经拼接完整的语句根据当前场景以及语音数据原有停顿进行处理,预留符号位。3.根据权利要求2所述的语音媒体处理用语音转文字识别系统,其特征在于,所述词库对接单元在搜索词库时,优先搜索拼音相符的文字和词汇,若无相关的文字及词汇,则搜索相似拼音的词汇。4.根据权利要求2所述的语音媒体处理用语音转文字识别系统,其特征在于,所述词库对接单元搜索相似拼音的词汇时,优先搜索海明距离最近的拼音。5.根据权利要求2所述的语音媒体处理用语音转文字识别系统,其特征在于,所述场景判断模块包括场景训练单元、文字对比纠错单元、符号填充单元和异常报告单元;所述场景训练单元用于训练模拟以及存储场景,所述文字对比纠错单元分别与场景训练单元和语音转化模块连接,用于将已存储场景与被转化的文字词汇进行对比,判断文字词汇场景,并将错误文字词汇替换已有场景内的原有词汇;所述符号填充单元分别与场景训练单元和语音转化模块连接,用于根据历史场景将符号填充至预留符号位内;所述异常报告单元用于将无法匹配场景的语音进行备份与上报。6.根据权利要求5所述的语音媒体处理用语音转文字识别系统,其特征在于,所述场景训练单元包括场景人工预设子单元和场景ai学习子单元,所述场景人工预设子单元用于人工对场景进行预设,填充新场景,所述场景ai学习子单元与词库连接,用于接收词汇并根据重组训练,进行场景填充。7.根据权利要求5所述的语音媒体处理用语音转文字识别系统,其特征在于,所述符号
填充单元还用于在没有匹配到场景时,自动为文字词汇填充默认符号。8.根据权利要求5所述的语音媒体处理用语音转文字识别系统,其特征在于,所述场景训练单元还与异常报告单元连接,用于对无法匹配场景的语音进行新场景训练处理。

技术总结
本发明公开了一种语音媒体处理用语音转文字识别系统,语音输入模块,其与外部终端连接,用于将外部终端语音媒体内的需要转文字的语音数据进行输入;语音转化模块,其与语音输入模块连接,用于将已经输入的语音数据进行拼音转化,并通过搜索词库,将拼音组成文字语句。本发明通过在语音转文字识别系统中添设置语音转化模块与场景判断模块,并通过词库存储模块的配合,自动将语音拼音化处理,然后根据相似度选择词汇,并根据训练场景的自动匹配,对转化的词汇进行纠错处理,替换合理词汇,从而达到快速语音转文字的效果,同时还对无法匹配场景的语音进行备份,进行新场景训练,丰富历史场景,为后续的语音转化提供场景基础。为后续的语音转化提供场景基础。为后续的语音转化提供场景基础。


技术研发人员:史琦 沈林啸 马凯
受保护的技术使用者:启迪万众网络科技(北京)有限公司
技术研发日:2022.08.02
技术公布日:2022/11/15
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献