一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种语音媒体处理用语音转文字识别系统的制作方法

2022-11-16 11:20:58 来源:中国专利 TAG:


1.本发明涉及语音识别技术领域,具体为一种语音媒体处理用语音转文字识别系统。


背景技术:

2.语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。现有的语音媒体在进行语音转文字识别时,直接对比文字库进行语音识别筛选词汇,效率较快,但是准确度缺乏保证,无法通过预设场景对语音进行匹配,导致文字识别出的词汇差别较多,意思相差较大。


技术实现要素:

3.本发明的目的在于提供一种语音媒体处理用语音转文字识别系统,以解决上述背景技术中提出的问题。
4.为实现上述目的,本发明提供如下技术方案:一种语音媒体处理用语音转文字识别系统,包括:
5.语音输入模块,其与外部终端连接,用于将外部终端语音媒体内的需要转文字的语音数据进行输入;
6.语音转化模块,其与语音输入模块连接,用于将已经输入的语音数据进行拼音转化,并通过搜索词库,将拼音组成文字语句;
7.词库存储模块,其与语音转化模块连接,用于储存文字词汇;
8.场景判断模块,其与语音转化模块连接,用于进行场景训练,并对比已经转化的文字语句,判断文字是否需要纠错,然后根据场景填充符号;
9.文字输出模块,其与场景判断模块和外部终端连接,用于将已经填充好符号的文字语句输出至外部终端语音媒体中。
10.优选的,所述语音转化模块包括音节分离单元、词库对接单元、字符拼接单元和停顿处理单元;
11.所述音节分离单元用于接收语音数据,并将语音数据根据音节进行拆分,并转化成拼音;
12.所述词库对接单元分别与音节分离单元、词库存储模块以及场景判断模块连接,用于将已经转化的拼音在词库中搜索,挑选同音的文字及词汇;
13.所述字符拼接单元分别与词库对接单元以及场景判断模块连接,用于与与历史场景对比,辅助词库对接单元挑选出符合当前场景的文字及词汇,并将其拼接为完整的语句;
14.所述停顿处理单元与字符拼接单元连接,用于将已经拼接完整的语句根据当前场景以及语音数据原有停顿进行处理,预留符号位。
15.优选的,所述词库对接单元在搜索词库时,优先搜索拼音相符的文字和词汇,若无
相关的文字及词汇,则搜索相似拼音的词汇。
16.优选的,所述词库对接单元搜索相似拼音的词汇时,优先搜索海明距离最近的拼音。
17.优选的,所述场景判断模块包括场景训练单元、文字对比纠错单元、符号填充单元和异常报告单元;
18.所述场景训练单元用于训练模拟以及存储场景,
19.所述文字对比纠错单元分别与场景训练单元和语音转化模块连接,用于将已存储场景与被转化的文字词汇进行对比,判断文字词汇场景,并将错误文字词汇替换已有场景内的原有词汇;
20.所述符号填充单元分别与场景训练单元和语音转化模块连接,用于根据历史场景将符号填充至预留符号位内;
21.所述异常报告单元用于将无法匹配场景的语音进行备份与上报。
22.优选的,所述场景训练单元包括场景人工预设子单元和场景ai学习子单元,所述场景人工预设子单元用于人工对场景进行预设,填充新场景,所述场景ai学习子单元与词库连接,用于接收词汇并根据重组训练,进行场景填充。
23.优选的,所述符号填充单元还用于在没有匹配到场景时,自动为文字词汇填充默认符号。
24.优选的,所述场景训练单元还与异常报告单元连接,用于对无法匹配场景的语音进行新场景训练处理。
25.与现有技术相比,本发明的有益效果是:
26.本发明通过在语音转文字识别系统中添设置语音转化模块与场景判断模块,并通过词库存储模块的配合,自动将语音拼音化处理,然后根据相似度选择词汇,并根据训练场景的自动匹配,对转化的词汇进行纠错处理,替换合理词汇,从而达到快速语音转文字的效果,同时还对无法匹配场景的语音进行备份,进行新场景训练,丰富历史场景,为后续的语音转化提供场景基础。
附图说明
27.图1为本发明实施例提供的一种语音媒体处理用语音转文字识别系统的结构框图;
28.图2为本发明实施例提供的一种语音媒体处理用语音转文字识别系统的语音转化模块的结构框图;
29.图3为本发明实施例提供的一种语音媒体处理用语音转文字识别系统的场景判断模块的结构框图。
具体实施方式
30.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
31.请参阅图1至3,本发明提供一种语音媒体处理用语音转文字识别系统,包括:
32.语音输入模块,其与外部终端连接,用于将外部终端语音媒体内的需要转文字的语音数据进行输入;
33.语音转化模块,其与语音输入模块连接,用于将已经输入的语音数据进行拼音转化,并通过搜索词库,将拼音组成文字语句;
34.词库存储模块,其与语音转化模块连接,用于储存文字词汇;
35.场景判断模块,其与语音转化模块连接,用于进行场景训练,并对比已经转化的文字语句,判断文字是否需要纠错,然后根据场景填充符号;
36.文字输出模块,其与场景判断模块和外部终端连接,用于将已经填充好符号的文字语句输出至外部终端语音媒体中。
37.具体的,当外部终端的语音媒体接收到语音输入后,提供语音转文字识别窗口,若窗口内响应,则语音转文字系统开始进行语音转文字。
38.进一步的,所述语音转化模块包括音节分离单元、词库对接单元、字符拼接单元和停顿处理单元;
39.所述音节分离单元用于接收语音数据,并将语音数据根据音节进行拆分,并转化成拼音;
40.所述词库对接单元分别与音节分离单元、词库存储模块以及场景判断模块连接,用于将已经转化的拼音在词库中搜索,挑选同音的文字及词汇;
41.所述字符拼接单元分别与词库对接单元以及场景判断模块连接,用于与与历史场景对比,辅助词库对接单元挑选出符合当前场景的文字及词汇,并将其拼接为完整的语句;
42.所述停顿处理单元与字符拼接单元连接,用于将已经拼接完整的语句根据当前场景以及语音数据原有停顿进行处理,预留符号位。
43.具体的,接收语音后,首先通过语音转化模块对语音进行音节分离,并将其进行拼音化处理,然后将已经拼音数据通过词库搜索以及场景对比选择合适的文字词汇,并将文字词汇拼接成完整的句子,并在句中符号处预留停顿。
44.进一步的,所述词库对接单元在搜索词库时,优先搜索拼音相符的文字和词汇,若无相关的文字及词汇,则搜索相似拼音的词汇。
45.进一步的,所述词库对接单元搜索相似拼音的词汇时,优先搜索海明距离最近的拼音。
46.也就是说,当一组拼音无法搜索到准确的词汇时,则搜索相近的词汇,例如:搜索“shou’gou”时,无法出现合理词组,则搜索“sou’gou”、“shou’gu”、“shu’gou”等,并根据场景对比以及相似程度,挑选最为相似的词汇。
47.进一步的,所述场景判断模块包括场景训练单元、文字对比纠错单元、符号填充单元和异常报告单元;
48.所述场景训练单元用于训练模拟以及存储场景,
49.所述文字对比纠错单元分别与场景训练单元和语音转化模块连接,用于将已存储场景与被转化的文字词汇进行对比,判断文字词汇场景,并将错误文字词汇替换已有场景内的原有词汇;
50.所述符号填充单元分别与场景训练单元和语音转化模块连接,用于根据历史场景
将符号填充至预留符号位内;
51.所述异常报告单元用于将无法匹配场景的语音进行备份与上报。
52.具体的,当语音转化模块在对语音进行转化时,场景判断模块在场景库中搜寻相似场景,并根据场景对比,辅助语音转化模块对拼音进行转化,若场景中无匹配场景,则进行备份上报,同时还将预留符号位内填充与场景相匹配的符号。
53.进一步的,所述场景训练单元包括场景人工预设子单元和场景ai学习子单元,所述场景人工预设子单元用于人工对场景进行预设,填充新场景,所述场景ai学习子单元与词库连接,用于接收词汇并根据重组训练,进行场景填充。
54.进一步的,所述符号填充单元还用于在没有匹配到场景时,自动为文字词汇填充默认符号。
55.进一步的,所述场景训练单元还与异常报告单元连接,用于对无法匹配场景的语音进行新场景训练处理。
56.其中,异常报告单元在备份上报异常语音后,可以通过场景人工预设子单元或场景ai学习子单元对异常语音进行识别,重新训练新场景。
57.具体的,在使用时,接收语音后,首先通过语音转化模块对语音进行音节分离,并将其进行拼音化处理,然后将已经拼音数据通过词库搜索对比选择合适的文字词汇,并将文字词汇拼接成完整的句子,并在句中符号处预留停顿,同时场景判断模块在场景库中搜寻相似场景,并根据场景对比,辅助语音转化模块对拼音进行转化,若场景中无匹配场景,则进行备份上报,同时还将预留符号位内填充与场景相匹配的符号,当文字语句已经填充好符号时,通过文字输出模块输出至外部终端语音媒体中。
58.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
59.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置、设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
60.在本技术所提供的几个实施例中,应该理解到,所揭露的系统,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或单元可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或设备的间接耦合或通信连接,可以是电性,机械或其它的形式。
61.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
62.另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
63.所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储服务器、随机存取存储服务器、磁碟或者光盘等各种可以存储程序指令的介质。
64.另外,还需要说明的是,本案中各技术特征的组合方式并不限本案权利要求中所记载的组合方式或是具体实施例所记载的组合方式,本案所记载的所有技术特征可以以任何方式进行自由组合或结合,除非相互之间产生矛盾。
65.需要注意的是,以上列举的仅为本发明的具体实施例,显然本发明不限于以上实施例,随之有着许多的类似变化。本领域的技术人员如果从本发明公开的内容直接导出或联想到的所有变形,均应属于本发明的保护范围。
66.以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献