一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

不受支持术语的语音到文本转换的制作方法

2021-11-20 05:24:00 来源:中国专利 TAG:

技术特征:
1.一种语音转换成文本的计算机实施方法,包括:

由终端机(212)接收(102)用户(202)的语音信号(206),其中,该语音信号包括该用户所说的通用语词和术语词;

将收到的语音信号输入(104)到语音到文本转换系统(226),其中,该语音到文本转换系统仅支持将语音信号转换为不包含所述术语词的目标词汇(234);

从该语音到文本转换系统接收(106)由该语音到文本转换系统按照该语音信号所生成的文本(208);

根据呈文本形式的词语分配表(238),通过由所述术语词自动替换所述接收文本中的目标词汇的词和短语来生成(110)校正文本(210),其中,该分配表给多个术语词中的每一个分配至少一个来自该目标词汇的词,其中,该目标词汇的被分配给术语词的至少一个词是该语音到文本转换系统在该术语词以音频信号形式被输入时错误识别的词或短语;并且

向该用户和/或软件(528;240)和/或硬件部件(506

516;240)输出(112)所述校正文本,其中,该软件或该硬件部件被配置用于按照该校正文本中的说明来执行功能。2.根据权利要求1所述的计算机实施方法,其中,该校正文本的生成是由校正系统执行的,其中,该校正系统是该终端机(212)或通过网络有效连接至该终端机的校正计算机系统(314;402)。3.根据前述权利要求之一所述的计算机实施方法,其中,

该目标词汇由通用语词集组成;或者

该目标词汇由通用语词集以及由此衍生的词组成;或者

该目标词汇由通用语词集辅以由此衍生的词和/或辅以通过识别音节组合而形成的词来组成。4.根据前述权利要求之一所述的计算机实施方法,其中,该术语词是来自以下类别之一的词:

化学物质、特别是油漆和清漆或油漆和清漆领域内的添加剂的名称;

化学物质的物理、化学、机械、光学或触觉特性;

实验室设备和化工业设备的名称;

实验室耗材和实验室需求品的名称;

油漆和清漆领域内的商品名。5.根据前述权利要求之一所述的计算机实施方法,还包括:

频率数据的接收或计算,其中,所述频率数据针对由该语音到文本转换系统按照该语音信号生成的文本中的至少若干词来说明按统计预期出现该词的频率;

其中,在生成所述校正文本时,根据该分配表仅由术语词替换所述接收文本中的目标词汇的如下词,按照接收到的频率数据,所述词的以统计方式预期的出现频率低于规定阈值。6.如权利要求5所述的计算机实施方法,其中,使用隐马尔可夫模型进行所述频率数据的计算。7.根据前述权利要求之一所述的计算机实施方法,还包括:

针对由该语音到文本转换系统按照该语音信号生成的文本中的至少若干词来接收词性标签、即pos标签,

其中,该词性标签至少包含用于名词、形容词和动词的标签;

其中,该分配表的术语词与所述术语词的词性标签一起被存储;

其中,在生成所述校正文本时,根据该分配表仅由术语词替换所述接收文本中的目标词汇的、pos标签一致的词。8.根据前述权利要求之一所述的计算机实施方法,还包括:

对于多个术语词中的每一个,采集至少一个说话者的至少一个选择性表述该术语词的参考语音信号;

将每个所述参考语音信号输入该语音到文本转换系统;

对于每个所述输入的参考语音信号,从该语音到文本转换系统接收由该语音到文本转换系统按照所述输入的参考语音信号生成的目标词汇的至少一个词,其中,因为该语音到文本转换系统的目标词汇不支持所述术语词,故该目标词汇的每个接收到的词代表误译;

其中,该分配表给已被相应采集至少一个参考语音信号的每个所述术语词和术语短语分配所述呈文本形式的目标词汇的至少一个词,所述至少一个词是由该语音到文本转换系统分别按照包含该术语词的参考语音信号来生成的。9.根据权利要求8所述的计算机实施方法,其中,

对于至少其中若干所述术语词中的每一个,多个参考语音信号分别由不同的说话者说出并被采集,其中,所述多个参考语音信号表述该术语词;

该分配表给至少其中若干术语词中的每一个相应分配所述呈文本形式的目标词汇的多个词,其中,该目标词汇的多个词代表该语音到文本转换系统针对所述不同说话者根据其声音所产生的误译。10.根据前述权利要求之一所述的计算机实施方法,其中,所述校正文本被输出给该用户,并且包括:o在该终端机的屏幕(218)上显示所述校正文本;和/或o通过文本到语音接口和该终端机的扬声器来输出所述校正文本。11.根据前述权利要求之一所述的计算机实施方法,其中,所述校正文本被输出至该软件,其中,该软件选自包括以下项的组:

化学物质数据库,其设计用于将所述校正文本解读为搜索输入,并且用于确定且返回该数据库内与该搜索输入相关的信息;和/或

互联网搜索引擎,其设计用于将所述校正文本解读为搜索输入,并且用于确定并返回该互联网上与该搜索输入相关的信息;和/或

模拟软件,其设计用于基于规定配方来模拟化学产品的、特别是油漆和清漆的特性,其中,该模拟软件设计用于将所述校正文本解读为针对应被模拟特性的产品的配方的详细说明;

用于对化学合成和/或生成混合物特别是油漆和清漆加以控制的控制软件,其中,该控制软件设计用于将所述校正文本解读为与所述混合物组成或所述合成相关的详细说明。12.根据前述权利要求之一所述的计算机实施方法,还包括:通过该终端机的扬声器或显示器来输出由该软件或硬件部件执行功能的结果。13.根据前述权利要求之一所述的计算机实施方法,其中,

将所述校正文本输出到该硬件部件,

该硬件部件是用于执行化学分析、化学合成和/或用于生成混合物特别是油漆和清漆的设备,

该设备设计用于还将所述校正文本解读为有关所述合成或所述混合物组成的详细说明或有关所述分析的详细说明。14.根据前述权利要求之一所述的计算机实施方法,其中,

该语音到文本转换系统以通过该互联网被提供给多个终端机的服务形式实现;和/或

该终端机是台式电脑、笔记本电脑、智能手机、集成到实验室设备中的计算机、本地连至实验室设备的计算机或单板计算机(树莓派)。15.一种终端机(212),包括:

麦克风(214),其用于接收用户的语音信号(206),其中,该语音信号包括该用户所说的通用语词和术语词;

连至该语音到文本转换系统(226)的接口(224),其中,o该接口被设计用于将收到的语音信号输入该语音到文本转换系统,其中,该语音到文本转换系统仅支持将该语音信号转换成不包含所述术语词的目标词汇(234);并且o该接口被设计用于接收由该语音到文本转换系统按照该语音信号生成的文本(208);

具有呈文本形式的词分配表(238)的数据存储器(220),其中,该分配表给多个术语词中的每一个相应分配该目标词汇的至少一个词,其中,该目标词汇的被分配给术语词的至少一个词是如下词或短语,该语音到文本转换系统在该术语词以音频信号形式被输入时错误识别该词或该短语;

校正程序(222),其设计用于通过根据该分配表由术语词自动替换该接收文本中的目标词汇的词和短语来生成校正文本(210);和

输出接口(218),其用于将该校正文本输出(112)给该用户和/或软件(528;240)和/或硬件部件(506

516;240),其中,该软件或该硬件部件配置用于根据该校正文本中的数据来执行功能。16.一种包括一个或多个根据权利要求15所述的终端机(212)的系统,还包括语音到文本转换系统(226),其中,所述语音到文本转换系统包括:

用于从一个或多个所述终端机中的每一个接收语音信号(206)的接口(224');

自动语音识别处理器(232),其用于按照接收到的语音信号(206)生成文本(208),其中,该语音识别处理器仅支持将语音信号转换为不包含所述术语词的目标词汇(234);并且

其中,该接口被设计用于将按照接收到的语音信号生成的文本(208)返回到发出所收到语音信号的终端机。

技术总结
本发明涉及一种用于语音到文本转换的计算机实施方法。该方法包括:接收(102)包含通用语词和术语词的语音信号(206);将接收到的语音信号输入(104)语音到文本转换系统(226),其仅支持将语音信号转换为不包含术语词的目标词汇(234);接收(106)由语音到文本转换系统按照语音信号生成的文本(208);通过根据分配表(238)由术语词自动替换该接收文本中的目标词汇的词和短语来生成(110)校正文本(210),分配表给多个术语词中的每一个分配来自目标词汇的至少一个由语音到文本转换系统错误识别的词或错误识别的短语;将校正文本输出(112)至用户或软件和/或硬件部件用以执行功能。用户或软件和/或硬件部件用以执行功能。用户或软件和/或硬件部件用以执行功能。


技术研发人员:奥利弗
受保护的技术使用者:赢创运营有限公司
技术研发日:2020.03.13
技术公布日:2021/11/19
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献