一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

具有高效解码的自动语音识别方法及系统与流程

2021-09-29 01:08:00 来源:中国专利 TAG:高效 解码 语音识别 方法 系统

技术特征:
1.一种计算机实现的自动语音识别方法,包括:获得音频数据,所述音频数据包括被分成帧的人类语音;通过语音识别解码器传播这些帧的令牌,包括:针对各个帧更新解码器束宽,所述更新发生在所述帧中的一个帧的当前令牌分数被计算之后并且在同一个帧的后续令牌分数被与更新后的束宽进行比较之前,其中后续是相对于计算所述当前令牌分数时而言的,并且其中所述更新针对所述一个帧的多个当前令牌分数被重复;以及根据所述令牌分数,确定一个或多个假设声音、单词或短语。2.如权利要求1所述的方法,其中,对所述束宽的更新是在帧的每个令牌分数被生成并且适配在当前束宽内之后发生的。3.如权利要求1所述的方法,其中,确定要对所述束宽进行更新是以几个所生成的令牌分数为间隔均匀发生的。4.如权利要求1所述的方法,其中,针对所述帧以逐个令牌分数的方式更新所述束宽,而不管令牌分数与哪个令牌相关联。5.如权利要求1所述的方法,包括:在所述解码器上的多个节点中设置源节点和目的地节点;根据所述源节点处的先前令牌分数、所述源节点和目的地节点之间的弧权重、以及所述目的地节点处的声学分数,计算当前令牌分数;将所述当前令牌分数与当前束宽进行比较;以及当所述当前令牌分数在所述当前束宽内时,在下一个令牌分数被计算之前更新所述束宽。6.如权利要求1所述的方法,其中,所述更新是在预定最小数目的令牌分数被添加到令牌列表之后被发起的。7.如权利要求1所述的方法,其中,所述更新是在从帧的处理的开始起达到预定时间之后被发起的。8.如权利要求1所述的方法,包括:当各个令牌分数被生成时,用令牌分数更新直方图;以及确定更新后的束宽,包括使用所述直方图进行确定。9.如权利要求8所述的方法,包括:在所述一个帧的处理期间,每当所述直方图被更新时更新所述束宽。10.一种计算机实现的自动语音识别系统,包括:音频捕获设备;存储器;以及至少一个处理器,通信地耦合到所述音频捕获设备和所述存储器,并且被布置为通过以下方式操作:获得音频数据,所述音频数据包括被分成帧的人类语音;通过语音识别解码器传播这些帧的令牌,包括:针对各个帧更新解码器束宽,所述更新发生在所述帧中的一个帧的当前令牌分数被计算之后并且在同一个帧的后续令牌分数被与更新后的束宽比较之前,其中后续是相对于计算所述当前令牌分数时而言的,并且其中所述更新针对所述一个帧的多个当前令牌分数被重复;以及根据所述令牌分数,确定一个或多个假设声音、单词或短语。
11.如权利要求10所述的系统,其中,所述更新是在帧的每个令牌分数被确定并且适配在当前束宽内之后发生的。12.如权利要求10所述的系统,其中,所述更新是帧内直方图修剪,该帧内直方图修剪在单帧处理期间提供束宽更新,所述单帧处理至少从在所述解码器上生成所述帧的第一个令牌分数延伸到使用所述单帧的最后计算的令牌分数进行的处理的结尾。13.如权利要求12所述的系统,其中,对所述最后计算的令牌分数进行的所述处理的结尾包括:将所述最后计算的令牌分数与最近更新的束宽进行比较。14.如权利要求10所述的系统,其中,所述至少一个处理器被布置为除了在所述一个帧的处理期间执行多个束宽更新之外,还在帧的处理之间执行束宽更新。15.如权利要求10所述的系统,其中,所述更新是在预定最小数目的令牌分数被添加到令牌列表之后被发起的。16.如权利要求10所述的系统,其中,当令牌列表中令牌分数的数目降至最小阈值以下时,所述更新被停止。17.如权利要求10所述的系统,其中,对所述束宽的更新包括:仅当先前帧的令牌的令牌分数在所述先前帧的束宽之内时,才允许在当前帧处进行对所述束宽的所述更新。18.至少一种具有指令的非暂时性计算机可读介质,这些指令使计算设备通过以下方式操作:获得音频数据,所述音频数据包括被分成帧的人类语音;通过语音识别解码器传播这些帧的令牌,包括:针对各个帧更新解码器束宽,所述更新发生在所述帧中的一个帧的当前令牌分数被计算之后并且在同一个帧的后续令牌分数被与更新后的束宽进行比较之前,其中后续是相对于计算所述当前令牌分数时而言的,并且其中所述更新针对所述一个帧的多个当前令牌分数被重复;以及根据所述令牌分数,确定一个或多个假设声音、单词或短语。19.如权利要求18所述的介质,其中,所述更新是在帧的每个令牌分数被确定并且适配在当前束宽内之后发生的。20.如权利要求18所述的介质,其中,对是否要更新所述束宽的确定是以几个所生成的令牌分数为间隔发生的。21.如权利要求18所述的介质,其中,所述束宽针对所述帧以逐个令牌分数的方式被更新,而不管令牌分数与哪个令牌相关联。22.如权利要求18所述的介质,其中,所述指令使所述计算设备通过以下方式操作:当先前帧的令牌分数不在所述先前帧的最后束宽之内时,丢弃令牌而不进一步计算令牌分数。23.如权利要求18所述的介质,其中,所述指令使所述计算设备通过以下方式操作:当以下两者都满足时,执行束宽更新:先前帧上的先前令牌分数在所述先前帧的束宽之内,并且与所述先前令牌分数相关联的当前令牌分数在所述当前帧的束宽之内。24.如权利要求18所述的介质,其中,所述指令使所述计算设备通过以下方式操作:确定先前帧上的令牌的源令牌分数是否在所述先前帧的束宽之内;以及当所述源令牌分数在所述先前帧的束宽之内时,确定通过使用所述源令牌分数计算的当前帧的当前令牌分数是否在所述当前帧的束宽之内;
当所述当前令牌分数在所述当前帧的束宽之内时,更新束宽直方图;以及根据所述束宽直方图,更新所述当前帧的所述束宽。25.如权利要求18所述的介质,其中,所述指令使所述计算设备通过以下方式操作:在各个令牌分数被生成时,用令牌分数更新直方图;以及确定更新后的束宽,包括使用所述直方图进行确定,其中每当所述直方图被更新时发生对所述束宽的更新。

技术总结
本公开涉及具有高效解码的自动语音识别方法及系统。通过频繁的束宽调整来实现具有高效解码的自动语音识别系统、物品和方法。物品和方法。物品和方法。


技术研发人员:彼得
受保护的技术使用者:英特尔公司
技术研发日:2020.11.30
技术公布日:2021/9/28
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜