技术特征:
1.一种语音识别方法,包括:
获取语音识别模型针对待识别语音输出的识别得分排在前n个的候选识别结果,所述n为大于1的正整数;
基于候选识别结果与预先收集的热门实体的发音相似度,分别对所述n个候选识别结果进行打分,得到各候选识别结果的相似度得分;
综合所述候选识别结果的识别得分和相似度得分,从所述n个候选识别结果中确定所述待识别语音对应的识别结果。
2.根据权利要求1所述的方法,还包括:
预先基于流量统计热门实体,生成热门实体列表。
3.根据权利要求2所述的方法,还包括:
将所述热门实体列表以树结构进行存储,得到实体资源树;其中,所述实体资源树中的节点为热门实体中的字,节点之间的边为字之间的顺序关系,在所述实体资源树上标注有各节点的发音。
4.根据权利要求3所述的方法,还包括:
加载所述实体资源树并作用于预设范围内用户的语音识别。
5.根据权利要求2所述的方法,其中,所述基于候选识别结果与预先收集的热门实体的发音相似度,分别对所述n个候选识别结果进行打分,得到各候选识别结果的相似度得分包括:
针对所述n个候选识别结果分别执行:利用相似度计算模型计算候选识别结果与各热门实体的发音相似度的最大值,基于该最大值确定该候选识别结果的相似度得分。
6.根据权利要求3所述的方法,其中,所述基于候选识别结果与预先收集的热门实体的发音相似度,分别对所述n个候选识别结果进行打分,得到各候选识别结果的相似度得分包括:
针对所述n个候选识别结果分别执行:将候选识别结果在实体资源模糊树上进行匹配;其中,所述实体资源模糊树通过在所述实体资源树上扩展标注各节点的相似发音得到;
若能够匹配,则利用相似度计算模型计算该候选识别结果与匹配得到的热门实体的发音相似度的最大值,基于该最大值确定该候选识别结果的相似度得分,否则,确定该候选识别结果的相似度得分为0。
7.根据权利要求1所述的方法,其中,所述综合所述候选识别结果的识别得分和相似度得分,从所述n个候选识别结果中确定所述待识别语音对应的识别结果包括:
将所述候选识别结果的识别得分和相似度得分进行加权求和,得到所述n个候选识别结果的最终得分;
利用所述最终得分确定所述待识别语音对应的识别结果。
8.根据权利要求1至7中任一项所述的方法,其中,所述热门实体包括:基于流量统计得到的热门兴趣点poi或热门地点。
9.一种语音识别装置,包括:
候选获取单元,用于获取语音识别模型针对待识别语音输出的识别得分排在前n个的候选识别结果,所述n为大于1的正整数;
相似度打分单元,用于基于候选识别结果与预先收集的热门实体的发音相似度,分别对所述n个候选识别结果进行打分,得到各候选识别结果的相似度得分;
结果确定单元,用于综合所述候选识别结果的识别得分和相似度得分,从所述n个候选识别结果中确定所述待识别语音对应的识别结果。
10.根据权利要求9所述的装置,还包括:
实体统计单元,用于预先基于流量统计所述热门实体,生成热门实体列表。
11.根据权利要求10所述的装置,还包括:
资源存储单元,用于将所述热门实体列表以树结构进行存储,得到实体资源树;其中,所述实体资源树中的节点为热门实体中的字,节点之间的边为字之间的顺序关系,在所述实体资源树上标注有各节点的发音。
12.根据权利要求10所述的装置,还包括:
资源加载单元,用于加载所述实体资源树并作用于预设范围内用户的语音识别。
13.根据权利要求10所述的装置,其中,所述相似度打分单元,具体用于针对所述n个候选识别结果分别执行:利用相似度计算模型计算候选识别结果与各热门实体的发音相似度的最大值,基于该最大值确定该候选识别结果的相似度得分。
14.根据权利要求11所述的装置,其中,所述相似度打分单元,具体用于针对所述n个候选识别结果分别执行:
将候选识别结果在实体资源模糊树上进行匹配;其中,所述实体资源模糊树通过在所述实体资源树上扩展标注各节点的相似发音得到;
若能够匹配,则利用相似度计算模型计算该候选识别结果与匹配得到的热门实体的发音相似度的最大值,基于该最大值作确定该候选识别结果的相似度得分,否则,确定该候选识别结果的相似度得分为0。
15.根据权利要求9所述的装置,其中,所述结果确定单元,具体用于:将所述候选识别结果的识别得分和实体得分进行加权求和,得到所述n个候选识别结果的最终得分;利用所述最终得分确定所述待识别语音对应的识别结果。
16.根据权利要求9至15中任一项所述的装置,其中,所述热门实体包括:基于流量统计得到的热门poi或热门地点。
17.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的方法。
19.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-8中任一项所述的方法。
技术总结
本公开公开了一种语音识别方法和装置,涉及语音和深度学习技术领域。具体实现方案为:获取语音识别模型针对待识别语音输出的识别得分排在前N个的候选识别结果,所述N为大于1的正整数;基于候选识别结果与预先收集的热门实体的发音相似度,分别对所述N个候选识别结果进行打分,得到各候选识别结果的相似度得分;综合所述候选识别结果的识别得分和相似度得分,从所述N个候选识别结果中确定所述待识别语音对应的识别结果。本公开能够提高识别准确性。
技术研发人员:张辽;赵银楼;蒋正翔;付晓寅;魏玮
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2021.04.12
技术公布日:2021.08.06
本文用于企业家、创业者技术爱好者查询,结果仅供参考。