虚拟听觉系统的制作方法

2022-05-08 08:25:56 来源：中国专利 TAG：

技术特征：
1.虚拟听觉系统，其特征在于，所述系统包括：声波获取部，配置用于获取待识别的乱序的语音数据的声波；三角波生成部，配置用于对声波进行解析，生成声波对应的三角波；分隔部，配置用于对生成的三角波进行分割，以得到多个子三角波，每个子三角波表征语音数据的一个发音；时序确定部，配置用于基于子三角波的特征，为子三角波确定一个时序；所述子三角波的特征包括：子三角波的长度、相位和幅度；发音识别部，配置用于基于子三角波进行发音识别，以确定子三角波对应的发音；时序冲突解决部，配置用于当多个子三角波的时序相同时，基于每个子三角波的发音，将相同时序的子三角波分别重新分配不同的时序；识别语音生成部，基于每个子三角波的发音和时序，将所有的发音进行连接，生成识别语音。2.如权利要求1所述的系统，其特征在于，所述系统还包括：语音调整部，配置用于对识别语音进行特征提取，以判断特征提取结果是否匹配预设的历史特征模板，若不匹配，则将相邻的设定数量的发音进行乱序重置，按照乱序重置后的时序，将发音进行连接，重新进行特征提取和将特征提取结果与历史特征模板进行匹配，循环执行上述步骤，直到特征提取结果与历史特征模板相匹配。3.如权利要求2所述的系统，其特征在于，所述声波获取部在获取待识别的乱序的语音数据的声波时，将按照获取声波的先后顺序，按照设定的间隔，将声波划分为多个声波段，并为每个声波段标注序号。4.如权利要求3所述的系统，其特征在于，所述三角波生成部对声波进行解析，生成声波对应的三角波的方法包括：首先生成声波的包络波形，生成的包络波形中与声波高点对应的点进行标注，同时在两个高点间，确定两个声波低点，也在包络波形中进行标注；所述声波高点为声波中某个幅度高于左右相邻的n个点的点；所述声波低点为声波中某个幅度低于左右相邻的n个点的点；将包络波形中的标注与声波高点对应的点与包络波形中标注与声波低点对应的点中距离最远的点进行连接，最后，去除包络波形中其他部分，得到三角波。5.如权利要求4所述的系统，其特征在于，所述分隔部对生成的三角波进行分割，以得到多个子三角波的方法包括：三角波中的每三个点组成的三角形视为一个待分离子三角波，将所有待分离子三角波与相邻的待分离子三角波的重叠部分进行分配后，从三角波中分离出来，得到子三角波。6.如权利要求5所述的系统，其特征在于，所述将所有待分离子三角波与相邻的待分离子三角波的重叠部分进行分配的方法执行以下步骤：计算每个待分离子三角波的面积，比对待分离子三角波的面积与相邻的待分离子三角波的面积进行比较，两者相较后，面积大的待分离子三角波获得重叠部分，面积小的待分离子三角波失去重叠部分。7.如权利要求6所述的系统，其特征在于，所述基于子三角波的特征，为子三角波确定一个时序的方法执行以下步骤：基于每个子三角波的特征，使用时序值计算公式计算子三角波的时序值，按照时序值的大小，为每个子三角波分配时序；所述时序值计算公式使用如下公式进行表示：；其中，为子三角波的长度，定义为子三角波的底边的长度；为子三角波的幅度，为子三角波的幅度。8.如权利要求7所述的系统，其特征在于，所述发音识别部基于子三角波进行发音识
别，以确定子三角波对应的发音的方法执行以下步骤：获取一组用于训练的子三角波以及与其匹配的发音的波形，建立子三角波与发音的关联模型，得到发音字典；再根据发音字典确定三角波对应的发音。9.如权利要求8所述的系统，其特征在于，所述发音字典的建立过程包括：获取一组用于训练的子三角波以及与其匹配的发音的波形；提取子三角波中的fiiterbank特征和发音的波形中的离散余弦变换的fiiterbank特征；将所述发音的波形中的离散余弦变换的fiiterbank特征作为训练后的高斯混合模型的输入数据，获取所述训练后的高斯混合模型输出的第一似然概率矩阵；将所子三角波中的filterbank特征作为训练后的二维循环神经网络模型的输入特征，分别进行时间维度和层次维度的计算，获取输出的包含有时间维度和层次维度信息的后验概率矩阵；根据所述后验概率矩阵和所述第一似然概率矩阵采用训练后的隐马尔可夫模型计算得到目标似然概率矩阵；所述目标似然概率矩阵表征每个发音的波形与子三角波的对应关系，完成发音字典的建立。10.如权利要求9所述的系统，其特征在于，所述对识别语音进行特征提取，以判断特征提取结果是否匹配预设的历史特征模板的方法包括：获取一组用于训练的语音，采用基于时域的特征提取对用于训练的语音进行特征提取，得到历史特征模板；所述历史特征模板表征语音的自然规律；对识别语音进行基于时域的特征提取，得到特征提取结果，再判断特征提取结果是否匹配预设的历史特征模板。

技术总结
本发明属于计算机听觉技术领域，具体涉及虚拟听觉系统。所述系统包括：声波获取部，配置用于获取待识别的乱序的语音数据的声波；三角波生成部，配置用于对声波进行解析，生成声波对应的三角波；分隔部，配置用于对生成的三角波进行分割，以得到多个子三角波，每个子三角波表征语音数据的一个发音；时序确定部，配置用于基于子三角波的特征，为子三角波确定一个时序；所述子三角波的特征包括：子三角波的长度、相位和幅度。本发明通过将声波转换为三角波，再对三角波进行分解，以实现单个语音的识别，完成了针对乱序的或者无序的语音数据的识别，具有识别准确率高的优点。具有识别准确率高的优点。具有识别准确率高的优点。

技术研发人员：史红军
受保护的技术使用者：史红军
技术研发日：2022.02.10
技术公布日：2022/5/6

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种钢琴盖带有缓降装置的钢琴的制作方法

虚拟听觉系统的制作方法

相关文献

最热文献