农林渔牧食品/饮料服装/饰品纺织/造纸医疗/保健机械/机床家具/门窗喷涂/染料道路/铁路

摄影/光学乐器/声学照明/工业冶金/铸造安全/消防建筑/工具控制/调节计算,推算其他产品

热搜：真空泵封装包装食品玩具

首页 > 乐器,声学设备的制造及制作,分析技术 > 正文

一种基于神经网络的自配置环境语音识别系统及方法与流程

2021-08-13 19:22:00 来源：中国专利 TAG：配置神经网络识别系统语音语音识别

技术特征：

1.一种基于神经网络的自配置环境语音识别系统，其特征在于，

所述自配置环境语音识别系统包括：环境语音读取模块、神经网络计算模式动态解析模块、语音识别模块；

所述环境语音采集模块，用于将接收到的32bit环境语音数据截位为16bit语音数据；

所述神经网络计算模式动态解析模块，用于根据神经网络识别结果确定神经网络当前的计算模式；其中，所述计算模式包括：8bit权重计算模式、1bit压缩权重计算模式；

所述语音识别模块，用于实现语音识别，其输入端接收16bit语音数据，根据16bit语音数据与计算模式对应权重的运算结果，得出语音识别结果；

所述语音识别模块包括：3层卷积神经网络计算子模块、2层全连接神经网络计算子模块；其中，各层卷积神经网络计算子模块和各层全连接神经网络计算子模块均采用神经网络计算模式动态解析模块输出的计算模式；其中，各层卷积神经网络计算子模块和各层全连接神经网络计算子模块中均包括网络权重压缩子单元；

所述8bit权重计算模式对应权重，是事先写入神经网络中的训练好的8bit权重，所述1bit压缩权重计算模式对应权重，是经过网络权重压缩子单元压缩好的1bit权重。

2.根据权利要求1所述的基于神经网络的自配置环境语音识别系统，其特征在于，

所述环境语音采集模块包括：麦克风语音输入单元和语音数据截位单元：

所述麦克风语音输入单元，用于接收环境语音数据，该单元遵守音频总线i2s协议，采样率设置为64，一帧读取32bit数据，有效数据高24bit，数据精度为18bit；

所述语音数据截位单元，用于对麦克风语音输入单元接收到的32bit环境语音数据进行截位操作，只取其中高位16bit部分的语音数据，输入到语音识别模块中，用于后续运算。

3.根据权利要求1所述的基于神经网络的自配置环境语音识别系统，其特征在于，

所述神经网络计算模式动态解析模块包括神经网络输出判别单元；

当神经网络识别结果中有检测到人声存在时，神经网络输出判别单元将各层神经网络中的网络权重压缩子单元全部关闭，即神经网络当前的计算模式为8bit权重计算模式；

当神经网络识别结果中未检测到人声存在时，神经网络输出判别单元将各层神经网络中的网络权重压缩子单元全部开启，网络权重压缩子单元将8bit权重压缩为1bit权重，即神经网络当前的计算模式为1bit压缩权重计算模式。

4.根据权利要求3所述的基于神经网络的自配置环境语音识别系统，其特征在于，

所述语音识别模块中的各层卷积神经网络计算子模块的结构相同，包括：可配置卷积神经网络计算单元、批量归一化计算单元、激活函数单元；

所述可配置卷积神经网络计算单元，用于进行16bit语音数据和计算模式对应权重的卷积运算；

所述批量归一化计算单元，用于进行神经网络的归一化计算，使神经网络输出保持相同分布；

所述激活函数单元，用于构建神经网络的激活函数，为神经网络引入非线性因素。

5.根据权利要求4所述的基于神经网络的自配置环境语音识别系统，其特征在于，

所述第一层卷积神经网络的参数为：20个神经元、3×3的卷积核、横向步长为2以及纵向步长为1；

所述第二层卷积神经网络的参数为：30个神经元、3×3的卷积核、横向步长为1以及纵向步长为2；

所述第三层卷积神经网络的参数为：12个神经元、3×3的卷积核、横向步长为2以及纵向步长为1。

6.根据权利要求4所述的基于神经网络的自配置环境语音识别系统，其特征在于，

所述可配置卷积神经网络计算单元包括：网络权重压缩子单元、卷积神经网络乘法器子单元以及卷积神经网络加法树子单元；

所述网络权重压缩子单元，首先读取权重数据，并接收系统计算模式配置信号，由系统计算模式配置信号决定是否网络权重压缩子单元的开启和关闭；在1bit压缩权重计算模式下，网络权重压缩子单元处于开启状态，先读取8bit权重并判断其符号，当8bit权重的最高位为‘1’表示该权重为负数，则压缩后的1bit权重为‘1’，当8bit权重的最高位为‘0’表示该权重为正数，则压缩后的1bit权重为‘-1’；在8bit权重计算模式时，网络权重压缩子单元仅读取8bit权重用于后续运算；

所述卷积神经网络乘法器子单元，用于进行16bit语音数据和权重的卷积运算的乘法部分；

所述卷积神经网络计算加法树子单元，采用由8个加法器组成的树形分层结构，用于把9个数据的相加过程分成4级加法树处理过程，完成卷积运算的加法部分。

7.根据权利要求3所述的基于神经网络的自配置环境语音识别系统，其特征在于，

所述语音识别模块中的各层全连接神经网络计算子模块结构相同，包括：可配置全连接神经网络计算单元、批量归一化计算单元、激活函数单元；

所述可配置全连接神经网络计算单元，用于进行16bit语音数据和计算模式对应权重的全连接运算；

所述批量归一化计算单元，用于进行神经网络的归一化计算，使神经网络输出保持相同分布；

所述激活函数单元，用于构建神经网络的激活函数，为神经网络引入非线性因素。

8.根据权利要求7所述的基于神经网络的自配置环境语音识别系统，其特征在于，

所述第一层全连接神经网络的参数为：30个神经元；

所述第二层全连接神经网络的参数为：12个神经元。

9.根据权利要求7所述的基于神经网络的自配置环境语音识别系统，其特征在于，

可配置全连接神经网络计算单元包括：网络权重压缩子单元、全连接神经网络乘法器子单元；

所述网络权重压缩子单元，首先读取权重数据，并接收系统计算模式配置信号，由系统计算模式配置信号决定是否网络权重压缩子单元的开启和关闭；在1bit压缩权重计算模式下，网络权重压缩子单元处于开启状态，先读取8bit权重并判断其符号，当8bit权重的最高位为‘1’表示该权重为负数，则压缩后的1bit权重为‘1’，当8bit权重的最高位为‘0’表示该权重为正数，则压缩后的1bit权重为‘-1’；在8bit权重计算模式时，网络权重压缩子单元仅读取8bit权重用于后续运算；

所述全连接神经网络乘法器子单元，用于进行16bit语音数据和权重的乘法运算。

10.利用权利要求1至9所述的基于神经网络的自配置环境语音识别系统而实现的一种基于神经网络的自配置环境语音识别方法，其特征在于，

所述自配置环境语音识别方法包括：

步骤1，当前周期，采集环境语音数据，并对环境语音数据进行截位处理，得到16bit语音数据；

步骤2，根据上一周期的语音识别结果，判别当前周期语音识别神经网络的计算模式：即当上一周期语音识别结果中有人声存在时，则判定当前周期语音识别神经网络的计算模式为8bit权重计算模式；反之，则判定当前周期语音识别神经网络的计算模式为1bit压缩权重计算模式；

步骤3，将16bit语音数据和当前计算模式对应的权重输入至神经网络中，由神经网络先进行卷积运算再进行全连接运算，最终获得当前周期语音识别结果。

技术总结
一种基于神经网络的自配置环境语音识别系统及方法，经过环境语音读取模块实时读取环境中的语音信号，然后神经网络计算模式动态解析模块解析当前需要的工作模式，最后采集到的信号经由语音识别模块识别出具体内容。在实现用神经网络进行语音识别的基础上，给系统的网络权重部分设计了两种工作模式，正常工作时，工作在1bit权重的工作模式下，大大降低了运算负担，降低功耗，当网络识别结果发现环境背景音中有可能的人声存在时，将工作模式切换至8bit权重，使识别结果更加精确，可以识别具体的语音内容，解决了现有语音识别系统功耗难以控制的技术问题。

技术研发人员：王镇
受保护的技术使用者：南京博芯电子技术有限公司
技术研发日：2021.05.11
技术公布日：2021.08.13

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种基于神经网络的自配置环境语音识别系统及方法与流程

相关文章

最热文献