一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

使用加速度计感测骨传导的语音识别的制作方法

2023-04-01 19:33:14 来源:中国专利 TAG:

技术特征:
1.一种语音识别系统,包括:壳体,被配置为接触用户的身体的部位;mems加速度计,位于所述壳体内并且被定位为感测来自所述用户的骨骼的振动;以及处理器,位于所述壳体内并且被耦合到所述加速度计,所述处理器被配置为处理所感测的振动并输出指示所述用户说出的词语的标识的信号。2.根据权利要求1所述的语音识别系统,其中被接触的所述身体部位是所述用户的颈部。3.根据权利要求2所述的语音识别系统,其中所述用户的骨骼包括舌骨。4.根据权利要求1所述的语音识别系统,其中所述用户的骨骼包括下巴骨。5.根据权利要求1所述的语音识别系统,其中所述用户的骨骼包括腭骨。6.一种用户说出的词语识别方法,包括:使用加速度计感测从所述用户的骨骼传导的音频振动;将与所感测的振动相对应的来自所述加速度计的样本信号输出到处理器;使用所述样本信号作为针对分类模型的输入来计算标签值;如果所述标签值在阈值内,则确定所述样本信号与所存储的词语匹配;以及如果所述样本信号在所述阈值内,则输出所述所存储的词语。7.根据权利要求6所述的词语识别方法,其中所述加速度计和所述处理器位于同一半导体衬底上。8.根据权利要求6所述的词语识别方法,其中所述加速度计和所述处理器位于同一壳体中。9.根据权利要求6所述的词语识别方法,其中所述加速度计和所述处理器位于两个不同的壳体中。10.根据权利要求9所述的词语识别方法,其中所述加速度计位于与所述用户相邻的壳体中,并且所述处理器位于远程服务器中。11.一种执行用户说出的词语识别的方法,包括:使用加速度计来感测从所述用户的骨骼传导的振动参考集;基于所感测的参考振动,将参考信号从所述加速度计输出到处理器;将所述参考信号存储在存储器中;接收提供与所述参考信号相对应的词语的标识的输入;将所述词语作为与所述参考信号的匹配项存储在所述存储器中;针对多个参考集重复先前的感测、输出、存储、接收和存储步骤,以存储多个不同的词语;使用所存储的多个参考集来训练分类模型;使用加速度计来感测从所述用户的骨骼传导的音频振动样本集;基于所述样本感测的振动将样本信号从所述加速度计输出到处理器;使用所述样本信号作为针对所述分类模型的输入来计算标签值;如果所述标签值在阈值内,则确定所述样本信号与所存储的词语匹配;以及如果所述样本信号匹配,则输出所述所存储的词语。12.根据权利要求11所述的执行用户说出的词语识别的方法,其中所述加速度计测量
x、y和z维度中的每一个维度上的多个振动。13.根据权利要求11所述的执行用户说出的词语识别的方法,包括将来自所述加速度计的多个测量值处理为数据流。14.根据权利要求11所述的执行用户说出的词语识别的方法,其中,使用所存储的多个参考集来训练所述分类模型的步骤包括以下项:对从所述用户的骨骼传导的振动执行信号卷积;用非线性函数修改所述信号卷积的输出;对根据所述非线性函数的经修改的信号执行比例偏置和归一化。15.根据权利要求14所述的执行用户说出的词语识别的方法,还包括以下附加步骤:池化被执行比例偏置和归一化的所述信号;在所述池化步骤之后对从所述用户的骨骼传导的振动执行第二信号卷积;用第二非线性函数修改所述第二信号卷积的输出;对根据所述非线性函数的经修改的信号执行第二比例偏置和归一化;池化所述第二比例偏置和归一化步骤的输出;对第二池化信号应用稠密函数;以及在所述稠密函数之后对所述骨传导数据执行第三非线性函数。16.根据权利要求13所述的执行用户说出的词语识别的方法,包括使用神经模型从所述数据流检测多个词语。17.根据权利要求11所述的执行用户说出的词语识别的方法,还包括:接收第一数据流并使用所述数据流来训练神经模型;以及使用所述神经模型,从第二数据流检测多个词语。18.一种设备,包括:加速度计;电源,与所述加速度计耦合;处理器,与所述加速度计耦合,所述处理器被配置为,在操作中,存储所收集的加速度计信号的第一集合;从所述所收集的加速度计信号生成多个频谱图;传输所述所收集的加速度计信号;接收从所述多个频谱图生成的函数;以及响应于第二所收集的加速度计信号,用所述函数来确定说出的词语。19.根据权利要求18所述的设备,包括壳体,所述壳体包括所述加速度计、所述电源和所述处理器,其中所述壳体包括:位于第一端部处的扬声器,所述第一端部具有球茎形状;以及从所述扬声器延伸的延伸部,所述第一端部被配置为容纳在用户的耳朵中。20.根据权利要求19所述的设备,其中所述壳体包括具有第一延伸部和第二延伸部的中央体部,所述中央体部被配置为搁置在用户颈部的后部,并且所述第一延伸部和所述第二延伸部被配置为朝向所述用户的颈部的前部延伸。

技术总结
本公开的实施例涉及使用加速度计来感测骨传导的语音识别。使用加速度计来执行语音命令识别和自然语言识别,加速度计感测来自用户的一个或多个骨骼的振动的信号,并且不接收音频输入。由于在人说话时仅使用来自加速度计的根据他们的骨传导的信号就可以进行词语识别,因此不需要声学麦克风,并且因此声学麦克风不用于收集用于词语识别的数据。根据一个实施例,壳体包含加速度计和处理器,两者均在同一壳体内。加速度计优选地是MEMS加速度计,MEMS加速度计能够在用户说出词语时感测存在于用户骨骼中的振动。将机器学习算法应用于所收集的数据,以正确地识别在创建可听语言方面具有显著障碍的人说出的词语。显著障碍的人说出的词语。显著障碍的人说出的词语。


技术研发人员:E
受保护的技术使用者:意法半导体股份有限公司
技术研发日:2022.08.08
技术公布日:2023/2/17
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献