一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于词库学习的饱和潜水氦语音解读方法与流程

2021-07-27 15:30:00 来源:中国专利 TAG:解读 语音 地说 词库 饱和

技术特征:

1.一种基于词库学习的饱和潜水氦语音解读方法,包括至少1个潜水员、1个氦语音校正网络和1个氦语音解读网络,潜水员的氦语音信号为s,所述氦语音解读方法包括如下步骤:

第一阶段-——校正网络学习

步骤1、词库信号构建——根据饱和潜水作业规范要求,构建潜水员饱和潜水作业常用工作语言词库k;

步骤2、监督信号生成——在正常大气压环境下,潜水员i朗读词库k中的文字获得监督信号xi,从而生成校正网络机器学习监督信号集x={xi},i=1,2,…,i,i为潜水员的人数;

步骤3、矢量信号生成——潜水员i分别在饱和潜水深度h1,h2,h3,…hl,…,hl对应的环境下朗读词库k中的文字获得矢量信号yi.l,l=1,2,…,l,从而生成校正网络机器学习的矢量信号集y={yi.l},l为饱和潜水深度的序号;

步骤4、校正网络学习——以矢量信号yi.l作为输入信号,以监督信号xi作为期望输出信号,校正网络进行监督学习,形成与矢量信号yi.l相对应的校正网络参数集c={ci.l};

第二阶段-——氦语音解读

步骤5、校正网络参数选取——将潜水员饱和潜水作业时的氦语音信号s与矢量信号集y中所有矢量信号yi.l进行拟合,选择一个拟合度最高的矢量信号yn.l所对应的参数cn,l作为校正网络的网络参数;

步骤6、氦语音校正——将氦语音信号s作为校正网络的输入信号,对氦语音信号s进行校正,生成校正语音信号t;

步骤7、解读网络学习——将校正语音信号t中的语音与校正网络机器学习监督信号集x中监督信号按文字进行逐一比较,计算他们之间的拟合度,在监督信号集x中选取拟合度最高的文字对应的语音与校正语音信号t文字对应的语音相匹配成组,并将这些匹配成组的语音按拟合度由高到低排序,选取拟合度前p%的组合,所述组合中校正语音信号t的语音作为解读网络机器学习的矢量信号u,所述组合中监督信号集x的文字对应的语音作为解读网络机器学习的监督信号v,解读网络进行监督学习;

步骤8、氦语音解读——以校正语音信号t作为解读网络的输入信号,完成氦语音s的解读。

2.根据权利要求1所述的基于词库学习的饱和潜水氦语音解读方法,其特征在于:步骤5和步骤7中,所述拟合度的评价指标为欧氏距离或方差,欧氏距离越小拟合度越高,方差越小拟合度越高。

3.根据权利要求1所述的基于词库学习的饱和潜水氦语音解读方法,其特征在于:根据氦语音解读器使用单位饱和潜水作业规范要求进行潜水员饱和潜水作业常用工作语言词库k的设置。

4.根据权利要求1所述的基于词库学习的饱和潜水氦语音解读方法,其特征在于:氦语音测试点深度h1,h2,h3,…,hl均匀覆盖打捞潜水作业的预设深度。

5.根据权利要求4所述的基于词库学习的饱和潜水氦语音解读方法,其特征在于:测试点的个数根据预设打捞潜水作业深度和测试点间隔确定。

6.根据权利要求1所述的基于词库学习的饱和潜水氦语音解读方法,其特征在于:所述步骤2中,当校正网络的监督信号采用文字标签时,直接采用词库k作为监督信号x;对应的,所述步骤6中所产生的校正语音信号t也是文字,所述步骤8中所产生的氦语音解读信号为文字。

7.根据权利要求1所述的基于词库学习的饱和潜水氦语音解读方法,其特征在于:词库k中的词汇在100个~300个之间,则p的大小选取在85~98之间。

8.根据权利要求1所述的基于词库学习的饱和潜水氦语音解读方法,其特征在于:步骤4和步骤7中采用的学习方法为k-近邻算法、决策树算法;或者自训练算法、半监督支持向量机算法。

9.根据权利要求1所述的基于词库学习的饱和潜水氦语音解读方法,其特征在于:对潜水员的语音进行失真识别,若失真较低,则校正语音信号t可以直接作为氦语音解读信号输出。

10.根据权利要求1所述的基于词库学习的饱和潜水氦语音解读方法,其特征在于:步骤1-步骤4是潜水员在潜水舱中完成的,步骤5-步骤8是是潜水员在深海潜水作业时完成的。


技术总结
本发明涉及一种基于词库学习的饱和潜水氦语音解读方法,在一个包括潜水员、校正网络和解读网络的系统中,建立饱和潜水作业常用工作语言词库,由潜水员分别不同环境下朗读,生成校正网络的监督信号和矢量信号,校正网络对不同潜水员在不同潜水深度的氦语音进行学习得到网络校正参数,并对潜水员的氦语音进行校正得到校正语音;解读网络对校正语音进行学习并完成氦语音的解读。本发明通过设置潜水员在不同环境下个体语音信号特征和工作语言词库特征,将机器学习引入到氦语音解读中,解决了饱和潜水氦语音的解读问题,减少了网络对学习样本数的要求,提高了氦语音解读器在不同潜水深度的自适应性,尤其适合于不同潜水深度环境下的氦语音的完备解读。

技术研发人员:张士兵;李明;李冬梅;包志华;吴建绒
受保护的技术使用者:南通大学
技术研发日:2021.04.26
技术公布日:2021.07.27
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜