一种用于英语学习的英语发音质量评估方法与流程

2021-07-02 21:13:00 来源：中国专利 TAG：

本发明属于语音识别与评价
技术领域：
，特别涉及一种用于英语学习的英语发音质量评估方法。
背景技术：
：英语口语是英语学习中的重要环节，在英语学习尤其是自学过程中，及时检验发音是否准确及与标准音之间的差距是十分重要的。而在实际学习过程中，学习者一般很难发现自身在发音方面存在的问题，或对自身发音做出客观、准确的评价；导致在发音方面很难快速提高。技术实现要素：本发明的目的是提供一种用于英语学习的英语发音质量评估方法，其能够进行语速和音准分别评价，并能够基于语速和音准给出综合评价。本发明提供的技术方案为：一种用于英语学习的英语发音质量评估方法，包括如下步骤：步骤一、将待测评语音与标准语音进行对比，得到所述待测评语音的语速偏差值；步骤二、确定所述待测评语音的音准分值；步骤三、采用模糊控制的方法，根据所述音准偏差率和语速偏差率确定英语发音质量等级。优选的是，在所述步骤一中，所述语速偏差值通过如下公式进行计算：式中，r表示待测评语音的语速偏差值，n表示标准语音中的单词数量，ls表示标准语音的总帧长度，lt表示待测评语音的总帧长度，sbegin(i)表示标准语音中第i个单词的起始帧位置，tbegin(i)待测评语音中第i个单词的起始帧位置，send(i)表示标准语音中第i个单词的结束帧位置，tend(i)表示待测评语音中第i个单词的结束帧位置。优选的是，在所述步骤二中，确定所述待测评语音的音准分值，包括如下步骤：步骤1、将待测评的语音中包含的音素组成音素集q＝{q1，q2，…，qn}；步骤2、计算每个音素的后验概率评分：步骤3、计算待测评语音的音准分值：其中，n为音素集中音素的数量，qi表示第i个音素，ei为第i个音素发音的起始帧，si为第i个音素发音的结束帧，p(qi)为音素qi的先验概率，mi为后验概率空间，p(o[i；si,ei|qi])p(qi)为音素qi的似然度；qj为后验概率空间中的音素，p(o[i；si,ei|qj])p(qj)为音素qj的似然度，p(qj)为音素qj的先验概率。优选的是，在所述步骤三中，通过模糊控制确定英语发音质量等级包括：分别将待测评语音的语速偏差值r和待测评语音的音准分值ρ换为模糊论域中的量化等级；将待测评语音的语速偏差值r和待测评语音的音准分值ρ输入模糊控制模型，所述待测评语音的语速偏差值r分为5个等级，所述待测评语音的音准分值ρ分为5个等级；模糊控制模型输出为英语发音质量等级，将所述英语发音质量等级分为5个等级，每个等级分别对应英语发音质量的5中水平等级。优选的是，所述待测评语音的语速偏差值r的论域为{0，1}，所述待测评语音的音准分值ρ的论域为{0，100}，所述英语发音质量等级的论域为{0，1}，阈值为0.51。优选的是，待测评语音的语速偏差值r分为5个等级，模糊集为{n，nm，m，ml，l}；所述待测评语音的音准分值ρ分为5个等级，模糊集为{l，lm，m，mh，h}；所述英语发音质量等级分为5个等级，模糊集为{s，sm，m，mb，b}；隶属函数均选用梯形隶属函数。优选的是，所述模糊控制模型的控制规则为：如果评语音的语速偏差值r对应的模糊等级为“n”，待测评语音的音准分值ρ对应的模糊等级为“l”，则英语发音质量等级对应的模糊等级为“s”，即英语发音质量等级低；如果评语音的语速偏差值r对应的模糊等级为“l”，待测评语音的音准分值ρ对应的模糊等级为“h”，则英语发音质量等级对应的模糊等级为“b”，即英语发音质量等级高；如果英语发音质量等级为“s或sm”，则英语发音质量等级低；如果英语发音质量等级为“b或mb”，则英语发音质量等级高；如果英语发音质量等级为“m”，英语发音质量等级为英语发音质量等级程度阈值，如果评语音的语速偏差值r或待测评语音的音准分值ρ数稍有变化，则会形成英语发音质量等级高和英语发音质量等级低的切换。本发明的有益效果是：本发明提供的用于英语学习的英语发音质量评估方法，能够进行语速和音准分别评价，并能够基于语速和音准给出综合评价。附图说明图1为本发明所述的待测评语音的语速偏差值r的隶属函数图。图2为本发明所述的待测评语音的音准分值ρ的隶属函数图。图3为本发明所述的英语发音质量等级dj的隶属函数图。具体实施方式下面结合附图对本发明做进一步的详细说明，以令本领域技术人员参照说明书文字能够据以实施。本发明提供了一种用于英语学习的英语发音质量评估方法，包括：(1)对采集到的发音测试者发出语音进行滤波等预处理，得到待测评语音。将所述待测评语音与预先存储在系统中的标准语音进行对比，对所述待测评语音的语速进行评价，得到待测评语音的语速偏差值。其中，标准语音的内容与待测评语音的内容完全相同。在本实施例中，语速偏差值通过如下公式进行计算：式中，r表示待测评语音的语速偏差值，n表示标准语音中的单词数量，ls表示标准语音的总帧长度，lt表示待测评语音的总帧长度，sbegin(i)表示标准语音中第i个单词的起始帧位置，tbegin(i)待测评语音中第i个单词的起始帧位置，send(i)表示标准语音中第i个单词的结束帧位置，tend(i)表示待测评语音中第i个单词的结束帧位置。在本实施例中，采用逐个单词进行对比，并叠加的方式，对语速偏差值进行计算；相对于对整段语音或整句话进行语速偏差计算的方法，本实施例提供的计算方法能够防止在实际使用中，有些待测评语音时快时慢，导致整体偏差不大而引起的语速计算误差；从而得到更为真实的测评结果。当得到语速偏差之后，还包括将语速偏差值与语速偏差阈值进行对比，当语速偏差值高于语速偏差阈值时，做出提示，提醒测试者注意语速问题。(2)确定所述待测评语音的音准分值，具体包括如下步骤：步骤1、将待测评的语音中包含的n个音素组成音素集，q＝{q1，q2，…，qn}；步骤2、计算待测评语音中每个音素的后验概率评分：在隐马尔可夫模型的语音识别中，通常认为各因素的先验概率相同，而且分母的求和可以通过求最大值代替，因此，上述公式可简化为：其中，分子表示测试者真实发音与标准语音模型的匹配情况，对应音素强制线性匹配网络fa(forcedaligment)的输出，分母表示测试者实际发音的音素级别的识别结果，对应无语阀模型限制的音素循环识别网络pl(phonemeloop)的输出。步骤3、计算待测评语音的音准分值：式中，o[i；si,ei]表示从待测评语音中提取的声学特征，即观测数据，n为音素集中音素的数量，qi表示第i个音素，ei为第i个音素发音的起始帧，si为第i个音素发音的结束帧，p(qi)为音素qi的先验概率，mi为后验概率空间，p(o[i；si,ei|qi])p(qi)为音素qi的似然度；qj为后验概率空间中的音素，p(o[i；si,ei|qj])p(qj)为音素qj的似然度，p(qj)为音素qj的先验概率。当得到待测评语音的音准分值之后，还包括根据待测评语音的音准分值高低，提示测评者注意音准问题。(3)采用模糊控制的方法，根据所述音准偏差率和语速偏差率确定英语发音质量等级。具体包括：分别将待测评语音的语速偏差值r，以及待测评语音的音准分值ρ转换为模糊论域中的量化等级；将所述待测评语音的语速偏差值r与待测评语音的音准分值ρ输入模糊控制模型，所述待测评语音的语速偏差值r分为5个等级，所述待测评语音的音准分值ρ分为5个等级；模糊控制模型输出为英语发音质量等级，将所述英语发音质量等级分为5个等级，每个等级分别对应英语发音质量的5中水平等级。以待测评语音的语速偏差值r与待测评语音的音准分值ρ为输入变量，以英语发音质量等级(dj)为输出变量；如果英语发音质量等级(dj)达到或高于设定阈值，则英语发音质量等级(dj)高(达到合格水平)。在本实施例中，所述设定阈值为0.51。所述待测评语音的语速偏差值r的论域为{0,0.2,0.35,0.5,0.65,0.8,1}，所述待测评语音的音准分值ρ的论域为{0,20,35,50,65,80,100}，所述英语发音质量等级(dj)的论域为{0,0.2,0.35,0.5,0.65,0.8,1}，输入变量r的模糊语言集为n(小)，nm(较小)，m(中等)，ml(较大)，l(大)；输入变量ρ的模糊语言集为l(低)，lm(较低)，m(中等)，mh(较高)，h(高)；输出变量dj的模糊语言集为：s(低)，sm(较低)，m(中等)，mb(较高)，b(高)；r与ρ的量化因子分别为αr＝1.0，αρ＝0.01。r的隶属函数采用梯形隶属函数(如图1所示)，ρ的隶属函数采用梯形隶属函数(如图2所示)；输出变量dj的隶属函数也采用梯形隶属函数(如图3所示)。如表1所示，给出了英语发音质量等级模糊逻辑控制模型的模糊控制规则，即用模糊语言描述控制器输入变量(r与ρ)与输出变量(dj)间的关系。表1模糊控制规则如果待测评语音的语速偏差值r对应的模糊等级为“n”，待测评语音的音准分值ρ对应的模糊等级为“l”，则待测评语音的发音质量等级对应的模糊等级为“s”，即待测评语音的发音质量等级为最低；如果待测评语音的语速偏差值r对应的模糊等级为“l”，待测评语音的音准分值ρ对应的模糊等级为“h”，则待测评语音的发音质量等级对应的模糊等级为“b”，即待测评语音的发音质量等级为最高；如果待测评语音的发音质量等级为“s或sm”，则待测评语音的发音质量较低，没有达到合格水平。如果待测评语音的发音质量等级为“b或mb”，则表示待测评语音的发音质量较高，在合格水平以上。如果待测评语音的发音质量等级为“m”，英语发音质量等级为英语发音质量等级程度阈值，如果评语音的语速偏差值r或待测评语音的音准分值ρ数稍有变化，则会形成英语发音质量等级高和英语发音质量等级低的切换。选取多段录制好1000段待测音频，分别采用本发明提供的方法进行评估和专家评分的方法进行质量评估。其中，专家评分时，每组为5个专家，以语速和音准作为采分点，进行综合评分，并对每段待测评语音得到的5个得分采用去掉最高分和最低分，取其余3个得分的平均分的方式进行计分。事先制定专家评分与本方法评分的对应规则，如表2所示：表2专家评分与本方法评分的对应规则专家评分0～3031～5556～7071～8586～100本方法ssmmmbb如果采用本发明提供的方法得到的某段待测音频的英语发音质量等级与专家的评分符合表2中的对应关系，则认为本本发明提供的方法准确。经试验验证，有927段待测音频通过本发明提供的方法得到的质量等级与专家评分的分数符合表2中的对应关系，相当于本发明提供的方法得到的英语发音质量等级的准确率为92.7％。证明本发明提供的英语发音质量评估方法具有较高的准确率，完全可以应用于英语学习中发音质量的评估。尽管本发明的实施方案已公开如上，但其并不仅仅限于说明书和实施方式中所列运用，它完全可以被适用于各种适合本发明的领域，对于熟悉本领域的人员而言，可容易地实现另外的修改，因此在不背离权利要求及等同范围所限定的一般概念下，本发明并不限于特定的细节和这里示出与描述的图例。当前第1页12

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种用于消除电吹风噪音的电吹风消声器的制作方法

一种用于英语学习的英语发音质量评估方法与流程

相关文章

最热文献