一种基于语音数据的质量评价方法与流程

2021-09-17 22:02:00 来源：中国专利 TAG：语音评价质量数据方法

1.本发明涉及语音数据质量评价技术领域，具体为一种基于语音数据的质量评价方法。

背景技术：

2.语音信号在经过传输、处理之后难免会发生失真，尤其是伴随着各种语音算法的出现，例如语音编码、语音增强、语音合成和信道传输等等，这些算法虽满足了某些应用需要，但也不可避免的对语音造成损伤，而且算法引起的失真类别不能从一而论，导致对语音质量造成的影响不可预料。语音质量更是检测语音设备和算法性能的重要指标，因而如何对语音质量进行评价显得尤为重要。
3.但是在现有技术中，不能够对测试语音进行预处理，导致工作强度增加，降低了语音质量评价的工作效率，同时，不能够轻易获取到语音的质量好坏，导致语音测试的工作强度降低。

技术实现要素：

4.本发明的目的就在于提出一种基于语音数据的质量评价方法，获取一段20秒的语音，随后获取到一段质量评价合格的语音并将其标记为标准语音，随后将测试语音进行一分钟不间断播放，且以每秒的时刻点为监测点，获取到一分钟内测试语音中监测点对应的语音序列间隔，语音序列间隔表示为语音内的字节播放时通过监测点的两个字节的间隔时长，随后获取到一分钟内标准语音中监测点对应的语音序列间隔；将监测语音中的语音序列间隔与标准语音中的语音序列间隔进行比较，将监测语音进行帧划分，将监测语音划分为若干个语音帧，获取到语音帧的音频波长和频率，随后通过公式获取到语音帧的参数分析系数x i，将测试语音内语音帧构建参数分析系数集合，并将参数分析系数集合内子集与参数分析系数阈值进行比较；对测试语音进行预处理，提高了测试语音的合格率，防止对不合格语音进行质量评价，导致工作强度增加，降低了语音质量评价的工作效率；
5.本发明的目的可以通过以下技术方案实现：
6.一种基于语音数据的质量评价方法，包括以下步骤：
7.步骤一、语音预处理，对语音数据进行预处理，从而对语音数据进行检测；
8.步骤二、数据分析，对通过预处理的语音数据进行数据分析，获取到语音数据的质量分析系数；
9.步骤三、质量评价，构建质量评价模型，对语音数据进行质量评价；
10.步骤一中语音数据预处理的具体步骤如下：
11.步骤s1：获取一段20秒的语音，并将其标记为测试语音，随后获取到一段质量评价合格的语音并将其标记为标准语音，随后将测试语音进行一分钟不间断播放，且以每秒的时刻点为监测点，获取到一分钟内测试语音中监测点对应的语音序列间隔，语音序列间隔表示为语音内的字节播放时通过监测点的两个字节的间隔时长，随后获取到一分钟内标准
语音中监测点对应的语音序列间隔；
12.步骤s2：将监测语音中的语音序列间隔与标准语音中的语音序列间隔进行比较，若监测语音中的语音序列间隔＞标准语音中的语音序列间隔，则判定测试语音序列间隔不合格，将其标记为序列间隔异常语音，若监测语音中的语音序列间隔≤标准语音中的语音序列间隔，则判定测试语音序列间隔合格，进入步骤s3；
13.步骤s3：将监测语音进行帧划分，将监测语音划分为若干个语音帧，并将若干个语音帧标记为i，i＝1，2，
……
，n，n为正整数，获取到语音帧的音频波长和频率，并将语音帧的音频波长和频率分别标记为bi和pi，随后通过公式xi＝β(bi
×
a1 pi
×
a2)2获取到语音帧的参数分析系数xi，其中，a1和a2均为比例系数，且β为误差修正因子，取值为1.36；
14.步骤s4：将测试语音内语音帧构建参数分析系数集合，并将参数分析系数集合内子集与参数分析系数阈值进行比较，若子集≥参数分析系数阈值，则将对应子集标记为合格子集，若子集＜参数分析系数阈值，则将对应子集标记为不合格子集；若参数分析系数集合内合格子集数量＞不合格子集，则获取到参数分析系数集合的平均值并将其标记为测试语音的参数分析系数rs，反之则将对应测试语音标记为参数不合格语音；对测试语音进行预处理，提高了测试语音的合格率，防止对不合格语音进行质量评价，导致工作强度增加，降低了语音质量评价的工作效率。
15.进一步地，步骤二中获取语音数据的质量分析系数的具体步骤如下：
16.步骤ss1：将测试语音标记为o，o＝1，2，
……
，m，m为正整数，获取到测试语音每个监测点的音频信噪比，并将测试语音每个监测点的音频信噪比标记为xzo；
17.步骤ss2：获取到测试语音每个监测点的音频周期，并将测试语音每个监测点的音频周期标记为zqo；
18.步骤ss3：获取到测试语音每个监测点的音频波长，并将测试语音每个监测点的音频波长标记为bco；
19.步骤ss4：通过公式获取到测试语音的质量分析系数fxo，其中，s1、s2以及s3均为比例系数，且s1＞s2＞s3＞0，e为自然常数；
20.步骤ss5：将测试语音的质量分析系数fxo与质量分析系数阈值进行比较：
21.若测试语音的质量分析系数fxo≥质量分析系数阈值，则判定测试语音质量合格，生成质量合格信号并将对应测试语音标记为质量合格测试语音；
22.若测试语音的质量分析系数fxo＜质量分析系数阈值，则判定测试语音质量不合格，生成质量不合格信号并将对应测试语音标记为质量不合格测试语音。
23.进一步地，步骤三中构建质量评价模型对语音数据进行质量评价，具体构建评价步骤如下：
24.步骤t1：获取到测试语音的参数分析系数rs和质量合格测试语音对应的质量分析系数fxo，随后构建质量评价模型，即质量评价模型公式为pj＝[α(e
rs
×
b1
e
fxo
×
b2
)
×
t]
3.65
，其中，b1和b2均为比例系数，且b1＞b2＞0，e为自然常数，t为自变量时间，pj为质量评价系数；
[0025]
步骤t2：以自变量时间为x轴，以质量评价系数为y轴建立直角坐标系，且以整点时刻为x轴上的点，并将x轴上的整点时刻点对应的直角坐标系内点进行标记，同时将直角坐
标系中内点进行连线构建测试语音的质量评价曲线；
[0026]
步骤t3：对质量评价曲线进行分析，将测试语音的总时长中对应的整点时刻进行分析，获取到两个相邻整点时刻之间的质量评价曲线斜率，并将对应质量评价曲线斜率将比较：
[0027]
若对应质量评价曲线斜率＜40度，则判定对应相邻整点时刻之间的测试语音正常；若40度≤对应质量评价曲线斜率＜65度，则判定对应相邻整点时刻之间的测试语音异常，并将对应相邻整点时刻之间的测试语音标记为异常语音，生成语音整顿信号并将语音整顿信号发送至管理人员的手机终端；对语音内每个时间段均进行质量评价，能够轻易获取到语音的质量好坏，提高了语音质量监测的准确性，同时降低了语音测试的工作强度，提高了工作效率。
[0028]
与现有技术相比，本发明的有益效果是：
[0029]
1、本发明中，获取一段20秒的语音，随后获取到一段质量评价合格的语音并将其标记为标准语音，随后将测试语音进行一分钟不间断播放，且以每秒的时刻点为监测点，获取到一分钟内测试语音中监测点对应的语音序列间隔，语音序列间隔表示为语音内的字节播放时通过监测点的两个字节的间隔时长，随后获取到一分钟内标准语音中监测点对应的语音序列间隔；将监测语音中的语音序列间隔与标准语音中的语音序列间隔进行比较，将监测语音进行帧划分，将监测语音划分为若干个语音帧，获取到语音帧的音频波长和频率，随后通过公式获取到语音帧的参数分析系数xi，将测试语音内语音帧构建参数分析系数集合，并将参数分析系数集合内子集与参数分析系数阈值进行比较；对测试语音进行预处理，提高了测试语音的合格率，防止对不合格语音进行质量评价，导致工作强度增加，降低了语音质量评价的工作效率；
[0030]
2、本发明中，构建质量评价模型对语音数据进行质量评价，获取到测试语音的参数分析系数rs和质量合格测试语音对应的质量分析系数fxo，随后构建质量评价模型，即质量评价模型公式为pj＝[α(e
rs
×
b1
e
fxo
×
b2
)
×
t]
3.65
，以自变量时间为x轴，以质量评价系数为y轴建立直角坐标系，且以整点时刻为x轴上的点，并将x轴上的整点时刻点对应的直角坐标系内点进行标记，同时将直角坐标系中内点进行连线构建测试语音的质量评价曲线；对质量评价曲线进行分析，将测试语音的总时长中对应的整点时刻进行分析，获取到两个相邻整点时刻之间的质量评价曲线斜率，并将对应质量评价曲线斜率将比较；构建质量评价模型，根据模型公式构建测试语音的质量评价曲线，对语音内每个时间段均进行质量评价，能够轻易获取到语音的质量好坏，提高了语音质量监测的准确性，同时降低了语音测试的工作强度，提高了工作效率。
附图说明
[0031]
为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0032]
图1为本发明的原理框图。
具体实施方式
[0033]
下面将结合实施例对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。
[0034]
如图1所示，一种基于语音数据的质量评价方法，包括以下步骤：
[0035]
步骤一、语音预处理，对语音数据进行预处理，从而对语音数据进行检测；
[0036]
步骤二、数据分析，对通过预处理的语音数据进行数据分析，获取到语音数据的质量分析系数；
[0037]
步骤三、质量评价，构建质量评价模型，对语音数据进行质量评价；
[0038]
步骤一中语音数据预处理的具体步骤如下：
[0039]
步骤s1：获取一段20秒的语音，并将其标记为测试语音，随后获取到一段质量评价合格的语音并将其标记为标准语音，随后将测试语音进行一分钟不间断播放，且以每秒的时刻点为监测点，获取到一分钟内测试语音中监测点对应的语音序列间隔，语音序列间隔表示为语音内的字节播放时通过监测点的两个字节的间隔时长，随后获取到一分钟内标准语音中监测点对应的语音序列间隔；
[0040]
步骤s2：将监测语音中的语音序列间隔与标准语音中的语音序列间隔进行比较，若监测语音中的语音序列间隔＞标准语音中的语音序列间隔，则判定测试语音序列间隔不合格，将其标记为序列间隔异常语音，若监测语音中的语音序列间隔≤标准语音中的语音序列间隔，则判定测试语音序列间隔合格，进入步骤s3；
[0041]
步骤s3：将监测语音进行帧划分，将监测语音划分为若干个语音帧，并将若干个语音帧标记为i，i＝1，2，
……
，n，n为正整数，获取到语音帧的音频波长和频率，并将语音帧的音频波长和频率分别标记为bi和pi，随后通过公式xi＝β(bi
×
a1 pi
×
a2)2获取到语音帧的参数分析系数xi，其中，a1和a2均为比例系数，且β为误差修正因子，取值为1.36；
[0042]
步骤s4：将测试语音内语音帧构建参数分析系数集合，并将参数分析系数集合内子集与参数分析系数阈值进行比较，若子集≥参数分析系数阈值，则将对应子集标记为合格子集，若子集＜参数分析系数阈值，则将对应子集标记为不合格子集；若参数分析系数集合内合格子集数量＞不合格子集，则获取到参数分析系数集合的平均值并将其标记为测试语音的参数分析系数rs，反之则将对应测试语音标记为参数不合格语音；对测试语音进行预处理，提高了测试语音的合格率，防止对不合格语音进行质量评价，导致工作强度增加，降低了语音质量评价的工作效率；
[0043]
步骤二中获取语音数据的质量分析系数的具体步骤如下：
[0044]
步骤ss1：将测试语音标记为o，o＝1，2，
……
，m，m为正整数，获取到测试语音每个监测点的音频信噪比，并将测试语音每个监测点的音频信噪比标记为xzo；
[0045]
步骤ss2：获取到测试语音每个监测点的音频周期，并将测试语音每个监测点的音频周期标记为zqo；
[0046]
步骤ss3：获取到测试语音每个监测点的音频波长，并将测试语音每个监测点的音频波长标记为bco；
[0047]
步骤ss4：通过公式获取到测试语音的质量分析系数fxo，其中，s1、s2以及s3均为比例系数，且s1＞s2＞s3＞0，e为自然常数；
[0048]
步骤ss5：将测试语音的质量分析系数fxo与质量分析系数阈值进行比较：
[0049]
若测试语音的质量分析系数fxo≥质量分析系数阈值，则判定测试语音质量合格，生成质量合格信号并将对应测试语音标记为质量合格测试语音；
[0050]
若测试语音的质量分析系数fxo＜质量分析系数阈值，则判定测试语音质量不合格，生成质量不合格信号并将对应测试语音标记为质量不合格测试语音；
[0051]
步骤三中构建质量评价模型对语音数据进行质量评价，具体构建评价步骤如下：
[0052]
步骤t1：获取到测试语音的参数分析系数rs和质量合格测试语音对应的质量分析系数fxo，随后构建质量评价模型，即质量评价模型公式为pj＝[α(e
rs
×
b1
e
fxo
×
b2
)
×
t]
3.65
，其中，b1和b2均为比例系数，且b1＞b2＞0，e为自然常数，t为自变量时间，pj为质量评价系数；
[0053]
步骤t2：以自变量时间为x轴，以质量评价系数为y轴建立直角坐标系，且以整点时刻为x轴上的点，并将x轴上的整点时刻点对应的直角坐标系内点进行标记，同时将直角坐标系中内点进行连线构建测试语音的质量评价曲线；
[0054]
步骤t3：对质量评价曲线进行分析，将测试语音的总时长中对应的整点时刻进行分析，获取到两个相邻整点时刻之间的质量评价曲线斜率，并将对应质量评价曲线斜率将比较：
[0055]
若对应质量评价曲线斜率＜40度，则判定对应相邻整点时刻之间的测试语音正常；若40度≤对应质量评价曲线斜率＜65度，则判定对应相邻整点时刻之间的测试语音异常，并将对应相邻整点时刻之间的测试语音标记为异常语音，生成语音整顿信号并将语音整顿信号发送至管理人员的手机终端；对语音内每个时间段均进行质量评价，能够轻易获取到语音的质量好坏，提高了语音质量监测的准确性，同时降低了语音测试的工作强度，提高了工作效率。
[0056]
本发明工作原理：
[0057]
一种基于语音数据的质量评价方法，具体质量评价方法步骤如下：语音预处理，对语音数据进行预处理，从而对语音数据进行检测；数据分析，对通过预处理的语音数据进行数据分析，获取到语音数据的质量分析系数；质量评价，构建质量评价模型，对语音数据进行质量评价；
[0058]
获取一段20秒的语音，并将其标记为测试语音，随后获取到一段质量评价合格的语音并将其标记为标准语音，随后将测试语音进行一分钟不间断播放，且以每秒的时刻点为监测点，获取到一分钟内测试语音中监测点对应的语音序列间隔，语音序列间隔表示为语音内的字节播放时通过监测点的两个字节的间隔时长，随后获取到一分钟内标准语音中监测点对应的语音序列间隔；将监测语音中的语音序列间隔与标准语音中的语音序列间隔进行比较，将监测语音进行帧划分，将监测语音划分为若干个语音帧，并将若干个语音帧标记为i，i＝1，2，
……
，n，n为正整数，获取到语音帧的音频波长和频率，随后通过公式获取到语音帧的参数分析系数x i，将测试语音内语音帧构建参数分析系数集合，并将参数分析系数集合内子集与参数分析系数阈值进行比较。
[0059]
上述公式均是去量纲取其数值计算，公式是由采集大量数据进行软件模拟得到最近真实情况的一个公式，公式中的预设参数由本领域的技术人员根据实际情况进行设置。
[0060]
以上内容仅仅是对本发明结构所作的举例和说明，所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，只要不偏离发明的结构或者超越本权利要求书所定义的范围，均应属于本发明的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种基于语音数据的质量评价方法与流程

相关文章

最热文献