一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种面向管制语音品质划分的量化评价及分类方法和装置

2023-01-05 17:18:34 来源:中国专利 TAG:

技术特征:
1.一种面向管制语音品质划分的量化评价及分类方法,其特征在于,包括以下步骤:s1.输入标注有正确含义的标准管制语音数据库的语音数据;s2.从民航陆空通话本身特点考虑,构建管制语音品质划分的评价指标体系;s3.对各评价指标定性分析,包括技术分析方法和指标分级量化单位;s4.采用聚类法对单一评价指标分析得出的数据进行分组,规定在单一评价指标下各语音等级的范围值;s5.采用赋权融合算法给各个评价指标加权,组合成多个级别品质的管制语音数据集。2.根据权利要求1所述的一种面向管制语音品质划分的量化评价及分类方法,其特征在于,在步骤s2中,所述管制语音品质划分的评价指标体系包括极大型指标、中间型指标、极小型指标、指定型指标,所述极大型指标是指值越大,语音识别效果越好,包括口音,所述中间型指标是指值越接近某个中间值时,语音识别效果越好,包括语速、声调、音强,所述极小型指标是指值越小,语音识别效果越好,包括连续性、干扰程度、专业术语占比、灰色词汇含量、音变,所述指定型指标是指值为某个值时,语音识别效果好,包括语种类别。3.根据权利要求1所述的一种面向管制语音品质划分的量化评价及分类方法,其特征在于,实现步骤s4中所述采用聚类法对单一评价指标分析得出的数据进行分组,规定在单一评价指标下各语音等级的范围值,包括以下步骤:步骤s4-1:输入想要划分的等级个数、各单一评价指标分析方法得出的数据集;步骤s4-2:输出聚类结果和各等级范围。4.根据权利要求3所述的一种面向管制语音品质划分的量化评价及分类方法,其特征在于,实现步骤s4-2中的输出聚类结果的方法,包括以下步骤:步骤s4-2-1:采用手肘法或者轮廓系数法确定最优类别数;步骤s4-2-2:初始化类中心值,计算每个样本点到每个类中心的欧氏距离,将每个样本指派到与其最近的类,构成聚类结果,欧氏距离指在m维空间中两个点之间的真实距离,或者向量的自然长度,其公式如下:其中, 代表样本点 到质点
ꢀꢀ
的距离,代表第i个样本的第k个属性,代表第j个样本的第k个属性,共有m维属性;步骤s4-2-3:计算聚类结果各类别中所有样本的均值,作为新的聚类中心;步骤s4-2-4:以样本到所属类中心距离总和作为目标函数,如果迭代收敛,或者符合停止条件,输出;否则,类别数 1,返回步骤s4-2-2重复计算;步骤s4-2-5:算法使用的是迭代计算,难以达到全局最优解,对此采用启发式策略,利用纳什均衡,实现问题最优解。5.根据权利要求1所述的一种面向管制语音品质划分的量化评价及分类方法,其特征在于,将管制语音品质划分为1-5级,等级越高,语音品质越好。6.根据权利要求2所述的一种面向管制语音品质划分的量化评价及分类方法,其特征
在于,在步骤s5中所述的采用赋权融合算法包括主观赋权值法和客观赋权值法,其实现步骤如下:步骤s5-1:主观赋权值法是利用专家经验,对评价指标客观所赋权值进行调优,是利用1-9标度法对同属于一层次的各指标相对于其上一层次的同一指标的重要程度进行两两定量比较,形成判断矩阵x,采用最大特征向量法计算判断矩阵对应特征根的特征向量,检验判断矩阵满足一致性时,可将特征向量作为各指标的权重;步骤s5-2:客观赋权值法包括以下步骤:步骤s5-2-1:指标的正向化,将极小型指标和中间型指标转化为极大型指标:极小型

>极大型:中间型

>极大型:其中,为识别效果最优数值,按评价指标方法所得出的语音集中数值作为最优值, 为正向化数值;步骤s5-2-2:数据标准化,平衡指标之间的量纲误差:其中,为第i条语音在第j个评价指标下的数值;步骤s5-2-3:数据归一化,统一到区间0-1:其中,n为评价对象的数量;步骤s5-2-4:计算各评价指标的信息熵值各评价指标的信息熵值:其中,n为评价对象的数量,m为评价指标的数量,j的值从1取到m;步骤s5-2-5:计算权重:
其中,j的值从1取到m;步骤s5-3:主客观权重融合:其中,n为评价对象的数量,为主观权重, 为客观权重;步骤s5-4:每条语音综合得分:其中,为第i个评价对象在第j个评价指标下数值的标准化,i的值从1取到n;步骤s5-5:各管制语音品质等级分值范围:整个标准管制语音数据库按照按上述评价方法计算综合评分,整个数据库的综合评分序列按5个等级划分,每个等级的区间范围即为每个品质等级的分值范围,所述区间范围为0到1,所有评价指标都进行了正向化处理,故综合评分值越大品质越优,5级品质最优。7.一种面向管制语音品质划分的量化评价及分类的装置,其特征在于,包括至少一个处理器,以及与至少一个处理器通信连接的存储器;存储器存储有可被至少一个处理器执行的指令,所述指令被至少一个处理器执行,以使至少一个处理器能够执行权利要求1所述的分类方法。

技术总结
本发明公开了一种面向管制语音品质划分的量化评价及分类方法和装置,方法包括以下步骤:S1.输入标注有正确含义的标准管制语音数据库的语音数据;S2.从民航陆空通话本身特点考虑,构建管制语音品质划分的评价指标体系;S3.对各评价指标定性分析,包括技术分析方法和指标分级量化单位;S4.采用聚类法对单一评价指标分析得出的数据进行分组,规定在单一评价指标下各语音等级的范围值;S5.采用赋权融合算法给各个指标加权,组合成多个级别品质的管制语音数据集;装置包括至少一个处理器及至少一个存储器。解决了无法对语音品质进行客观地量化分析,不能明确管制语音品质与各评价指标之间的对应关系的问题。标之间的对应关系的问题。标之间的对应关系的问题。


技术研发人员:潘卫军 张坚 蒋培元 蒋倩兰 王泆棣 张玉梅
受保护的技术使用者:中国民用航空飞行学院
技术研发日:2022.11.22
技术公布日:2022/12/30
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献