技术特征:
1.一种语谱图的生成方法,其特征在于,包括:
获取目标语音帧序列的每个语音帧中各时频点的强度,所述目标语音帧序列是对目标语音信号进行分帧得到的;
根据所述目标语音信号对应的匹配参数确定所述匹配参数对应的目标彩色色卡;所述匹配参数包括统计特征参数和聚类结果参数中的至少一项,所述统计特征参数是对所述每个语音帧中各时频点的强度进行统计分析确定的,所述聚类结果参数是对所述每个语音帧中各时频点的强度进行聚类分析确定的;
根据所述目标彩色色卡所限定强度与色彩信息之间的对应关系和所述每个语音帧中各时频点的强度,确定所述每个语音帧中各时频点对应的色彩信息;
按照所述每个语音帧中各时频点对应的色彩信息,生成所述目标语音信号的语谱图。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标彩色色卡所限定强度与色彩信息之间的对应关系和所述每个语音帧中各时频点的强度,确定所述每个语音帧中各时频点对应的色彩信息之前,所述方法还包括:
在用户界面中显示所述目标彩色色卡对应的选择选项;
检测针对所述选择选项的触发操作,确定触发选择的目标彩色色卡;
所述根据所述目标彩色色卡所限定强度与色彩信息之间的对应关系和所述每个语音帧中各时频点的强度,确定所述每个语音帧中各时频点对应的色彩信息,包括:
根据所述触发选择的目标彩色色卡所限定的强度与色彩信息之间的对应关系,确定所述每个语音帧中各时频点的强度所对应的色彩信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标彩色色卡所限定强度与色彩信息之间的对应关系和所述每个语音帧中各时频点的强度,确定所述每个语音帧中各时频点对应的色彩信息,包括:
将所述每个语音帧中各时频点的强度转换到指定范围内,得到所述每个语音帧中各时频点所对应转换后的强度;
根据所述目标彩色色卡所限定强度与色彩信息之间的对应关系,确定所述每个语音帧中各时频点所对应转换后的强度对应的色彩信息。
4.根据权利要求3所述的方法,其特征在于,所述将所述每个语音帧中各时频点的强度转换到指定范围内,得到所述每个语音帧中各时频点所对应转换后的强度,包括:
根据设定参数范围中的强度最大值和强度最小值,对所述每个语音帧中各时频点的强度进行截幅处理;
将所述每个语音帧中各时频点所对应截幅处理后的强度进行归一化处理,得到所述每个语音帧中各时频点所对应转换后的强度。
5.根据权利要求3所述的方法,其特征在于,所述将所述每个语音帧中各时频点的强度转换到指定范围内,得到所述每个语音帧中各时频点所对应转换后的强度,包括:
将所述每个语音帧中各时频点的强度分别与强度参考值相减;所述强度参考值是根据所述每个语音帧中各时频点的强度确定的;
根据设定参数范围中的强度最大值和强度最小值,对所述每个语音帧中各时频点相减后的强度进行截幅处理;
将所述每个语音帧中各时频点截幅处理后的强度进行归一化处理,得到所述每个语音帧中各时频点所对应转换后的强度。
6.根据权利要求5所述的方法,其特征在于,所述将所述每个语音帧中各时频点的强度分别与强度参考值相减,包括:
获取模式选择信息,所述模式选择信息指示了触发选择的增强模式;
若所述模式选择信息指示所选择的增强模式为第一增强模式,且所述目标语音信号的时长满足设定条件,则执行所述将所述每个语音帧中各时频点的强度分别与强度参考值相减的步骤。
7.根据权利要求1所述的方法,其特征在于,所述根据所述目标语音信号对应的匹配参数确定所述匹配参数对应的目标彩色色卡之前,所述方法还包括:
对所述每个语音帧中各时频点的强度进行聚类处理,得到聚类结果,所述聚类结果指示了所述每个语音帧中各时频点的强度所属的聚类类别;
根据所述每个语音帧中各时频点的强度所属的聚类类别,确定所述聚类结果参数。
8.根据权利要求1所述的方法,其特征在于,所述获取目标语音帧序列的每个语音帧中各时频点的强度,包括:
对所述目标语音帧序列中的每个语音帧向频域进行变换,得到所述每个语音帧中各时频点的幅度值;
对所述每个语音帧中各时频点的幅度值进行取模操作;
将所述每个语音帧中各时频点取模操作后的幅度值进行对数运算,得到所述每个语音帧中各时频点的强度。
9.根据权利要求1-8中任一项所述的方法,其特征在于,所述聚类结果参数包括各聚类类别对应的聚类中心、各聚类类别对应的聚类重心、聚类类别的数量、聚类中心距离均值中的至少一项。
10.根据权利要求1-8中任一项所述的方法,其特征在于,所述统计特征参数包括强度均值、强度方差、强度标准差、偏度和峭度中的至少一项。
11.一种语谱图的生成装置,其特征在于,包括:
获取模块,用于获取目标语音帧序列的每个语音帧中各时频点的强度,所述目标语音帧序列是对目标语音信号进行分帧得到的;
目标彩色色卡确定模块,用于根据所述目标语音信号对应的匹配参数确定所述匹配参数对应的目标彩色色卡;所述匹配参数包括统计特征参数和聚类结果参数中的至少一项,所述统计特征参数是对所述每个语音帧中各时频点的强度进行统计分析确定的,所述聚类结果参数是对所述每个语音帧中各时频点的强度进行聚类分析确定的;
色彩信息确定模块,用于根据所述目标彩色色卡所限定强度与色彩信息之间的对应关系和所述每个语音帧中各时频点的强度,确定所述每个语音帧中各时频点对应的色彩信息;
语谱图生成模块,用于按照所述每个语音帧中各时频点对应的色彩信息,生成所述目标语音信号的语谱图。
12.一种电子设备,其特征在于,包括:
处理器;
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如权利要求1-10中任一项所述的方法。
13.一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被处理器执行时,实现如权利要求1-10中任一项所述的方法。
技术总结
本申请涉及音频处理技术领域,具体公开了一种语谱图的生成方法、装置、电子设备及存储介质,该方法包括:获取目标语音帧序列的每个语音帧中各时频点的强度;根据目标语音信号对应的匹配参数确定匹配参数对应的目标彩色色卡;匹配参数包括统计特征参数和聚类结果参数中的至少一项;根据目标彩色色卡所限定强度与色彩信息之间的对应关系和每个语音帧中各时频点的强度,确定每个语音帧中各时频点对应的色彩信息;按照每个语音帧中各时频点对应的色彩信息,生成目标语音信号的语谱图。本方案保证了所生成语谱图在强度上的分辨率和保证了语谱图的质量。
技术研发人员:李亚桐;谢单辉
受保护的技术使用者:深圳市声扬科技有限公司
技术研发日:2021.07.07
技术公布日:2021.08.13
本文用于企业家、创业者技术爱好者查询,结果仅供参考。