一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种提升音频主观感受质量的方法及装置与流程

2022-06-12 00:25:33 来源:中国专利 TAG:


1.本发明涉及音频设备调教技术领域,具体涉及一种提升音频主观感受质量的方法及装置。


背景技术:

2.随着电子设备的普及率直线上升,用户可以使用电子设备播放音频流。但是电子设备中音频输出单元的低中高各频段的声性能不足,导致输出的声音质量差,如语音清晰度差,其中音频流可以是一个独立的音频流或者是包括在视频文件中的音频流。
3.目前,市场中音频设备用户只能被动地接受音频厂家出厂默认设置的现状,出厂后的产品无法根据每个使用者不同的音频质量主观感受的情况进行调教。


技术实现要素:

4.鉴于以上技术问题,本发明的目的在于提供一种提升音频主观感受质量的方法及装置,解决传统的音频设备无法根据每个使用者不同的音频质量主观感受的情况进行调教的问题。
5.本发明采用以下技术方案:
6.一种提升音频主观感受质量的方法,包括以下步骤:
7.获取用户的人耳频谱敏感度,根据所述人耳频谱敏感度调整音频设备输出的音频信号强度,得到调整后的音频信号;
8.采用自动降噪调整算法对调整后的音频信号进行降噪,并保留降噪时的降噪参数,将所述降噪参数作为适合用户主观感受的降噪参数;
9.将音频设备的配置设置为所述适合用户主观感受的降噪参数。
10.可选的,所述采用自动降噪调整算法对调整后的音频信号进行降噪,包括:
11.获取音频信号中的噪声估计,根据噪声估计得到音频信号的增益因子;
12.获取音频信号的频域信号;
13.根据所述频域信号和增益因子得到降噪计算公式,采用所述降噪计算公式对调整后的音频信号进行降噪;所述降噪计算公式满足以下式子:
[0014][0015]
其中,为降噪之后的音频信号,g(k)为增益因子,y(k)为音频信号的频域信号。
[0016]
可选的,所述获取音频信号中的噪声估计包括:
[0017]
对所述音频信号进行预处理,获取预处理后的音频信号中的带噪语音的最小值;
[0018]
根据所述带噪语音的最小值,计算带噪语音的存在概率;
[0019]
根据所述存在概率,计算噪声估计的平滑因子;
[0020]
根据所述平滑因子,采用递归平均法得到噪声估计。
[0021]
可选的,所述增益因子满足以下公式:
[0022][0023]
其中,y(k)为音频信号的频域信号,λd(k)为噪声估计,r(k)为后验信噪比,g(k)为增益因子。
[0024]
可选的,所述获取用户的人耳频谱敏感度步骤之前还包括:
[0025]
获取用户佩戴的音频设备的气密性百分比;
[0026]
在所述气密性百分比大于预设阈值时,则表示用户佩戴音频设备的气密性百分比未达到预设要求,提示用户调整佩戴音频设备。
[0027]
可选的,所述获取用户的人耳频谱敏感度步骤包括:
[0028]
获取用户当前使用场景下的客观音频参数,以及用户提供的音频主观质量水平;
[0029]
获取各类特定测试音频,接收音频设备的前馈数字麦录取的测试音频,得到前馈数字麦录取的客观音频曲线;
[0030]
根据所述客观音频曲线、客观音频参数以及音频主观质量水平,得到用户人耳频谱敏感度值。
[0031]
可选的,所述获取预处理后的音频信号的带噪语音的最小值包括:
[0032]
设定所述音频信号的一个时间窗,采用局部最小值追踪方法搜索所述音频信号在该时间窗的最小值。
[0033]
一种提升音频主观感受质量的装置,包括:
[0034]
调整单元:用于获取用户的人耳频谱敏感度,根据所述人耳频谱敏感度调整音频设备输出的音频信号强度,得到调整后的音频信号;
[0035]
降噪单元,用于采用自动降噪调整算法对调整后的音频信号进行降噪,并保留降噪时的降噪参数,将所述降噪参数作为适合用户主观感受的降噪参数;
[0036]
设置单元,用于将音频设备的配置设置为所述适合用户主观感受的降噪参数。
[0037]
一种电子设备,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行所述的一种提升音频主观感受质量的方法。
[0038]
一种计算机存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时,实现所述的一种提升音频主观感受质量的方法。
[0039]
相比现有技术,本发明的有益效果在于:
[0040]
本发明通过先根据所述人耳频谱敏感度调整音频设备输出的音频信号强度,得到调整后的音频信号,然后采用自动降噪调整算法对调整后的音频信号进行降噪,并保留降噪时的降噪参数,将所述降噪参数作为适合用户主观感受的降噪参数;将音频设备的配置设置为所述适合用户主观感受的降噪参数;本发明通过自动降噪调整算法对用户音频设备的降噪效果进行调教后,可以将用户音频设备进行适合用户自身的主观感受的个性化设置,从而使用户拥有更好的听觉体验,避免传统的音频设备无法根据每个使用者不同的音频质量主观感受的情况进行调教的问题。
附图说明
[0041]
图1为本发明一实施例提供的一种提升音频主观感受质量的方法的流程示意图;
[0042]
图2为本发明另一实施例提供的一种提升音频主观感受质量的方法的流程示意图;
[0043]
图3为本发明一实施例提供的一种提升音频主观感受质量的装置的示意图;
[0044]
图4为本发明一实施例提供的一种电子设备的结构示意图。
具体实施方式
[0045]
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例:
[0046]
实施例一:
[0047]
请参照图1-4所示,图1示出了本发明的一种提升音频主观感受质量的方法的示意图,包括以下步骤:
[0048]
步骤s1:获取用户的人耳频谱敏感度,根据所述人耳频谱敏感度调整音频设备输出的音频信号强度,得到调整后的音频信号;
[0049]
步骤s2:采用自动降噪调整算法对调整后的音频信号进行降噪,并保留降噪时的降噪参数,将所述降噪参数作为适合用户主观感受的降噪参数;
[0050]
具体的,所述采用自动降噪调整算法对调整后的音频信号进行降噪,包括:
[0051]
步骤s21:获取音频信号中的噪声估计,根据噪声估计得到音频信号的增益因子;
[0052]
具体的,所述增益因子满足以下公式:
[0053][0054]
其中,y(k)为音频信号的频域信号,λd(k)为噪声估计,r(k)为后验信噪比,g(k)为增益因子。
[0055]
步骤s22:获取音频信号的频域信号;
[0056]
具体的,对音频信号进行预处理后的频域信号满足以下公式:
[0057][0058]
其中,k表示频点索引,l表示时间帧索引,n表示每一帧的长度,m表示帧移,y(k,l)表示处理后的音频信号的频域信号,y(n lm)表示时域信号,h(n)表示窗函数,n表示时间帧的长度,j表示复数。
[0059]
步骤s23:根据所述频域信号和增益因子得到降噪计算公式,采用所述降噪计算公式对调整后的音频信号进行降噪;
[0060]
所述降噪计算公式满足以下式子:
[0061]
[0062]
其中,为降噪之后的音频信号,g(k)为增益因子,y(k)为音频信号的频域信号。
[0063]
可选的,所述获取音频信号中的噪声估计包括:
[0064]
对所述音频信号进行预处理,获取预处理后的音频信号中的带噪语音的最小值;
[0065]
具体的,所述对所述音频信号进行预处理包括:
[0066]
对所述音频信号进行分帧、加窗和傅里叶变换,处理后的音频信号满足以下公式:
[0067][0068]
其中,k表示频点索引,l表示时间帧索引,n表示每一帧的长度,m表示帧移,y(k,l)表示处理后的音频信号的频域信号,y(n lm)表示时域信号,h(n)表示窗函数,n表示时间帧的长度,j表示复数。
[0069]
具体的,采用局部最小值追踪的方法,设定一个时间窗l,搜索局部最小值,获得最小能量,其计算方法如下:
[0070][0071]
s(k,l)=αss(k,l-1) (1-αs)sf(k,l);
[0072][0073]
其中,0《αs《1是时域平滑因子,b(i)为频域窗,i表示频率,l表示频域帧索引,sf(k,l)表示频域帧l内的局部能量,s(k,l)表示进过平滑处理后的能量,sf表示局部能量,s(k,l-1)表示经过平滑处理后的频域帧l-1的局部能量,y(k-i,l)表示频域帧l,频率k-i的幅值。
[0074]
根据所述带噪语音的最小值,计算带噪语音的存在概率;
[0075]
根据所述存在概率,计算噪声估计的平滑因子;
[0076]
具体的,通过带噪语音的最小值,计算语音存在概率,包括:
[0077]
设定语音存在概率为
[0078]
则:
[0079]
其中,
[0080]
表示(l-1)帧内计算获得的概率,s(k,l)为计算的局部能量,δ为能量阈值,i(k,l)为能力是否满足阈值的概率,α
p
表示语音存在概率的平滑因子。
[0081]
噪声的平滑因子满足以下公式
[0082]
其中,为噪声估计平滑因子,αd为噪声平滑因子,其初始值为0,为语
音存在的概率;
[0083]
其中,噪声估计满足以下公式:
[0084]
其中,为(l 1)帧噪声估计,为噪声估计平滑因子,为l帧的噪声估计,y(k,l)|2为l帧的频域信号。
[0085]
作为另一实施例,请参照图2所示,图2示出了本发明的一种提升音频主观感受质量的方法的示意图,与上一个实施例不同的是,的所述获取用户的人耳频谱敏感度步骤之前还包括:
[0086]
步骤s01:获取用户佩戴的音频设备的气密性百分比;
[0087]
具体的,通过调整旋转佩戴耳机的佩戴角度获得耳机气密性百分比。例如,录音对比预设的频谱曲线,通过低频段幅值差异值,得出气密性百分比。耳机喇叭播放一段音乐,内置的fb麦克风进行录音,录制完成的音频文件上传至调教app进行分析,具体fft分析录制得频谱和app内预设仿真人头内参考的频谱曲线进行对比,通过分析音频低频段幅度的差异值,从而得出在人耳内耳机气密性百分比,调整旋转佩戴耳机的佩戴角度以便得到的低频段幅度差异值变化情况。
[0088]
步骤s02:在所述气密性百分比大于预设阈值时,则表示用户佩戴音频设备的气密性百分比未达到预设要求,提示用户调整佩戴音频设备。
[0089]
在本实施例中,用户调整佩戴音频设备后,重新检测的气密性百分比,直到检测的气密性百分比不大于预设阈值。
[0090]
在本实施例中,气密性百分比可根据气密性检测仪进行测试。
[0091]
需要说明的是,气密性差异是由于胶水凝结成固体状态时,会产生干裂,进而使前后腔气体导通,导致前腔气密性变弱,按常理来说,前腔密闭型耳机,插入耳道时有"啪啪声或吱吱声"是气密性良好,没有的算气密性稍差。
[0092]
具体的,所述获取用户的人耳频谱敏感度步骤包括:
[0093]
步骤s11:获取用户当前使用场景下的客观音频参数,以及用户提供的音频主观质量水平;
[0094]
在本实施例中,音频主观质量水平主要是依靠人为的听与主观评价,其中,主观评价主要参照国家标准《ydt2309-2011音频质量主观测试方法》,国家标准主要也是参考国际标准中的主观评价:itu-r bs.1116-1997。国际标准中比较常用的有:itu-t p800(电话传输系统语音质量主观评价)、itu-t p830(电话宽带和宽带数字语音编解码器主观评价方法)、itu-t p805(对话质量主观评价)。然后,根据测试规则按照5分或者7分制打分。
[0095]
步骤s12:获取各类特定测试音频,接收音频设备的前馈数字麦录取的测试音频,得到前馈数字麦录取的客观音频曲线;
[0096]
在本实施例中,各类特定测试音频可存于移动终端的app,建立移动终端app与音频设备的控制连接,通过移动终端的app执行音频设备的调教。移动终端app识别音频设备类型和属性,整理出调教测试项,app测试项目确定后进行调教。
[0097]
在本实施例中,客观音频曲线主要依靠仪器的测试测量。
[0098]
步骤s13:根据所述客观音频曲线、客观音频参数以及音频主观质量水平,得到用户人耳频谱敏感度值。
[0099]
可选的,所述预设阈值为0.9。
[0100]
在本实施例中,在所述客观音频曲线中,可得到用户的人耳频谱敏感度值,一般,人耳对频率为4khz左右的声音最敏感,也就是说在4khz左右刚好可以检测到音压,低于4khz频率比较多的音压是无法被检测到的。耳感到疼痛时的声压级约达到140db左右。响度级较小时,高、低频声音灵敏度降低较明显,而低频段比高频段灵敏度降低更加剧烈,一般应特别重视加强低频音量。通常200hz
‑‑
3khz语音声压级以60db—70db为宜,频率范围较宽的音乐声压以80db—90db最佳。
[0101]
例如,对于1khz纯音,主观感受0db—20db为宁静声,30db
‑‑
40db为微弱声,50db—70db为正常声,80db—100db为响音声,110db—130db为极响声。
[0102]
具体的,所述获取预处理后的音频信号的带噪语音的最小值包括:
[0103]
设定所述音频信号的一个时间窗,采用局部最小值追踪方法搜索所述音频信号在该时间窗的最小值。
[0104]
步骤s3:将音频设备的配置设置为所述适合用户主观感受的降噪参数。
[0105]
在本实施例中,音频设备,例如耳机将保持并采用新的这个调教后的配置参数,使音频设备整体降噪体验效果更加符合当前的使用者。
[0106]
在上述实现过程中,通过获取当前佩戴者的气密性百分比和人耳频谱敏感度,耳机将通过自动降噪调整算法对降噪参数进行调优,调整完成后耳机将保持并采用新的这个调教后的配置参数,使音频设备整体降噪体验效果更加符合当前的使用者,然后对播放的音频进行降噪,可主动改善音频主观感受质量,改变固定的通过音频厂家出厂默认设置的现状,提升了当前使用者的听觉体验,可提高输出音频的音质及人耳的主观感受,进而提高了用户体验。
[0107]
实施例二:
[0108]
请参照图3所示,图3示出了本发明的一种提升音频主观感受质量的装置,包括:
[0109]
调整单元:用于获取用户的人耳频谱敏感度,根据所述人耳频谱敏感度调整音频设备输出的音频信号强度,得到调整后的音频信号;
[0110]
降噪单元,用于采用自动降噪调整算法对调整后的音频信号进行降噪,并保留降噪时的降噪参数,将所述降噪参数作为适合用户主观感受的降噪参数;
[0111]
设置单元,用于将音频设备的配置设置为所述适合用户主观感受的降噪参数。
[0112]
实施例三:
[0113]
图4为本技术实施例提供的一种电子设备的结构示意图,在本技术中可以通过图4所示的示意图来描述用于实现本技术实施例的本发明一种提升音频主观感受质量的方法的电子设备100。
[0114]
如图4所示的一种电子设备的结构示意图,电子设备100包括一个或多个处理器102、一个或多个存储装置104,这些组件通过总线系统和/或其它形式的连接机构(未示出)互连。应当注意,图3所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备可以具有图4示出的部分组件,也可以具有图3未示出的其他组件和结构。
[0115]
所述处理器102可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制所述电子设备100中的其它组件以执行期望的
功能。
[0116]
所述存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器102可以运行所述程序指令,以实现下文所述的本技术实施例中(由处理器实现)的功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。
[0117]
本发明还提供一种计算机存储介质,其上存储有计算机程序,本发明的方法如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在该计算机存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机存储介质不包括电载波信号和电信信号。
[0118]
对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献