防止广告干扰的音频编解码方法、系统、发射器及接收器与流程

2021-09-04 12:24:00 来源：中国专利 TAG：音频蓝牙编解码接收器发射

1.本申请涉及蓝牙音频编解码技术领域，特别涉及一种防止广告干扰的音频编解码方法、系统、发射器及接收器。

背景技术：

2.现有的各种型号的蓝牙音频编解码器在进行编解码时均没有对原音频的响度进行监测并控制响度，但是其中音频编解码器lc3既可以面向低功耗蓝牙，也可以用于经典蓝牙，其具有较低延迟、较高的音质和编码增益以及在蓝牙领域无专利费等优点。
3.在基于手机app收听或收看节目时，app通常会在两个节目中间或者一个节目内定期插入广告，由正常的节目转为广告时，音量会瞬间升高，让人很烦躁不得不手工降低音量，等广告结束后又需要手工升高音量，需要用户频繁进行手动调整音量，所以可以在音频编解码器lc3的编解码过程中增加响度监测并控制的过程来避免广告音量突然升高对用户造成的困扰。

技术实现要素：

4.针对现有技术存在的视频中由正常节目进入广告时音量突然升高，需要用户频繁进行手动调整音量，对用户造成干扰，影响用户体验的问题，本申请主要提供一种防止广告干扰的音频编解码方法、系统、发射器及接收器。
5.为了实现上述目的，本申请采用的一个技术方案是：提供一种防止广告干扰的音频编解码方法，其包括：在音频编码或解码的过程中，对当前音频帧进行有效声音判断，当当前音频帧包括有效声音且响度计数器计数完毕时，根据音频信号的时长和音频编解码器对应音频帧的帧长，对响度计数器设置预设值，其中有效声音包括人声和/或乐声，在音频信号的时长确定的情况下，帧长越长，预设值越小；根据响度计数器的预设值，计算包含当前音频帧在内的预设值数目帧连续音频帧的响度平均值，将响度平均值作为当前响度，并在计算下一预设值数目帧连续音频帧的响度时，将当前响度的值作为历史响度；以及判断当前响度和历史响度之间的差值与预设响度门限的大小关系，并根据判断结果设置衰减谱系数标志，并且根据设置的衰减谱系数标志对当前音频帧的谱系数进行调节，其中当衰减谱系数标志设置为存在时，对当前音频帧的谱系数进行调节。
6.本申请采用的另一个技术方案是：提供一种防止广告干扰的音频编解码系统，其包括：有效声音判断模块，其用于在音频编码或解码的过程中，对当前音频帧进行有效声音判断，当当前音频帧包括有效声音且响度计数器计数完毕时，根据音频信号的时长和音频编解码器对应音频帧的帧长，对响度计数器设置预设值，其中有效声音包括人声和/或乐声，在音频信号的时长确定的情况下，帧长越长，预设值越小；响度计算模块，其用于根据响度计数器的预设值，计算包含当前音频帧在内的预设值数目帧连续音频帧的响度平均值，将响度平均值作为当前响度，并在计算下一预设值
数目帧连续音频帧的响度时，将当前响度的值作为历史响度；以及响度调节模块，其用于判断当前响度和历史响度之间的差值与预设响度门限的大小关系，并根据判断结果设置衰减谱系数标志，并且根据设置的衰减谱系数标志对当前音频帧的谱系数进行调节，其中当衰减谱系数标志设置为存在时，对当前音频帧的谱系数进行调节。
7.本申请采用的另一个技术方案是：提供一种防止广告音量干扰的蓝牙发射器，其包括蓝牙发射模块，其中，音频编码模块，其用于对当前音频帧进行有效声音判断，当当前音频帧包括有效声音且响度计数器计数完毕时，根据音频信号的时长和音频编解码器对应音频帧的帧长，对响度计数器设置预设值，其中有效声音包括人声和/或乐声，在音频信号的时长确定的情况下，帧长越长，预设值越小；其用于根据响度计数器的预设值，计算包含当前音频帧在内的预设值数目帧连续音频帧的响度平均值，将响度平均值作为当前响度，并在计算下一预设值数目帧连续音频帧的响度时，将当前响度的值作为历史响度；以及其用于判断当前响度和历史响度之间的差值与预设响度门限的大小关系，并根据判断结果设置衰减谱系数标志，并且根据设置的衰减谱系数标志对当前音频帧的谱系数进行调节，并将经调节的谱系数通过低延迟改进型离散余弦变换子模块输出，其中当衰减谱系数标志设置为存在时，对当前音频帧的谱系数进行调节。
8.本申请采用的另一个技术方案是：提供一种防止广告音量干扰的蓝牙接收器，其包括蓝牙接收模块，其中，音频解码模块，其用于对音频码流解码得到的当前音频帧进行有效声音判断，当当前音频帧包括有效声音且响度计数器计数完毕时，根据音频信号的时长和音频编解码器对应音频帧的帧长，对响度计数器设置预设值，其中有效声音包括人声和/或乐声，在音频信号的时长确定的情况下，帧长越长，预设值越小；其用于根据响度计数器的预设值，计算包含当前音频帧在内的预设值数目帧连续音频帧的响度平均值，将响度平均值作为当前响度，并在计算下一预设值数目帧连续音频帧的响度时，将当前响度的值作为历史响度；以及其用于判断当前响度和历史响度之间的差值与预设响度门限的大小关系，并根据判断结果设置衰减谱系数标志，并且根据设置的衰减谱系数标志对当前音频帧的谱系数进行调节，并将经调节的谱系数通过频域噪声整形子模块输出，其中当衰减谱系数标志设置为存在时，对当前音频帧的谱系数进行调节。
9.本申请的技术方案可以达到的有益效果是：本申请设计了一种防止广告干扰的音频编解码方法、系统、蓝牙发射器及蓝牙接收器。本申请通过对响度初始更新标志的判断确保响度判断时历史响度和当前响度都已经更新为非零值，避免误判；通过对当前响度和历史响度之间的第一差值和第二差值与响度门限之间的大小关系，判断视频是从正常节目转为广告，还是从广告转为正常节目，从而对转为广告时的音频的谱系数进行衰减，降低音频的音量。
附图说明
10.为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现
有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
11.图1是基于蓝牙技术收听手机声音的示意图；图2是本申请一种防止广告干扰的音频编解码方法的一个具体实施方式的示意图；图3是本申请一种防止广告干扰的音频编解码方法的一个具体实例的示意图；图4是本申请一种防止广告干扰的音频编解码方法的另一个具体实例的示意图；图5是本申请一种防止广告干扰的音频编解码方法的另一个具体实例的示意图；图6是本申请一种防止广告干扰的音频编解码方法的另一个具体实例的示意图；图7是本申请一种防止广告干扰的音频编解码系统的一个具体实施方式的示意图；图8是本申请一种防止广告干扰的蓝牙发射器的一个具体实施方式的示意图；图9是本申请一种防止广告干扰的蓝牙接收器的一个具体实施方式的示意图。
12.通过上述附图，已示出本申请明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围，而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
13.下面结合附图对本申请的较佳实施例进行详细阐述，以使本申请的优点和特征能更易于被本领域技术人员理解，从而对本申请的保护范围做出更为清楚明确的界定。
14.需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
15.现有的音频编解码器lc3，既可以面向低功耗蓝牙，也可以用于经典蓝牙，其具有较低延迟、较高的音质和编码增益以及在蓝牙领域无专利费等优点。用户在观看视频或听音乐时，在播放下一节目时或在一段正常节目中间会有插入的广告，这时视频音量会瞬间提高，影响用户的心情，图1为基于蓝牙技术收听手机声音的示意图，其中的蓝牙发射器可以是手机内置的，也可以是手机外接的，手机将音频数据发送到蓝牙发射器中，此时可以在音频编码器lc3进行编码时进行计算响度并调节响度的过程，将音频数据包发送到蓝牙接收器中，在音频解码器lc3进行解码时，可以执行计算响度并调节响度的过程，当然，计算响度并调节响度的过程可以只存在于音频编码器lc3的编码过程中，也可以只存在于音频解码器lc3的解码过程中，还可以存在于编解码过程中。
16.针对上述广告的音量过大导致用户体验差，需要用户频繁进行手动调整音量，本申请提出一种防止广告干扰的音频编解码方法，在蓝牙发射器对音频编码时或者在蓝牙接
收器对音频解码时，监测音频的响度变化并将其设置为无干扰模式。该方法首先将包含有效声音的音频帧计算响度，不包含有效声音的音频帧不计算响度，既节省了算力，又避免了无有效声音时计算的响度对响度判断造成的干扰；响读计数器的预设值将包含有效声音的音频帧连续化，并计算出了预设值数目帧连续音频帧的响度平均值，避免了对响度的误判，使得响度监测结果更为精准；为了保证广告音量的自动降低，当前响度和历史响度中的音频帧的响度为衰减谱系数之前的响度，当判断视频进入广告阶段后，每次计算响度并判断响度后，才会对当前音频帧的谱系数进行衰减，衰减后的谱系数可以有效降低音频的音量。
17.在实际应用中，通常包含两种可能的典型场景：第一种典型场景为视频或音乐刚开始播放时没有高音量的广告，用户觉得音频响度合适，中间出现高音量的广告，用户感觉不适，利用本申请提供的防止广告干扰的音频编解码方法可以自动降低广告音量，减少用户的不适感；第二种典型场景为视频或音乐刚开始播放时就是广告，这时有两种可能：用户觉得广告音量合适，等广告播放结束后用户觉得音量较小，此时用户可以手动将音量调节到合适，后续再出现大音量的广告时，利用本申请提供的防止广告干扰的音频编解码方法可以自动实现广告的响度衰减，降低广告音量。
18.用户觉得广告音量较大，手动调节至音量较小，等广告结束，再手动调节至合适的音量，后面广告再出现时，利用本申请提供的防止广告干扰的音频编解码方法可以自动实现广告的响度衰减，降低广告音量。结合本申请，用户最多需要两次手动调节音量，可以避免频繁手动调节音量，提升用户体验。
19.下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本申请的实施例进行描述。
20.图2示出了本申请一种防止广告干扰的音频编解码方法的一个具体实施方式。
21.在图2所示的具体实施方式中，防止广告干扰的音频编解码方法主要包括：步骤s201，在音频编码或解码的过程中，对当前音频帧进行有效声音判断，当当前音频帧包括有效声音且响度计数器计数完毕时，根据音频信号的时长和音频编解码器对应音频帧的帧长，对响度计数器设置预设值，其中有效声音包括人声和/或乐声，在音频信号的时长确定的情况下，帧长越长，预设值越小。
22.在该具体实施方式中，对当前音频帧进行有效声音判断可以避免在当前音频帧无有效声音时计算响度，既可以节省算力，也可以避免无有效声音时计算的响度对本申请的响度判断造成干扰。有效声音指的是有人说话、或者有音乐、或者二者的混合体；通常响度计数器需要先进行初始化，可以避免响度计数器中的历史值对计算响度的干扰。当响度计数器初始化为0时，如果检测到当前音频帧包含有效声音，则将响度计数器设定为预设值，其目的是在计算响度平均值时，将具有有效声音的音频帧连续化。通常音频信号为平稳信号，在30ms~50ms内为近似平稳信号，如果音频编解码器lc3的配置为10ms帧长，则可以将预设值设为3~5，如果音频编解码器lc3的配置为7.5ms，则可以将预设值设为4~7。响度计数器的预设值只要不为初始化时的零值就无需重新将其设为预设值。
23.需要说明的是，音频信号通常包括语音信号、音乐信号或其他声音信号。
24.在本申请的一个具体实施例中，在音频编码或解码的过程中，对当前音频帧进行
有效声音判断，包括：在音频编码的过程中，利用冲击标志、基音存在标志和当前音频帧的谱系数的能量熵与能量熵门限的大小关系中的一种或多种方式对当前音频帧进行有效声音判断，其中若检测到冲击标志存在，则确定当前音频帧包含有效声音；若检测到基音存在标志存在，则确定当前音频帧包含有效声音；若能量熵小于能量熵门限，则确定当前音频帧包含有效声音。
25.在该具体实施例中，冲击标志attack_flag、基音存在标志pitch_present是在编码过程中可以得到的，充分利用编码器已有的信息，既避免漏检，又节省算力。冲击标志attack_flag=1时，表示检测到冲击标志存在，并且音频有瞬间的能量升高，通常指示有效声音的开始；基音存在标志pitch_present=1，表示检测到基音存在标志存在，从另外一个角度指示当前音频帧包含有效声音；当冲击标志和基音存在标志都没有检测到存在时，利用当前音频帧的谱系数计算出的能量熵与能量熵门限的大小关系，可以判断当前音频帧是否包含有效声音，这三个标志分别从能量、基音和能量熵的角度检测当前音频帧是否包含有效声音。
26.在本申请的一个具体实例中，判断当前音频帧是否包含有效声音的过程可以是先检测冲击标志是否存在，若冲击标志存在，则直接确定当前音频帧包含有效声音；若冲击标志不存在，则检测基音存在标志是否存在，若基音存在标志存在，则直接确定当前音频帧包含有效声音；若基音存在标志不存在，则判断谱系数的能量熵和能量熵门限的大小关系，若能量熵小于能量熵门限，则代表当前音频帧有很大概率包含有效声音，并且确定当前音频帧包含有效声音，若能量熵不小于能量熵门限，则代表当前音频帧有很大概率没有有效声音，可能是静音、或能量较小的噪音等，认定当前音频帧不包含有效声音。判断当前音频帧是否为包含有效声音的过程还可以是同时检测冲击标志和基音存在标志是否存在以及同时判断能量熵和能量熵门限的大小关系，只要这三种方式中任一种方式满足条件，则认为当前音频帧包含有效声音。
27.在本申请的一个具体实施例中，在音频编码或解码的过程中，对每一当前音频帧进行有效声音判断，还包括：在音频解码的过程中，通过对基音存在标志的存在与否进行检测或当前音频帧的谱系数的能量熵与能量熵门限的大小关系，对当前音频帧进行有效声音判断，其中若检测到基音存在标志存在，则确定当前音频帧包含有效声音；若能量熵小于能量熵门限，则确定当前音频帧包含有效声音。
28.在该具体实施例中，音频解码过程无法获得冲击标志，此时可以忽略此冲击标志，即此冲击标志attack_flag=0；当基音存在标志没有检测到存在时，利用当前音频帧的谱系数计算出的能量熵与能量熵门限的大小关系，可以判断当前音频帧是否包含有效声音。采用其中任一种方式或者两种方式可以避免漏检，避免在无有效声音时计算响度，节省了算力，避免了无有效声音时计算的响度对本发明的判断造成干扰。
29.在一个具体的实例中，在音频编码过程中计算谱系数能量，假定音频编码器lc3配置为：采样率48khz和帧长10ms，编码器执行ld
‑
mdct后，可以得到480个谱系数，其他配置计算方法类似：第一个谱系数对应直流成分，实际编码时后80个谱系数会被丢弃，所以使用其余
的399个谱系数计算其能量分别为：谱系数总能量为：计算能量概率：计算能量熵：需要注意的是，上述计算过程用于解码器时，对应的谱系数符号为：。
30.需要说明的是，能量熵门限是用于判断当前音频帧是否有效声音，可以根据一些典型的音频信号统计取值获得能量熵门限，可取0.8。当能量熵小于能量熵门限时，当前音频帧有很大概率包含有效声音；当能量熵大于等于能量熵门限时，当前音频帧有很大概率没有有效声音，可能是静音、或能量较小的噪音等。
31.图3是本申请一种防止广告干扰的音频编解码方法的另一个具体实例的示意图。
32.在图3所示的实例中，只有当响度计数器的值不为0时，才会利用冲击标志、基音存在标志以及谱系数的能量熵实时监测每一音频帧是否包含有效声音。若冲击标志attack_flag=1，则直接判断当前音频帧包含有效声音，并对响度计数器设置预设值，否则检测是否存在基音存在标志，若存在基音存在标志，则直接对响度计数器设置预设值，否则计算能量熵，并对能量熵和能量熵门限的大小关系进行判断，当能量熵小于能量熵门限时，判断当前音频帧具有有效声音，直接对响度计数器设置预设值。
33.在图2所示的具体实施方式中，防止广告干扰的音频编解码方法主要还包括：步骤s202，根据响度计数器的预设值，计算包含当前音频帧在内的预设值数目帧连续音频帧的响度平均值，将响度平均值作为当前响度，并在计算下一预设值数目帧连续音频帧的响度时，将当前响度的值作为历史响度。
34.在该具体实施方式中，利用响度计数器的预设值，将包含有效声音的音频帧连续化，便于计算响度平均值。取连续预设值数目帧音频帧的响度计算响度平均值，将响度平均值作为响度判断的值，可以减少计算误差，避免响度误判。
35.在本申请的一个具体实施例中，根据响度计数器的预设值，计算包含当前音频帧在内的预设值数目帧连续音频帧的响度平均值，包括：每次计算出预设值数目帧连续音频帧中的一帧音频帧的响度后，将响度计数器的预设值递减；当预设值递减完毕时，计算预设值数目帧连续音频帧的响度平均值。
36.在该具体实施例中，预设值的设定，方便了依次循环进行音频帧的响度的计算以及各个音频帧响度和的计算。当预设值递减为0，即响度计数器计数完毕时，计算响度和的
平均值，将响度平均值作为当前响度，使用少量的代码可以实现计算的过程。
37.本申请利用现有技术中的响度计算方法计算响度，对响度计算方法不做限制，对现有技术中的响度计算方法进行简单叙述：响度计数器不为0，则当前音频帧包含有效声音，需要计算响度；首先根据mdct系数计算第t帧，即当前音频帧上第k个频仓bin的移动平均功率谱：此功率谱的计算需要包括当前音频帧与之前的音频帧，总共t帧的数据来完成，此处t取1，因为后续会总共使用一定的帧数计算平均，所以与上述发明的思想殊途同归。
38.再计算第t帧的a加权功率：其中，在采样率48khz和帧长10ms的配置时，n
f
为400。
39.最后将加权功率变换为db单位即得到第t帧，即当前音频帧的响度：根据响度计数器的预设值，计算连续预设值数目帧音频帧的各个响度和响度平均值。
40.图4是本申请一种防止广告干扰的音频编解码方法的另一个具体实例的示意图。
41.在图4所示的具体实例中，假设响度计数器的预设值为3，预设值数目也为3。首先计算第一帧的响度，然后将预设值减去一，此时响度计数器的值为2，不为0，则继续计算第二帧的响度，并将第一帧的响度和第二帧的响度相加，再将响度计数器的值减去一，此时响度计数器的值为1，不为0，则继续计算第三帧的响度，将第三帧的响度加上前两帧的响度，再将响度计数器的值减去一，此时响度计数器的值为0，直接计算连续三帧的响度和的平均值，得到响度平均值，并将其作为当前响度。
42.需要注意的是，在进行响度计算之前，将历史响度和当前响度都初始化为0，可以避免因历史响度有历史值而造成的误差。
43.在图2所示的具体实施方式中，防止广告干扰的音频编解码方法主要还包括：步骤s203，判断当前响度和历史响度之间的差值与预设响度门限的大小关系，并根据判断结果设置衰减谱系数标志，并且根据设置的衰减谱系数标志对当前音频帧的谱系数进行调节，其中当衰减谱系数标志设置为存在时，对当前音频帧的谱系数进行调节。
44.在该具体实施方式中，衰减谱系数标志一旦设置为存在，在满足下一个触发条件之前，都需要将当前音频帧的谱系数进行调节。
45.在本申请的一个具体实施例中，判断当前响度与历史响度的差值与预设响度门限的大小关系之前，还包括：利用响度初始更新标志判断当前响度的值和历史响度的值是否已更新，其中若检测到响度初始更新标志存在，则当前响度的值和历史响度的值已经更新为非零值；若未检测到响度初始更新标志存在，则将当前响度的值作为历史响度，当前响度
初始化，并利用预设值计算下一预设值数目帧连续音频帧的响度平均值，将其作为当前响度。
46.在该具体实施例中，若未检测到响度初始更新标志存在，则需要手动将响度初始更新标志设置为存在，然后在对当前响度和历史响度更新。响度初始更新标志可以确保响度判断时历史响度和现在响度都已经更新为非零值，可以避免响度误判。
47.在本申请的一个具体实施例中，判断当前响度和历史响度之间的差值与预设响度门限的大小关系，并根据判断结果设置衰减谱系数标志，还包括：当当前响度减去历史响度的第一差值大于预设响度门限中的第一响度门限时，设置衰减谱系数标志为存在；当第一差值不大于预设响度门限且历史响度减去当前响度的第二差值大于预设响度门限中的第二响度门限时时，设置衰减谱系数标志为不存在，其中差值包括第一差值和第二差值。
48.在该具体实施例中，当前响度减去历史响度的第一差值大于预设响度门限中的第一响度门限，代表视频由正常节目进入广告，需要衰减谱系数，可以及时对进入广告的音频帧进行谱系数衰减，进而控制音频音量；历史响度减去当前响度的第二差值大于预设响度门限中的第二响度门限，代表视频由广告进入正常节目，此时不再需要衰减谱系数，可以及时停止对返回正常节目的音频的谱系数的衰减，进而避免降低正常节目的原始音频的音量。
49.需要说明的是，第一响度门限的数值和第二响度门限的数值必须相等，如果二者不相等，则会使得历史响度的更新很复杂。第一响度门限的数值和第二响度门限的数值根据人的听力感知状况或国际音频响度标准确定。
50.在本申请的一个具体实施例中，当衰减谱系数标志设置为存在时，对当前音频帧的谱系数进行调节，包括：当衰减谱系数标志设置为存在时，利用衰减因子对当前音频帧的谱系数进行衰减，其中衰减因子根据历史实验统计得到的经验值确定，调节包括衰减。
51.在该具体实施例中，当前响度减去历史响度的第一差值大于预设响度门限中的第一响度门限时，设置衰减谱系数标志为存在，表示对后续音频帧的谱系数进行衰减，此后一段时间内视频一直处于广告阶段，这一段时间内的第一差值和第二差值均不会大于预设响度门限中对应的第一响度门限和第二响度门限，但是因为衰减谱系数标志一直为存在的状态，所以在广告阶段中，用于计算响度平均值的预设值数目帧连续音频帧中的每一音频帧的谱系数会衰减，也指广告阶段中包括有效声音的当前音频帧的谱系数会继续衰减，直至第二差值大于预设响度门限中的第二响度门限后才会停止谱系数衰减。将已存在的当前音频帧的谱系数乘以衰减因子，可以得到衰减的谱系数，保证了广告音量自动降低，避免了广告的大音量影响人的心情，提升了用户体验。
52.图5是本申请一种防止广告干扰的音频编解码方法的一个具体实例的示意图。
53.在图5所示的实例中，当响度初始更新标志不为1时，将响度初始更新标志设为1，并将历史响度设定为当前响度的值，将当前响度设定为初始值0，确保了响度判断时历史响度和现在响度都已经更新为非零值，避免误判；此时响度初始更新标志为1，则判断当前响度减去历史响度的第一差值是否大于预设响度门限，若第一差值大于预设响度门限，则代表视频由正常节目进入广告，那么将衰减谱系数标志设为1，代表衰减谱系数标志存在，需要衰减谱系数，并将历史响度设定为当前响度的值，将当前响度设定为初始值0，根据衰减谱系数标志为1这一结果，对当前音频帧的谱系数进行衰减，从而降低音频的音量；若第一
差值不大于预设响度门限，则判断历史响度减去当前响度的第二差值是否大于预设响度门限，若第二差值不大于预设响度门限，则代表视频还处于广告阶段或者正常节目阶段，此时需要根据衰减谱系数标志判断是否需要衰减谱系数，由于前一操作将衰减谱系数标志设为1，此时处于广告阶段，需要衰减当前音频帧的谱系数，若第二差值大于预设响度门限，则代表视频由广告返回正常节目，那么将衰减谱系数标志设为0，代表衰减谱系数标志不存在，不需要衰减谱系数，并将历史响度设定为当前响度的值，将当前响度设定为初始值0，根据衰减谱系数标志为0这一结果，不会对当前音频帧进行谱系数衰减，回归音频的正常音量。
54.衰减谱系数：将如下所有谱系数乘以衰减因子，此衰减因子为经验值，可以由实验统计得到：音频编码器：，编码过程中由低延迟改进型离散余弦变换子模块（ld
‑
mdct）输出；音频解码器：，解码过程中由频域噪声整形子模块（sns）输出。
55.在广告期间，包含有效声音的音频帧的响度平均值的变换很小，需要保持每一有效广告音频帧的谱系数衰减；在非广告期间，包含有效声音的音频帧的响度平均值的变换也很小，需要保持每一有效非广告音频帧的谱系数不变。
56.在图6所示的实例中，设置响度计数器为3，统计3帧的响度平均值。假定第n
‑
5帧检测到有效声音，在第n
‑
3帧时计算连续3帧的响度平均值，并将其存为历史响度；假定在第n
‑
2帧检测到有效声音，在第n帧时计算连续3帧的响度平均值，并将其存为当前响度，此时第n帧为当前音频帧，如果第一次检测到当前响度与历史响度的差值中的第一差值超过预设响度门限中的第一响度门限，表示视频由正常节目进入广告，音频响度升高，对应图5中第一次检测到响度升高，则从第n帧开始需要衰减谱系数，即衰减第n帧的谱系数，进而降低第n帧的响度，并且设置衰减谱系数标志为存在。后续根据是否包含有效声音、设置响度计数器并继续计算连续3帧的响度平均值。当第n 1帧来临时，根据包含有效声音，设置响度计数为3，此时因为响度计数器的数值不为零，所以不会进行响度平均值的计算及判断，但是由于衰减谱系数标志的存在，还需要对第n 1帧的谱系数进行衰减，但是在对第n 1帧的谱系数进行衰减之前，利用原始的谱系数进行第n 1帧的响度计算，将第n 1帧的响度存入响度数组中，同理，因为衰减谱系数标志的存在，需要对第n 2帧和第n 3帧的谱系数进行衰减，将利用第n 2帧和第n 3帧的原始谱系数计算出的各自的响度存入响度数组中，将响度数组中存储的第n 1帧、第n 2帧和第n 3帧的各自的响度，计算出响度平均值，将此响度平均值作为当前响度，检测当前响度与历史响度，并与设置的预设响度门限进行比较，使得在广告阶段，对应广告音频帧的响度降低，提升用户体验。如果第一次检测到当前响度与历史响度的差值中的第二差值超过预设响度门限中的第二响度门限，表示视频由广告进入正常节目，音频响度降低，则不再衰减谱系数，并且设置衰减谱系数标志为不存在；例如在图6中，当第m
‑
2帧、第m
‑
1帧和第m帧的原始谱系数计算各自的响度并存储到响度数组中，并根据衰减谱系数标志的存在，对各自的原始谱系数进行衰减，将响度数组中存储的第m
‑
2帧、第m
‑
1帧和第m帧的响度计算出的响度平均值作为当前响度之后，检测当前响度和历史响度，如果检测
到第二差值超过第二响度门限，则将衰减谱系数设置为不存在，第m 1帧来临时不需要衰减其谱系数。
57.图7示出了本申请一种防止广告干扰的音频编解码系统的一个具体实施方式。
58.在图7所示的具体实施方式中，提供一种防止广告干扰的音频编解码系统，其包括：模块701，有效声音判断模块，其用于在音频编码或解码的过程中，对当前音频帧进行有效声音判断，当当前音频帧包括有效声音且响度计数器计数完毕时，根据音频信号的时长和音频编解码器对应音频帧的帧长，对响度计数器设置预设值，其中有效声音包括人声和/或乐声，在音频信号的时长确定的情况下，帧长越长，预设值越小；模块702，响度计算模块，其用于根据响度计数器的预设值，计算包含当前音频帧在内的预设值数目帧连续音频帧的响度平均值，将响度平均值作为当前响度，并在计算下一预设值数目帧连续音频帧的响度时，将当前响度的值作为历史响度；以及模块703，响度调节模块，其用于判断当前响度和历史响度之间的差值与预设响度门限的大小关系，并根据判断结果设置衰减谱系数标志，并且根据设置的衰减谱系数标志对当前音频帧的谱系数进行调节，其中当衰减谱系数标志设置为存在时，对当前音频帧的谱系数进行调节。
59.本申请提供的防止广告干扰的音频编解码系统，可用于执行上述任一实施例描述的防止广告干扰的音频编解码方法，其实现原理和技术效果类似，在此不再赘述。
60.在本申请的一个具体实施例中，本申请一种防止广告干扰的音频编解码系统中各功能模块可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。
61.软件模块可驻留在ram存储器、快闪存储器、rom存储器、eprom存储器、eeprom存储器、寄存器、硬盘、可装卸盘、cd
‑
rom或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器，使得处理器可从存储介质读取信息和向存储介质写入信息。
62.处理器可以是中央处理单元(英文：central processing unit，简称：cpu)，还可以是其他通用处理器、数字信号处理器(英文：digital signal processor，简称：dsp)、专用集成电路(英文：application specific integrated circuit，简称：asic)、现场可编程门阵列（英文：field programmable gate array，简称：fpga）或其它可编程逻辑系统、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器，但在替代方案中，处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算系统的组合，例如dsp与微处理器的组合、多个微处理器、结合dsp核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中，存储介质可与处理器成一体式。处理器和存储介质可驻留在asic中。asic可驻留在用户终端中。在替代方案中，处理器和存储介质可作为离散组件驻留在用户终端中。
63.图8示出了本申请一种防止广告干扰的蓝牙发射器的一个具体实施方式。
64.在图8所示的具体实施方式中，提供一种防止广告干扰的蓝牙发射器，其包括：模块801，音频编码模块模块，其用于对当前音频帧进行有效声音判断，当当前音频帧包括有效声音且响度计数器计数完毕时，根据音频信号的时长和音频编解码器对应音频帧的帧长，对响度计数器设置预设值，其中有效声音包括人声和/或乐声，在音频信号的时长确定的情况下，帧长越长，预设值越小，
其用于根据响度计数器的预设值，计算包含当前音频帧在内的预设值数目帧连续音频帧的响度平均值，将响度平均值作为当前响度，并在计算下一预设值数目帧连续音频帧的响度时，将当前响度的值作为历史响度，其用于判断当前响度和历史响度之间的差值与预设响度门限的大小关系，并根据判断结果设置衰减谱系数标志，并且根据设置的衰减谱系数标志对当前音频帧的谱系数进行调节，并将经调节的谱系数通过低延迟改进型离散余弦变换子模块输出，其中当衰减谱系数标志设置为存在时，对当前音频帧的谱系数进行调节；以及模块802，蓝牙发射模块，其用于对当前音频帧经编码得到的音频码流进行发送。
65.图9示出了本申请一种防止广告干扰的蓝牙接收器的一个具体实施方式。
66.在图9所示的具体实施方式中，提供一种防止广告音量干扰的蓝牙接收器，其包括：模块901，蓝牙接收模块，其用于对音频码流进行接收并存储；以及模块902，音频解码模块，其用于对音频码流解码得到的当前音频帧进行有效声音判断，当当前音频帧包括有效声音且响度计数器计数完毕时，根据音频信号的时长和音频编解码器对应音频帧的帧长，对响度计数器设置预设值，其中有效声音包括人声和/或乐声，在音频信号的时长确定的情况下，帧长越长，预设值越小，其用于根据响度计数器的预设值，计算包含当前音频帧在内的预设值数目帧连续音频帧的响度平均值，将响度平均值作为当前响度，并在计算下一预设值数目帧连续音频帧的响度时，将当前响度的值作为历史响度，其用于判断当前响度和历史响度之间的差值与预设响度门限的大小关系，并根据判断结果设置衰减谱系数标志，并且根据设置的衰减谱系数标志对当前音频帧的谱系数进行调节，并将经调节的谱系数通过频域噪声整形子模块输出，其中当衰减谱系数标志设置为存在时，对当前音频帧的谱系数进行调节。
67.在本申请所提供的几个实施例中，应该理解到，所揭露的系统和方法，可以通过其它的方式实现。例如，以上所描述的系统实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，系统或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
68.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
69.以上所述仅为本申请的实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：声音数据降噪方法、装置、设备、存储介质及程序产品与流程

防止广告干扰的音频编解码方法、系统、发射器及接收器与流程

相关文章

最热文献