一种协议音频格式的判断方法与流程

2022-12-07 02:23:51 来源：中国专利 TAG：

1.本发明涉及音频技术领域，具体为一种协议音频格式的判断方法。

背景技术：

2.gb28181协议在全国平安城市、交通、道路等监控中广泛采用，若想做统一的大监控平台，则支持28181协议接入是必不可少的；
3.如今很多客户都是想在之前使用的28181平台的基础上进行拓展；
4.但在平台对接的过程过，由于各个厂家对协议的理解存在一定的偏差，导致音频数据的解析存在不少问题，例如下级平台对音频编码格式、采样率等关键参数没有做出明确的说明，导致解码和播放的过程中会出现音频播放异常的情况，从而影响客户端用户体验。

技术实现要素：

5.本发明提出了一种在音频传输过程中实时识别音频编码格式的方法，以解决在各个平台上传的音视频流不规范的情况。
6.为实现上述目的，本发明提供如下技术方案：一种协议音频格式的判断方法，包括以下步骤：
7.步骤1、获取下级平台url；
8.步骤2、通过url下载rtp打包数据；
9.步骤3、解析rtp报，拆分出音频和视频数据；
10.步骤4、缓存2m bytes的音频数据；
11.步骤5、将缓存的2mbyte的音频数据送入解码器1；
12.步骤6、如果解码器报错，则选择下一个解码器；
13.步骤7、如果解码器未报错，则分析解码器输出的pcm数据；
14.步骤8、分析pcm数据的绝对值-幅值；
15.步骤9、如果解码后的pcm数据未出现大量幅值很大的数据，则将这些pcm数据除以2^15得到-1到1之间的浮点；
16.步骤10、利用快速傅里叶变换把这些浮点数表示的时域信息转换为频域信息，计算频谱的平坦度fi＝其中y(k)表示第k个频点的幅度谱，n表示经过fft以后的频率点数，i为解码器编号，将fi的值做平滑处理后放入数组中暂存；
17.步骤11、重复步骤5；
18.步骤12、比较fi的值，取最小值所在的解码器作为该路音频的解码器。
19.优选的，步骤8中，该值的取值范围与采样的位深相关，以位深16位举例，则取值范围为-32768～32767(2^16＝65,536)，当pcm数据的绝对值大量频繁大于30000时，则认为pcm数据不合理，解码失败。
20.优选的，步骤10中，声音信号在频域表现为多个不同频率、振幅信号组成。
21.优选的，步骤11中，直至所有解码器都运行完毕。
22.本发明提出的一种协议音频格式的判断方法，有益效果在于：
23.本发明通过时域和频域的pcm特征，对解码后的pcm数据进行分析，从而找到最有可能的音频格式，从而对其解码后正常播放，解决现有技术常常在播放下级平台上传的音频时由于无法确定音频格式从而使用错误的解码器进行解码导致音频播放异常的问题。
附图说明
24.图1为本发明的协议音频格式的判断方法流程图；
25.图2为本发明的时域幅值正常的波形图；
26.图3为本发明的时域幅值过大的波形图。
具体实施方式
27.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
28.实施例，请参阅图1-3，本发明提供一种技术方案：一种协议音频格式的判断方法，包括以下步骤：
29.步骤1、获取下级平台url；
30.步骤2、通过url下载rtp打包数据；
31.步骤3、解析rtp报，拆分出音频和视频数据；
32.步骤4、缓存2m bytes的音频数据；
33.步骤5、将缓存的2mbyte的音频数据送入解码器1；
34.步骤6、如果解码器报错，则选择下一个解码器；
35.步骤7、如果解码器未报错，则分析解码器输出的pcm数据；
36.步骤8、分析pcm数据的绝对值-幅值，该值的取值范围与采样的位深相关，以位深16位举例，则取值范围为-32768～32767(2^16＝65,536)，当pcm数据的绝对值大量频繁大于30000时，则认为pcm数据不合理，解码失败；
37.步骤9、如果解码后的pcm数据未出现大量幅值很大的数据，则将这些pcm数据除以2^15得到-1到1之间的浮点；
38.步骤10、利用快速傅里叶变换把这些浮点数表示的时域信息转换为频域信息，声音信号在频域表现为多个不同频率、振幅信号组成；计算频谱的平坦度fi＝其中y(k)表示第k个频点的幅度谱，n表示经过fft以后的频率点数，i为解码器编号，将fi的值做平滑处理后放入数组中暂存；
39.步骤11、重复步骤5，直至所有解码器都运行完毕；
40.步骤12、比较fi的值，取最小值所在的解码器作为该路音频的解码器。
41.将下级平台上传的音频文件从rtp格式中分离出来，并依次在系统注册的音频解码器中解码一次获得pcm数据，如果解码失败，则说明解码器不匹配，否则根据pcm数据在时域的幅值判断是否解码失败，依据为频繁出现幅值过大；如果时域的幅值正常，则将pcm数
据经过预处理后进行fft变换，得到该段声音的频谱，再利用频谱的平坦度算法挑选平坦度最小的解码器作为首选解码器。
42.尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

技术特征：
1.一种协议音频格式的判断方法，其特征在于，包括以下步骤：步骤1、获取下级平台url；步骤2、通过url下载rtp打包数据；步骤3、解析rtp报，拆分出音频和视频数据；步骤4、缓存2m bytes的音频数据；步骤5、将缓存的2mbyte的音频数据送入解码器1；步骤6、如果解码器报错，则选择下一个解码器；步骤7、如果解码器未报错，则分析解码器输出的pcm数据；步骤8、分析pcm数据的绝对值-幅值；步骤9、如果解码后的pcm数据未出现大量幅值很大的数据，则将这些pcm数据除以2^15得到-1到1之间的浮点；步骤10、利用快速傅里叶变换把这些浮点数表示的时域信息转换为频域信息，计算频谱的平坦度fi＝其中y(k)表示第k个频点的幅度谱，n表示经过fft以后的频率点数，i为解码器编号，将fi的值做平滑处理后放入数组中暂存；步骤11、重复步骤5；步骤12、比较fi的值，取最小值所在的解码器作为该路音频的解码器。2.根据权利要求1所述的一种协议音频格式的判断方法，其特征在于，步骤8中，该值的取值范围与采样的位深相关，以位深16位举例，则取值范围为-32768～32767(2^16＝65,536)，当pcm数据的绝对值大量频繁大于30000时，则认为pcm数据不合理，解码失败。3.根据权利要求1所述的一种协议音频格式的判断方法，其特征在于，步骤10中，声音信号在频域表现为多个不同频率、振幅信号组成。4.根据权利要求1所述的一种协议音频格式的判断方法，其特征在于，步骤11中，直至所有解码器都运行完毕。

技术总结
本发明涉及音频技术领域，本发明公开了一种协议音频格式的判断方法，包括以下步骤：步骤1、获取下级平台URL；步骤2、通过URL下载RTP打包数据；步骤3、解析RTP报，拆分出音频和视频数据；步骤4、缓存2M Bytes的音频数据；步骤5、将缓存的2MByte的音频数据送入解码器1；步骤6、如果解码器报错，则选择下一个解码器；步骤7、如果解码器未报错，则分析解码器输出的PCM数据；步骤8、分析PCM数据的绝对值-幅值；步骤9、如果解码后的PCM数据未出现大量幅值很大的数据，则将这些PCM数据除以2^15得到-1到1之间的浮点。本发明通过时域和频域的PCM特征，对解码后的PCM数据进行分析，从而找到最有可能的音频格式，从而对其解码后正常播放。从而对其解码后正常播放。从而对其解码后正常播放。

技术研发人员：王麒
受保护的技术使用者：杭州登虹科技有限公司
技术研发日：2022.09.06
技术公布日：2022/12/5

再多了解一些

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：基于领域分类和热词前缀树集束搜索的语音识别方法及系统与流程

一种协议音频格式的判断方法与流程

相关文献

最热文献