一种音频处理方法及系统与流程

2021-10-09 01:41:00 来源：中国专利 TAG：音频处理方法系统

1.本发明涉及音频处理技术领域，特别是涉及一种音频处理方法及系统。

背景技术：

2.midi(musical instrument digital interface，乐器数字接口)是编曲界最广泛的音乐标准格式，可称为“计算机能理解的乐谱”。
3.现有技术中，针对某一音频数据，存在将其转换音色的需求。现有技术中，电子乐器信号的音频处理方法，以对电鼓信号的音频处理方法为例，主要包括：将击打电鼓产生的midi格式的音频数据导入音频处理系统，进而对接收到的midi格式的音频数据进行处理，得到另一种音色的音频数据。
4.但是，在使用现有技术过程中，发明人发现现有技术中至少存在如下问题：midi格式的音频数据不易读写，不便于数据的交互；另外，变换音频速度时，midi格式音频数据的基础时间单位会随着音乐的速度变化而变化，基础时间单位变化会导致计算该速度下，这段时间的音乐的音符的长度表示会发生变化，造成最终输出的音频数据无法适应变速的音频数据的处理，数据解析的准确度与稳定度较差；再者，midi格式的音频数据只能对一个音轨里所有音符添加音效，数据处理的灵活性较低。

技术实现要素：

5.本发明旨在至少在一定程度上解决上述技术问题，本发明提供了一种音频处理方法及系统，以保证对应音频数据的可读性，增加对数据的解析度，提高数据的稳定性，同时具备对单个音符进行调整的灵活性。
6.本发明采用的技术方案是：
7.一种音频处理方法，包括音频解析方法，所述音频解析方法包括以下步骤：
8.读取midi格式的第一音频数据；
9.解析当前第一音频数据中每个轨道的信息，得到当前第一音频数据中每个轨道对应的文本信息；
10.将当前第一音频数据中每个轨道对应的文本信息存储为enmf格式的文本文件；
11.输出enmf格式的文本文件。
12.优选地，解析当前第一音频数据中每个轨道的信息时，基于python语言进行解析。
13.具体地，当前第一音频数据中每个轨道的信息，基于python语言进行解析时，步骤如下：
14.使用python语言的库与包，将midi格式的第一音频数据中的16进制的音符以及信息、速度、拍号、乐器、控制器等音频信息解析成当前第一音频数据中每个轨道对应的文本信息。
15.需要说明的是，python语言的库是指具有相关功能模块的集合，python语言的包是指为了方便管理而将文件进行打包的文件包。
16.优选地，当前第一音频数据中每个轨道对应的文本信息包括第一音频数据的音轨控制信息和音频事件信息，所述音频事件信息包括音符信息、控制器信息和/或速度信息。
17.进一步地，所述音频处理方法还包括音频转换方法，所述音频转换方法包括以下步骤：
18.读取enmf格式的文本文件；
19.根据enmf格式的文本文件创建音序与音轨；
20.对第一音频数据的音轨控制信息进行处理，并将音轨写入音频事件信息中，再调用预设的音色库，以将enmf格式的文本文件转变成第二音频数据；
21.输出第二音频数据。
22.进一步地，创建音序与音轨时，步骤如下：
23.将第一音频数据的音轨控制信息和音频事件信息进行结合，得到音序；
24.获取信息数组，然后将当前信息数组调用预设的音色库，得到音轨。
25.进一步地，第二音频数据的格式为mp3格式或wav格式。
26.一种音频处理系统，用于实现上述任一项所述的音频处理方法；所述音频处理系统包括依次连接的拾音器、ad转换器和enmf接口；
27.所述拾音器，用于读取midi格式的第一音频数据；
28.所述ad转换器，用于对拾音器读取的第一音频数据进行格式转换，然后输出转换后的第一音频数据；
29.所述enmf接口，用于解析当前第一音频数据中每个轨道的信息，得到当前第一音频数据中每个轨道对应的文本信息，然后将当前第一音频数据中每个轨道对应的文本信息存储为enmf格式的文本文件，最后输出enmf格式的文本文件。
30.优选地，所述音频处理系统还包括依次与enmf接口连接的合成器、da转换器和扬声器，所述合成器连接有音色库；
31.所述合成器，用于读取enmf格式的文本文件，并根据enmf格式的文本文件创建音序与音轨；所述合成器，还用于对第一音频数据的音轨控制信息进行处理，并将音轨写入音频事件信息中，再调用预设的音色库，以将enmf格式的文本文件转变成第二音频数据；
32.所述da转换器，用于对合成器输出的第二音频数据进行格式转换，然后输出转换后的第二音频数据；
33.所述扬声器，用于输出第二音频数据。
34.具体地，拾音器读取的第一音频数据的格式为midi格式，扬声器输出的第二音频数据的格式为mp3格式或wav格式。
35.需要说明的是，音频处理系统即为电子乐器，基于实施例1中的音频处理方法，本实施例中的音频处理系统可将获取的第一音频数据转换为第二音频数据，从而便于实现乐器的同源替换。
36.本发明的有益效果如下：
37.1)本发明可提高midi格式的音频数据的可读性，增强数据交互性；具体地，相对于midi格式，enmf(enewsletter manager message file,电子邮件管理器消息文件，可理解为一种自我定义用来保存文本的脚本语言的文件格式后缀)格式采用了文本化的记录方式，enmf格式的文本文件比midi格式的音频数据相比，更易读写，更方便数据的交互；
38.2)本发明可对midi格式的音频数据进行精准的控制与解析，保证midi格式的音频数据解析的准确度与稳定度；具体地，由于enmf格式采用了区别于midi格式的绝对时间记录，可适应各种变速midi格式的音频数据的处理，便于对midi格式的音频数据进行精准的控制与解析，保证midi的音频数据解析的准确度与稳定度；
39.3)本发明可针对midi音轨音效单一性进行处理，可实现对任意轨道任意音符进行音效的处理；具体地，由于enmf格式使用了单音音效，具备更强的灵活性，enmf格式的文本文件可以对单个音符施加单音音效，使得处理音乐更为灵活，进而可实现对任意轨道任意音符进行音效的处理，避免了midi格式中采用整轨音效的弊端。
附图说明
40.图1是本发明中音频解析方法的流程图；
41.图2是本发明中音频转换方法的流程图；
42.图3是本发明中音频处理系统的结构示意图；
43.图4是本发明中一种电子设备的模块框图。
具体实施方式
44.下面结合附图及具体实施例来对本发明作进一步阐述。
45.应当理解，尽管本文可能使用术语第一、第二等等来描述各种单元，但是这些单元不应当受到这些术语的限制。这些术语仅用于区分一个单元和另一个单元。
46.应当理解，对于本文中可能出现的术语“和/或”，其仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，单独存在b，同时存在a和b三种情况。
47.应当理解，还应当注意到在一些备选实施例中，所出现的功能/动作可能与附图出现的顺序不同。例如，取决于所涉及的功能/动作，实际上可以实质上并发地执行，或者有时可以以相反的顺序来执行连续示出的两个图。
48.实施例1：
49.本实施例提供一种音频处理方法，包括音频解析方法，如图1所示，所述音频解析方法包括以下步骤：
50.a1.读取midi格式的第一音频数据；
51.a2.解析当前第一音频数据中每个轨道的信息，得到当前第一音频数据中每个轨道对应的文本信息；
52.a3.将当前第一音频数据中每个轨道对应的文本信息存储为enmf格式的文本文件；
53.a4.输出enmf格式的文本文件。
54.本实施例主要用于对midi格式的音频数据进行处理。
55.本实施例的有益效果如下：
56.1)本实施例可提高midi格式的音频数据的可读性，增强数据交互性；具体地，相对于midi格式，enmf(enewsletter manager message file,电子邮件管理器消息文件，可理解为一种自我定义用来保存文本的脚本语言的文件格式后缀)格式采用了文本化的记录方
式，enmf格式的文本文件比midi格式的音频数据相比，更易读写，更方便数据的交互；
57.2)本实施例可对midi格式的音频数据进行精准的控制与解析，保证midi格式的音频数据解析的准确度与稳定度；具体地，由于enmf格式采用了区别于midi格式的绝对时间记录，可适应各种变速midi格式的音频数据的处理，便于对midi格式的音频数据进行精准的控制与解析，保证midi的音频数据解析的准确度与稳定度；
58.3)本实施例可针对midi音轨音效单一性进行处理，可实现对任意轨道任意音符进行音效的处理；具体地，由于enmf格式使用了单音音效，具备更强的灵活性，enmf格式的文本文件可以对单个音符施加单音音效，使得处理音乐更为灵活，进而可实现对任意轨道任意音符进行音效的处理，避免了midi格式中采用整轨音效的弊端。
59.本实施例中，解析当前第一音频数据中每个轨道的信息时，基于python语言进行解析。
60.需要说明的是，python语言提供了高效的高级数据结构，还能简单有效地面向对象编程。
61.具体地，当前第一音频数据中每个轨道的信息，基于python语言进行解析时，步骤如下：
62.使用python语言的库与包，将midi格式的第一音频数据中的16进制的音符以及信息、速度、拍号、乐器、控制器等音频信息解析成当前第一音频数据中每个轨道对应的文本信息。
63.需要说明的是，python语言的库是指具有相关功能模块的集合，python语言的包是指为了方便管理而将文件进行打包的文件包。
64.本实施例中，当前第一音频数据中每个轨道对应的文本信息包括第一音频数据的音轨控制信息和音频事件信息，所述音频事件信息包括音符信息、控制器信息和/或速度信息。
65.进一步地，所述音频处理方法还包括音频转换方法，如图2所示，所述音频转换方法包括以下步骤：
66.b1.读取enmf格式的文本文件；
67.b2.根据enmf格式的文本文件创建音序与音轨；应当理解的是，音序指代声音的序列，音轨指代存放音序的轨道。
68.b3.对第一音频数据的音轨控制信息进行处理，并将音轨写入音频事件信息中，再调用预设的音色库，以将enmf格式的文本文件转变成第二音频数据；
69.b4.输出第二音频数据。需要说明的是，输出第二音频数据，可采用将第二音频数据播放的形式实现，以便用户检测第二音频数据的音频质量。
70.本实施例中，创建音序与音轨时，步骤如下：
71.b201.将第一音频数据的音轨控制信息和音频事件信息进行结合，得到音序；
72.b202.获取信息数组，然后将当前信息数组调用预设的音色库，得到音轨。
73.本实施例中，信息数组基于python语言写出。
74.现有技术中，需要结合自制的音色库，生成更优质的音频数据，即需要经过更多音频的采样才能输出优质的音乐。本实施例中，基于python语言，预设的音色库可自动生成，然后结合该自动生成的音色库对第一音频数据进行转换，有效提高了音频数据的转换速
度。
75.本实施例中，第二音频数据的格式为mp3格式或wav格式。需要说明的是，midi格式的音频数据是没有音色相关的信息的，其音频质量较差，而基于音频处理方法生成的mp3格式的音频数据带有优秀的音色，进而提升原midi格式的第一音频数据的音频质量。
76.实施例2：
77.本实施例公开了一种音频处理系统，用于实现实施例1中任一项所述的音频处理方法；如图3所示，所述音频处理系统包括依次连接的拾音器、ad(altium designer)转换器和enmf接口；
78.所述拾音器，用于读取midi格式的第一音频数据；
79.所述ad转换器，用于对拾音器读取的第一音频数据进行格式转换，然后输出转换后的第一音频数据；具体地，拾音器读取的第一音频数据为模拟信号，ad转换器可将模拟信号转变为enmf接口可接收的数字信号。
80.所述enmf接口，用于解析当前第一音频数据中每个轨道的信息，得到当前第一音频数据中每个轨道对应的文本信息，然后将当前第一音频数据中每个轨道对应的文本信息存储为enmf格式的文本文件，最后输出enmf格式的文本文件。本实施例中，enmf接口解析当前第一音频数据中每个轨道的信息时，基于python语言进行解析。
81.本实施例中，所述音频处理系统还包括依次与enmf接口连接的合成器、da转换器和扬声器，所述合成器连接有音色库；
82.所述合成器，用于读取enmf格式的文本文件，并根据enmf格式的文本文件创建音序与音轨；所述合成器，还用于对第一音频数据的音轨控制信息进行处理，并将音轨写入音频事件信息中，再调用预设的音色库，以将enmf格式的文本文件转变成第二音频数据；
83.所述da转换器，用于对合成器输出的第二音频数据进行格式转换，然后输出转换后的第二音频数据；具体地，合成器输出的第二音频数据为模拟信号，da转换器可将数字信号转变为扬声器可输出的模拟信号。
84.所述扬声器，用于输出第二音频数据。
85.本实施例中，拾音器读取的第一音频数据的格式为midi格式，扬声器输出的第二音频数据的格式为mp3格式或wav格式。
86.需要说明的是，音频处理系统即为电子乐器，基于实施例1中的音频处理方法，本实施例中的音频处理系统可将获取的第一音频数据转换为第二音频数据，从而便于实现乐器的同源替换。
87.实施例3：
88.在实施例1或2的基础上，本实施例公开了一种电子设备，该设备可以是智能手机、平板电脑、笔记本电脑或者台式电脑等。电子设备可能被称为用于终端、便携式终端、台式终端等，如图4所示，电子设备包括：
89.存储器，用于存储计算机程序指令；以及，
90.处理器，用于执行所述计算机程序指令从而完成如实施例1中任一所述的音频处理方法的操作。
91.具体地，处理器301可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器301可以采用dsp(digital signal processing，数字信号处理)、fpga
(field－programmable gate array，现场可编程门阵列)、pla(programmable logic array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器301也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称cpu(central processingunit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器301可以在集成有gpu(graphics processing unit，图像处理器)，gpu用于负责显示屏所需要显示的内容的渲染和绘制。处理器301还可以包括ai(artificial intelligence，人工智能)处理器，该ai处理器用于处理有关机器学习的计算操作，使得图神经网络的节点编码模型可以自主训练学习，提高效率和准确度。
92.存储器302可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器302还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器302中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器801所执行以实现本技术中方法实施例提供的图神经网络的节点编码方法。
93.在一些实施例中，终端还可选包括有：通信接口303和至少一个外围设备。处理器301、存储器302和通信接口303之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与通信接口303相连。具体地，外围设备包括：射频电路304、显示屏305和电源306中的至少一种。
94.通信接口303可被用于将i/o(input/output，输入/输出)相关的至少一个外围设备连接到处理器301和存储器302。在一些实施例中，处理器301、存储器302和通信接口303被集成在同一芯片或电路板上；在一些其他实施例中，处理器301、存储器302和通信接口303中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。
95.射频电路304用于接收和发射rf(radio frequency，射频)信号，也称电磁信号。射频电路304通过电磁信号与通信网络以及其他通信设备进行通信。
96.显示屏305用于显示ui(user interface，用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。
97.电源306用于为电子设备中的各个组件进行供电。
98.实施例4：
99.在实施例1至3任一项实施例的基础上，本实施例公开了一种计算机可读存储介质，用于存储计算机可读取的计算机程序指令，所述计算机程序指令被配置为运行时执行如实施例1所述的音频处理方法的操作。
100.需要说明的是，所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read
‑
onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。
101.以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例
对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
102.最后应说明的是，本发明不局限于上述可选的实施方式，任何人在本发明的启示下都可得出其他各种形式的产品。上述具体实施方式不应理解成对本发明的保护范围的限制，本发明的保护范围应当以权利要求书中界定的为准，并且说明书可以用于解释权利要求书。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：水轮机组遥听监测方法、装置和系统与流程

一种音频处理方法及系统与流程

相关文章

最热文献