音质评价方法、装置及计算机存储介质与流程

2022-03-13 18:48:39 来源：中国专利 TAG：

1.本发明实施例涉及声音领域，并且更具体地，涉及一种音质评价方法、装置及计算机存储介质。

背景技术：

2.音质的优劣取决于多种因素，为了对再现声音的质量进行评价，可以使用音质评价方法。一般地，音质评价方法包括主观评价和客观评价两种方法。
3.其中，主观评价方法是组织专家团队对声音的音质进行打分来评价，但是这种方式代价太高。其中，客观评价方法是使用仪器来测试声音的技术指标，但是这种测量方法与主观聆听方法差距比较大，会导致具有完美的频响曲线的声音的音质并不好。
4.因此，目前对再现的声音的音质评价的难度较大。

技术实现要素：

5.本发明提供了一种音质评价方法、装置及计算机存储介质，能够方便进行音质评价，且结果准确可靠。
6.根据本发明的第一方面，提供了一种音质评价方法，包括：
7.获取待测均衡器参数调整后的待评价音乐；
8.将所述待评价音乐输入预先训练好的神经网络；
9.获取所述神经网络输出的对所述待评价音乐的在所述待测均衡器参数的音质的评价结果。
10.在本发明的一种实现方式中，将所述待评价音乐输入预先训练好的神经网络，包括：对所述待评价音乐进行傅立叶变换，进而得到所述待评价音乐的特征向量；将所述待评价音乐的特征向量输入所述预先训练好的神经网络。
11.在本发明的一种实现方式中，所述神经网络通过下述方式训练得到：构建训练集，所述训练集包括多个训练数据以及与所述多个训练数据对应的音质评价，每个训练数据包括音频信息以及对应的均衡器参数，且所述对应的音质评价为所述音频信息在不同的均衡器参数下的音质的评价；基于所述训练集对所述神经网络进行训练。
12.在本发明的一种实现方式中，所述构建训练集，包括：针对某一个音频信息，进行多种不同的均衡器参数调整，并获取某一个人针对所述多种不同的均衡器参数调整后的所述音频信息的音质评价。
13.在本发明的一种实现方式中，所述基于所述训练集对所述神经网络进行训练，包括：对所述训练集中的训练数据进行预处理，得到预处理后的数据；提取所述预处理后的数据的特征向量；将所述特征向量输入至所述神经网络进行训练。
14.在本发明的一种实现方式中，所述预处理包括：将所述训练集中的训练数据按照预定时长进行截断，得到具有多个预定时长的数据。
15.在本发明的一种实现方式中，所述提取所述预处理后的数据的特征向量，包括：将
所述预处理后的数据进行快速傅立叶变换、交叠、梅尔谱变换，进而得到每个数据的特征向量。
16.第二方面，提供了一种音质评价装置，所述装置用于实现前述第一方面或任一实现方式所述方法的步骤，所述装置包括：
17.获取模块，用于获取待测均衡器参数调整后的待评价音乐；
18.输入模块，用于将所述待评价音乐输入预先训练好的神经网络；
19.输出模块，用于获取所述神经网络输出的对所述待评价音乐的在所述待测均衡器参数的音质的评价结果。
20.第三方面，提供了一种音质评价装置，包括存储器、处理器及存储在所述存储器上且在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现前述第一方面或任一实现方式所述方法的步骤。
21.第四方面，提供了一种计算机存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现前述第一方面或任一实现方式所述方法的步骤。
22.可见，本发明实施例在进行训练集构建的过程中，兼顾了客观与主观的方法，并使用深度学习技术进行训练，得到了可靠的用于评价音质的神经网络，并且该神经网络得到的音质评价不仅成本低，无需组织大量的专家团队人力，而且结果准确可靠。
附图说明
23.通过结合附图对本发明实施例进行更详细的描述，本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解，并且构成说明书的一部分，与本发明实施例一起用于解释本发明，并不构成对本发明的限制。在附图中，相同的参考标号通常代表相同部件或步骤。
24.图1是现有技术仪器测试耳机的频响曲线的一个场景图；
25.图2是现有技术专家团队对耳机的音质进行打分的一个场景图；
26.图3是本发明实施例的对神经网络进行训练的一个示意图；
27.图4是本发明实施例的训练正确率的一个示意图；
28.图5是本发明实施例的训练误差的一个示意图；
29.图6是本发明实施例的验证正确率的一个示意图；
30.图7是本发明实施例的音质评价方法的一个示意性流程图；
31.图8是本发明实施例的音质评价装置的一个示意性框图；
32.图9是本发明实施例的音质评价装置的另一个示意性框图。
具体实施方式
33.为了使得本发明的目的、技术方案和优点更为明显，下面将参照附图详细描述根据本发明的示例实施例。显然，所描述的实施例仅仅是本发明的一部分实施例，而不是本发明的全部实施例，应理解，本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例，本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。
34.声音(例如音乐等)的音质的优劣取决于多种因素，包括但不限于：声源特性、音响
器材的信号特性、声场特性、听觉特性等。其中，声源特性可以包括例如声压、频率、频谱等；音响器材的信号特性可以包括例如失真度、频响、动态范围、信噪比、瞬态特性、立体声分离度等；声场特性可以包括例如直达声、前期反射声、混响声、两耳间互相关系数、基准振动、吸声率等；听觉特性可以包括例如响度曲线、可听范围、各种听感等。因此，也就导致了对音质进行的评价的难度较大。
35.客观评价的方法是使用仪器测试技术指标，例如可以测试器材(如耳机)的频响曲线。示例性地，测试耳机的频响曲线的一个场景图如图1所示。图1中，用于测试的仪器包括测试部分、测试套件1、测试套件2和测试套件3，其中，测试套件3为信号发生器、测试套件2为测试主要部分、测试套件1为接收器。具体地，可以由电脑产生扫频信号，如200hz～8khz，经由信号发生器输入至待测的耳机，对耳机的输出进行测试，得到频响曲线。进一步地，可以将得到的频响曲线与目标频响曲线进行比对，进而能够客观地判断音质的好坏。
36.主观评价的方法是组织专家团队，并由专家团队进行打分。示例性地，一个场景图如图2所示。图2中，电脑产生声音，随后可以对该声音的均衡器(equalizer，eq)参数进行不同的调整，得到若干个调整后的声音，通过耳机输出，由专家团队打分确定哪个eq参数对应的音质高，如图2中的位于上面的一支。图2中，电脑产生声音，通过不同的耳机输出，由专家团队打分确定哪个耳机的音质高，如图2中的位于下面的一支。
37.但是，现有技术中两种评价的方法各有缺陷，如与实际差别较大，如成本太高。
38.本发明实施例提供了一种神经网络，能够实现对音乐的音质评价，确定在不同的eq参数下的音乐的音质的好坏。
39.本发明实施例可以构建训练集，并基于训练集对神经网络进行训练，从而得到训练好的神经网络，其能够用于后续对音乐的音质进行评价。
40.该训练集包括多个训练数据以及对应的音质评价。其中，训练数据可以包括音频信息以及对应的均衡器参数，相应地音质评价为音频信息在不同的均衡器参数下的音质的评价。
41.示例性地，如下表一所示，是训练数据及对应的音质评价的示例。但是可理解的是，表一仅是示意，本技术对训练数据的具体形式不作限定。
42.表一
[0043][0044]
其中，训练数据对应的音质评价可以是通过主观评价得到的，因此准确度高，进而
保证神经网络的可用性。参照表一，同一音频信息(如音频信息1)在不同的均衡器参数(如eq参数1、eq参数2、eq参数3)下的音质评价可能是不同的，不同的音频信息(如音频信息1、音频信息2)在相同的均衡器参数(如eq参数3)下的音质评价可能是不同的。
[0045]
另外，可理解，音质评价可以用于表示喜好程度，如表一中包括喜欢、中等、不喜欢。但是本技术对此不限定，例如可以划分更多或更少的评价级别，再例如可以通过其他方式(如打分)进行评价，等等。
[0046]
如下首先描述如何得到某一训练数据对应的音质评价，进而构建训练集。
[0047]
针对某一音频信息(为了描述方便，下面假设为音乐m)，可以通过如下方式得到在不同均衡器参数下的对应的音质评价。
[0048]
(1)，针对音乐m，可以进行多种不同的eq参数调整，然后通过同一器材播放，得到某一个人对多种不同eq参数调整后的音乐m的音质评价。其中音质评价可以为某一个人对eq参数的喜好程度。
[0049]
示例性地，可以进行8种不同的eq参数调整，得到相应的音乐m的8个对应音乐，随后某一个人可以这8个对应音乐的喜好程度。喜好程度可以包括喜欢、中等、不喜欢。或者，喜好程度可以包括非常喜欢、一般喜欢、中等、不喜欢。等等，也就是说喜欢程度可以是3类、4类、甚至8类。例如，可以将8个对应音乐按喜好程度进行排序，即可以理解为喜好程度被分为8类。
[0050]
可选地，本发明实施例假设喜好程度包括喜欢、中等、不喜欢。那么，在确定喜好程度时，可以通过盲评4、2、1的淘汰赛进行打分。
[0051]
具体地，可以将音乐m进行8种不同eq参数调整后的8个对应音乐进行编号，可以依次为no1，no2，no3，no4，no5，no6，no7，no8。随后，可以分为4组，每组包括2个对应音乐，让某一个人来听，从而得到4个喜好程度为不喜欢的。例如，no1和no2为一组，可以从中选取较好的一个，另一个被淘汰的为“不喜欢”；no3和no4为一组，可以从中选取较好的一个，另一个被淘汰的为“不喜欢”；no5和no6为一组，可以从中选取较好的一个，另一个被淘汰的为“不喜欢”；no7和no8为一组，可以从中选取较好的一个，另一个被淘汰的为“不喜欢”。这样，选出了4个未被淘汰的，再分为2组，每组选出较好的一个，淘汰另一个。其中，每组中淘汰的那个为“中等”。在此之后，可以再将选出的那两个再进行比较，选择较好的那个，那么最后这次淘汰的那个为“中等”，而选出的那个为“喜欢”。上述过程进行了三次，第一次被分为4组，第二次被分为2组，第三次为1组，从而可以称为“4、2、1”淘汰打分制。这样，针对8种不同eq参数调整后的8个对应音乐，4个为不喜欢，3个为中等，1个为喜欢。
[0052]
(2)，针对音乐m，可以通过多种器材播放，得到某一个人对多种器材的音质评价。其中音质评价可以为某一个人对器材的偏好。
[0053]
其中，每一种器材的频响曲线是可以通过测试得到的，那么可以理解，某一个人对各种器材的偏好，也就相当于，得到了某一个人对频响曲线的偏好。
[0054]
将上述(1)和(2)得到的结果对应起来，便可以得到某一个人所喜欢的频响曲线与eq参数的对应关系。
[0055]
进一步地，可以根据(1)得到的某一个人所喜欢的eq参数，对同类型(或称风格)音乐样本进行处理，得到在eq参数调整之后的该个人所喜欢的音乐。举例来说，假设上述的音乐m的风格为民谣，上述(1)某个人所喜欢的eq参数为eq参数1，那么，可以对同为民谣的其
他若干(假设为m1，如100首或更多或更少)样本音乐进行eq参数1调整。
[0056]
再举例来说，假设上述的音乐m的风格为民谣，上述(1)某一个人所不喜欢的eq参数为eq参数2、eq参数3、eq参数4、eq参数5，那么，可以对同为民谣的其他若干(假设为m1，如100首或更多或更少)样本音乐分别进行eq参数2、eq参数3、eq参数4、eq参数5调整，从而得到对某一个人来说，喜好程度为不喜欢的400首音乐样本。若上述(1)某一个人所中等的eq为eq参数6、eq参数7、eq参数8，那么，可以对同为民谣的其他若干(假设为m1，如100首或更多或更少)样本音乐分别进行eq参数6、eq参数7、eq参数8调整，从而得到对某一个人来说，喜好程度为中等的300首音乐样本。
[0057]
这样，本发明实施例得到了若干音频信息对应的第一训练数据。
[0058]
假设上述(1)和(2)的过程是针对某一个人(假设为p1)所进行的，那么通过上面的过程，能够得到某一个人(假设为p1)针对某类音频信息在各个不同的eq参数下的音质评价，也即能够得到多个训练数据以及对应的音质评价。
[0059]
类似地，可以针对其他人进行上述过程，从而得到更多的训练数据以及对应的音质评价。举例来说，可以对p2、p3、p4
…
通过同样的过程得到这些人对某类音频信息在各个eq参数时的音质评价。
[0060]
为了描述方便，这里假设为100个人，这样针对音乐m，可以分别得到100个人的喜好程度。通过综合100个人的喜好程度，得到大部分人的喜好。例如，若100个人中标注“喜欢”的数量最多(如50个人、80个人等)的eq参数为eq参数2，那么说明针对音乐m，eq参数2为大部分人的喜好。
[0061]
进一步地，可以根据得到的大部分人所喜欢的eq参数(如上举例的eq参数2)，对同类型音乐样本进行处理，得到在eq参数调整后的该个人所喜欢的音乐。举例来说，假设上述的音乐m的风格为民谣，上述得到的大部分人所喜欢的eq参数为eq参数2，那么，可以对同为民谣的其他若干(假设为m1，如100首或更多或更少)样本音乐进行eq参数2调整。
[0062]
这样，本发明实施例得到了若干(m1)音频信息对应的第二训练数据。
[0063]
通过上述所描述的过程，可以针对音乐m，经过多个人(如100个)主观地标注喜好程度得到对应的音质评价，并结合客观地测试得到的器材的频响曲线，可以得到第一训练数据和第二训练数据。类似地，针对其他的音乐(例如另一类型的音乐)，也可以通过上述过程得到对应的第一训练数据和第二训练数据。
[0064]
也就是说，假设存在多种不同的类型的音频信息，可以从类型1中选出一首音乐(如音乐m)执行上述的过程，然后再从类型2中选出一首音乐(如音乐n)执行上述的过程，
……
这样可以得到更多的训练数据，并且针对多种不同类型的音频信息，使得训练集更加丰富，进而使得后续神经网络更加准确。
[0065]
将上面的所有训练数据(第一训练数据和第二训练数据)进行综合，可以作为用于训练神经网络的训练集。可见，该训练集包括多个训练数据以及关于该多个训练数据的音质评价。其中，训练数据可以包括音频信息以及对应的多个不同的均衡器参数，从而对应的音质评价可以表示多个人对多个音频信息在多个不同的均衡器参数下的音质的评价。
[0066]
本发明实施例的神经网络可以包括两个卷积层和一个全连接层，如图3所示。通过多次迭代，可以完成对神经网络的训练。
[0067]
应注意的是，图3所示仅是示例，例如可以包括更多数量的卷积层，例如可以还包
括反卷积层、池化层等。示例性地，可以构建损失函数来判断是否收敛从而确定训练是否完成。其中，可以将训练数据输入至训练中的神经网络，得到对应的输出，并进一步根据该对应的输出以及与训练数据对应的音质评价构建损失函数。
[0068]
示例性地，为了降低训练时的计算量，提高训练的效率，缩短训练的时长。在对神经网络进行之前，可以将训练数据进行预处理。也就是说，训练神经网络可以包括：对训练集中的训练数据进行预处理，得到预处理后的数据；提取预处理后的数据的特征向量；将该预处理后的数据的特征向量输入至神经网络进行训练。
[0069]
预处理可以包括：将训练集中的训练数据按照预定时长进行截断，得到具有多个预定时长的数据。
[0070]
随后，可以提取各个数据的特征向量，将各个数据的特征向量输入至神经网络进行训练。具体地，将多个预定时长的数据中的每个数据进行快速傅立叶变换(fast fourier transform，fft)、交叠、梅尔谱变换，进而得到每个数据的特征向量(也称为语谱图)。
[0071]
例如，预定时长可以为10秒(s)，将训练数据按照10秒一段进行截断，假设一共得到94860个片段(均为10s)的数据，随后每段数据进行4196点的fft变换，3072点的交叠，128点的梅尔谱变换，得到427
×
128的语谱图。
[0072]
这样，通过按照预定时长进行截断，使得数据的时长更短，进而在对神经网络进行训练时，可以更快地收敛，缩短了训练的总时长，如图4和图5分别示出了训练的正确率和训练的误差，可以看出，随着迭代次数的增加，正确率逐渐接近于1，误差逐渐接近于0，即达到了收敛。
[0073]
另外，为了对神经网络进行验证，还可以进一步使用测试集对训练好的神经网络进行验证，如图6所示，可以看出，针对测试集，可以达到70％的正确率。
[0074]
可见，本发明实施例在进行训练集构建的过程中，兼顾了客观与主观的方法，并使用深度学习技术进行训练，得到了可靠的用于评价音质的神经网络，并且该神经网络得到的音质评价不仅成本低，无需动用大量的专家团队人力，而且结果准确可靠。
[0075]
图7是本发明实施例的音质评价方法的一个示意性流程图。图7所示的过程包括：
[0076]
s110，获取待测均衡器参数调整后的待评价音乐；
[0077]
s120，将所述待评价音乐输入预先训练好的神经网络；
[0078]
s130，获取所述神经网络输出的对所述待评价音乐的在所述待测均衡器参数的音质的评价结果。
[0079]
示例性地，如果想要对某音乐在某个eq参数的音质进行评价，那么可以对该音乐进行eq参数调整，从而得到s110中的待评价音乐。举例来讲，假设待测均衡器参数是eq参数1，那么可以调整某音乐的eq参数1，从而得到待评价音乐。
[0080]
示例性地，s120中，可以将待评价音乐的特征向量输入至预先训练好的神经网络；或者，可以由神经网络首先提取该待评价音乐的特征向量。
[0081]
具体地，可以对待评价音乐进行傅立叶变换，进而得到待评价音乐的特征向量。举例来说，可以对待评价音乐进行快速傅里叶变换(fft)、交叠、梅尔谱变换，进而得到其特征向量。
[0082]
可选地，预先训练好的神经网络包括特征提取模型，该特征提取模型用于提取所输入的待评价音乐的特征向量。具体地，该特征提取模型可以对待评价音乐进行快速傅里
叶变换(fft)、交叠、梅尔谱变换，进而得到其特征向量。例如，特征提取模型可以对待评价音乐进行4196点的快速傅里叶变换(fft)、3072点的交叠、128点的梅尔谱变换，进而得到其特征向量，即得到427
×
128的语谱图。
[0083]
示例性地，s120中预先训练好的神经网络可以如前所述，该神经网络可以包括两个卷积层和一个全连接层。可理解，也可以进一步提高神经网络的复杂度以提升神经网络的精度，如卷积层的数量可以更多，如还可以包括池化层等，本发明对此不限定。
[0084]
在对神经网络进行训练的过程中，可以提取训练数据的特征向量，输入至神经网络，并通过多次迭代，得到s220中的训练好的神经网络。
[0085]
示例性地，在训练过程中，可以对训练数据进行预处理，得到预处理后的数据；提取预处理后的数据的特征向量；将该预处理后的数据的特征向量输入至神经网络进行训练。
[0086]
其中，预处理可以包括：将训练集中的训练数据按照预定时长进行截断，得到具有多个预定时长的数据。
[0087]
随后，可以提取各个数据的特征向量，将各个数据的特征向量输入至神经网络进行训练。具体地，将多个预定时长的数据中的每个数据进行快速傅立叶变换(fast fourier transform，fft)、交叠、梅尔谱变换，进而得到每个数据的特征向量(也称为语谱图)。
[0088]
例如，预定时长可以为10秒(s)，将训练数据按照10秒一段进行截断，假设一共得到94860个片段(均为10s)的数据，随后每段数据进行4196点的fft变换，3072点的交叠，128点的梅尔谱变换，得到427
×
128的语谱图。
[0089]
这样，通过按照预定时长进行截断，使得数据的时长更短，进而在对神经网络进行训练时，可以更快地收敛，缩短了训练的总时长。
[0090]
示例性地，s130中神经网络的输出可以为喜欢、中等或不喜欢中的一个。当然该输出也可以为其他的形式。可以理解的是，该输出与神经网络有关，例如，如果对神经网络进行训练时，训练数据对应的音质评价指示喜好程度包括喜欢、中等、不喜欢，那么该神经网络的输出也为这三个之一。再例如，如果对神经网络进行训练时，训练数据对应的音质评价指示喜好程度包括更多的程度，那么该神经网络的输出也为这更多的程度之一。
[0091]
由此可见，本发明实施例使用预先训练好的神经网络来评价音乐的音质，操作简单，无需组织专家团队，并且结果更加准确可靠。
[0092]
图8是本发明实施例的音质评价装置的一个示意性框图。图8所示的装置20包括获取模块210、输入模块220和输出模块230。
[0093]
获取模块210可以用于获取待测均衡器参数调整后的待评价音乐；
[0094]
输入模块220可以用于将所述待评价音乐输入预先训练好的神经网络；
[0095]
输出模块230可以用于获取所述神经网络输出的对所述待评价音乐的在所述待测均衡器参数的音质的评价结果。
[0096]
示例性地，输入模块220可以对待评价音乐进行傅立叶变换，进而得到待评价音乐的特征向量。举例来说，可以对待评价音乐进行快速傅里叶变换(fft)、交叠、梅尔谱变换，进而得到其特征向量。
[0097]
例如，可以对待评价音乐进行4196点的快速傅里叶变换(fft)、3072点的交叠、128点的梅尔谱变换，进而得到其特征向量，即得到427
×
128的语谱图。
[0098]
示例性地，输出模块230的输出可以喜欢、中等或不喜欢中的一个。当然该输出也可以为其他的形式。可以理解的是，该输出与神经网络有关，例如，如果对神经网络进行训练时，训练数据对应的音质评价指示喜好程度包括喜欢、中等、不喜欢，那么该神经网络的输出也为这三个之一。再例如，如果对神经网络进行训练时，训练数据对应的音质评价指示喜好程度包括更多的程度，那么该神经网络的输出也为这更多的程度之一。
[0099]
举例来说，在构建训练集时，训练数据对应的音质评价可以包括人对音乐的喜好程度，如前所述，可以使用8种不同的eq参数调整音乐，并采用4、2、1的淘汰打分方法确定其中的喜好程度为不喜欢、中等、喜欢的数量分别为4、3和1。
[0100]
示例性地，装置20还可以包括训练模块，用于通过训练得到s220中的神经网络。
[0101]
训练模块可以用于：构建训练集；基于所述训练集对所述神经网络进行训练。具体过程可以参见前述对神经网络进行训练的详细描述，这里不再赘述。
[0102]
图8所示的装置20能够实现前述图7所示的音质评价方法，为避免重复，这里不再赘述。
[0103]
本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。
[0104]
另外，本发明实施例还提供了另一种音质评价装置，包括存储器、处理器及存储在所述存储器上且在所述处理器上运行的计算机程序，处理器执行所述程序时实现前述图7所示的音质评价方法的步骤。
[0105]
如图9所示，该装置30可以包括存储器910和处理器920。
[0106]
存储器910存储用于实现根据本发明实施例的音质评价方法中的相应步骤的计算机程序代码。
[0107]
处理器920用于运行存储器910中存储的计算机程序代码，以执行根据本发明实施例的音质评价方法的相应步骤。
[0108]
示例性地，在所述计算机程序代码被处理器920运行时执行以下步骤：获取待测均衡器参数调整后的待评价音乐；将所述待评价音乐输入预先训练好的神经网络；获取所述神经网络输出的对所述待评价音乐的在所述待测均衡器参数的音质的评价结果。
[0109]
另外，本发明实施例还提供了一种计算机存储介质，其上存储有计算机程序。当所述计算机程序由处理器执行时，可以实现前述图7所示的音质评价方法的步骤。例如，该计算机存储介质为计算机可读存储介质。
[0110]
在一个实施例中，所述计算机程序指令在被计算机或处理器运行时使计算机或处理器执行以下步骤：获取待测均衡器参数调整后的待评价音乐；将所述待评价音乐输入预先训练好的神经网络；获取所述神经网络输出的对所述待评价音乐的在所述待测均衡器参数的音质的评价结果。
[0111]
计算机存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(rom)、可擦除可编程只读存储器(eprom)、便携式紧致盘只读存储器(cd-rom)、usb存储器、或者上述存储介质的任意组合。计算机可读存储介质可以是一个
或多个计算机可读存储介质的任意组合。
[0112]
另外，本发明实施例还提供了一种计算机程序产品，其包含指令，当该指令被计算机所执行时，使得计算机执行上述图7所示的音质评价方法的步骤。
[0113]
在一个实施例中，当该指令被计算机所执行时，使得计算机执行：获取待测均衡器参数调整后的待评价音乐；将所述待评价音乐输入预先训练好的神经网络；获取所述神经网络输出的对所述待评价音乐的在所述待测均衡器参数的音质的评价结果。
[0114]
由此可见，现有技术中客观评价方法使用仪器测试技术指标，例如可以测试器材(如耳机)的频响曲线，忽略了人的主观感受，测试结果不准确。主观评价方法组织专家团队，并由专家团队进行打分，不能进行大规模使用，投入代价太大。本发明实施例在进行训练集构建的过程中，兼顾了客观与主观的方法，并使用深度学习技术进行训练，得到了可靠的用于评价音质的神经网络，并且该神经网络得到的音质评价不仅成本低，无需组织大量的专家团队人力，而且结果准确可靠。
[0115]
尽管这里已经参考附图描述了示例实施例，应理解上述示例实施例仅仅是示例性的，并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改，而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。
[0116]
本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。
[0117]
在本技术所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个设备，或一些特征可以忽略，或不执行。
[0118]
在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。
[0119]
类似地，应当理解，为了精简本发明并帮助理解各个发明方面中的一个或多个，在对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该本发明的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如相应的权利要求书所反映的那样，其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。
[0120]
本领域的技术人员可以理解，除了特征之间相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0121]
此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0122]
本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(digital signal processing，dsp)来实现根据本发明实施例的装置中的一些模块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。
[0123]
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
[0124]
以上所述，仅为本发明的具体实施方式或对具体实施方式的说明，本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种带有伸缩折叠功能的儿童敲击乐器的制作方法

音质评价方法、装置及计算机存储介质与流程

相关文献

最热文献