音频质量评估方法及其装置、设备、介质、产品与流程

2021-12-17 19:51:00 来源：中国专利 TAG：

1.本技术涉及音频处理技术领域，尤其涉及一种音频质量评估方法及其相应的装置、计算机设备、计算机可读存储介质，以及计算机程序产品。

背景技术：

2.伴随互联网在线音乐服务的发展，歌曲作品越来越丰富，然而质量却参差不齐。随着人们对歌曲作品的音质要求越来越高，以及出于维护曲库实现去伪存真的需要，对构造曲库或者创作音乐作品所需的音质进行检测也就变得更为必要。
3.现有技术中，对歌曲之类的音乐作品实施质量评估的方法，多依赖于音乐作品的音频数据的功率谱密度数据进行分析，功率谱密度是表征信号的功率能量与频率的关系的物理量，通过对功率谱密度数据进行频域分析来评估音频数据的音质信息，从而判定音乐作品的音质。
4.现有技术仅在频域对音乐作品的音质进行分析，忽略了音频数据在时域上的表现，常导致无法有效分析出音质较差的音频数据，影响评估效果，也影响相关业务的正常进行，例如一些音乐辅助创作领域需要调用高音质背景音乐相对应的音频数据时，为其推荐的音频数据却是劣质的，这种情况下便会影响辅助创作效率，降低用户体验。

技术实现要素：

5.本技术的首要目的在于解决上述问题至少之一而提供一种音频质量评估方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品，以有助辅助音乐创作。
6.为满足本技术的各个目的，本技术采用如下技术方案：
7.适应本技术的目的之一而提供的一种音频质量评估方法，包括如下步骤：
8.获取音频数据，所述音频数据以预定采样位数采样而成；
9.根据所述音频数据的功率谱密度确定该音频数据的截止频率；
10.根据所述音频数据中所述预定采样位数的低位部分相对应的低位数据在该音频数据的时域上的数据分布特征确定该音频数据的采样精度等级；
11.根据预设评估规则确定所述音频数据的评价信息，所述评估规则被配置为根据所述采样精度等级及所述截止频率确定所述评价信息。
12.深化的实施例中，获取音频数据，所述音频数据以预定采样位数采样而成，包括如下步骤：
13.获取用户提交的本地无损音频文件或用户指定的曲库中的无损音频文件；
14.以预定采样位数将所述无损音频文件转换为脉冲编码调制格式的音频数据。
15.深化的实施例中，根据所述音频数据的功率谱密度确定该音频数据的截止频率，包括如下步骤：
16.根据所述音频数据转换出语谱图相对应的元数据；
17.将所述元数据转换为第一功率谱密度数据，根据第一功率谱密度数据确定第一候
选截止频率；
18.将所述元数据二值化后转换为第二功率谱密度数据，根据第二功率谱密度数据确定第二候选截止频率；
19.选取第一候选截止频率与第二候选截止频率中最小者作为所述的截止频率。
20.具体化的实施例中，将所述元数据转换为第一功率谱密度数据，根据第一功率谱密度数据确定第一候选截止频率，包括如下步骤：
21.根据所述元数据确定第一功率谱密度数据相对应的第一频率序列，第一频率序列包括多个频率相对应的功率总值，所述功率总值为与其相对应的频率沿音频数据时域上分布的多个功率值之和；
22.根据第一频率序列中的各个功率总值拟合成的平滑曲线数据确定出曲线斜率变化最大时所对应的频率为第一候选截止频率。
23.具体化的实施例中，将所述元数据二值化后转换为第二功率谱密度数据，根据第二功率谱密度数据确定第二候选截止频率，包括如下步骤：
24.对所述元数据进行二值化转换，获得二值化数据序列；
25.根据所述二值化数据序列确定第二功率谱密度数据相对应的第二频率序列，第二频率序列包括多个频率相对应的二值化累加值，所述二值化累加值为与其对应的频率沿音频数据时域上分布的多个二值化数据的累加和；
26.根据第二频率序列中的各个二值化累加值拟合成的平滑曲线数据确定出曲线斜率变化最大时所对应的频率为第二候选截止频率。
27.深化的实施例中，根据所述音频数据中所述预定采样位数的低位部分相对应的低位数据在该音频数据的时域上的数据分布特征确定该音频数据的采样精度等级，包括如下步骤：
28.将所述音频数据转换为绝对值形式；
29.获取所述音频数据中的低位部分相对应的低位数据，将所有低位数据聚类为多个分类相对应的数值标签，所述低位部分的位长为预设定值；
30.统计所述数值标签在所述音频数据中出现的频度，构成频度数据序列；
31.识别出所述频度数据序列的数据分布特征，根据所述数据分布特征判定出相应的采样精度等级。
32.具体化的实施例中，识别出所述频度数据序列的数据分布特征，根据所述数据分布特征判定出相应的采样精度等级的步骤中，包括：
33.当所述数据分布特征显示为全零数据的特征时/为沿序列递减的特征时/为沿序列递增的特征时/为序列中呈奇偶数频率高低交替的特征时，判断所述音频数据的采样精度等级为低于所述预定采样位数的等级。
34.较佳的实施例中，所述低位部分的预设定值为低8位。
35.深化的实施例中，根据预设评估规则确定所述音频数据的评价信息，所述评估规则被配置为根据所述采样精度等级及所述截止频率确定所述评价信息，包括如下步骤：
36.确定所述采样精度等级下所述截止频率相邻的两个采样频率相对应的基准评分；
37.应用评估规则，以其中较低采样频率相对应的基准评分为起始分值累加两个基准评分之间的归一化差值确定量化评分，作为所述的评价信息；
38.输出所述评价信息。
39.适应本技术的目的之一而提供的一种音频质量评估装置，包括：数据获取模块、频域分析模块、时域分析模块，以及综合评估模块，所述数据获取模块，用于获取音频数据，所述音频数据以预定采样位数采样而成；所述频域分析模块，用于根据所述音频数据的功率谱密度确定该音频数据的截止频率；所述时域分析模块，用于根据所述音频数据中所述预定采样位数的低位部分相对应的低位数据在该音频数据的时域上的数据分布特征确定该音频数据的采样精度等级；所述综合评估模块，用于根据预设评估规则确定所述音频数据的评价信息，所述评估规则被配置为根据所述采样精度等级及所述截止频率确定所述评价信息。
40.深化的实施例中，所述数据获取模块包括：文件获取子模块，用于获取用户提交的本地无损音频文件或用户指定的曲库中的无损音频文件；采样转换子模块，用于以预定采样位数将所述无损音频文件转换为脉冲编码调制格式的音频数据。
41.深化的实施例中，所述频域分析模块包括：频域转换子模块，用于根据所述音频数据转换出语谱图相对应的元数据；第一频率子模块，用于将所述元数据转换为第一功率谱密度数据，根据第一功率谱密度数据确定第一候选截止频率；第二频率子模块，用于将所述元数据二值化后转换为第二功率谱密度数据，根据第二功率谱密度数据确定第二候选截止频率；频率优选子模块，用于选取第一候选截止频率与第二候选截止频率中最小者作为所述的截止频率。
42.具体化的实施例中，所述第一频率子模块包括：功率向量单元，用于根据所述元数据确定第一功率谱密度数据相对应的第一频率序列，第一频率序列包括多个频率相对应的功率总值，所述功率总值为与其相对应的频率沿音频数据时域上分布的多个功率值之和；功率计算单元，用于根据第一频率序列中的各个功率总值拟合成的平滑曲线数据确定出曲线斜率变化最大时所对应的频率为第一候选截止频率。
43.具体化的实施例中，所述第二频率子模块包括：二值转换单元，用于对所述元数据进行二值化转换，获得二值化数据序列；二值向量单元，用于根据所述二值化数据序列确定第二功率谱密度数据相对应的第二频率序列，第二频率序列包括多个频率相对应的二值化累加值，所述二值化累加值为与其对应的频率沿音频数据时域上分布的多个二值化数据的累加和；二值计算单元，用于根据第二频率序列中的各个二值化累加值拟合成的平滑曲线数据确定出曲线斜率变化最大时所对应的频率为第二候选截止频率。
44.深化的实施例中，所述时域分析模块包括：坐标转换子模块，用于将所述音频数据转换为绝对值形式；低位提取子模块，用于获取所述音频数据中的低位部分相对应的低位数据，将所有低位数据聚类为多个分类相对应的数值标签，所述低位部分的位长为预设定值；频度统计子模块，用于统计所述数值标签在所述音频数据中出现的频度，构成频度数据序列；精度判定子模块，用于识别出所述频度数据序列的数据分布特征，根据所述数据分布特征判定出相应的采样精度等级。
45.具体化的实施例中，所述精度判定子模块被配置为以如下任意一种调整采样精度等级：当所述数据分布特征显示为全零数据的特征时/为沿序列递减的特征时/为沿序列递增的特征时/为序列中呈奇偶数频率高低交替的特征时，判断所述音频数据的采样精度等级为低于所述预定采样位数的等级。
46.较佳的实施例中，所述低位部分的预设定值为低8位。
47.深化的实施例中，所述综合评估模块包括：基准检索子模块，用于确定所述采样精度等级下所述截止频率相邻的两个采样频率相对应的基准评分；评估量化子模块，用于应用评估规则，以其中较低采样频率相对应的基准评分为起始分值累加两个基准评分之间的归一化差值确定量化评分，作为所述的评价信息；信息输出子模块，用于输出所述评价信息。
48.适应本技术的目的之一而提供的一种计算机设备，包括中央处理器和存储器，所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本技术所述的音频质量评估方法的步骤。
49.适应本技术的另一目的而提供的一种计算机可读存储介质，其以计算机可读指令的形式存储有依据所述的音频质量评估方法所实现的计算机程序，该计算机程序被计算机调用运行时，执行该方法所包括的步骤。
50.适应本技术的另一目的而提供的一种计算机程序产品，包括计算机程序/指令，该计算机程序/指令被处理器执行时实现本技术任意一种实施例中所述音频质量评估方法的步骤。
51.相对于现有技术，本技术的优势如下：
52.首先，本技术一方面利用功率谱密度数据实现对音频数据的频域分析，确定出音频数据的截止频率，另一方面利用音频数据的采样位数中的低位部分相对应的低位数据实现对音频数据的时域分析，确定出音频数据实际的采样精度等级，最后根据预设评估规则实现根据截止频率及采样精度等级确定评价信息，全面考虑了音频数据在频域和时域两个维度的质量因素，能够为音频数据的音质评估提供更为精准的评价信息，能提升音频数据的音质评估结果的可信度。
53.其次，本技术适用预设评估规则，根据频域分析获得的截止频率与时域分析获得的采样精度等级之间的对应关系，将音频数据的音质转换为评价信息，实现对音质评估的归一化表征，方便统一音质评价标准，提升依据评价信息进行音频数据标记、筛选、处理的效率。
54.此外，本技术归一化表征的评价信息更具可读性，容易理解，有助于提升人机交互过程中的用户体验。
附图说明
55.本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：
56.图1为本技术的音频质量评估方法的典型实施例的流程示意图；
57.图2为本技术的实施例为音频数据确定截止频率的具体流程示意图；
58.图3为本技术的实施例计算截止频率过程中所引用的示例性参考图，其中a为根据示例性音频数据制作的语谱图，b为根据该语谱图转换的第一功率谱密度数据所制作的功谱图，c为根据所述第一功率谱密度数据所拟合的平滑曲线计算的斜率所表现的示意图；
59.图4为本技术的实施例基于音频数据的二值化数据确定候选截止频率的流程示意图；
60.图5为本技术的实施例为音频数据确定其采样精度等级的具体流程示意图；
61.图6为本技术的实施例计算采样精度等级过程中所引用的示例性参考图，其中a为示例性音频数据的频谱图；b为将所述频谱图相对应的元数据绝对值化后所表现的频谱图；c为根据音频数据中单个声道的低位数据所构造的频谱图；d为对低位数据所对应的数值标签进行频度统计所表现的直方图；
62.图7为本技术的实施例确定评价信息的具体流程示意图；
63.图8为本技术的实施例中在客户端的图形用户界面进行关于音质评估的人机交互过程中产生的各种通知界面效果，其中a用于指示处于音质鉴别状态，b、c分别用于显示不同评价信息；
64.图9为本技术的音频质量评估装置的典型实施例的原理框图；
65.图10为本技术所采用的一种计算机设备的结构示意图。
具体实施方式
66.下面详细描述本技术的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本技术，而不能解释为对本技术的限制。
67.本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
68.本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)，具有与本技术所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样被特定定义，否则不会用理想化或过于正式的含义来解释。
69.本技术领域技术人员可以理解，这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备，其仅具备无发射能力的无线信号接收器的设备，又包括接收和发射硬件的设备，其具有能够在双向通信链路上，进行双向通信的接收和发射硬件的设备。这种设备可以包括：蜂窝或其他诸如个人计算机、平板电脑之类的通信设备，其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备；pcs(personal communications service，个人通信系统)，其可以组合语音、数据处理、传真和/或数据通信能力；pda(personal digital assistant，个人数字助理)，其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或gps(global positioning system，全球定位系统)接收器；常规膝上型和/或掌上型计算机或其他设备，其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的，
或者适合于和/或配置为在本地运行，和/或以分布形式，运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端，例如可以是pda、mid(mobile internet device，移动互联网设备)和/或具有音乐/视频播放功能的移动电话，也可以是智能电视、机顶盒等设备。
70.本技术所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件，本质上是具备个人计算机等效能力的电子设备，为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置，计算机程序存储于其存储器中，中央处理器将存储在外存中的程序调入内存中运行，执行程序中的指令，与输入输出设备交互，借此完成特定的功能。
71.需要指出的是，本技术所称的“服务器”这一概念，同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理，所述各服务器应是逻辑上的划分，在物理空间上，这些服务器既可以是互相独立但可通过接口调用的，也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通，而不应以此约束本技术的网络部署方式的实施方式。
72.本技术的一个或数个技术特征，除非明文指定，既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问，也可直接部署并运行于客户端来实施访问。
73.本技术中所引用或可能引用到的神经网络模型，除非明文指定，既可部署于远程服务器且在客户端实施远程调用，也可部署于设备能力胜任的客户端直接调用。本领域技术人员应当理解，只要设备运行资源适格，均可用作所述神经网络模型相应的模型训练设备和模型运行设备。某些实施例中，当其运行于客户端时，其相应的智能可通过迁移学习来获得，以便降低对客户端硬件运行资源的要求，避免过度占用客户端硬件运行资源。
74.本技术所涉及的各种数据，除非明文指定，既可远程存储于服务器，也可存储于本地终端设备，只要其适于被本技术的技术方案所调用即可。
75.本领域技术人员对此应当知晓：本技术的各种方法，虽然基于相同的概念而进行描述而使其彼此间呈现共通性，但是，除非特别说明，否则这些方法都是可以独立执行的。同理，对于本技术所揭示的各个实施例而言，均基于同一发明构思而提出，因此，对于相同表述的概念，以及尽管概念表述不同但仅是为了方便而适当变换的概念，应被等同理解。
76.本技术即将揭示的各个实施例，除非明文指出彼此之间的相互排斥关系，否则，各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例，只要这种结合不背离本技术的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通，本领域技术人员应当知晓。
77.本技术的一种音频质量评估方法，可被编程为计算机程序产品，部署于终端设备和/或服务器中运行而实现，藉此，客户端可以网页程序或应用程序的形式访问该计算机程序产品运行后开放的用户界面，实现人机交互。
78.请参阅图1，在其典型实施例中，该方法包括如下步骤：
79.步骤s1100、获取音频数据，所述音频数据以预定采样位数采样而成：
80.待检测音质的音频数据，既可以是用户创作完成的音频数据，也可以是预存储的音频数据。所述音频数据既可以是客户端设备本地存储的数据，也可以属于远程服务器所
存储的曲库中的数据。本技术的示例化应用场景中，所述音频数据存储歌曲、乐曲相对应的音乐数据，既可以是单纯的伴奏数据，也可以是携带人声演唱部分的歌曲数据；既可以是纯乐器演奏的数据，也可以是多声道混响数据。
81.所述音频数据原始格式一般为无损音频文件，通常被存储为音乐文件。为方便本技术实施数字化处理，所述音频数据被转换为pcm格式，即脉冲编码调制格式，在转换pcm格式时，根据一个预设的采样精度等级相对应的采样位数对原始音频数据进行采样而获得pcm格式的音频数据。所述采样精度等级，不同的采样精度等级指示以不同的采样精度进行采样所得的品质，对应按照不同位数的字长表达音频数据的采样精度，常用的采样精度等级为8位、16位、24位、32位等，适应计算机存储原理，基本上以字节即8位字长为基本单位确定相应的采样精度等级。本技术的示例性应用中，预先设定以24位的采样精度对原始音频数据进行采样，将其转换为pcm格式的音频数据，对此本领域技术人员可灵活变通实施。
82.步骤s1200、根据所述音频数据的功率谱密度确定该音频数据的截止频率：
83.功率谱密度(psd，power spectral density)，简称功率谱，是表征信号的功率能量与频率的关系的物理量，经常用来研究随机振动信号，psd通常根据频率分辨率做归一化。功率谱密度被定义为单位频带内的信号功率。它表示了信号功率随着频率的变化关系，即信号功率在频域的分布状况。
84.功率谱密度相对应的数据可以从pcm格式的音频数据的频谱信息中转换而得，频谱信息中提供计算功率谱密度所需的元数据，根据所述元数据可以直接构造出语谱图，所述元数据包括沿音频数据的时域统计的各个频率相对应的功率值，其在转换为语谱图时，可以时域和频域为维度建立二维坐标系，对于同一时刻下不同频率相对应的功率值，可以颜色饱和度或颜色渐变关系来表征不同的功率值。进一步可将所述元数据加工转换为各种数据，包括用于表示功率谱图所需的第一功率谱密度数据以用于表现功率谱图，以及在元数据二值化的基础上转换出第二功率谱密度数据等。理论上，由此转换出的各种数据均能在某种程度上对音频数据的不同频率及其功率值之间的相对关系进行有效表征。至于划分各个频率所占的频宽，可以根据采样频率而定，或者采用其他方式确定，本领域技术人员可灵活确定。
85.根据音频数据的功率谱密度相应的数据所呈现的特征，对应到功率谱图上，各个频率的功率能量分布会在某个频率处存在一个下降特征，使得部分频点的功率能量集中于某个频率以下。下降特征的位置所对应的频率可称为音频数据的截止频率。准确地计算截止频率，可以在音频数据的扩频、削波杂音的消除、语音识别等场景中起到非常重要的作用。
86.因此，根据功率谱密度所蕴含的特点，可以通过考察功率谱密度数据呈现的规律，结合截止频率的特征，应用本领域技术人员熟知的算法，便可确定所述音频数据中相应的截止频率。除此之外，本技术后续实施例即将揭示的算法也可用于根据功率谱密度确定音频数据的截止频率，此处暂且不表。
87.根据对元数据以不同方式转换而成的不同类型的功率谱密度数据来确定出的截止频率未必完全一致，本领域技术人员可以仅采用其中之一来确定所述的截止频率，也可以通过多种方式先确定候选截止频率，再从候选截止频率中择优确定其中之一用做最终确定的截止频率。一般而言，适宜采用频率值较小的候选截止频率作为最终确定的截止频率。
88.本实施例中，本技术所确定的截止频率进行音质评估之用，而音质评估结果本身可做适用于多种应用场景，例如曲库的音频文件的音质评估或对个别音频文件的音质的评测，这种场景中，截止频率均可发挥判断依据的作用。例如，可把44.1khz/16bit定义为音频数据音质的最低标准，结合奈奎斯特理论，44.1khz的音频能达到的最高频率是22.05khz。而实际的音频数据中，大部分可能会在20khz左右。本实施例可将这个20khz作为一个参考阈值，通过检测曲库中参数高于44.1khz/16bit的无损音频文件的截止频率，如果截止频率小于上面给出的阈值，则认为该音频不能达到预期音质标准，从而可以据此相应给定用于确定评价信息的基准评分或者据此优化曲库实现去伪存真之类的目的，总之，一旦确定所述的截止频率，便可将其用于音频数据的音质评估。
89.步骤s1300、根据所述音频数据中所述预定采样位数的低位部分相对应的低位数据在该音频数据的时域上的数据分布特征确定该音频数据的采样精度等级：
90.如前所述，所述音频数据在先被以预定采样位数进行采样转换为pcm格式，以本技术中24bit采样为例，其音频数据是24位字长进行表达，包括三个字节长度。考虑到不同采样精度的转换对应格式的关系，本技术确定其中低位的最后一个字长相对应的低位数据进行采样精度等级的考察和判定。例如，本技术示例性地采用8位单字节长度为单位，截取音频数据相应的数据序列中每个数据的低8位作为低位数据进行考察。当然，所述低位部分的字长，适应采样精度等级的多样化，及考察精度而定，本领域技术人员可以按需灵活调节。
91.结合音频数据数字处理相关的原理可以理解，假定期望原始音频数据是以所述预定采样位数进行采样的，此时其期望采样精度应也是本示例中的24位，这种情况下，如果原始音频数据是以低于所述预定采样位数进行采样的，或者是经过音频编辑软件处理后丢失了采样精度，则必然导致所述低位数据呈现一定的规律信息，这些规律信息反映到低位数据序列上，便呈现出数据分布特征，据此，便可判定所述音频数据是以低于所述期望采样精度的采样精度进行采样的，因此，可将原始音频数据判定为低于24位采样精度等级的更低的采样精度等级，即16位采样精度等级。当然，在未发现相关规律信息时，可判定所述原始音频数据的采样精度等级为期望采样精度等级。
92.变通的实施例中，运用此一原理，确定低位部分的字长为16位，可进一步确定原始音频数据的采样精度等级是否更低。
93.进一步变通的实施例中，可将首次判定时的预定采样位数设定为最高采样精度例如32位字长，然后应用前述的原理，自上而下逐级判定所述原始音频数据的采样精度等级。
94.根据以上原理，可以看出，根据所述音频数据中所述预定采样位数的低位部分相对应的低位数据在该音频数据的时域上的数据分布特征确定该音频数据的采样精度等级时，具体是以所述低位数据与所述音频数据中的全量数据的比对结果来分析确定的，通过在所述全量数据中查寻所述低位数据并发现数据分布特征，可以确定音频数据的音质相对应的采样精度等级。
95.步骤s1400、根据预设评估规则确定所述音频数据的评价信息，所述评估规则被配置为根据所述采样精度等级及所述截止频率确定所述评价信息：
96.为了根据所确定的截止频率及采样精度等级给出原始音频数据相对应的评价信息，可以通过设置一个预设的评估规则来进行评估。所述评估规则可以采用根据截止频率和采样精度等级进行联立判断的方式，或者进行融合判断的方式来确定所述的评价信息。
本领域技术人员知晓利用两个参数进行量化而给出相应的具有量化作用的评价信息的多种已知方式，因此，可由本领域技术人员相应实施之。除此之外，本技术后续即将揭示的实施例中，将给出更具创新特性的实施思路，此处暂且不表。
97.本技术中，所述用于确定音频数据的截止频率的步骤s1200及用于确定音频数据的采样精度等级的步骤s1300可以同步实施，两者互不依赖，本领域技术人员应当知晓此一变通。
98.根据本技术音频质量评估方法的典型实施例的揭示，可以看出，该实施例具备如下优势：
99.首先，本技术一方面利用功率谱密度数据实现对音频数据的频域分析，确定出音频数据的截止频率，另一方面利用音频数据的采样位数中的低位部分相对应的低位数据实现对音频数据的时域分析，确定出音频数据实际的采样精度等级，最后根据预设评估规则实现根据截止频率及采样精度等级确定评价信息，全面考虑了音频数据在频域和时域两个维度的质量因素，能够为音频数据的音质评估提供更为精准的评价信息，能提升音频数据的音质评估结果的可信度。
100.其次，本技术适用预设评估规则，根据频域分析获得的截止频率与时域分析获得的采样精度等级之间的对应关系，将音频数据的音质转换为评价信息，实现对音质评估的归一化表征，方便统一音质评价标准，提升依据评价信息进行音频数据标记、筛选、处理的效率。
101.此外，本技术归一化表征的评价信息更具可读性，容易理解，有助于提升人机交互过程中的用户体验。
102.一种深化的实施例中，所述步骤s1100、获取音频数据，所述音频数据以预定采样位数采样而成，包括如下步骤：
103.步骤s1110、获取用户提交的本地无损音频文件或用户指定的曲库中的无损音频文件：
104.本实施例中，可以由客户端用户指定音频文件，所述音频文件优选为flac格式的无损音频文件。一个变通的实施例中，通过在客户端中提供一个引导界面，允许用户导入其本地文件，来获取相应的无损音频文件。另一变通的实施例中，通过在客户端中提供一个列表界面，列出存储于云端的曲库中的多首歌曲，当用户在其中选定一首歌曲后，对应获取该歌曲相对应的无损音频文件。
105.步骤s1120、以预定采样位数将所述无损音频文件转换为脉冲编码调制格式的音频数据：
106.本实施例中设定预定采样位数为24位，由此也就确定了前文实施例中所述的期望采样精度，以24位为预定采样位数，为因应现实中的普遍音频采样精度而设置的经验性设置，本领域技术人员可灵活变通调节。
107.所述的无损音频文件被以预定的采样位置转码为脉冲编码调制格式，即pcm格式，以便实施本技术的后续处理。
108.本实施例通过在客户端引导用户提交或指定无损音频文件，以便供用户评价其指定的目标音频数据，实质上向用户开放了本技术所实现的音频质量评估接口，使用户可以更为便利地调用本技术所实现的接口用于对其本地或其指定的音频数据进行音质评估，方
便后续做深化的交互例如实现音乐辅助创作，提升用户体验。
109.一种深化的实施例中，如图2所示，所述步骤s1200、根据所述音频数据的功率谱密度确定该音频数据的截止频率，包括如下步骤：
110.步骤s1210、根据所述音频数据转换出语谱图相对应的元数据：
111.从所述音频数据中转换出功率谱密度相对应的元数据，具体而言，可以先根据所述的音频数据，沿时域统计其各个频率相对应的功率能量，即功率值。请参阅图3(a)的语谱图所示，所述元数据是一个沿时域分布的向量序列，向量序列中的向量包括该向量对应的频率及该频率在相应时刻下相对应的功率值。
112.变通的实施例中，为提高计算效率，可以预先对所述音频数据进行预处理，将其转换为0至1之间的浮点数，以方便转换出所述元数据。
113.步骤s1220、将所述元数据转换为第一功率谱密度数据，根据第一功率谱密度数据确定第一候选截止频率：
114.如前所述，所述语谱图相对应的元数据序列，当其被转换为功率谱密度数据时，表现了各个频率相对应的时域上分布的功率值的累加结果，即为功率总值，由此确定的功率谱密度数据为第一功率谱密度数据，对应参考如图3(b)所示的功谱图中，其包含各个频率相对应的功率总值，所述功率总值为其相应的频率沿时域上分布的各个功率值之和。由此，便可从第一功率谱密度数据中确定出呈现功率总值下降特征时相对应的频率，将该频率确定为第一候选截止频率。
115.步骤s1230、将所述元数据二值化后转换为第二功率谱密度数据，根据第二功率谱密度数据确定第二候选截止频率：
116.为了确保截止频率的准确性，在确定所述第一候选截止频率的基础上，进一步将所述元数据序列进行二值化，具体可以借助一个根据经验确定的功率阈值来实现，例如120db，当某个频率相对应的功率值高于该功率阈值时，便用1表示，否则用0表示。按照这一方式处理，便获得一个二值化后的数据序列。
117.适应前一步骤中关于构造所述第一功率谱密度数据的方式，可以将二值化后的数据序列转换为第二功率谱密度数据，其包含各个频率相对应的二值化累加值，所述二值化累加值为其相应的频率沿时域上分布的各个二值化数据之和。由此，便可从第二功率谱密度数据中确定出呈现二值化累加值下降特征时相对应的频率，将该频率确定为第一候选截止频率。
118.步骤s1240、选取第一候选截止频率与第二候选截止频率中最小者作为所述的截止频率：
119.前述根据对元数据的不同形式的转换处理，分别获得第一候选截止频率及第二候选截止频率，两者之间往往会出现偏差，对此，可以将两者进行比较，选取其中频率值最小者，作为所述音频数据最终确定的截止频率。
120.本实施例中，通过采用多种方式对音频数据语谱图相对应的元数据进行不同形式的转换获得不同的功率谱密度数据，在不同功率谱密度数据的基础上计算出多个候选截止频率，然后确定其中最小值作为最终选定的截止频率，此举避免采用单种方式进行截止频率计算导致评估不准的情况，提升了对截止频率评估的准确度。
121.一种具体化的实施例中，所述步骤s1220、将所述元数据转换为第一功率谱密度数
据，根据第一功率谱密度数据确定第一候选截止频率，包括如下步骤：
122.步骤s1221、根据所述元数据确定第一功率谱密度数据相对应的第一频率序列，第一频率序列包括多个频率相对应的功率总值，所述功率总值为与其相对应的频率沿音频数据时域上分布的多个功率值之和:
123.如前所述，可以在所述元数据序列的基础上，按照各个频率，对其分布在时域上的各个功率值进行求和，以确定出各个步骤相对应的功率总值，由此，不同频率与功率总值之间的对应关系便得以确立，可以表示为功率谱图，相对应的获得第一功率谱密度数据，该第一功率谱密度数据为第一频率序列，第一频率序列包括多个频率相对应的功率总值，所述功率总值为与其相对应的频率沿音频数据时域上分布的多个功率值之和，在程序层面，可以采用一个数组来表示所述第一频率序列。
124.步骤s1222、根据第一频率序列中的各个功率总值拟合成的平滑曲线数据确定出曲线斜率变化最大时所对应的频率为第一候选截止频率：
125.可以理解，所述第一频率序列的各个功率总值映射到一个二维坐标系上时，可以得到一个非平滑的曲线，据此，进一步采用拟合技术对该曲线进行拟合，使其形成一个平滑曲线，相应的，所述第一频率序列的各个功率总值也被拟合微调，实际上变成平滑曲线相对应的数据，即平滑曲线数据。
126.在平滑曲线数据的基础上，便可对其求导计算曲线斜率，由斜率构造的图象可参考图3(c)所示，然后确定曲线斜率变化最大处所对应的频率为第一候选截止频率。
127.本实施例进一步通过拟合数据的方式，根据第一功率谱密度数据确定出相应的第一候选截止频率，算法简便易实现，计算效率高，响应快速，有助于提升音质评估效率。
128.一种具体化的实施例中，如图4所示，所述步骤s1230、将所述元数据二值化后转换为第二功率谱密度数据，根据第二功率谱密度数据确定第二候选截止频率，包括如下步骤：
129.步骤s1231、对所述元数据进行二值化转换，获得二值化数据序列：
130.如前所述，可以借助一个根据经验确定的功率阈值来实现，例如120db，当某个频率相对应的功率值高于该功率阈值时，便用1表示，否则用0表示。按照这一方式处理，便获得一个二值化后的数据序列。
131.步骤s1232、根据所述二值化数据序列确定第二功率谱密度数据相对应的第二频率序列，第二频率序列包括多个频率相对应的二值化累加值，所述二值化累加值为与其对应的频率沿音频数据时域上分布的多个二值化数据的累加和：
132.在所述二值化数据序列的基础上，按照各个频率，对其分布在时域上的各个二值化数据进行求和，以确定出各个步骤相对应的二值化累加值，由此，不同频率与二值化累加值之间的对应关系便得以确立，相对应的获得第二功率谱密度数据，该第二功率谱密度数据为第二频率序列，第二频率序列包括多个频率相对应的二值化累加值，所述二值化累加值为与其相对应的频率沿音频数据时域上分布的多个二值化数据之和，在程序层面，可以采用一个数组来表示所述第二频率序列。
133.步骤s1233、根据第二频率序列中的各个二值化累加值拟合成的平滑曲线数据确定出曲线斜率变化最大时所对应的频率为第二候选截止频率：
134.可以理解，所述第二频率序列的各个二值化累加值映射到一个二维坐标系上时，可以得到一个非平滑的曲线，据此，进一步采用拟合技术对该曲线进行拟合，使其形成一个
平滑曲线，相应的，所述第二频率序列的各个二值化累加值也被拟合微调，实际上变成平滑曲线相对应的数据，即平滑曲线数据。
135.在平滑曲线数据的基础上，便可对其求导计算曲线斜率，然后确定曲线斜率变化最大处所对应的频率为第二候选截止频率。
136.本实施例进一步通过拟合数据的方式，根据第二功率谱密度数据确定出相应的第二候选截止频率，算法简便易实现，计算效率高，响应快速，有助于提升音质评估效率。
137.一种深化的实施例中，请参考图5，所述步骤s1300、根据所述音频数据中所述预定采样位数的低位部分相对应的低位数据在该音频数据的时域上的数据分布特征确定该音频数据的采样精度等级，包括如下步骤：
138.步骤s1310、将所述音频数据转换为绝对值形式：
139.原始的音频数据由于pcm格式自身原因，其数据包含正负值形式，如图6(a)所示，表现到二维坐标系中，呈沿参考轴上下波动的图象，为了便于计算，故先对音频数据取绝对值，使所有音频数据所对应的图象均被归一化到以同一参考轴为参考基线，如图6(b)所示。
140.步骤s1320、获取所述音频数据中的低位部分相对应的低位数据，将所有低位数据聚类为多个分类相对应的数值标签，所述低位部分的位长为预设定值：
141.本实施例中，以采用24位采样精度对无损音频文件采样为例，设需要截取的低位数据为低8位部分的数据，据此截取已经绝对值化的所述音频数据中一个声道所对应的全部低8位数据。截取单声道低八位数据获得的一个示例性图象可参考图6(c)所示。如前所述，所要截止的低位部分的长度，通常是一个预设定值，本领域技术人员可灵活调节。因一个字长为8位，方式计算机运算，效率较高，故可优选之。
142.为了方便计算，将所有截取的低位数据全部转换为十进制正整数，鉴于字长为8位，28＝256，因此，所有低位数据将被转换为[0,255]之间的整数n，各个整数均可被视为数值标签，由此最多可获得m个数值标签，m、n均在[0,255]之间取值。在此基础上，对转成正整数后的所有低位数据，便可以通过聚类来确定其相对应的数值标签，这些数值标签可被用来做后续的统计的归类。
[0143]
步骤s1330、统计所述数值标签在所述音频数据中出现的频度，构成频度数据序列：
[0144]
确定所述低位数据所占用的m个所述的数值标签之后，便可根据各个数值标签相对应的数值n，统计该数值n在所述音频数据的所有采样数据(以十进制计算)中出现的频度，从而获得m个统计值，可以利用m个统计值排序构成的频度数据序列来表现出相应的直方图，如图6(d)所示，以便人力考察或加深对本实施例的理解。
[0145]
步骤s1340、识别出所述频度数据序列的数据分布特征，根据所述数据分布特征判定出相应的采样精度等级：
[0146]
进一步，可对频度数据序列所呈现的数据分布特征进行分析，对数据分布特征的分析是通过寻找频度数据序列中隐藏的规律信息来实现的，此一原理对应的实例难以穷举，本领域技术人员可以结合先验知识进行总结，然后将足以确定音频数据质量异常的规律信息表述为数据分布特征，实现为程序代码，利用程序代码运行时的指令在所述频度数据序列中发现所述的规律信息，从而做出采样精度等级的判定。
[0147]
示例而言，结合根据所述频度数据序列所构建的直方图可以理解，如果频度直方
图表现出非常明显的规律，例如频度全为0、直方图中两头高中间低、直方图显示沿频度数据序列的排序方向频度一直递减或一直递增、直方图中出现奇偶数频度高低交替等，此类情况下，结合先验知识，便可认为该音频数据在采样精度上存在缺陷，例如可能是16位采样精度的音频文件转换而来，或者是经过编辑软件处理后丢失了采样精度，因此可判定音频数据的采样精度等级为16位或更低。参考图6(d)的示例，其直方图表现出来的特征就是两头高中间低，且数值标签30至220附近的数据全为0，说明此音频采样精度存在缺陷。
[0148]
对应以上的示例，表现在对所述频度数据序列的数据识别层面，可以对应考虑如下特征：
[0149]
当所述数据分布特征显示为全零数据的特征时，即构成缺陷认定，从而可以降低音频数据的采样数度；
[0150]
当所述数据分布特征显示为沿排序后的频度数据序列递减或递增的特征时，即构成缺陷认定，从而可以降低音频数据的采样数度；
[0151]
当所述数据分布特征显示为沿频度数据序列的排序方向呈奇偶数频率高低交替的特征时，即构成缺陷认定，从而可以降低音频数据的采样数度。
[0152]
以上任意一种情况出现，均可判断所述音频数据的采样精度等级为低于所述预定采样位数的等级，例如本技术示例性以24位对无损音频文件进行采样，若出现以上情况，则可判定所述无损音频文件的实际采样精度等级应为16位或更低。
[0153]
本实施例进一步利用音频数据中的低位数据的数值转换出数值标签，然后在音频数据中查找各个数值标签出现的频度，由此充分考虑了音频数据在时域上的数据分布特征，从中容易发现采样精度相关的缺陷，从而便于重新确定原始音频数据的实际采样精度等级，便于对原始音频数据进行音质标注，以及便于进行相应的后续处理等。不难理解，此算法简单易实施，且计算量少，计算效率高，能够快速地实现采样精度分析。
[0154]
一种深化的实施例中，如图7所示，所述步骤s1400、根据预设评估规则确定所述音频数据的评价信息，所述评估规则被配置为根据所述采样精度等级及所述截止频率确定所述评价信息，包括如下步骤：
[0155]
步骤s1410、确定所述采样精度等级下所述截止频率相邻的两个采样频率相对应的基准评分：
[0156]
本实施例中，为便于量化评价信息，所述的预设评估规则被配置为根据本技术所确定的音频数据相对应的采样精度等级及截止频率来综合确定相应的评价信息。
[0157]
为此，可分别以采样精度等级和采样频率为维度，构建一个二维映射表格，使每个采样精度等级对应各个采样频率均有相应的基准评分，因此，根据本技术所判定的音频数据的实际的采样精度等级，可以查找到其对应于各个采样频率的基准评分，进而，根据本技术所确定的音频数据的截止频率，可以确定与该截止频率相邻的两个采样频率相对应的基准评分。特别的，如果截止频率刚好等于其中一个采样频率，则直接采用其基准评分作为本技术的评价信息即可。可以理解，一般而言，针对同一采样精度等级，采样频率越高，其对应的基准评分也便越高，以表征采样频率越高，音质越佳。同理，针对同一采样频率，采样精度越高，其对应的基准评分也便越高，以表征采样精度越高，音质越佳。可以理解，评价信息通常是基于一个评价标准来实施的，例如将该评价标准规定为0
‑
100分之间取值。
[0158]
步骤s1420、应用评估规则，以其中较低采样频率相对应的基准评分为起始分值累
加两个基准评分之间的归一化差值确定量化评分，作为所述的评价信息：
[0159]
根据所述预设评估规则，所述评估规则具体被配置为利用查找出的所述两个基准评分中相对较低的第一基准评分做为起始分，然后，将截止频率相对于其相邻两个采样频率之间的相对差值归一化为置于所述评价标准所规定的分值范围之内取值，然后以该起始分加计归一化后的差值，便可获得符合所述评价标准所规范的有效量化评分，该量化评分即可作为所述的评价信息。
[0160]
步骤s1430、输出所述评价信息：
[0161]
确定所述量化评分作为评价信息之后，便可将其输出至图形用户界面或者相关数据库中。变通的实施例中，所述的评价信息可以被根据量化评分的分值转换为表征音质等级信息，对此，本领域技术人员可灵活处理。
[0162]
一种变通的实施例中，适应本技术的各个实施例在客户端中实施或者调用的应用场景，可以通过终端设备运行依据本技术实现的计算机程序产品，对用户提交或指定的音频数据进行频域和时域两个维度的分析，并综合分析结果获得所述的评价信息，然后，将该评价信息输出至用户的图形用户界面中显示。
[0163]
如图8(a)所示，用户提交或指定其音频数据之后，其图形用户界面显示第一通知信息，通知用户正在进行音频数据的音质鉴别，期间可允许用户取消鉴别；如图8(b)和图8(c)所示，因应音频数据所获得的评价信息所表示的量化评分或等级的不同，可以对应输出其相对应的界面通知消息。由此可见，用户的音频数据确定后，便可快速获知其指定或提交的歌曲相对应的音频数据的音质评估结果。
[0164]
另一变通的实施例中，适应本技术的各个实施例在服务器实施而在客户端调用的应用场景，用户在客户端的图形用户界面中输入关键词搜索相关歌曲，服务器执行根据所述关键词在曲库中搜索相匹配的歌曲的无损音频文件，然后根据各个歌曲相对应的无损音频文件相对应的音频数据，按照本技术的技术方案对各个音频数据确定相应的评价信息，最后将所述歌曲的命名标识及其无损音频文件的访问地址以及该无损音频文件相对应的评价信息构造为映射关系数据，将搜索到的所有歌曲的映射关系数据构造为搜索结果列表推送到所述客户端，由所述客户端解析该搜索结果列表后，在其图形用户界面输出所述歌曲的命名标识以及其对应的评价信息，使用户一目了然，能够通过歌曲给定的评价信息选取其目标歌曲，从而通过该歌曲相对应的访问地址调用所述无损音频文件进行音乐播放。
[0165]
再一变通的实施例中，适应本技术的各个实施例在服务器实施并被调用运行的应用场景，由实现了本技术的应用程序进程对服务器所维护的曲库中的无损音频文件实施音频数据音质评估，从而确定出各个无损音频文件的质量评价信息，为这些无损音频文件进行打标，构造出打标信息列表，所述打标信息列表可以存储于数据库中，其中的打标信息可以包括所述无损音频文件的id、对该无损音频文件执行本技术的评估方案后获得的截止频率、采样精度等级以及量化评分等。由此，管理用户可以通过对所述打标信息列表进行过滤，来实现按音质对无损音频文件的批量处理，从而提高曲库的维护效率。
[0166]
本实施例通过示例性地给出一个具体的评估方案，实现依据本技术所确定的音频数据的截止频率及采样精度等级来给出音频数据的音质的评价信息，提供了音质评估的量化标准，同时使评价信息可视化，改善人机交互体验，且由于这一评价信息综合了截止频率和采样精度等级两个数据，更具科学性，能够更精准有效地评价音频数据的音质。
[0167]
本实施例也进一步揭示了本技术的技术方案的多种应用场景，可以看出，作为一种基础技术，本技术的各个技术方案具有非常广阔的应用场景。
[0168]
请参阅图9，本技术提供的一种音频质量评估装置，适应本技术的音频质量评估方法进行功能化部署，包括：数据获取模块1100、频域分析模块1200、时域分析模块1300，以及综合评估模块1400，所述数据获取模块1100，用于获取音频数据，所述音频数据以预定采样位数采样而成；所述频域分析模块1200，用于根据所述音频数据的功率谱密度确定该音频数据的截止频率；所述时域分析模块1300，用于根据所述音频数据中所述预定采样位数的低位部分相对应的低位数据在该音频数据的时域上的数据分布特征确定该音频数据的采样精度等级；所述综合评估模块1400，用于根据预设评估规则确定所述音频数据的评价信息，所述评估规则被配置为根据所述采样精度等级及所述截止频率确定所述评价信息。
[0169]
深化的实施例中，所述数据获取模块1100包括：文件获取子模块，用于获取用户提交的本地无损音频文件或用户指定的曲库中的无损音频文件；采样转换子模块，用于以预定采样位数将所述无损音频文件转换为脉冲编码调制格式的音频数据。
[0170]
深化的实施例中，所述频域分析模块1200包括：频域转换子模块，用于根据所述音频数据转换出语谱图相对应的元数据；第一频率子模块，用于将所述元数据转换为第一功率谱密度数据，根据第一功率谱密度数据确定第一候选截止频率；第二频率子模块，用于将所述元数据二值化后转换为第二功率谱密度数据，根据第二功率谱密度数据确定第二候选截止频率；频率优选子模块，用于选取第一候选截止频率与第二候选截止频率中最小者作为所述的截止频率。
[0171]
具体化的实施例中，所述第一频率子模块包括：功率向量单元，用于根据所述元数据确定第一功率谱密度数据相对应的第一频率序列，第一频率序列包括多个频率相对应的功率总值，所述功率总值为与其相对应的频率沿音频数据时域上分布的多个功率值之和；功率计算单元，用于根据第一频率序列中的各个功率总值拟合成的平滑曲线数据确定出曲线斜率变化最大时所对应的频率为第一候选截止频率。
[0172]
具体化的实施例中，所述第二频率子模块包括：二值转换单元，用于对所述元数据进行二值化转换，获得二值化数据序列；二值向量单元，用于根据所述二值化数据序列确定第二功率谱密度数据相对应的第二频率序列，第二频率序列包括多个频率相对应的二值化累加值，所述二值化累加值为与其对应的频率沿音频数据时域上分布的多个二值化数据的累加和；二值计算单元，用于根据第二频率序列中的各个二值化累加值拟合成的平滑曲线数据确定出曲线斜率变化最大时所对应的频率为第二候选截止频率。
[0173]
深化的实施例中，所述时域分析模块1300包括：坐标转换子模块，用于将所述音频数据转换为绝对值形式；低位提取子模块，用于获取所述音频数据中的低位部分相对应的低位数据，将所有低位数据聚类为多个分类相对应的数值标签，所述低位部分的位长为预设定值；频度统计子模块，用于统计所述数值标签在所述音频数据中出现的频度，构成频度数据序列；精度判定子模块，用于识别出所述频度数据序列的数据分布特征，根据所述数据分布特征判定出相应的采样精度等级。
[0174]
具体化的实施例中，所述精度判定子模块被配置为以如下任意一种调整采样精度等级：当所述数据分布特征显示为全零数据的特征时/为沿序列递减的特征时/为沿序列递增的特征时/为序列中呈奇偶数频率高低交替的特征时，判断所述音频数据的采样精度等
级为低于所述预定采样位数的等级。
[0175]
较佳的实施例中，所述低位部分的预设定值为低8位。
[0176]
深化的实施例中，所述综合评估模块1400包括：基准检索子模块，用于确定所述采样精度等级下所述截止频率相邻的两个采样频率相对应的基准评分；评估量化子模块，用于应用评估规则，以其中较低采样频率相对应的基准评分为起始分值累加两个基准评分之间的归一化差值确定量化评分，作为所述的评价信息；信息输出子模块，用于输出所述评价信息。
[0177]
为解决上述技术问题，本技术实施例还提供计算机设备。如图10所示，计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中，该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令，数据库中可存储有控件信息序列，该计算机可读指令被处理器执行时，可使得处理器实现一种音频质量评估方法。该计算机设备的处理器用于提供计算和控制能力，支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令，该计算机可读指令被处理器执行时，可使得处理器执行本技术的音频质量评估方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解，图10中示出的结构，仅仅是与本技术方案相关的部分结构的框图，并不构成对本技术方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
[0178]
本实施方式中处理器用于执行图9中的各个模块及其子模块的具体功能，存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本技术的音频质量评估装置中执行所有模块/子模块所需的程序代码及数据，服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
[0179]
本技术还提供一种存储有计算机可读指令的存储介质，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行本技术任一实施例的音频质量评估方法的步骤。
[0180]
本技术还提供一种计算机程序产品，包括计算机程序/指令，该计算机程序/指令被一个或多个处理器执行时实现本技术任一实施例所述音频质量评估方法的步骤。
[0181]
本领域普通技术人员可以理解实现本技术上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(read
‑
only memory，rom)等计算机可读存储介质，或随机存储记忆体(random access memory，ram)等。
[0182]
综上所述，本技术从时域和频域上实现对音频数据的音质分析评估，综合时域和频域的分析结果确定出音质相对应的评价信息，使音质评估更准确高效。
[0183]
本技术领域技术人员可以理解，本技术中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地，具有本技术中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地，现有技术中的具有与本技术中公开的各种操作、方法、流程中的步骤、措施、方案
也可以被交替、更改、重排、分解、组合或删除。
[0184]
以上所述仅是本技术的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本技术原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本技术的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

音频质量评估方法及其装置、设备、介质、产品与流程

相关文献

最热文献