一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

模型训练方法、多维评分方法、介质及装置与流程

2022-06-18 05:15:16 来源:中国专利 TAG:


1.本公开的实施方式涉及计算机技术领域,更具体地,本公开的实施方式涉及模型训练方法、多维评分方法、介质及装置。


背景技术:

2.本部分旨在为本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
3.随着科技的不断发展,用户已经可以通过应用程序实现多种功能,例如线上k歌娱乐活动,随之衍生出用户对相应的音频作品进行评分的需求。
4.相关技术中,现有在对用户的音频作品进行评分时,通常基于音频作品中干声域属性数据来评分,例如基于音准数据、音域数据等来评分,如判断音准数据是否达到设定音准,音域数据覆盖范围是否达到设定范围等。
5.然而,上述评分方法考虑的评分因素较少,导致评分结果专业性较差,难以对音频作品做出全面和科学的区分。


技术实现要素:

6.本公开提供一种模型训练方法、多维评分方法、介质及装置,以实现对音频作品的多维评分。
7.在本公开实施方式的第一方面中,提供了一种模型训练方法,包括:确定训练数据,该训练数据包括多个音频作品的多维特征属性数据,该多维特征属性数据包括评分域属性数据、干声域属性数据和伴奏域属性数据;根据上述训练数据,进行模型训练,获得训练好的目标模型,该目标模型用于对音频作品进行多维评分。
8.在本公开的一个实施例中,在根据训练数据,进行模型训练,获得训练好的目标模型之前,还包括:根据多维特征属性数据,以及多个音频作品的时长和生成方式,按照预设清洗规则,对多个音频作品进行数据清洗;确定训练数据,包括:根据数据清洗后获得的音频作品,确定训练数据,训练数据包括数据清洗后获得的音频作品的所述多维特征属性数据。
9.在本公开的一个实施例中,根据训练数据,进行模型训练,包括:对数据清洗后获得的音频作品的所述多维特征属性数据,进行特征量化和规范化处理,特征量化用于将非数值型属性数据转化为数值型属性数据,规范化用于对数据进行无量纲化处理,并将不同量纲的数据转换到同一量纲;根据特征量化和规范化处理后获得的音频作品的多维特征属性数据,进行模型训练。
10.在本公开的一个实施例中,音频作品是用户与音视频应用程序进行交互后生成的;预设清洗规则包括清洗无干声的音频作品、清洗评分低于预设评分阈值的音频作品、清洗不是用户与音视频应用程序进行交互后生成的音频作品,以及清洗时长低于预设时长阈值的音频作品。
11.在本公开的一个实施例中,根据训练数据,进行模型训练,获得训练好的目标模型,包括:基于评分域属性数据,进行模型训练,获得第一评分模型;根据干声域属性数据和第一评分模型,进行模型训练,获得第二评分模型,并根据伴奏域属性数据和第一评分模型,进行模型训练,获得第三评分模型;基于第二评分模型和第三评分模型,确定目标模型。
12.在本公开的一个实施例中,基于评分域属性数据,进行模型训练,获得第一评分模型,包括:获取预设的所述多个音频作品的作品评分变量与评分域属性数据的线性关系式,线性关系式中包括待求解评分参数;根据多个音频作品的作品评分变量与评分域属性数据的线性关系式,以及多个音频作品的作品评分的正态分布,进行拟合处理,确定待求解评分参数的值;基于多个音频作品的作品评分变量与评分域属性数据的线性关系式,以及待求解评分参数的值,获得第一评分模型。
13.在本公开的一个实施例中,根据干声域属性数据和第一评分模型,进行模型训练,获得第二评分模型,包括:根据第一评分模型,确定多个音频作品的作品评分,对多个音频作品的作品评分和干声域属性数据,进行主成分分析,获得多个主成分参数;对多个主成分参数进行聚类,获得聚类结果,根据聚类结果,获得第二评分模型。
14.在本公开的一个实施例中,根据伴奏域属性数据和第一评分模型,进行模型训练,获得第三评分模型,包括:获取预设的多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,线性关系式中包括待求解伴奏参数;根据多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,以及第一评分模型,进行拟合处理,确定待求解伴奏参数的值;基于多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,以及待求解伴奏参数的值,获得第三评分模型。
15.在本公开的一个实施例中,基于第二评分模型和第三评分模型,确定目标模型,包括:获得第二评分模型的目标权重系数和第三评分模型的目标权重系数;根据第二评分模型、第二评分模型的目标权重系数、第三评分模型和第三评分模型的目标权重系数,获得目标模型。
16.在本公开的一个实施例中,获得第二评分模型的目标权重系数和第三评分模型的目标权重系数,包括:获取多个第二评分模型的预设权重系数和多个第三评分模型的预设权重系数;根据第二评分模型、第三评分模型、多个第二评分模型的预设权重系数,以及多个第三评分模型的预设权重系数,确定多个目标模型;基于所述训练数据和所述多个目标模型,获得所述多个音频作品的多个多维评分;根据多个多维评分和多个音频作品的参考多维评分,从多个第二评分模型的预设权重系数和多个第三评分模型的预设权重系数中,确定第二评分模型的目标权重系数和第三评分模型的目标权重系数。
17.在本公开实施方式的第二方面中,提供一种多维评分方法,包括:确定目标音频作品的多维特征属性数据,其中,该多维特征属性数据包括评分域属性数据、干声域属性数据和伴奏域属性数据;根据上述多维特征属性数据和目标模型,获得上述目标音频作品的多维评分,其中,上述目标模型是根据如第一方面提供的模型训练方法训练得到的;基于上述目标音频作品,推送上述多维评分。
18.在本公开的一个实施例中,在根据多维特征属性数据和目标模型,获得目标音频作品的多维评分之前,还包括:根据多维特征属性数据,以及目标音频作品的时长和生成方式,按照预设清洗规则,对目标音频作品进行数据清洗;确定目标音频作品的多维特征属性
数据,包括:根据数据清洗后获得的音频作品,确定目标音频作品的多维特征属性数据,目标音频作品的多维特征属性数据包括数据清洗后获得的音频作品的多维特征属性数据。
19.在本公开的一个实施例中,根据所述多维特征属性数据和目标模型,获得目标音频作品的多维评分,包括:对数据清洗后获得的音频作品的多维特征属性数据,进行特征量化和规范化处理,特征量化用于将非数值型属性数据转化为数值型属性数据,规范化用于对数据进行无量纲化处理,并将不同量纲的数据转换到同一量纲;根据特征量化和规范化处理后获得的音频作品的多维特征属性数据和目标模型,获得目标音频作品的多维评分。
20.在本公开的一个实施例中,目标音频作品是用户与音视频应用程序进行交互后生成的;预设清洗规则包括清洗无干声的音频作品、清洗评分低于预设评分阈值的音频作品、清洗不是用户与音视频应用程序进行交互后生成的音频作品,以及清洗时长低于预设时长阈值的音频作品。
21.在本公开的一个实施例中,根据多维特征属性数据和目标模型,获得目标音频作品的多维评分,包括:基于目标音频作品的评分域属性数据和第一评分模型,获得第一评分,其中,第一评分模型基于多个音频作品的评分域属性数据训练得到;根据目标音频作品的干声域属性数据、第一评分和第二评分模型,获得第二评分,并根据目标音频作品的伴奏域属性数据、第一评分和第三评分模型,获得第三评分,其中,第二评分模型基于多个音频作品的干声域属性数据和第一评分模型训练得到,第三评分模型基于多个音频作品的伴奏域属性数据和第一评分模型训练得到;基于第二评分、第三评分和目标模型,确定目标音频作品的多维评分,其中,目标模型根据第二评分模型和第三评分模型确定。
22.在本公开的一个实施例中,基于目标音频作品的评分域属性数据和第一评分模型,获得第一评分,包括:获取预设的多个音频作品的作品评分变量与评分域属性数据的线性关系式,线性关系式中包括待求解评分参数;根据多个音频作品的作品评分变量与评分域属性数据的线性关系式,以及多个音频作品的作品评分的正态分布,进行拟合处理,确定待求解评分参数的值;基于多个音频作品的作品评分变量与评分域属性数据的线性关系式,以及待求解评分参数的值,获得第一评分模型,将目标音频作品的评分域属性数据输入第一评分模型,获得第一评分。
23.在本公开的一个实施例中,根据目标音频作品的干声域属性数据、第一评分和第二评分模型,获得第二评分,包括:根据第一评分模型,确定多个音频作品的作品评分,对多个音频作品的作品评分和干声域属性数据,进行主成分分析,获得多个主成分参数;对多个主成分参数进行聚类,获得聚类结果,根据聚类结果,获得第二评分模型,将目标音频作品的干声域属性数据和第一评分,输入第二评分模型,获得第二评分。
24.在本公开的一个实施例中,根据目标音频作品的伴奏域属性数据、第一评分和第三评分模型,获得第三评分,包括:获取预设的多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,线性关系式中包括待求解伴奏参数;根据多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,以及第一评分模型,进行拟合处理,确定待求解伴奏参数的值;基于多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,以及待求解伴奏参数的值,获得第三评分模型,将目标音频作品的伴奏域属性数据和第一评分,输入第三评分模型,获得第三评分。
25.在本公开的一个实施例中,基于第二评分、第三评分和目标模型,确定目标音频作
品的多维评分,包括:获得第二评分模型的目标权重系数和第三评分模型的目标权重系数;根据第二评分模型、第二评分模型的目标权重系数、第三评分模型和第三评分模型的目标权重系数,获得目标模型,将第二评分和第三评分输入目标模型,获得多维评分。
26.在本公开的一个实施例中,获得第二评分模型的目标权重系数和第三评分模型的目标权重系数,包括:获取多个第二评分模型的预设权重系数和多个第三评分模型的预设权重系数;根据第二评分模型、第三评分模型、多个第二评分模型的预设权重系数,以及多个第三评分模型的预设权重系数,确定多个目标模型;基于多个音频作品的多维特征属性数据和多个目标模型,获得多个音频作品的多个多维评分;根据多个多维评分和多个音频作品的参考多维评分,从多个第二评分模型的预设权重系数和多个第三评分模型的预设权重系数中,确定第二评分模型的目标权重系数和第三评分模型的目标权重系数。
27.在本公开实施方式的第三方面,提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如第一方面提供的模型训练方法,和/或,实现如第二方面提供的多维评分方法。
28.在本公开实施方式的第四方面中,提供了一种模型训练装置,包括:数据确定模块,用于确定训练数据,该训练数据包括多个音频作品的多维特征属性数据,该多维特征属性数据包括评分域属性数据、干声域属性数据和伴奏域属性数据;模型训练模块,用于根据上述训练数据,进行模型训练,获得训练好的目标模型,该目标模型用于对音频作品进行多维评分。
29.在本公开的一个实施例中,数据确定模块,具体用于:根据多维特征属性数据,以及多个音频作品的时长和生成方式,按照预设清洗规则,对多个音频作品进行数据清洗;根据数据清洗后获得的音频作品,确定训练数据,训练数据包括数据清洗后获得的音频作品的多维特征属性数据。
30.在本公开的一个实施例中,模型训练模块,具体用于:对数据清洗后获得的音频作品的所述多维特征属性数据,进行特征量化和规范化处理,特征量化用于将非数值型属性数据转化为数值型属性数据,规范化用于对数据进行无量纲化处理,并将不同量纲的数据转换到同一量纲;根据特征量化和规范化处理后获得的音频作品的多维特征属性数据,进行模型训练。
31.在本公开的一个实施例中,音频作品是用户与音视频应用程序进行交互后生成的;预设清洗规则包括清洗无干声的音频作品、清洗评分低于预设评分阈值的音频作品、清洗不是用户与音视频应用程序进行交互后生成的音频作品,以及清洗时长低于预设时长阈值的音频作品。
32.在本公开的一个实施例中,模型训练模块,具体用于:基于评分域属性数据,进行模型训练,获得第一评分模型;根据干声域属性数据和第一评分模型,进行模型训练,获得第二评分模型,并根据伴奏域属性数据和第一评分模型,进行模型训练,获得第三评分模型;基于第二评分模型和第三评分模型,确定目标模型。
33.在本公开的一个实施例中,模型训练模块,具体用于:获取预设的多个音频作品的作品评分变量与所述评分域属性数据的线性关系式,线性关系式中包括待求解评分参数;根据多个音频作品的作品评分变量与评分域属性数据的线性关系式,以及多个音频作品的作品评分的正态分布,进行拟合处理,确定待求解评分参数的值;基于多个音频作品的作品
评分变量与评分域属性数据的线性关系式,以及待求解评分参数的值,获得第一评分模型。
34.在本公开的一个实施例中,所述模型训练模块,具体用于:根据第一评分模型,确定多个音频作品的作品评分,对多个音频作品的作品评分和干声域属性数据,进行主成分分析,获得多个主成分参数;对多个主成分参数进行聚类,获得聚类结果,根据聚类结果,获得第二评分模型。
35.在本公开的一个实施例中,模型训练模块,具体用于:获取预设的多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,线性关系式中包括待求解伴奏参数;根据多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,以及第一评分模型,进行拟合处理,确定待求解伴奏参数的值;基于多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,以及待求解伴奏参数的值,获得第三评分模型。
36.在本公开的一个实施例中,模型训练模块,具体用于:获得第二评分模型的目标权重系数和第三评分模型的目标权重系数;根据第二评分模型、第二评分模型的目标权重系数、第三评分模型和第三评分模型的目标权重系数,获得目标模型。
37.在本公开的一个实施例中,所述模型训练模块,具体用于:获取多个第二评分模型的预设权重系数和多个第三评分模型的预设权重系数;根据第二评分模型、第三评分模型、多个第二评分模型的预设权重系数,以及多个第三评分模型的预设权重系数,确定多个目标模型;基于训练数据和多个目标模型,获得多个音频作品的多个多维评分;根据多个多维评分和多个音频作品的参考多维评分,从多个第二评分模型的预设权重系数和多个第三评分模型的预设权重系数中,确定第二评分模型的目标权重系数和第三评分模型的目标权重系数。
38.在本公开实施方式的第五方面中,提供了一种多维评分装置,包括:属性确定模块,用于确定目标音频作品的多维特征属性数据,其中,该多维特征属性数据包括评分域属性数据、干声域属性数据和伴奏域属性数据;多维评分模块,用于根据上述多维特征属性数据和目标模型,获得上述目标音频作品的多维评分,其中,上述目标模型是根据如第一方面提供的模型训练方法训练得到的;评分推送模块,用于基于上述目标音频作品,推送上述多维评分。
39.在本公开的一个实施例中,属性确定模块,具体用于:根据多维特征属性数据,以及目标音频作品的时长和生成方式,按照预设清洗规则,对目标音频作品进行数据清洗;根据数据清洗后获得的音频作品,确定目标音频作品多维特征属性数据,目标音频作品的多维特征属性数据包括数据清洗后获得的音频作品的多维特征属性数据。
40.在本公开的一个实施例中,多维评分模块,具体用于:对数据清洗后获得的音频作品的多维特征属性数据,进行特征量化和规范化处理,特征量化用于将非数值型属性数据转化为数值型属性数据,规范化用于对数据进行无量纲化处理,并将不同量纲的数据转换到同一量纲;根据特征量化和规范化处理后获得的音频作品的多维特征属性数据和目标模型,获得目标音频作品的多维评分。
41.在本公开的一个实施例中,目标音频作品是用户与音视频应用程序进行交互后生成的;预设清洗规则包括清洗无干声的音频作品、清洗评分低于预设评分阈值的音频作品、清洗不是用户与音视频应用程序进行交互后生成的音频作品,以及清洗时长低于预设时长阈值的音频作品。
42.在本公开的一个实施例中,多维评分模块,具体用于:基于目标音频作品的评分域属性数据和第一评分模型,获得第一评分,其中,第一评分模型基于多个音频作品的评分域属性数据训练得到;根据目标音频作品的干声域属性数据、第一评分和第二评分模型,获得第二评分,并根据目标音频作品的伴奏域属性数据、第一评分和第三评分模型,获得第三评分,其中,第二评分模型基于多个音频作品的干声域属性数据和第一评分模型训练得到,第三评分模型基于多个音频作品的伴奏域属性数据和第一评分模型训练得到;基于第二评分、第三评分和目标模型,确定目标音频作品的多维评分,其中,目标模型根据第二评分模型和第三评分模型确定。
43.在本公开的一个实施例中,多维评分模块,具体用于:获取预设的多个音频作品的作品评分变量与评分域属性数据的线性关系式,线性关系式中包括待求解评分参数;根据多个音频作品的作品评分变量与评分域属性数据的线性关系式,以及多个音频作品的作品评分的正态分布,进行拟合处理,确定待求解评分参数的值;基于多个音频作品的作品评分变量与评分域属性数据的线性关系式,以及待求解评分参数的值,获得第一评分模型,将目标音频作品的评分域属性数据输入第一评分模型,获得第一评分。
44.在本公开的一个实施例中,多维评分模块,具体用于:根据第一评分模型,确定多个音频作品的作品评分,对多个音频作品的作品评分和干声域属性数据,进行主成分分析,获得多个主成分参数;对多个主成分参数进行聚类,获得聚类结果,根据聚类结果,获得第二评分模型,将目标音频作品的干声域属性数据和第一评分,输入第二评分模型,获得第二评分。
45.在本公开的一个实施例中,多维评分模块,具体用于:获取预设的多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,线性关系式中包括待求解伴奏参数;根据多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,以及第一评分模型,进行拟合处理,确定待求解伴奏参数的值;基于多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,以及待求解伴奏参数的值,获得第三评分模型,将目标音频作品的伴奏域属性数据和第一评分,输入第三评分模型,获得第三评分。
46.在本公开的一个实施例中,多维评分模块,具体用于:获得第二评分模型的目标权重系数和第三评分模型的目标权重系数;根据第二评分模型、第二评分模型的目标权重系数、第三评分模型和第三评分模型的目标权重系数,获得目标模型,将第二评分和第三评分输入目标模型,获得多维评分。
47.在本公开的一个实施例中,多维评分模块,具体用于:获取多个第二评分模型的预设权重系数和多个第三评分模型的预设权重系数;根据第二评分模型、第三评分模型、多个第二评分模型的预设权重系数,以及多个第三评分模型的预设权重系数,确定多个目标模型;基于多个音频作品的多维特征属性数据和多个目标模型,获得多个音频作品的多个多维评分;根据多个多维评分和多个音频作品的参考多维评分,从多个第二评分模型的预设权重系数和多个第三评分模型的预设权重系数中,确定第二评分模型的目标权重系数和第三评分模型的目标权重系数。
48.在本公开实施方式的第六方面中,提供了一种计算设备,包括:至少一个处理器和存储器;存储器存储计算机执行指令;至少一个处理器执行存储器存储的计算机执行指令,使得至少一个处理器执行如第一方面提供的模型训练方法,和/或,使得至少一个处理器执
行如第二方面提供的多维评分方法。
49.在本公开实施方式中,基于训练数据,训练用于对音频作品进行评分的目标模型,其中,上述训练数据包括多个音频作品的多维特征属性数据,该多维特征属性数据包括评分域属性数据、干声域属性数据和伴奏域属性数据,从而,利用模型训练的思想,提供了一种对音频作品进行多维分析的方式,不仅实现对音频作品的多维评分,而且通过对音频作品的多维评分,使得评分结果更具专业性,对音频作品做出全面和科学的区分。
附图说明
50.通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
51.图1示意性地示出了根据本公开实施方式提供的应用场景示意图;
52.图2示意性地示出了根据本公开一实施例提供的模型训练方法的流程示意图;
53.图3示意性地示出了根据本公开另一实施例提供的模型训练方法的流程示意图;
54.图4示意性地示出了根据本公开再一实施例提供的模型训练方法的流程示意图;
55.图5示意性地示出了根据本公开又一实施例提供的模型训练方法的流程示意图;
56.图6示意性地示出了根据本公开一实施例提供的多维评分方法的流程示意图;
57.图7示意性地示出了根据本公开另一实施例提供的多维评分方法的流程示意图;
58.图8示意性地示出了根据本公开再一实施例提供的多维评分方法的流程示意图;
59.图9示意性地示出了根据本公开一实施例提供的存储介质的结构示意图;
60.图10示意性地示出了根据本公开一实施例提供的模型训练装置的结构示意图;
61.图11示意性地示出了根据本公开一实施例提供的多维评分装置的结构示意图;
62.图12示意性地示出了根据本公开一实施例提供的计算设备的结构示意图。
63.在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
64.下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
65.本领域技术人员知道,本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
66.根据本公开的实施方式,提出了一种模型训练方法、多维评分方法、介质及装置。
67.在本文中,需要理解的是,所涉及的术语以及术语的含义如下:
68.(1)伴奏域属性数据:音频作品可分解为伴奏域,干声域和评分域。其中和伴奏相关的特征和属性,统称为伴奏域属性数据。
69.(2)干声域属性数据:音频作品中,以用户k歌作品为例,由用户演唱所产生的声音文件为干声,和干声相关的特征和属性统称为干声域属性数据。
70.(3)评分域属性数据:在一些产品,如音视频应用程序中对音频作品产生的任何具有评价意义的行为,如点赞数、评论数、分享数、关注数和送礼数等,可以转化为评分的特征和属性,统称为评分域属性数据。
71.此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
72.下面参考本公开的若干代表性实施方式,详细阐释本公开的原理和精神。
73.发明概述
74.本发明人发现,随着应用程序功能的不断增加完善,用户已经可以通过应用程序实现多种功能,例如线上k歌娱乐活动,随之衍生出用户对相应的音频作品进行评分的需求。现有在对用户的音频作品进行评分时,通常基于音频作品中干声域属性数据来评分,考虑的评分因素较少,导致评分结果专业性较差,难以评出高低,使得用户音频作品的区分度较小。所以,有必要考虑如何对音频作品进行多维评分。
75.出于对音频作品进行多维评分的想法,本公开的实施方式中,基于包括多个音频作品的多维特征属性数据的训练数据,训练能够对音频作品进行多维评分的目标模型,其中,上述多维特征属性数据包括评分域属性数据、干声域属性数据和伴奏域属性数据,进而,基于上述目标模型,不仅实现了对音频作品的多维评分,使评分结果更具专业性,更是通过对音频作品的多维评分,对音频作品做出全面和科学的区分。
76.在介绍了本公开的基本原理之后,下面具体介绍本公开的各种非限制性实施方式。
77.应用场景总览
78.本公开实施方式适用于的场景包括模型训练场景和/或多维评分场景。
79.首先参考图1,图1示意性地示出了根据本公开实施方式提供的应用场景示意图,该应用场景涉及的设备包括服务器101。
80.应用场景为模型训练场景时:服务器101上存储有预先采集的训练数据且部署有待训练的模型,可在服务器101上基于训练数据训练模型。
81.应用场景为多维评分场景时:服务器101上存储有待进行多维评分的音频作品的相关数据且部署有训练后的模型,可在服务器101上基于音频作品的相关数据和训练后的模型,预测到该音频作品的多维评分。
82.可选的,应用场景涉及的设备还包括终端102,服务器101与终端102可通过网络进行通信。此时,服务器101可为与音视频相关的应用程序的产品服务器,终端102可为部署有该应用程序的客户端。
83.其中,用户可在终端102上打开与音视频相关的应用程序,与该应用程序进行交互,例如,在应用程序上k歌。经用户授权的情况下,终端102可记录用户k歌作品,并将记录的k歌作品发送至服务器101,以用于模型训练和/或用于作品的多维评分。
84.示例性方法
85.下面结合图1的应用场景,参考图2-图8来描述根据本公开示例性实施方式提供的模型训练方法和多维评分方法。需要注意的是,上述应用场景仅是为了便于理解本公开的精神和原理而示出,本公开的实施方式在此方面不受任何限制。相反,本公开的实施方式可以应用于适用的任何场景。
86.需要说明的是,本公开的实施方式可应用于电子设备,电子设备可以为终端或者服务器,即可在终端或者服务器上执行本公开示例性实施方式提供的模型训练方法和/或多维评分方法。
87.其中,终端可以是个人数字处理(personal digital assistant,简称pda)设备、具有无线通信功能的手持设备(例如智能手机、平板电脑)、计算设备(例如个人电脑(personal computer,简称pc))、车载设备、可穿戴设备(例如智能手表、智能手环)、智能家居设备(例如智能显示设备)等。
88.服务器可以是整体式服务器或是跨多计算机或计算机数据中心的分散式服务器。服务器还可以是各种类别的,例如但不限于,网络服务器,应用服务器,或数据库服务器,或代理服务器。
89.可选的,服务器可以包括硬件,软件,或用于执行服务器所支持或实现的合适功能的内嵌逻辑组件或两个或多个此类组件的组合。例如,服务器例如刀片服务器、云端服务器等,或者可以是由多台服务器组成的服务器群组,可以包括上述类别的服务器中的一种或多种等等。
90.需要说明的是,根据本公开示例性实施方式提供的模型训练方法和多维评分方法,可以在同一设备上执行,也可以在不同设备上执行。
91.参考图2,图2示意性地示出了根据本公开一实施例提供的模型训练方法的流程示意图。本实施例的执行主体以图1中的服务器为例,具体执行主体可以根据实际应用场景确定,本公开实施例对此不做特别限制。如图2所示,模型训练方法包括:
92.s201、确定训练数据,该训练数据包括多个音频作品的多维特征属性数据,该多维特征属性数据包括评分域属性数据、干声域属性数据和伴奏域属性数据。
93.这里,上述评分域属性数据可以包括如上述的作品点赞数、评论数、分享数、关注数和礼物数等中的一个或多个。上述干声域属性数据可以包括音准、节奏、气息、情感强度、咬字准确率、音域、颤音数量和滑音数量等中的一个或多个。上述伴奏域属性数据可以包括伴奏难度、伴奏类型、伴奏年代、伴奏热度和伴奏风格等中的一个或多个。
94.其中,上述服务器可以从业务数据库中,获得上述多个音频作品的评分域属性数据。同样,上述服务器可以从伴奏库中,获得上述多个音频作品的伴奏域属性数据;可以从曲库中,获得上述多个音频作品的干声域属性数据。以获得干声域属性数据为例,上述服务器可以从上述曲库中,获取上述多个音频作品对应的标注信息,然后将该标注信息输入预设学习模型,例如神经网络模型,学习得到上述多个音频作品的干声域属性数据。
95.对于上述训练数据,上述服务器可以从历史音频作品中,获取上述多个音频作品作为上述训练数据。这里,上述历史音频作品可以是一段时间内多个用户与音视频应用程序进行交互后生成的音频作品。例如以线上k歌为例,用户在终端(如手机)上打开与k歌相关的应用程序,选择k歌录制模式,从而,上述应用程序在该模式下录制歌曲,生成用户的k歌作品。
96.在历史音频作品中,可记载着历史音频作品的上述多维特征属性数据,还可记载着用户标识和/或音视频应用程序的标识。其中,上述一段时间可以根据实际情况设置,例如距离当前时间的一个月内。
97.s202、根据上述训练数据,进行模型训练,获得训练好的目标模型,该目标模型用
于对音频作品进行多维评分。
98.其中,音频作品的多维评分可以反映为音频作品的多维特征评分,如音频作品的多维评分包括音频作品的评分域评分、干声域评分和伴奏域评分。
99.这里,上述服务器在根据上述训练数据,进行模型训练时,可以先将训练数据中多个音频作品的多维特征属性数据输入目标模型,得到多个音频作品对应的多维预测评分,然后,基于该多维预测评分,以及多个音频作品对应的多维参考评分和损失函数,调整目标模型的模型参数,以获得训练好的目标模型。其中,上述服务器可以根据多个音频作品对应的多维预测评分与多个音频作品对应的多维参考评分之间的差异,确定损失函数的函数值,进而,根据损失函数的函数值,对目标模型的模型参数进行调整,以使调整后获得的损失函数的函数值小于预设阈值,最后获得训练好的目标模型。这里,上述预设阈值可以根据实际情况确定,例如在音频作品对应的多维预测评分与音频作品对应的多维参考评分之间的差异较小时,如小于5分时,确定的损失函数的函数值作为上述预设阈值。另外,上述多个音频作品对应的多维参考评分可以由相关人员基于多个音频作品的多维属性数据,即评分域属性数据、干声域属性数据和伴奏域属性数据进行评分后得到。
100.另外,上述服务器在根据上述训练数据,进行模型训练时,还可以对上述训练数据进行调整,如对上述多个音频作品的多维特征属性数据进行删减或增加等,即对上述多个音频作品的评分域属性数据(如作品点赞数、评论数、分享数、关注数和礼物数等)、干声域属性数据(如音准、节奏、气息、情感强度、咬字准确率、音域、颤音数量和滑音数量等)和伴奏域属性数据(如伴奏难度、伴奏类型、伴奏年代、伴奏热度和伴奏风格等)进行删减或增加等,以获得训练好的目标模型,使得多个音频作品基于上述目标模型获得的多维预测评分与多个音频作品对应的多维参考评分之间的差异较小,如小于5分等,提高目标模型的预测准确度。
101.本实施例中,在训练数据中,上述服务器将多个音频作品的多维特征属性数据作为目标模型的输入数据,然后基于多个音频作品对应的多维参考评分,以及目标模型输出的多个音频作品对应的多维预测评分,对目标模型进行有监督训练,使得目标模型预测的多维评分接近音频作品对应的多维参考评分,提高目标模型的多维评分预测的准确性。
102.本公开实施例中,基于多个音频作品的多维特征属性数据确定训练数据,进而,根据该训练数据,训练目标模型,从而后续可以基于训练好的目标模型实现对音频作品的多维评分,使得音频作品的评分结果更具专业性,对音频作品做出全面和科学的区分。
103.另外,本公开实施例在根据上述训练数据,进行模型训练前,还考虑进行数据清洗、特征量化和/或规范化处理等。其中,上述数据清洗可以清洗掉一些不良数据,以提高后续处理的准确性。上述特征量化可以将非数值型属性数据转化为数值型属性数据,方便后续数据处理。上述规范化可以对数据进行无量纲化处理,并将不同量纲的数据转换到同一量纲,便于不同单位或量级的数据进行比较等。图3为本公开另一实施例提供的模型训练方法的流程示意图,本实施例的执行主体也以图1中的服务器为例。如图3所示,该实施例在进行模型训练时,进行数据清洗、特征量化和规范化处理,该方法包括:
104.s301、根据多维特征属性数据,以及多个音频作品的时长和生成方式,按照预设清洗规则,对多个音频作品进行数据清洗,其中,上述多维特征属性数据包括评分域属性数据、干声域属性数据和伴奏域属性数据。
105.这里,上述多个音频作品可以是用户与音视频应用程序进行交互后生成的。上述预设清洗规则可以根据实际情况设置,例如包括清洗无干声的音频作品、清洗评分低于预设评分阈值的音频作品、清洗不是用户与音视频应用程序进行交互后生成的音频作品,以及清洗时长低于预设时长阈值的音频作品等。其中,上述无干声的音频作品可以为用户与音视频应用程序进行交互过程中没有发声或者发声比例小于预设比例阈值的音频作品。上述不是用户与音视频应用程序进行交互后生成的音频作品可以为用户没有与音视频应用程序进行交互而直接上传的音频作品。
106.本实施例中,上述服务器通过对多个音频作品进行数据清洗,清洗掉无干声的音频作品、评分低的音频作品、没有与音视频应用程序进行交互而直接上传的音频作品,以及时长低的音频作品,从而提高音频作品的质量,进而,提高后续处理的准确率。
107.s302、根据数据清洗后获得的音频作品,确定训练数据,该训练数据包括数据清洗后获得的音频作品的多维特征属性数据。
108.s303、对上述数据清洗后获得的音频作品的多维特征属性数据,进行特征量化和规范化处理。
109.其中,对于部分多维特征属性数据,例如伴奏域的伴奏风格,伴奏类型等为非数值型属性数据,需要转化为数值型属性数据,因此,上述服务器对数据清洗后获得的音频作品的多维特征属性数据,进行特征量化,以将其中非数值型属性数据转化为数值型属性数据,方便后续的数据处理。其中,上述服务器中还可以预设非数值型属性数据转化为数值型属性数据的转化规则,进而,基于该转化规则,对数据清洗后获得的音频作品的多维特征属性数据,进行特征量化。示例性的,上述服务器可以获取多个已经进行转化的非数值型属性数据对应的数值型属性数据,然后根据获取的数据,构建上述非数值型属性数据转化为数值型属性数据的转化规则。
110.另外,对于不同单位和/或不同量纲的数据,为了方便后续数据比较,上述服务器对其进行规范化处理,即进行无量纲化处理,并将不同量纲的数据转换到同一量纲。
111.s304、根据特征量化和规范化处理后获得的音频作品的多维特征属性数据,进行模型训练,获得训练好的目标模型,该目标模型用于对音频作品进行多维评分。
112.本公开实施例中,在进行模型训练前,进行数据清洗,清洗掉一些不良数据,而且还进一步对数据进行特征量化,将非数值型属性数据转化为数值型属性数据,并对数据进行规范化,使不同单位和/或不同量纲的数据能够进行比较,从而使得训练数据能够被目标模型更好地处理,提高目标模型对音频作品进行多维评分的准确性。
113.另外,本公开实施例在根据上述训练数据,进行模型训练时,还考虑基于上述评分域属性数据,进行模型训练,获得第一评分模型,进而,根据上述干声域属性数据和上述第一评分模型,进行模型训练,获得第二评分模型,并根据上述伴奏域属性数据和上述第一评分模型,进行模型训练,获得第三评分模型,最后基于上述第二评分模型和第三评分模型,确定上述目标模型,以实现对音频作品的多维评分。图4为本公开再一实施例提供的模型训练方法的流程示意图,本实施例的执行主体也以图1中的服务器为例。如图4所示,该方法包括:
114.s401、确定训练数据,该训练数据包括多个音频作品的多维特征属性数据,该多维特征属性数据包括评分域属性数据、干声域属性数据和伴奏域属性数据。
115.其中,步骤s401的实现方式参见图2和图3实施例中的相关描述,此处不再赘述。
116.s402、基于上述评分域属性数据,进行模型训练,获得第一评分模型。
117.这里,上述服务器可以获取预设的多个音频作品的作品评分变量与上述评分域属性数据的线性关系式,该线性关系式中包括待求解评分参数,进而,根据上述线性关系和多个音频作品的作品评分的正态分布,进行拟合处理,确定上述待求解评分参数的值,从而,基于上述线性关系式,以及上述待求解评分参数的值,获得上述第一评分模型。
118.其中,假如上述评分域属性数据表示为{x1,x2,

,xm},(m≥2),上述服务器获取的上述线性关系式可以表示为:
119.y1=θ0 θ1x1 θ2x2

θmxm ε
120.这里,y1表示上述多个音频作品的作品评分变量,θ0,θ1,

,θm,以及ε表示待求解评分参数。
121.本实施例中,多个音频作品的作品评分的正态分布为:
[0122][0123]
其中,σ和ν为已知参数。
[0124]
上述服务器将上述评分域属性数据带入上面俩式,进行拟合处理,可求解出待求解评分参数θ0,θ1,

,θm,以及ε,从而获得多个音频作品的作品评分变量与上述评分域属性数据的线性关系,并可以将该线性关系作为上述第一评分模型。
[0125]
s403、根据上述干声域属性数据和上述第一评分模型,进行模型训练,获得第二评分模型,并根据上述伴奏域属性数据和上述第一评分模型,进行模型训练,获得第三评分模型。
[0126]
本实施例中,上述服务器在获得上述第一评分模型后,可以进一步根据上述第一评分模型,确定上述多个音频作品的作品评分,然后,对上述多个音频作品的作品评分和上述干声域属性数据,进行主成分分析,获得多个主成分参数,从而,对该多个主成分参数进行聚类,获得聚类结果,根据该聚类结果,获得第二评分模型。其中,该第二评分模型可以将音频作品划分成若干类,使得作品的评分分布更加均匀,避免大量作品在某个分段聚集。
[0127]
这里,上述服务器通过对上述多个音频作品的作品评分和上述干声域属性数据,进行主成分分析,将高维的特征映射到低维空间中,同时尽可能保留高维的特征的所有关键信息,同时去掉一些高维特征中的噪声以及多重共线性,在保证后续处理正常进行的前提下提高了后续处理速度。
[0128]
其中,上述服务器在进行主成分分析之前,可以对上述多个音频作品的作品评分和上述干声域属性数据进行一些数据处理,例如进行数据标准化处理。如假设有n个作品,m个特征参数,该m个特征参数包括上述多个音频作品的作品评分和上述干声域属性数据,从而,得到原始数据的矩阵为:
[0129]
[0130]
其中,x
ij
为第i个音频作品的第j个数据。
[0131]
上述服务器对上述矩阵中的数据进行一些数据处理,例如进行数据标准化处理,得到:
[0132][0133]
其中,y
ij
表示标准化后第i个音频作品的第j个数据,表示第j个数据的均值,sj表示第j个数据的标准差。
[0134]
进一步计算标准化后数据的相关系数矩阵:
[0135][0136]
然后,求解上述相关系数矩阵的特征值和相应的特征向量:
[0137]
|λi-r|=0
[0138]
再计算累计贡献度,选择含有主要信息的主成分,即完成对上述多个音频作品的作品评分和上述干声域属性数据的主成分分析,获得:
[0139][0140]
假设主成分分析后,上述服务器获得多个主成分参数为:cp1,cp2,

,cpa,获得a个主成分参数。然后,上述服务器可以对上述a个主成分参数进行聚类,例如分析数据,联系业务场景,确定分类数,在每类中随机确定初始的聚类中心,计算各个样本到聚类中心之间的距离(欧式距离),样本归入距聚类中心最近的一类,重新选取每一类的新的聚类中心,根据新的聚类中心重新进行分类,重复上述操作,直到达到指定的迭代次数或者新的聚类中心和上一次的聚类中心相比不再发生改变,即停止聚类。
[0141]
假设第k类的初始聚类中心的评分为sk,对于音频作品的作品评分和干声域属性数据,通过上述主成分分析和聚类,聚集到m类,且欧氏距离为d,从而得到第二评分模型:
[0142]
y2=sk λd
[0143]
其中,λ为欧式距离的权重系数。
[0144]
另外,对于第三评分模型的获得,上述服务器可以先获取预设的上述多个音频作品的作品评分变量与上述伴奏域属性数据的线性关系式,该线性关系式中包括待求解伴奏参数,然后,根据该线性关系式,以及上述第一评分模型,进行拟合处理,确定上述待求解伴奏参数的值,最后,基于上述线性关系式,以及上述待求解伴奏参数的值,获得上述第三评分模型。
[0145]
示例性的,假如上述伴奏域属性数据表示为{z1,z2,

,zm},(m≥2),上述服务器获取的上述线性关系式可以表示为:
[0146]
y3=θ
′0 θ
′1z1 θ
′2z2

θ
′mzm ε

[0147]
其中,y3表示上述多个音频作品的作品评分变量,θ
′0,θ
′1,



mm
,以及ε

表示待
求解伴奏参数。
[0148]
本实施例中,为了给多元线性回归方程找到最优解,以确保模型的预测值最接近实际值,求解下式:
[0149][0150]
上述服务器将上述伴奏域属性数据和第一评分模型作为上述输入,进行拟合处理,可求解出待求解评分参数θ
′0,θ
′1,


′m,以及ε

,从而获得多个音频作品的作品评分变量与上述伴奏域属性数据的线性关系,并可以将该线性关系作为上述第三评分模型。
[0151]
s404、基于上述第二评分模型和第三评分模型,确定目标模型,该目标模型用于对音频作品进行多维评分。
[0152]
这里,上述服务器在获得上述第二评分模型和第三评分模型后,可以进一步获得上述第二评分模型的目标权重系数和上述第三评分模型的目标权重系数,从而,根据上述第二评分模型、第二评分模型的目标权重系数、第三评分模型和第三评分模型的目标权重系数,获得上述目标模型。例如上述目标模型表示为:
[0153]
y=αy2 βy3[0154]
其中,y表示上述目标模型,α表示第二评分模型的目标权重系数,β表示第三评分模型的目标权重系数。
[0155]
其中,上述服务器在获得上述系数α和β时,可以通过获取多个第二评分模型的预设权重系数和多个第三评分模型的预设权重系数,然后,根据上述第二评分模型、第三评分模型、多个第二评分模型的预设权重系数,以及多个第三评分模型的预设权重系数,确定多个目标模型,再基于上述训练数据和多个目标模型,获得多个音频作品的多个多维评分,最后,根据该多个多维评分和上述多个音频作品的参考多维评分,从多个第二评分模型的预设权重系数和多个第三评分模型的预设权重系数中,确定上述第二评分模型的目标权重系数和第三评分模型的目标权重系数。
[0156]
本实施例,考虑如果α过大会导致模型评分缺乏伴奏属性导致专业性不足,如果β过大则会导致模型评分缺失干声属性导致评分严重失真,因此,上述服务器通过测试和调优,考虑模型对训练数据的泛化效果调整模型的相关系数,从而获得泛化能力最好的模型作为目标模型,提高后续基于目标模型对音频作品进行多维评分的准确性。
[0157]
本公开实施例中,基于上述评分域属性数据,进行模型训练,获得第一评分模型,进而,跟据上述干声域属性数据和上述第一评分模型,进行模型训练,获得第二评分模型,并根据上述伴奏域属性数据和上述第一评分模型,进行模型训练,获得第三评分模型,从而,基于上述第二评分模型和第三评分模型,确定上述目标模型,对音频作品进行多维属性的打分,评分专业性更强;而且,本公开实施例通过上述分类打分和拟合打分等,有效的解决了评分区分度的问题,且使得作品评分趋于正态分布,更符合业务场景。
[0158]
另外,如图5所示,本公开又一实施例提供的模型训练方法的流程示意图,执行主体以图1中的服务器为例。上述服务器首先获取多个音频作品的多维特征属性数据,该多维特征属性数据包括评分域属性数据、干声域属性数据和伴奏域属性数据,然后,按照预设清洗规则,对上述多个音频作品进行数据清洗,并根据数据清洗后获得的音频作品,确定训练数据,该训练数据包括数据清洗后获得的音频作品的所述多维特征属性数据,进而,对数据
清洗后获得的音频作品的多维特征属性数据,进行特征量化和规范化处理,从而,根据特征量化和规范化处理后获得的音频作品的多维特征属性数据,进行模型训练。例如上述服务器基于特征量化和规范化处理后获得的音频作品的评分域属性数据,进行模型训练,获得第一评分模型,并根据特征量化和规范化处理后获得的音频作品的干声域属性数据和上述第一评分模型,进行模型训练,获得第二评分模型,根据特征量化和规范化处理后获得的音频作品的伴奏域属性数据和上述第一评分模型,进行模型训练,获得第三评分模型,从而,基于上述第二评分模型和第三评分模型,确定目标模型,该目标模型用于对音频作品进行多维评分。
[0159]
其中,本公开实施例考虑音频作品的多维特征属性,提供一种对音频作品进行多维分析的方式,实现对音频作品的多维评分。而且,本公开实施例在进行模型训练前,进行数据清洗、特征量化和规范化处理,使得训练数据能够被目标模型更好地处理,提高目标模型对音频作品进行多维评分的准确性。另外,本公开实施例通过对音频作品的多维评分,使得评分结果更具专业性,对音频作品做出全面和科学的区分。
[0160]
后续,提供目标模型应用于多维评分的多个实施例。
[0161]
参考图6,图6示意性地示出了根据本公开一实施例提供的多维评分方法的流程示意图,本实施例的执行主体也以图1中的服务器为例。如图6所示,多维评分方法包括:
[0162]
s601、确定目标音频作品的多维特征属性数据,其中,该多维特征属性数据包括评分域属性数据、干声域属性数据和伴奏域属性数据。
[0163]
其中,上述评分域属性数据、干声域属性数据和伴奏域属性数据可参照前述实施例的描述,不再赘述。
[0164]
对于上述目标音频作品,上述服务器可以从历史音频作品中获取。其中,上述历史音频作品可以是一段时间内多个用户与音视频应用程序进行交互后生成的音频作品。在历史音频作品中,可记载着历史音频作品的上述多维特征属性数据,还可记载着用户标识和/或音视频应用程序的标识。
[0165]
可选的,上述服务器可以每隔预设时间段,确定目标音频作品的多维特征属性数据,从而,周期性地对目标音频作品进行多维评分分析,以提高多样评分的准确性。
[0166]
可选的,上述服务器可以在接收到对目标音频作品进行多维评分的请求的情况下,确定目标音频作品的多维特征属性数据,从而,满足对目标音频作品进行多维评分的需求,为用户提供更好的服务体验。
[0167]
s602、根据上述多维特征属性数据和目标模型,获得上述目标音频作品的多维评分。
[0168]
其中,目标模型是根据前述任一实施例提供的模型训练方法训练得到的,具体可参照前述实施例,在此不再赘述。
[0169]
本实施例中,可将上述多维特征属性数据输入至目标模型中,由目标模型基于上述多维特征属性数据对目标音频作品进行多维评分,得到经目标模型预测得到的多维评分,将该多维评分称为目标音频作品的多维评分。
[0170]
其中,目标音频作品的多维评分可以反映为目标音频作品的多维特征评分,如目标音频作品的多维评分包括目标音频作品的评分域评分、干声域评分和伴奏域评分。
[0171]
s603、基于上述目标音频作品,推送上述多维评分。
[0172]
本实施例中,可通过推送提醒消息的方式,展示多样性预测评分,例如基于上述目标音频作品确定目标用户,向目标用户发送“某某用户,经评估分析您音频作品的多维评分为
……”
的提醒消息;和/或,可通过在显示屏幕上显示目标用户的多样性预测评分的方式,向目标用户展示该多维评分。
[0173]
示例性的,上述服务器可将上述目标音频作品的多维评分发送至目标用户的终端上进行展示。另外如果当前执行主体为终端,则终端可在自身的显示屏幕上显示上述目标音频作品的多维评分。
[0174]
可选的,上述服务器可以响应于目标用户的用户中心页面的访问请求,在用户中心页面向目标用户展示上述目标音频作品的多维评分,从而便于用户在个人中心查看到自己音频作品的多维评分,提高多维评分查看的便捷性,为用户提供更好的体验。
[0175]
可选的,上述服务器可以通过预设图案、文字、音频中的一种或多种结合的方式,向目标用户展示上述目标音频作品的多维评分。
[0176]
可选的,上述服务器可以基于多维评分与多维等级的对应关系,确定目标用户目标音频作品的多维评分对应的多维等级,向目标用户展示该多维等级。例如,向目标用户展示目标用户达成了与音频作品多维评分相关的某某成就。
[0177]
本公开实施例中,基于目标音频作品的多维特征属性数据和预先训练好的目标模型,对目标音频作品进行多维评分,并基于目标音频作品,推送上述多维评分,从而,使得音频作品的评分结果更具专业性,有利于评出高低分,提高音频作品的区分度,而且也有利于相关用户更准确地了解自身音频作品的情况。
[0178]
另外,本公开实施例在根据上述多维特征属性数据和目标模型,获得目标音频作品的多维评分前,还考虑进行数据清洗、特征量化和规范化处理,使得目标音频作品能够被目标模型更好地处理,提高目标模型对音频作品进行多维评分的准确性。图7为本公开另一实施例提供的多维评分方法的流程示意图,本实施例的执行主体也以图1中的服务器为例。如图7所示,该方法包括:
[0179]
s701、根据多维特征属性数据,以及目标音频作品的时长和生成方式,按照预设清洗规则,对上述目标音频作品进行数据清洗,其中,该多维特征属性数据包括评分域属性数据、干声域属性数据和伴奏域属性数据。
[0180]
这里,上述目标音频作品可以是用户与音视频应用程序进行交互后生成的。上述预设清洗规则可以根据实际情况设置,例如包括清洗无干声的音频作品、清洗评分低于预设评分阈值的音频作品、清洗不是用户与音视频应用程序进行交互后生成的音频作品,以及清洗时长低于预设时长阈值的音频作品等。
[0181]
本实施例中,上述服务器通过对目标音频作品进行数据清洗,清洗掉无干声的音频作品、评分低的音频作品、没有与音视频应用程序进行交互而直接上传的音频作品,以及时长低的音频作品,从而提高音频作品的质量,进而,提高后续处理的准确率。
[0182]
s702、根据数据清洗后获得的音频作品,确定目标音频作品的多维特征属性数据,目标音频作品的多维特征属性数据包括数据清洗后获得的音频作品的多维特征属性数据。
[0183]
s703、对上述数据清洗后获得的音频作品的多维特征属性数据,进行特征量化和规范化处理。
[0184]
其中,上述特征量化用于将非数值型属性数据转化为数值型属性数据,上述规范
化用于对数据进行无量纲化处理,并将不同量纲的数据转换到同一量纲。
[0185]
本实施例中,考虑到对于部分多维特征属性数据,例如伴奏域的伴奏风格,伴奏类型等为非数值型属性数据,需要转化为数值型属性数据,因此,对数据清洗后获得的音频作品的多维特征属性数据,进行特征量化,以将其中非数值型属性数据转化为数值型属性数据,方便后续的数据处理。其中,上述服务器中还可以预设非数值型属性数据转化为数值型属性数据的转化规则,进而,基于该转化规则,对数据清洗后获得的音频作品的多维特征属性数据,进行特征量化。示例性的,上述服务器可以获取多个已经进行转化的非数值型属性数据对应的数值型属性数据,然后根据获取的数据,构建上述非数值型属性数据转化为数值型属性数据的转化规则。
[0186]
另外,本实施例考虑到对于不同单位和/或不同量纲的数据,后续数据比较不方便,因此进一步对数据进行规范化处理,即进行无量纲化处理,并将不同量纲的数据转换到同一量纲,方便后续数据比较。
[0187]
s704、根据特征量化和规范化处理后获得的音频作品的多维特征属性数据和上述目标模型,获得上述目标音频作品的多维评分。
[0188]
s705、基于上述目标音频作品,推送上述多维评分。
[0189]
本公开实施例中,在根据上述多维特征属性数据和目标模型,获得目标音频作品的多维评分前,进行数据清洗,清洗掉一些不良数据,而且还进一步对数据进行特征量化,将非数值型属性数据转化为数值型属性数据,并对数据进行规范化,使不同单位和/或不同量纲的数据能够进行比较,从而使得目标音频作品能够被目标模型更好地处理,提高目标模型对音频作品进行多维评分的准确性。
[0190]
另外,本公开实施例在根据上述多维特征属性数据和目标模型,获得上述目标音频作品的多维评分时,还考虑基于目标音频作品的评分域属性数据和第一评分模型,获得第一评分,进而,根据目标音频作品的干声域属性数据、第一评分和第二评分模型,获得第二评分,并根据目标音频作品的伴奏域属性数据、第一评分和第三评分模型,获得第三评分,最后基于上述第二评分、第三评分和目标模型,实现对目标音频作品的多维评分。图8为本公开再一实施例提供的多维评分方法的流程示意图,本实施例的执行主体也以图1中的服务器为例。如图8所示,该方法包括:
[0191]
s801、确定目标音频作品的多维特征属性数据,其中,该多维特征属性数据包括评分域属性数据、干声域属性数据和伴奏域属性数据。
[0192]
其中,步骤s801的实现方式参见图6和图7实施例中的相关描述,此处不再赘述。
[0193]
s802、基于上述目标音频作品的评分域属性数据和第一评分模型,获得第一评分,其中,上述第一评分模型基于多个音频作品的评分域属性数据训练得到。
[0194]
这里,上述服务器可以先获取预设的多个音频作品的作品评分变量与评分域属性数据的线性关系式,该线性关系式中包括待求解评分参数,进而,根据该线性关系式,以及上述多个音频作品的作品评分的正态分布,进行拟合处理,确定上述待求解评分参数的值,从而,基于上述线性关系式,以及待求解评分参数的值,获得第一评分模型,将上述目标音频作品的评分域属性数据输入第一评分模型,获得第一评分。
[0195]
s803、根据上述目标音频作品的干声域属性数据、第一评分和第二评分模型,获得第二评分,并根据上述目标音频作品的伴奏域属性数据、第一评分和第三评分模型,获得第
三评分,其中,上述第二评分模型基于多个音频作品的干声域属性数据和第一评分模型训练得到,上述第三评分模型基于多个音频作品的伴奏域属性数据和第一评分模型训练得到。
[0196]
本实施例中,上述服务器可以根据第一评分模型,确定多个音频作品的作品评分,然后,对多个音频作品的作品评分和干声域属性数据,进行主成分分析,获得多个主成分参数,从而,对该多个主成分参数进行聚类,获得聚类结果,根据该聚类结果,获得第二评分模型,将上述目标音频作品的干声域属性数据和第一评分,输入第二评分模型,获得第二评分。
[0197]
另外,上述服务器还可以获取预设的多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,该线性关系式中包括待求解伴奏参数,然后,根据该线性关系式,以及第一评分模型,进行拟合处理,确定待求解伴奏参数的值,从而,基于上述线性关系式,以及待求解伴奏参数的值,获得第三评分模型,将上述目标音频作品的伴奏域属性数据和第一评分,输入第三评分模型,获得第三评分。
[0198]
s804、基于上述第二评分、第三评分和目标模型,确定上述目标音频作品的多维评分,其中,上述目标模型根据第二评分模型和第三评分模型确定。
[0199]
这里,上述服务器可以获得第二评分模型的目标权重系数和第三评分模型的目标权重系数,并根据第二评分模型、第二评分模型的目标权重系数、第三评分模型和第三评分模型的目标权重系数,获得目标模型,将上述第二评分和第三评分输入目标模型,获得多维评分。
[0200]
其中,上述服务器可以通过获取多个第二评分模型的预设权重系数和多个第三评分模型的预设权重系数,然后,根据第二评分模型、第三评分模型、多个第二评分模型的预设权重系数,以及多个第三评分模型的预设权重系数,确定多个目标模型,从而,基于多个音频作品的多维特征属性数据和多个目标模型,获得多个音频作品的多个多维评分,最后,根据多个多维评分和多个音频作品的参考多维评分,从多个第二评分模型的预设权重系数和多个第三评分模型的预设权重系数中,确定第二评分模型的目标权重系数和第三评分模型的目标权重系数。
[0201]
s805、基于上述目标音频作品,推送上述多维评分。
[0202]
本公开实施例中,基于目标音频作品的评分域属性数据和第一评分模型,获得第一评分,进而,根据目标音频作品的干声域属性数据、第一评分和第二评分模型,获得第二评分,并根据目标音频作品的伴奏域属性数据、第一评分和第三评分模型,获得第三评分,最后基于上述第二评分、第三评分和目标模型,对音频作品进行多维属性的打分,评分专业性更强,而且有效的解决了评分区分度的问题。
[0203]
示例性介质
[0204]
在介绍了本公开示例性实施方式的方法之后,接下来,参考图9对本公开示例性实施方式的存储介质进行说明。
[0205]
参考图9所示,存储介质90中存储着根据本公开的实施方式的用于实现上述方法的程序产品,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此。
[0206]
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信
号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0207]
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质。
[0208]
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c 等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备。
[0209]
示例性装置
[0210]
在介绍了本公开示例性实施方式的介质之后,接下来,参考图10-图11对本公开示例性实施方式的模型训练装置、多维评分装置进行说明,其中,模型训练装置用于实现上述任一方法实施例提供的模型训练方法,多维评分装置用于实现上述任一方法实施例提供的多维评分方法,其实现原理和技术效果类似,在此不再赘述。
[0211]
参考图10,图10为本公开一实施例提供的模型训练装置的结构示意图。如图10所示,模型训练装置包括:
[0212]
数据确定模块1001,用于确定训练数据,该训练数据包括多个音频作品的多维特征属性数据,所述多维特征属性数据包括评分域属性数据、干声域属性数据和伴奏域属性数据。
[0213]
模型训练模块1002,用于根据上述训练数据,进行模型训练,获得训练好的目标模型,该目标模型用于对音频作品进行多维评分。
[0214]
在本公开的一个实施例中,数据确定模块1001,具体用于:
[0215]
根据多维特征属性数据,以及多个音频作品的时长和生成方式,按照预设清洗规则,对多个音频作品进行数据清洗;根据数据清洗后获得的音频作品,确定训练数据,训练数据包括所述数据清洗后获得的音频作品的所述多维特征属性数据。
[0216]
在本公开的又一个实施例中,模型训练模块1002,具体用于:
[0217]
对数据清洗后获得的音频作品的多维特征属性数据,进行特征量化和规范化处理,特征量化用于将非数值型属性数据转化为数值型属性数据,规范化用于对数据进行无量纲化处理,并将不同量纲的数据转换到同一量纲;根据特征量化和规范化处理后获得的音频作品的多维特征属性数据,进行模型训练。
[0218]
在本公开的又一个实施例中,音频作品是用户与音视频应用程序进行交互后生成的。预设清洗规则包括清洗无干声的音频作品、清洗评分低于预设评分阈值的音频作品、清洗不是用户与音视频应用程序进行交互后生成的音频作品,以及清洗时长低于预设时长阈值的音频作品。
[0219]
在本公开的又一个实施例中,模型训练模块1002,具体用于:
[0220]
基于评分域属性数据,进行模型训练,获得第一评分模型;根据干声域属性数据和第一评分模型,进行模型训练,获得第二评分模型,并根据伴奏域属性数据和第一评分模型,进行模型训练,获得第三评分模型;基于第二评分模型和第三评分模型,确定目标模型。
[0221]
在本公开的又一个实施例中,模型训练模块1002,具体用于:
[0222]
获取预设的多个音频作品的作品评分变量与评分域属性数据的线性关系式,线性关系式中包括待求解评分参数;根据多个音频作品的作品评分变量与所述评分域属性数据的线性关系式,以及多个音频作品的作品评分的正态分布,进行拟合处理,确定待求解评分参数的值;基于多个音频作品的作品评分变量与所述评分域属性数据的线性关系式,以及待求解评分参数的值,获得第一评分模型。
[0223]
在本公开的又一个实施例中,模型训练模块1002,具体用于:
[0224]
根据第一评分模型,确定多个音频作品的作品评分,对多个音频作品的作品评分和干声域属性数据,进行主成分分析,获得多个主成分参数;对多个主成分参数进行聚类,获得聚类结果,根据聚类结果,获得第二评分模型。
[0225]
在本公开的又一个实施例中,模型训练模块1002,具体用于:
[0226]
获取预设的多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,线性关系式中包括待求解伴奏参数;根据多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,以及第一评分模型,进行拟合处理,确定待求解伴奏参数的值;基于多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,以及待求解伴奏参数的值,获得第三评分模型。
[0227]
在本公开的又一个实施例中,模型训练模块1002,具体用于:
[0228]
获得第二评分模型的目标权重系数和第三评分模型的目标权重系数;根据第二评分模型、第二评分模型的目标权重系数、第三评分模型和第三评分模型的目标权重系数,获得目标模型。
[0229]
在本公开的又一个实施例中,模型训练模块1002,具体用于:
[0230]
获取多个第二评分模型的预设权重系数和多个第三评分模型的预设权重系数;根据第二评分模型、第三评分模型、多个第二评分模型的预设权重系数,以及多个第三评分模型的预设权重系数,确定多个目标模型;基于训练数据和多个目标模型,获得多个音频作品的多个多维评分;根据多个多维评分和多个音频作品的参考多维评分,从多个第二评分模型的预设权重系数和多个第三评分模型的预设权重系数中,确定第二评分模型的目标权重系数和第三评分模型的目标权重系数。
[0231]
参考图11,图11为本公开一实施例提供的多维评分装置的结构示意图。如图11所示,多维评分装置包括:
[0232]
属性确定模块1101,用于确定目标音频作品的多维特征属性数据,其中,该多维特征属性数据包括评分域属性数据、干声域属性数据和伴奏域属性数据。
[0233]
多维评分模块1102,用于根据多维特征属性数据和目标模型,获得目标音频作品的多维评分,其中,目标模型是根据前述任一实施例提供的模型训练方法训练得到的。
[0234]
评分推送模块1103,用于基于目标音频作品,推送多维评分。
[0235]
在本公开的一个实施例中,属性确定模块1101,具体用于:
[0236]
根据多维特征属性数据,以及目标音频作品的时长和生成方式,按照预设清洗规则,对目标音频作品进行数据清洗;根据数据清洗后获得的音频作品,确定目标音频作品的多维特征属性数据,目标音频作品的多维特征属性数据包括数据清洗后获得的音频作品的多维特征属性数据。
[0237]
在本公开的又一个实施例中,多维评分模块1102,具体用于:
[0238]
对数据清洗后获得的音频作品的所述多维特征属性数据,进行特征量化和规范化处理,特征量化用于将非数值型属性数据转化为数值型属性数据,规范化用于对数据进行无量纲化处理,并将不同量纲的数据转换到同一量纲;根据特征量化和规范化处理后获得的音频作品的所述多维特征属性数据和所述目标模型,获得目标音频作品的多维评分。
[0239]
在本公开的又一个实施例中,目标音频作品是用户与音视频应用程序进行交互后生成的。预设清洗规则包括清洗无干声的音频作品、清洗评分低于预设评分阈值的音频作品、清洗不是用户与音视频应用程序进行交互后生成的音频作品,以及清洗时长低于预设时长阈值的音频作品。
[0240]
在本公开的又一个实施例中,多维评分模块1102,具体用于:
[0241]
基于目标音频作品的评分域属性数据和第一评分模型,获得第一评分,其中,第一评分模型基于多个音频作品的评分域属性数据训练得到;根据目标音频作品的干声域属性数据、第一评分和第二评分模型,获得第二评分,并根据目标音频作品的伴奏域属性数据、第一评分和第三评分模型,获得第三评分,其中,第二评分模型基于多个音频作品的干声域属性数据和第一评分模型训练得到,第三评分模型基于多个音频作品的伴奏域属性数据和第一评分模型训练得到;基于第二评分、第三评分和目标模型,确定目标音频作品的多维评分,其中,目标模型根据第二评分模型和第三评分模型确定。
[0242]
在本公开的又一个实施例中,多维评分模块1102,具体用于:
[0243]
获取预设的多个音频作品的作品评分变量与评分域属性数据的线性关系式,线性关系式中包括待求解评分参数;根据多个音频作品的作品评分变量与评分域属性数据的线性关系式,以及多个音频作品的作品评分的正态分布,进行拟合处理,确定待求解评分参数的值;基于多个音频作品的作品评分变量与评分域属性数据的线性关系式,以及待求解评分参数的值,获得第一评分模型,将目标音频作品的评分域属性数据输入第一评分模型,获得第一评分。
[0244]
在本公开的又一个实施例中,多维评分模块1102,具体用于:
[0245]
根据第一评分模型,确定多个音频作品的作品评分,对多个音频作品的作品评分和干声域属性数据,进行主成分分析,获得多个主成分参数;对多个主成分参数进行聚类,获得聚类结果,根据聚类结果,获得第二评分模型,将目标音频作品的干声域属性数据和所述第一评分,输入第二评分模型,获得第二评分。
[0246]
在本公开的又一个实施例中,多维评分模块1102,具体用于:
[0247]
获取预设的多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,线性关系式中包括待求解伴奏参数;根据多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,以及第一评分模型,进行拟合处理,确定待求解伴奏参数的值;基于多个音频作品的作品评分变量与伴奏域属性数据的线性关系式,以及待求解伴奏参数的值,获得第三评分模型,将目标音频作品的伴奏域属性数据和第一评分,输入第三评分模型,获得第三评
分。
[0248]
在本公开的又一个实施例中,多维评分模块1102,具体用于:
[0249]
获得第二评分模型的目标权重系数和第三评分模型的目标权重系数;根据第二评分模型、第二评分模型的目标权重系数、第三评分模型和第三评分模型的目标权重系数,获得目标模型,将第二评分和第三评分输入目标模型,获得多维评分。
[0250]
在本公开的又一个实施例中,多维评分模块1102,具体用于:
[0251]
获取多个第二评分模型的预设权重系数和多个第三评分模型的预设权重系数;根据第二评分模型、第三评分模型、多个第二评分模型的预设权重系数,以及多个第三评分模型的预设权重系数,确定多个目标模型;基于多个音频作品的多维特征属性数据和多个目标模型,获得多个音频作品的多个多维评分;根据多个多维评分和多个音频作品的参考多维评分,从多个第二评分模型的预设权重系数和多个第三评分模型的预设权重系数中,确定第二评分模型的目标权重系数和第三评分模型的目标权重系数。
[0252]
示例性计算设备
[0253]
在介绍了本公开示例性实施方式的方法、介质和装置之后,接下来,参考图12对本公开示例性实施方式的计算设备进行说明。
[0254]
图12显示的计算设备120仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0255]
如图12所示,计算设备120以通用计算设备的形式表现。计算设备120的组件可以包括但不限于:上述至少一个处理单元1201、上述至少一个存储单元1202,连接不同系统组件(包括处理单元1201和存储单元1202)的总线1203。
[0256]
总线1203包括数据总线、控制总线和地址总线。
[0257]
存储单元1202可以包括易失性存储器形式的可读介质,例如随机存取存储器(ram)12021和/或高速缓存存储器12022,可以进一步包括非易失性存储器形式的可读介质,例如只读存储器(rom)12023。
[0258]
存储单元1202还可以包括具有一组(至少一个)程序模块12024的程序/实用工具12025,这样的程序模块12024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0259]
计算设备120也可以与一个或多个外部设备1204(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(i/o)接口1205进行。并且,计算设备120还可以通过网络适配器1206与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图12所示,网络适配器1206通过总线1203与计算设备120的其它模块通信。应当理解,尽管图中未示出,可以结合计算设备120使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0260]
应当注意,尽管在上文详细描述中提及了模型训练装置、多维评分装置的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
[0261]
此外,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
[0262]
虽然已经参考若干具体实施方式描述了本公开的精神和原理,但是应该理解,本公开并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献