一种声纹资质考核方法、装置、设备及存储介质与流程

2022-11-09 22:59:49 来源：中国专利 TAG：

1.本发明涉及声纹资质考核技术领域，尤其涉及一种声纹资质考核方法、装置、设备及存储介质。

背景技术：

2.通常，指纹、虹膜、dna和笔迹等都可以作为识别个体身份的有效凭据，相对于基于这些传统的个体生物特征进行个体身份识别而言，基于声纹特征进行个体身份识别是一个新兴的研究领域。近年来，随着相关技术的深入研究和发展，基于声纹特征的个体身份识别技术越来越受到相关研究人员的重视。随着声纹识别领域的数据积累和研究发展，基于声纹特征进行个体身份识别的准确性越来越高。
3.基于声纹特征的个体身份识别技术指的是，通过声纹特征对比给出两个声纹特征是否同源(即两个声纹特征是否为同一个体的声纹特征)的判断。比如，对从案发现场获得的语音样本(即检材数据)提取声纹特征，通过将该声纹特征与从嫌疑人的语音样本(即样本数据)提取的声纹特征进行对比，来确定两个声纹特征是否同源，若两个声纹特征同源，说明从案发现场获得的语音样本为嫌疑人的语音样本。
4.目前，在国内绝大多数的法庭说话人识别案件中，都希望语音鉴定专家给出“是同一人”或“不是同一人”这样明确的结论。但是，由于受各种主客观条件的限制，如录音的环境及条件，语音证据提取、保存条件与方法，检验鉴定的时间间隔以及检验设备、检验方法的局限等等，罪犯样本和嫌疑人样本之间或多或少都会存在一定程度的差异，这就决定了鉴定人认定同一或否定排除要达到100％的确认几乎是不可能的。这种客观实际催生了众多声纹比对引擎被研发出来。
5.现如今，市面上有众多的声纹比对引擎，但是，这些声纹比对引擎的比对质量良莠不齐，为了能够获知这些声纹比对引擎的比对质量，目前亟需一种能够对声纹比对引擎进行资质鉴定的方法。

技术实现要素：

6.有鉴于此，本发明提供了一种声纹资质考核方法、装置、设备及存储介质，用以对声纹比对引擎进行资质鉴定，其技术方案如下：
7.一种声纹资质考核方法，包括：
8.从若干等级分别对应的样本集中，获取考核等级对应的样本集；其中，所述若干等级分别对应的样本集基于若干样本构建，一等级对应的样本集中包括所述若干样本中属于该等级的样本，属于不同等级的样本的判别难度不同，所述若干样本中的每个样本包括检材数据和样本数据，所述考核等级为所述若干等级中的一个等级；
9.采用所述考核等级对应的样本集中的样本，测试待考核的声纹比对引擎的资质是否达到所述考核等级。
10.可选的，所述若干等级分别对应的样本集的构建过程包括：
11.获取若干样本；
12.确定所述若干样本分别对应的判别难度表征值，其中，所述判别难度表征值能够表征对应样本的判别难度；
13.根据所述若干样本分别对应的判别难度表征值，从所述若干等级中确定所述若干样本分别所属的等级；
14.将属于同一等级的样本组成样本集，得到所述若干等级分别对应的样本集。
15.可选的，所述确定所述若干样本分别对应的判别难度表征值，包括：
16.针对所述若干样本中待确定判别难度表征值的目标样本：
17.基于标准的声纹提取模型，对所述目标样本包括的检材数据和样本数据分别提取声纹特征，得到所述目标样本对应的声纹特征对；
18.计算所述目标样本对应的声纹特征对的相似度，得到所述目标样本对应的声纹特征相似度；
19.根据所述目标样本对应的声纹特征相似度，确定所述目标样本对应的判别难度表征值。
20.可选的，所述根据所述目标样本对应的声纹特征相似度，确定所述目标样本对应的判别难度表征值，包括：
21.基于预设的线性映射关系，将所述目标样本对应的声纹特征相似度映射为能够表征所述目标样本的判别难度的值，作为所述目标样本对应的判别难度表征值。
22.可选的，所述若干个样本包括正样本和负样本，所述正样本包括的检材数据和样本数据来自同一对象，所述负样本包括的检材数据和样本数据来自不同对象；
23.所述基于预设的线性映射关系，将所述目标样本对应的声纹特征相似度映射为能够表征所述目标样本的判别难度的值，包括：
24.若所述目标样本为正样本，则基于针对正样本预设的第一线性映射关系，将所述目标样本的声纹特征相似度映射为能够表征所述目标样本的判别难度的值；
25.若所述目标样本为负样本，则基于针对负样本预设的第二线性映射关系，将所述目标样本的声纹特征相似度映射为能够表征所述目标样本的判别难度的值。
26.可选的，所述若干等级分别对应有判别难度表征值范围；
27.所述根据所述若干样本分别对应的判别难度表征值，从所述若干等级中确定所述若干样本分别所属的等级，包括：
28.针对所述若干个样本中待确定等级的目标样本：
29.从所述若干等级分别对应的判别难度表征值范围中，确定所述目标样本对应的判别难度表征值所在的判别难度表征值范围，作为目标判别难度表征值范围；
30.将所述目标判别难度表征值范围对应的等级，确定为所述目标样本所属的等级。
31.可选的，所述采用所述考核等级对应的样本集中的样本，测试待考核的声纹比对引擎的资质是否达到所述考核等级，包括：
32.从所述考核等级对应的样本集中获取指定数量的样本作为测试样本，以得到指定数量的测试样本；
33.基于所述声纹比对引擎判别每个测试样本包含的检材数据与样本数据是否来自同一对象，得到所述指定数量的测试样本分别对应的判别结果；
34.根据所述指定数量的测试样本分别对应的判别结果以及所述指定数量的测试样本分别对应的样本标签，确定所述声纹比对引擎的判别准确率，其中，所述样本标签用于指示对应的测试样本包含的检材数据和样本数据是否来自同一对象；
35.根据所述声纹比对引擎的判别准确率，确定所述声纹比对引擎的资质是否达到所述考核等级。
36.一种声纹资质考核装置，包括：样本集获取模块和声纹资质考核模块；
37.所述样本集获取模块，用于从若干等级分别对应的样本集中，获取考核等级对应的样本集；其中，所述若干等级分别对应的样本集基于若干样本构建，一等级对应的样本集中包括所述若干样本中属于该等级的样本，属于不同等级的样本的判别难度不同，所述若干样本中的每个样本包括检材数据和样本数据，所述考核等级为所述若干等级中的一个等级；
38.所述声纹资质考核模块，用于采用所述考核等级对应的样本集中的样本，测试待考核的声纹比对引擎的资质是否达到所述考核等级。
39.一种声纹资质考核设备，包括：存储器和处理器；
40.所述存储器，用于存储程序；
41.所述处理器，用于执行所述程序，实现上述任一项所述的声纹资质考核方法的各个步骤。
42.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现上述任一项所述的声纹资质考核方法的各个步骤。
43.本发明提供的声纹资质考核方法、装置、设备及存储介质，首先从若干等级分别对应的样本集中，获取考核等级对应的样本集，然后采用考核等级对应的样本集中的样本，测试待考核的声纹比对引擎的资质是否达到考核等级，经由本发明实施例提供的声纹资质考核方法可确定出声纹比对引擎的资质，而且，确定出的资质为所达到的具体等级，并非简单的是否达标。本发明提供的声纹资质考核方法为可对不同声纹比对引擎进行考核的统一方法，经由该声纹资质考核方法针对不同声纹比对引擎给出的考核结果能够直接进行比较；本发明提供的声纹资质考核方法采用同一批样本(即若干等级分别对应的样本集)对不同声纹比对引擎进行考核，避免了样本不同给考核带来的扰动，使得考核结果公平可靠；本发明提供的声纹资质考核方法将样本按判别难度划分等级，使用考核等级对应的样本集测试声纹比对引擎的资质是否达到考核等级，这种考核方式抛开了常用的评价指标的束缚，可操作性更强。综上，本发明提供的声纹资质考核方法的考核流程较为简单，考核过程较为规范，可操作性强，考核结果的可信度较高，并且，不同声纹比对引擎的考核结果能够直接进行比较。
附图说明
44.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。
45.图1为本发明实施例提供的声纹资质考核方法的流程示意图；
46.图2为本发明实施例提供的基于若干样本构建若干等级分别对应的样本集的流程示意图；
47.图3为本发明实施例提供的采用考核等级对应的样本集中的样本，测试待考核的声纹比对引擎的资质是否达到考核等级的示意图；
48.图4为本发明实施例提供的声纹资质考核装置的结构示意图；
49.图5为本发明实施例提供的声纹资质考核设备的结构示意图。
具体实施方式
50.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
51.为了能够对声纹比对引擎进行资质鉴定，本案发明人进行了研究，起初的思路是，采用基于评估指标的声纹资质考核方法对声纹比对引擎进行资质鉴定，该方法的大致思路是：
52.首先，将若干测试样本(每个测试样本包括检材数据和样本数据)输入待考核的声纹比对引擎，以得到若干测试样本分别对应的判别结果，然后根据若干测试样本分别对应的判别结果确定如下指标中的一个或多个：准确率、虚警率、漏警率、等错误率、召回率、精确度等，最后根据确定出的指标确定声纹比对引擎是否达标。
53.其中，准确率是指正负样本被正确分类的比例，其计算方式如下所示：
[0054][0055]
式中的n
tp
表示正样本(包括的检材数据和样本数据来自同一对象)被正确分类的数目，n
tn
表示负样本(包括的检材数据和样本数据来自不同对象)被正确分类的数目，n
fp
表示负样本被判别为正样本的数目，n
fn
表示正样本被判别为负样本的数目。准确率越高，说明声纹比对引擎的性能越好。
[0056]
虚警率也称错误接受率，在声纹对比问题中，若一样本包含的检材数据和样本数据来自不同对象，却被声纹比对引擎判别为来自同一对象，则其为错误接受案例。错误接受率是指错误接受案例在所有异类匹配案例的比例，其计算方式如下所示：
[0057][0058]
漏警率也称错误拒绝率,在声纹对比问题中，若一样本包含的检材数据和样本数据来自同一对象，却被声纹比对引擎判别为来自不同对象，则其为错误拒绝案例。错误拒绝率是指错误拒绝案例在所有同类匹配案例的比例，其计算方式如下所示：
[0059][0060]
可见，虚警率和漏警率越小，说明声纹比对引擎的性能越好。
[0061]
等错误率是虚警率和漏警率的一个相对平衡点。在接受/拒绝二元分类系统中，通
常会设定一个阈值，分数超过该值时才做出接受决定。调节阈值可以根据业务需求平衡虚警率与漏警率，当设定高阈值时，系统做出接受决定的得分要求较为严格，虚警率降低，漏警率升高；当设定低阈值时，系统做出接受决定的得分要求较为宽松，虚警率升高，漏警率降低。在不同应用场景下，调整不同的阈值，则可在安全性和易用性间平衡。调整阈值，使得虚警率等于漏警率，此时的虚警率与漏警率的值称为等错误率。
[0062]
本案发明人对上述基于评估指标的声纹资质考核方法进行研究发现：不同声纹对比引擎使用的评估指标通常不同，比如，声纹对比引擎a使用的指标为等错误率，声纹对比引擎b使用的指标为虚警率，不同声纹对比引擎的考核结果无法直接进行比较，其对实际对比没有参考价值；不同对比引擎使用的测试样本不同，这导致即便不同对比引擎使用的评估指标相同，最终获得的考核结果也无法直接进行比较；基于评估指标的声纹资质考核方法只能给出是否达标的结论，但是待考核的声纹识别引擎的性能具体处于什么水平，无可靠结论。
[0063]
鉴于基于评估指标的声纹资质考核方法存在诸多缺陷，本案发明人继续进行研究，通过不断研究，最终提出了一种效果较好的声纹资质考核方法，该声纹资质考核方法完美克服了基于评估指标的声纹资质考核方法的缺陷。
[0064]
本发明提供的声纹资质考核方法可应用于具有处理能力的电子设备，该电子设备可以为网络侧的服务器，也可以为用户侧使用的终端，其中，服务器可以是一台服务器，也可以是由多台服务器组成的服务器集群，或者是一个云计算服务器中心，服务器可以包括处理器、存储器以及网络接口等，终端可以但不限定为pc、笔记本、智能手机等。网络侧的服务器或用户侧使用的终端可按本发明提供的声纹资质考核方法对待考核的声纹比对引擎进行声纹资质考核。
[0065]
本领域技术人员应能理解上述终端和服务器仅为举例，其它现有的或今后可能出现的终端或服务器如可适用于本发明，也应包含在本发明保护范围以内，并在此以引用方式包含于此。
[0066]
接下来通过下述实施例对本发明提供的声纹资质考核方法进行介绍。
[0067]
第一实施例
[0068]
请参阅图1，示出了本发明实施例提供的声纹资质考核方法的流程示意图，可以包括：
[0069]
步骤s101：从若干等级分别对应的样本集中，获取考核等级对应的样本集。
[0070]
其中，若干等级分别对应的样本集基于若干样本构建，一等级对应的样本集中包括若干样本中属于该等级的样本，属于不同等级的样本的判别难度不同，若干样本中的每个样本包括检材数据和样本数据，考核等级为若干等级中的一个等级。
[0071]
示例性的，若干等级包括等级一、等级二、等级三、等级四、等级五，其中，等级一为最低等级，等级五为最高等级，等级一、等级二、等级三、等级四、等级五分别对应的样本集基于若干样本构建，等级一对应的样本集中包括若干样本中属于等级一的样本，等级二对应的样本集中包括若干样本中属于等级二的样本，等级三对应的样本集中包括若干样本中属于等级三的样本，等级四对应的样本集中包括若干样本中属于等级四的样本，等级五对应的样本集中包括若干样本中属于等级五的样本，属于不同等级的样本的判别难度不同，属于越高等级的样本的判别难度越大，属于越低等级的样本的判别难度越小，比如，属于等
级五的样本的判别难度大于属于等级四的样本的判别难度，属于等级四的样本的判别难度大于属于等级三的样本的判别难度，属于等级三的样本的判别难度大于属于等级二的样本的判别难度，属于等级二的样本的判别难度大于属于等级一的样本的判别难度。
[0072]
步骤s102：采用考核等级对应的样本集中的样本，测试待考核的声纹比对引擎的资质是否达到考核等级。
[0073]
示例性的，若干等级包括等级一、等级二、等级三、等级四、等级五，待考核的声纹比对引擎预申请等级五的资质，即考核等级为等级五，则采用等级五对应的样本集中的样本，测试声纹比对引擎的资质是否达到等级五。
[0074]
在采用考核等级对应的样本集中的样本，测试声纹比对引擎的资质是否达到考核等级时，可从考核等级对应的样本集中获取部分样本，作为测试样本，用获取的测试样本测试声纹比对引擎的资质是否达到考核等级。当然本实施例并不限定于此，比如，还可用考核等级对应的样本集中的所有样本测试声纹比对引擎的资质是否达到考核等级。
[0075]
需要说明的是，对于不同的声纹比对引擎，本发明采用同一批样本(即若干等级分别对应的样本集)进行考核，比如，对于声纹比对引擎a，从若干等级分别对应的样本集获取其考核等级a对应的样本集，采用考核等级a对应的样本集中的样本，测试声纹比对引擎a的资质是否达到考核等级a，对于声纹比对引擎b，从若干等级分别对应的样本集获取其考核等级b对应的样本集，采用考核等级b对应的样本集中的样本，测试声纹比对引擎b的资质是否达到考核等级b。
[0076]
本发明实施例提供的声纹资质考核方法，首先从若干等级分别对应的样本集中，获取考核等级对应的样本集，然后采用考核等级对应的样本集中的样本，测试待考核的声纹比对引擎的资质是否达到考核等级，经由本发明实施例提供的声纹资质考核方法可确定出声纹比对引擎的资质，而且，确定出的资质并非简单的是否达标，而是能够给出所达到的具体等级。
[0077]
本发明实施例提供的声纹资质考核方法具有如下优势：其一，本发明实施例提供的声纹资质考核方法为可对不同声纹比对引擎进行考核的统一方法，经由该声纹资质考核方法针对不同声纹比对引擎给出的考核结果能够直接进行比较；其二，本发明实施例提供的声纹资质考核方法采用同一批样本(即若干等级分别对应的样本集)对不同声纹比对引擎进行考核，避免了样本不同给考核带来的扰动，使得考核结果公平可靠；其三，本发明实施例提供的声纹资质考核方法将样本按判别难度划分等级，使用考核等级对应的样本集中的样本测试声纹比对引擎的资质是否达到考核等级，这种考核方式抛开了评价指标的束缚，可操作性更强。综上，本发明实施例提供的声纹资质考核方法的考核流程较为简单，考核过程较为规范，可操作性强，考核结果的可信度较高，并且，不同声纹比对引擎的考核结果能够直接进行比较。
[0078]
第二实施例
[0079]
上述实施例提到，若干等级分别对应的样本集基于若干样本构建，本实施例对基于若干样本构建若干等级分别对应的样本集的具体实现过程进行介绍。
[0080]
请参阅图2，示出了基于若干样本构建若干等级分别对应的样本集的流程示意图，可以包括：
[0081]
步骤s201：获取若干样本。
[0082]
其中，每个样本包括检材数据和样本数据。
[0083]
需要说明的是，若干个样本包含的各样本数据为质量较佳且对象身份清晰已知的语音数据，质量较佳的语音数据可以为满足高信噪比、一定长度的有效语言时长、录音信道频响均衡等条件的语音数据。
[0084]
不同于样本数据，若干个样本包含的各检材数据的语音质量可以参差不齐，这是因为，实际应用中，受录音的环境及条件、语音证据的提取、保存条件与方法等因素的影响，检材数据的语音质量无法保证。
[0085]
优选的，经由步骤s201获取的若干样本可以包括正样本和负样本，其中，正样本包括的检材数据与样本数据来自同一对象，负样本包括的检材数据与样本数据来自不同对象。
[0086]
具体的，获取若干样本的过程可以包括：获取m个对象分别对应的样本数据，以及n个对象分别对应的检材数据；将m个对象分别对应的样本数据与n个对象分别对应的检材数据两两组合，得到m*n个数据对，每个数据对作为一个样本，即得到m*n个样本。
[0087]
可选的，m个对象和n个对象可以包含相同对象和不同对象，如此，最终获得的样本中既包括正样本又包括负样本。需要说明的是，获取的每条样本数据和每条检材数据的对象身份都是明确已知的，在获得m*n个样本后，可获得m*n个样本分别对应的样本标签，比如，正样本的样本标签为“1”，负样本的样本标签为“0”。
[0088]
示例性的，获取对象a的样本数据a、对象b的样本数据b、对象c的样本数据c，获取对象b的检材数据b
′
、对象d的检材数据d，对象c的检材数据c
′
，则将上述的3条样本数据与3条检材数据两两组合，得到9个样本(a，b
′
)、(a，d)、(a，c
′
)、(b，b
′
)、(b，d)、(b，c
′
)、(c，b
′
)、(c，d)、(c，c
′
)，其中，(a，b
′
)、(a，d)、(a，c
′
)、(b，d)、(b，c
′
)、(c，b
′
)、(c，d)为负样本，对应的样本标签均为“0”，(b，b
′
)、(c，c
′
)为正样本，对应的样本标签均为“1”。
[0089]
步骤s202：确定若干个样本对分别对应的判别难度表征值。
[0090]
其中，判别难度表征值能够表征对应样本的判别难度。
[0091]
确定若干个样本对分别对应的判别难度表征值的过程可以包括：
[0092]
针对若干样本中的每个样本xi(i＝1,2，
…
，m*n，m*n为样本总数量)，执行：
[0093]
步骤a1、基于标准的声纹提取模型，对样本xi包括的检材数据和样本数据分别提取声纹特征，得到样本xi对应的声纹特征对。
[0094]
本实施例中“标准的声纹提取模型”指的是具有较好性能的声纹提取模型。
[0095]
步骤a2、计算样本xi对应的声纹特征对的相似度，得到样本xi对应的声纹特征相似度。
[0096]
计算样本xi对应的声纹特征对的相似度，即计算样本xi对应的声纹特征对包含的两个声纹特征的相似度。
[0097]
计算两个声纹特征的相似度的方式有多种，比如，可计算两个声纹特征的余弦距离，计算得到的余弦距离作为两个声纹特征的相似度，余弦距离cosθ的计算公式如下：
[0098][0099]
本实施例并不限定采用余弦距离度量两个声纹特征的相似度，还可采用其它，比如，欧式距离、闵可夫斯基距离、马氏距离等等。为了便于描述，后续以余弦距离为例进行介
绍。
[0100]
步骤a3、根据样本xi对应的声纹特征相似度，确定样本xi对应的判别难度表征值。
[0101]
具体的，基于预设的线性映射关系，将样本xi对应的声纹特征相似度映射为能够表征样本xi的判别难度的值，作为样本xi对应的判别难度表征值。
[0102]
更为具体的，若样本xi为正样本，则基于针对正样本预设的第一线性映射关系，将样本xi的声纹特征相似度映射为能够表征样本xi的判别难度的值，作为样本xi对应的判别难度表征值；若样本xi为负样本，则基于针对负样本预设的第二线性映射关系，将样本xi的声纹特征相似度映射为能够表征样本xi的判别难度的值，作为样本xi对应的判别难度表征值。
[0103]
示例性的，两个声纹特征的相似度采用两个声纹特征的余弦距离度量，则针对正样本预设的第一线性映射关系和针对负样本预设的第二线性映射关系依次可以为：
[0104][0105][0106]
其中，cs表示样本对应的声纹特征相似度，score表示样本对应的判别难度表征值。
[0107]
可选的，针对正样本，可预设表1中的几组关系，根据表1中的几组关系确定第一线性映射关系，针对负样本，可预设表2中的几组关系，根据表2中的几组关系确定第二线性映射关系。
[0108]
表1对于正样本，特征相似度和判别难度表征值的关系
[0109]
特征相似度(余弦距离)判别难度表征值(得分)-10-0.5250500.5751100
[0110]
表2对于负样本，特征相似度和判别难度表征值的关系
[0111]
特征相似度(余弦距离)判别难度表征值(得分)-1100-0.5750500.52510
[0112]
对于正样本而言，特征相似度(余弦距离)为1，则得分为100，特征相似度(余弦距离)为-1，则得分为0，特征相似度(余弦距离)在-1～1之间时，得分成线性分布。需要说明的是，对于正样本而言，其对应的特征相似度越大，其得分越大，判别难度越小，反之，其对应的特征相似度越小，得分越小，判别难度越大。
[0113]
对于负样本而言，特征相似度(余弦距离)为-1，则得分为100，特征相似度(余弦距
离)为1，则得分为0。需要说明的是，对于负样本而言，其对应的特征相似度越大，得分越小，判别难度越大，反之，其对应的特征相似度越小，得分越大，判别难度越小。
[0114]
不管是正样本还是负样本，最终都是得分越小，判别难度越大，得分越大，判别难度越小。
[0115]
步骤s203：根据若干个样本分别对应的判别难度表征值，从设定的若干等级中确定若干样本分别所属的等级，以得到若干等级分别对应的样本集。
[0116]
可选的，若干等级分别对应有判别难度表征值范围。
[0117]
根据若干个样本分别对应的判别难度表征值，从设定的若干等级中确定若干样本分别所属的等级的过程包括：
[0118]
针对若干样本中的每个样本xi(i＝1,2，
…
，m*n，m*n为样本总数量)，执行：
[0119]
步骤b1、从若干等级分别对应的判别难度表征值范围中，确定样本xi对应的判别难度表征值所在的判别难度表征值范围，作为目标判别难度表征值范围。
[0120]
示例性的，若干等级包括等级一、等级二、等级三、等级四、等级五，其中，等级一为最低等级，等级五为最高等级，五个等级分别对应的判别难度表征值范围(比如得分范围)如下表所示：
[0121]
表3若干等级分别对应的判别难度表征值范围
[0122]
等级判别难度表征值范围(得分范围)等级五0≤score《20等级四20≤score《40等级三40≤score《60等级二60≤score《80等级一80≤score≤100
[0123]
假设样本xi对应的判别难度表征值(比如得分)为20，经由上表可知，20位于0≤score《20这一判别难度表征值范围(得分范围)内，因此，确定0≤score《20为目标判别难度表征值范围。假设样本xi对应的判别难度表征值(比如得分)为50，经由上表可知，50位于40≤score《60这一判别难度表征值范围(得分范围)内，因此，确定40≤score《60为目标判别难度表征值范围。
[0124]
步骤b2、将目标判别难度表征值范围对应的等级，确定为样本xi所属的等级。
[0125]
示例性的，若目标判别难度表征值范围为上表中的0≤score《20，则确定样本xi所属的等级为等级五，若目标判别难度表征值范围为上表中的20≤score《40，则确定样本xi所属的等级为等级四，若目标判别难度表征值范围为上表中的40≤score《60，则确定样本xi所属的等级为等级三，若目标判别难度表征值范围为上表中的60≤score《80，则确定样本xi所属的等级为等级二，若目标判别难度表征值范围为上表中的80≤score≤100，则确定样本xi所属的等级为等级一。
[0126]
经由上述过程可获得若干样本分别所属的等级。
[0127]
步骤s204：将属于同一等级的样本组成样本集，得到若干等级分别对应的样本集。
[0128]
示例性的，若干等级包括等级一、等级二、等级三、等级四、等级五，若干样本包括x1、x2、x3、x4、x5、x6、x7、x8、x9、x
10
、x
11
、x
12
、x
13
、x
14
、x
15
，假设确定x1所属的等级为等级一，x2所属的等级为等级二、x3所属的等级为等级一、x4所属的等级为等级三、x5所属的等级为等级
五、x6所属的等级为等级四、x7所属的等级为等级二、x8所属的等级为等级三、x9所属的等级为等级四、x
10
所属的等级为等级二、x
11
所属的等级为等级一、x
12
所属的等级为等级五、x
13
所属的等级为等级三、x
14
所属的等级为等级二、x
15
所属的等级为等级四，则最终可获得等级一对应的样本集{x1，x3，x
11
}、等级二对应的样本集{x2，x7，x
10
、x
14
}、等级三对应的样本集{x4，x8，x
13
}、等级四对应的样本集{x6，x9，x
15
}和等级五对应的样本集{x5，x
12
}。
[0129]
经由本实施例提供的方法，可构建出若干等级分别对应的样本集。
[0130]
第三实施例
[0131]
本实施例对上述实施例中的“步骤s102：采用考核等级对应的样本集中的样本，测试待考核的声纹比对引擎的资质是否达到考核等级”的具体实现过程进行介绍。
[0132]
请参阅图3，示出了采用考核等级对应的样本集中的样本，测试待考核的声纹比对引擎的资质是否达到考核等级的流程示意图，可以包括：
[0133]
步骤s301：从考核等级对应的样本集中获取指定数量的样本作为测试样本，以得到指定数量的测试样本。
[0134]
若将考核等级对应的样本集的样本总数量表示为n，则指定数量可以为n，可也小于n。需要说明的是，测试样本的数量可根据具体情况设定。
[0135]
可选的，若指定数量为m，m小于n，则可采用如下策略从考核等级对应的样本集中获取测试样本：首先将考核等级对应的样本集中的样本按判别难度表征值(比如得分)由大到小，或者由小到大的顺序排列，然后每隔n/m个样本取一个样本。
[0136]
步骤s302：基于声纹比对引擎判别每个测试样本包含的检材数据与样本数据是否来自同一对象，得到指定数量的测试样本分别对应的判别结果。
[0137]
具体的，将每个测试样本输入声纹比对引擎，声纹比对引擎首先对输入的测试样本包含的检材数据和样本数据分别提取声纹特征，然后计算提取的两个声纹特征的相似度，最后根据计算的相似度判别测试样本包含的检材数据和样本数据是来自同一对象，还是来自不同对象，进而输出判别结果。
[0138]
步骤s303：根据指定数量的测试样本分别对应的判别结果以及指定数量的测试样本分别对应的样本标签，确定声纹比对引擎的判别准确率。
[0139]
其中，样本标签用于指示对应的测试样本包含的检材数据和样本数据是否来自同一对象。
[0140]
需要说明的是，对于一测试样本，在该测试样本的判别结果指示该测试样本包含的检材数据与样本数据来自同一对象的情况下，若该测试样本对应的样本标签指示该测试样本包含的检材数据与样本数据来自同一对象，则可确定声纹比对引擎对该测试样本判别正确，若该测试样本对应的样本标签指示该测试样本包含的检材数据与样本数据来自不同对象，则可确定声纹比对引擎对该测试样本判别错误；在该测试样本的判别结果指示该测试样本包含的检材数据与样本数据来自不同对象的情况下，若该测试样本对应的样本标签指示该测试样本包含的检材数据与样本数据来自同一对象，则可确定声纹比对引擎对该测试样本判别错误，若该测试样本对应的样本标签指示该测试样本包含的检材数据与样本数据来自不同对象，则可确定声纹比对引擎对该测试样本判别正确。
[0141]
若指定数量为m，声纹比对引擎在m个测试样本中的p个测试样本上判别正确，则可确定声纹比对引擎的判别准确率为p/m。
[0142]
步骤s304：根据声纹比对引擎的判别准确率，确定声纹比对引擎的资质是否达到考核等级。
[0143]
具体的，可判断声纹比对引擎的判别准确率是否大于或等于预设的判别准确率阈值，若是，则确定声纹比对引擎的资质达到考核等级，若否，则确定声纹比对引擎的未资质达到考核等级。
[0144]
示例性的，考核等级为等级五，若声纹比对引擎的判别准确率大于或等于预设的判别准确率阈值，则可确定声纹比对引擎的资质达到等级五，若声纹比对引擎的判别准确率小于预设的判别准确率阈值，则确定声纹比对引擎的资质未达到等级五。
[0145]
需要说明的是，若声纹比对引擎的资质未达到考核等级，可申请低等级，比如，声纹比对引擎的考核等级为等级五(申请等级五的资质)，经考核，声纹比对引擎的资质为未达到考等级五，则可申请等级四的资质。
[0146]
第四实施例
[0147]
本发明实施例还提供了一种声纹资质考核装置，下面对本发明实施例提供的声纹资质考核装置进行描述，下文描述的声纹资质考核装置与上文描述的声纹资质考核方法可相互对应参照。
[0148]
请参阅图4，示出了本发明实施例提供的声纹资质考核装置的结构示意图，可以包括：样本集获取模块401和声纹资质考核模块402。
[0149]
样本集获取模块401，用于从若干等级分别对应的样本集中，获取考核等级对应的样本集。
[0150]
其中，若干等级分别对应的样本集基于若干样本构建，一等级对应的样本集中包括若干样本中属于该等级的样本，属于不同等级的样本的判别难度不同，若干样本中的每个样本包括检材数据和样本数据，考核等级为若干等级中的一个等级。
[0151]
声纹资质考核模块402，用于采用考核等级对应的样本集中的样本，测试待考核的声纹比对引擎的资质是否达到考核等级。
[0152]
可选的，本发明实施例提供的声纹资质考核装置还可以包括：样本集构建模块。
[0153]
样本集构建模块可以包括：样本获取子模块、判别难度表征值确定子模块、等级确定子模块和样本集构建子模块。
[0154]
样本获取子模块，用于获取若干样本。
[0155]
判别难度表征值确定子模块，用于确定所述若干样本分别对应的判别难度表征值，其中，所述判别难度表征值能够表征对应样本的判别难度。
[0156]
等级确定子模块，用于根据所述若干样本分别对应的判别难度表征值，从所述若干等级中确定所述若干样本分别所属的等级。
[0157]
样本集构建子模块，用于将属于同一等级的样本组成样本集，得到所述若干等级分别对应的样本集。
[0158]
可选的，判别难度表征值确定子模块在确定所述若干样本分别对应的判别难度表征值时，具体用于：
[0159]
针对所述若干样本中待确定判别难度表征值的目标样本：
[0160]
基于标准的声纹提取模型，对所述目标样本包括的检材数据和样本数据分别提取声纹特征，得到所述目标样本对应的声纹特征对；
[0161]
计算所述目标样本对应的声纹特征对的相似度，得到所述目标样本对应的声纹特征相似度；
[0162]
根据所述目标样本对应的声纹特征相似度，确定所述目标样本对应的判别难度表征值。
[0163]
可选的，判别难度表征值确定子模块在根据所述目标样本对应的声纹特征相似度，确定所述目标样本对应的判别难度表征值时，具体用于：
[0164]
基于预设的线性映射关系，将所述目标样本对应的声纹特征相似度映射为能够表征所述目标样本的判别难度的值，作为所述目标样本对应的判别难度表征值。
[0165]
可选的，所述若干个样本包括正样本和负样本，所述正样本包括的检材数据和样本数据来自同一对象，所述负样本包括的检材数据和样本数据来自不同对象；
[0166]
判别难度表征值确定子模块在基于预设的线性映射关系，将所述目标样本对应的声纹特征相似度映射为能够表征所述目标样本的判别难度的值时，具体用于：
[0167]
若所述目标样本为正样本，则基于针对正样本预设的第一线性映射关系，将所述目标样本的声纹特征相似度映射为能够表征所述目标样本的判别难度的值；
[0168]
若所述目标样本为负样本，则基于针对负样本预设的第二线性映射关系，将所述目标样本的声纹特征相似度映射为能够表征所述目标样本的判别难度的值。
[0169]
可选的，所述若干等级分别对应有判别难度表征值范围；
[0170]
所述等级确定子模块在根据所述若干样本分别对应的判别难度表征值，从所述若干等级中确定所述若干样本分别所属的等级时，具体用于：
[0171]
针对所述若干个样本中待确定等级的目标样本：
[0172]
从所述若干等级分别对应的判别难度表征值范围中，确定所述目标样本对应的判别难度表征值所在的判别难度表征值范围，作为目标判别难度表征值范围；
[0173]
将所述目标判别难度表征值范围对应的等级，确定为所述目标样本所属的等级。
[0174]
可选的，声纹资质考核模块402在采用所述考核等级对应的样本集中的样本，测试待考核的声纹比对引擎的资质是否达到所述考核等级时，具体用于：
[0175]
从所述考核等级对应的样本集中获取指定数量的样本作为测试样本，以得到指定数量的测试样本；
[0176]
基于所述声纹比对引擎判别每个测试样本包含的检材数据与样本数据是否来自同一对象，得到所述指定数量的测试样本分别对应的判别结果；
[0177]
根据所述指定数量的测试样本分别对应的判别结果以及所述指定数量的测试样本分别对应的样本标签，确定所述声纹比对引擎的判别准确率，其中，所述样本标签用于指示对应的测试样本包含的检材数据和样本数据是否来自同一对象；
[0178]
根据所述声纹比对引擎的判别准确率，确定所述声纹比对引擎的资质是否达到所述考核等级。
[0179]
本发明实施例提供的声纹资质考核装置，首先从若干等级分别对应的样本集中，获取考核等级对应的样本集，然后采用考核等级对应的样本集中的样本，测试待考核的声纹比对引擎的资质是否达到考核等级，经由本发明实施例提供的声纹资质考核装置可确定出声纹比对引擎的资质，而且，确定出的资质并非简单的是否达标，而是能够给出所达到的具体等级。
[0180]
第五实施例
[0181]
本发明实施例还提供了一种声纹资质考核设备，请参阅图5，示出了该声纹资质考核设备的结构示意图，该声纹资质考核设备可以包括：至少一个处理器501，至少一个通信接口502，至少一个存储器503和至少一个通信总线504；
[0182]
在本发明实施例中，处理器501、通信接口502、存储器503、通信总线504的数量为至少一个，且处理器501、通信接口502、存储器503通过通信总线504完成相互间的通信；
[0183]
处理器501可能是一个中央处理器cpu，或者是特定集成电路asic(application specific integrated circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路等；
[0184]
存储器503可能包含高速ram存储器，也可能还包括非易失性存储器(non-volatile memory)等，例如至少一个磁盘存储器；
[0185]
其中，存储器存储有程序，处理器可调用存储器存储的程序，所述程序用于：
[0186]
从若干等级分别对应的样本集中，获取考核等级对应的样本集；其中，所述若干等级分别对应的样本集基于若干样本构建，一等级对应的样本集中包括所述若干样本中属于该等级的样本，属于不同等级的样本的判别难度不同，所述若干样本中的每个样本包括检材数据和样本数据，所述考核等级为所述若干等级中的一个等级；
[0187]
采用所述考核等级对应的样本集中的样本，测试待考核的声纹比对引擎的资质是否达到所述考核等级。
[0188]
可选的，所述程序的细化功能和扩展功能可参照上文描述。
[0189]
第六实施例
[0190]
本发明实施例还提供一种可读存储介质，该可读存储介质可存储有适于处理器执行的程序，所述程序用于：
[0191]
从若干等级分别对应的样本集中，获取考核等级对应的样本集；其中，所述若干等级分别对应的样本集基于若干样本构建，一等级对应的样本集中包括所述若干样本中属于该等级的样本，属于不同等级的样本的判别难度不同，所述若干样本中的每个样本包括检材数据和样本数据，所述考核等级为所述若干等级中的一个等级；
[0192]
采用所述考核等级对应的样本集中的样本，测试待考核的声纹比对引擎的资质是否达到所述考核等级。
[0193]
可选的，所述程序的细化功能和扩展功能可参照上文描述。
[0194]
最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0195]
本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。
[0196]
对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。
对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：语音合成模型的训练方法、语音合成方法及相关装置与流程

一种声纹资质考核方法、装置、设备及存储介质与流程

相关文献

最热文献