一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

声纹特征的有效性检测方法、装置及电子设备与流程

2021-10-29 22:49:00 来源:中国专利 TAG:电子设备 语音 检测方法 装置 有效性


1.本技术涉及语音处理技术领域,具体而言,本技术涉及一种声纹特征的有效性检测方法、装置及电子设备。


背景技术:

2.声纹识别是智能语音领域的一个重要的应用场景,即通过说话人语音来识别身份。声纹识别主要通过声纹模型提取说话人语音的声纹特征来标识一个人。
3.在实际使用中,可能存在多种原因影响的声纹特征的有效性,从而会影响对用户身份的识别效果。如果能够对声纹特征的有效性进行检测,保证用于身份识别的声纹特征的有效性,就能够提高声纹识别的识别效果。


技术实现要素:

4.本技术的目的旨在至少能解决上述的技术缺陷之一。本技术所采用的技术方案如下:
5.第一方面,本技术实施例提供了一种声纹特征的有效性检测方法,该方法包括:
6.对待处理声纹特征进行聚类处理,得到目标聚类,目标聚类中的声纹特征在待处理声纹特征中的占比大于预设值;
7.基于目标聚类中是否存在与目标聚类的质心的距离不小于预设距离的声纹特征,确定待处理声纹的有效性。
8.可选地,基于目标聚类中是否存在与目标聚类的质心的距离小于预设距离的声纹特征,确定待处理声纹的有效性,包括:
9.若目标聚类中存在与目标聚类的质心的距离不小于预设距离的声纹特征,则确定待处理声纹无效;
10.若目标聚类中不存在与目标聚类的质心的距离不小于预设距离的声纹特征,则确定待处理声纹有效。
11.可选地,上述方法还包括:
12.基于预训练的平稳噪音检测模型确定第一语音数据中是否包含平稳噪音;
13.基于第一语音数据中是否包含平稳噪音,对第一语音数据进行处理,得到第二语音数据。
14.可选地,平稳噪音检测模型是将预配置的人声语音数据作为正样本,将样本语音数据作为负样本,进行模型训练得到的,其中,样本语音数据包括融合语音数据以及预配置的噪音数据,融合语音数据是基于人声语音数据与噪音数据融合得到的。
15.可选地,基于第一语音数据中是否包含平稳噪音,对第一语音数据进行处理,得到第二语音数据,包括:
16.若第一语音数据中包含平稳噪音,则对第一语音数据中的平稳噪音进行处理,得到第二语音数据;
17.若第一语音数据中不包含平稳噪音,则将第一语音数据作为第二语音数据。
18.可选地,上述方法还包括:
19.基于第二语音数据中是否包含静音,对第二语音数据进行处理得到第三语音数据。
20.可选地,基于第二语音数据中是否包含静音,对第二语音数据进行处理得到第三语音数据,包括:
21.若第二语音数据中包含静音,则对第二语音数据中的静音进行处理得到第三语音数据;
22.若第二语音数据中不包含静音,则将第二语音数据作为第三语音数据。
23.可选地,上述方法还包括:
24.基于预设步长以及预设滑窗,将第三语音数据划分为至少一个第四语音数据;
25.通过第四语音数据提取待处理声纹特征。
26.可选地,若确定待处理声纹有效,则上述方法还包括:
27.将离群声纹特征对应的语音数据从第四语音数据中去除,其中,离群声纹特征为待处理声纹特征的聚类结果中除目标聚类之外的声纹特征。
28.第二方面,本技术实施例提供了一种声纹特征的有效性检测装置,该装置包括:
29.聚类模块,用于对待处理声纹特征进行聚类处理,得到目标聚类,目标聚类中的声纹特征在待处理声纹特征中的占比大于预设值;
30.有效性检测模块,用于基于目标聚类中是否存在与目标聚类的质心的距离不小于预设距离的声纹特征,确定待处理声纹的有效性。
31.可选地,有效性检测模块具体用于:
32.若目标聚类中存在与目标聚类的质心的距离不小于预设距离的声纹特征,则确定待处理声纹无效;
33.若目标聚类中不存在与目标聚类的质心的距离不小于预设距离的声纹特征,则确定待处理声纹有效。
34.可选地,上述装置还包括平稳噪音处理模块,平稳噪音处理模块具体用于:
35.基于预训练的平稳噪音检测模型确定第一语音数据中是否包含平稳噪音;
36.基于第一语音数据中是否包含平稳噪音,对第一语音数据进行处理,得到第二语音数据。
37.可选地,平稳噪音检测模型是将预配置的人声语音数据作为正样本,将样本语音数据作为负样本,进行模型训练得到的,其中,样本语音数据包括融合语音数据以及预配置的噪音数据,融合语音数据是基于人声语音数据与噪音数据融合得到的。
38.可选地,上述平稳噪音处理模块在基于第一语音数据中是否包含平稳噪音,对第一语音数据进行处理,得到第二语音数据时,具体用于:
39.若第一语音数据中包含平稳噪音,则对第一语音数据中的平稳噪音进行处理,得到第二语音数据;
40.若第一语音数据中不包含平稳噪音,则将第一语音数据作为第二语音数据。
41.可选地,上述装置还包括静音处理模块,静音处理模块用于:
42.基于第二语音数据中是否包含静音,对第二语音数据进行处理得到第三语音数
据。
43.可选地,上述静音处理模块具体用于:
44.若第二语音数据中包含静音,则对第二语音数据中的静音进行处理得到第三语音数据;
45.若第二语音数据中不包含静音,则将第二语音数据作为第三语音数据。
46.可选地,上述装置还包括声纹特征提取模块,声纹特征提取模块用于:
47.基于预设步长以及预设滑窗,将第三语音数据划分为至少一个第四语音数据;
48.通过第四语音数据提取待处理声纹特征。
49.可选地,上述装置还包括:
50.语音清洗模块,用于在确定待处理声纹有效时,将离群声纹特征对应的语音数据从第四语音数据中去除,其中,离群声纹特征为待处理声纹特征的聚类结果中除目标聚类之外的声纹特征。
51.第三方面,本技术实施例提供了一种电子设备,该电子设备包括:处理器和存储器;
52.存储器,用于存储操作指令;
53.处理器,用于通过调用操作指令,执行如本技术的第一方面的任一实施方式中所示的声纹特征的有效性检测方法。
54.第四方面,本技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本技术的第一方面的任一实施方式中所示的声纹特征的有效性检测方法。
55.本技术实施例提供的技术方案带来的有益效果是:
56.本技术实施例提供的方案,通过对待处理声纹特征进行聚类处理,得到目标聚类,并基于目标聚类中是否存在与目标聚类的质心的距离不小于预设距离的声纹特征,确定待处理声纹的有效性。基于本方案,能够实现对声纹特征的有效性的检测,保证用于身份识别的声纹特征的有效性,从而能够为提高声纹识别的识别效果提供基础。
附图说明
57.为了更清楚地说明本技术实施例中的技术方案,下面将对本技术实施例描述中所需要使用的附图作简单地介绍。
58.图1为本技术实施例提供的一种声纹特征的有效性检测方法的流程示意图;
59.图2为本技术实施例提供的一种具体实施方式中对第一语音数据中可能包含的平稳噪音以及静音进行处理的流程示意图;
60.图3为本技术实施例的一种具体实施方式中通过滑窗提取声纹特征的示意图;
61.图4为本技术实施例提供的声纹特征的有效性检测方法的一种具体实施方式的流程示意图;
62.图5为本技术实施例提供的一种声纹特征的有效性检测装置的结构示意图;
63.图6为本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
64.下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本技术,而不能解释为对本发明的限制。
65.本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
66.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
67.提取声纹特征的过程主要包括以下三个步骤:语音信号预处理、有效语音提取与检测、声纹模型的特征提取。通常声纹模型在测试集上的测试效果较好,但是上线到生产环境时效果急剧下降,主要原因是生产环境情况较为复杂,语音信号中不仅有大量随机出现的静音,而且叠加了各种平稳与非平稳噪音。这时候提取与检测出有效的语音信号就显的至关重要,通过对语音信号去除静音与噪音,得到干净有效的语音信号。
68.另外,当声纹特征中包含表征多个用户的特征时,也会造成声纹特征的无效,使得无法得到准确的识别结果。
69.本技术实施例提供的声纹特征的有效性检测方法、装置及电子设备,旨在解决现有技术的如上技术问题中的至少一个。
70.下面以具体地实施例对本技术的技术方案以及本技术的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本技术的实施例进行描述。
71.图1示出了本技术实施例提供的一种声纹特征的有效性检测方法的流程示意图,如图1所示,该方法主要可以包括:
72.步骤s110:对待处理声纹特征进行聚类处理,得到目标聚类,目标聚类中的声纹特征在待处理声纹特征中的占比大于预设值。
73.其中,待处理声纹特征可以为从待检测人声中提取的一组声纹特征序列,对待处理声纹特征进行聚类处理,能够得到聚类处理结果,可以将聚类处理结果中的最大类确定为目标聚类,预设占比可以根据实际需要指定。
74.作为一个示例,可以采用谱聚类算法对待处理声纹特征进行聚类处理,谱聚类是广泛使用的聚类算法,比起传统的k

means算法,适应性较强。在使用谱聚类算法对待处理声纹特征进行聚类处理时,距离可以采用余弦距离,可以通过调节参数,使最大类(即目标聚类)中的声纹特征数量占待处理声纹特征总数的80%以上。
75.步骤s120:基于目标聚类中是否存在与目标聚类的质心的距离不小于预设距离的声纹特征,确定待处理声纹的有效性。
76.其中,距离以及预设距离均可以采用余弦距离。
77.本技术实施例中,可以确定目标聚类的质心,并分别计算目标聚类中的各声纹特征与质心的余弦距离,并将计算出的各余弦距离与预设距离进行比较,可以认为当余弦距离大于预设距离时,该声纹特征不稳定,无法很好的体现说话人的特征,也就无法有效的进行声纹识别。
78.在实际使用中,余弦距离的取值范围为0至1,若余弦距离为0,则可以认为该声纹特征与目标聚类的质心可以表示同一个说话人,而若余弦距离为1,则可以认为该声纹特征与目标聚类的质心可以表示两个不同的说话人,本例中预设距离可以设置为0.4。
79.本技术实施例提供的方法,通过对待处理声纹特征进行聚类处理,得到目标聚类,并基于目标聚类中是否存在与目标聚类的质心的距离不小于预设距离的声纹特征,确定待处理声纹的有效性。基于本方案,能够实现对声纹特征的有效性的检测,保证用于身份识别的声纹特征的有效性,从而能够为提高声纹识别的识别效果提供基础。
80.本技术实施例的一种可选方式中,基于目标聚类中是否存在与目标聚类的质心的距离小于预设距离的声纹特征,确定待处理声纹的有效性,包括:
81.若目标聚类中存在与目标聚类的质心的距离不小于预设距离的声纹特征,则确定待处理声纹无效;
82.若目标聚类中不存在与目标聚类的质心的距离不小于预设距离的声纹特征,则确定待处理声纹有效。
83.本技术实施例的一种可选方式中,上述方法还包括:
84.基于预训练的平稳噪音检测模型确定第一语音数据中是否包含平稳噪音;
85.基于第一语音数据中是否包含平稳噪音,对第一语音数据进行处理,得到第二语音数据。
86.其中,第一语音数据可以为录制的用户语音数据,在实际情况下,第一语音数据中可能会存在平稳噪音。
87.本技术实施例中,可以通过平稳噪音检测模型对第一语音数据中是否包含平稳噪音进行检测,并根据第一语音数据中是否包含平稳噪音,对第一语音数据进行处理,得到第二语音数据。
88.本技术实施例的一种可选方式中,平稳噪音检测模型是将预配置的人声语音数据作为正样本,将样本语音数据作为负样本,进行模型训练得到的,其中,样本语音数据包括融合语音数据以及预配置的噪音数据,融合语音数据是基于人声语音数据与噪音数据融合得到的。
89.本技术实施例中,在为平稳噪音检测模型的训练构建训练集。
90.具体地,可以使用noisex

92噪音数据集,该数据集总共包含15种不同的噪声。通过15种不同的噪声中的任几种互相排列组合总共能够合成32767种不同的纯噪音,合成时不同纯噪音之间的功率比为0db,即功率大小相等。上述的32767种不同的纯噪音即预配置的噪音数据。
91.预配置的人声语音数据可以为干净的人声语音,标签为0,将其作为训练集中的负样本。使用上述的32767种不同纯噪声与预配置的人声语音数据进行融合,分别生成信噪比为3db、0db、

5db、

10db、

15db、

20db带噪音的人声语音,即融合语音数据。样本语音数据包括融合语音数据以及上述的32767种不同的纯噪声。样本语音数据的标签为1,将其作为
训练集中的正样本。
92.在构建出训练集后,可以使用训练集对平稳噪音检测模型进行训练。
93.具体地,平稳噪音检测模型可以为二分类的深度学习模型,模型结构可以使用vgg、resnet、lstm等,在此不作限定。
94.本技术实施例的一种可选方式中,基于第一语音数据中是否包含平稳噪音,对第一语音数据进行处理,得到第二语音数据,包括:
95.若第一语音数据中包含平稳噪音,则对第一语音数据中的平稳噪音进行处理,得到第二语音数据;
96.若第一语音数据中不包含平稳噪音,则将第一语音数据作为第二语音数据。
97.本技术实施例中,在检测出第一语音数据中包含平稳噪音时,则可以对第一语音数据中的平稳噪音进行处理,如使用维纳滤波器或高斯滤波器或小波滤波器等滤波器对平稳噪音进行处理,本例中不限定具体滤波器的种类。
98.本技术实施例的一种可选方式中,上述方法还包括:
99.基于第二语音数据中是否包含静音,对第二语音数据进行处理得到第三语音数据。
100.本技术实施例中,在经过平稳噪音的检测及处理之后得到的第二语音数据中,可能会存在较长的静音,这些静音对于后续的声纹特征提取造成影响,因此需要对静音进行处理。
101.本技术实施例的一种可选方式中,基于第二语音数据中是否包含静音,对第二语音数据进行处理得到第三语音数据,包括:
102.若第二语音数据中包含静音,则对第二语音数据中的静音进行处理得到第三语音数据;
103.若第二语音数据中不包含静音,则将第二语音数据作为第三语音数据。
104.本技术实施例中,在检测到第二语音数据中包含静音时,可以对第二语音数据中的静音进行处理,如可以采用vad算法去除静音。
105.通过将第一语音数据中可能包含的平稳噪音以及静音进行处理,能够使得提取到的声纹特征更为干净有效。
106.作为一个示例,图2中示出了本技术实施例提供的一种具体实施方式中对第一语音数据中可能包含的平稳噪音以及静音进行处理的流程示意图。如图2中所示,可以先对第一语音数据是否包含平稳噪音进行检测,若包含平稳噪音,则对平稳噪音进行处理,而后对可能存在的静音进行去除。若不包含平稳噪音,则可以对可能存在的静音进行去除。
107.本技术实施例的一种可选方式中,上述方法还包括:
108.基于预设步长以及预设滑窗,将第三语音数据划分为至少一个第四语音数据;
109.通过第四语音数据提取待处理声纹特征。
110.本技术实施例中,在对第一语音数据中可能包含的平稳噪音以及静音进行处理得到第三语音数据之后,
111.本技术实施例中,可以采取滑窗的方式从第三语音数据中提取第四语音数据,而后将第四语音数据输入声纹模型提取声纹特征。
112.作为一个示例,预设滑窗的滑窗大小可以为1400ms至1800ms,预设步长可以为半
窗,当提取至最后一个滑窗时,如果剩余的语音数据占滑窗不足75%则丢弃,超过75%则用零值填充滑窗。经过滑窗划分的每段第四语音数据输入到训练好的神经网络声纹模型中,得到一组声纹特征序列,即待处理声纹特征。
113.图3中示出了本技术实施例的一种具体实施方式中通过滑窗提取声纹特征的示意图。
114.如图3中所示,可以按照将预设滑窗大小的滑窗,以半窗的长度为步长进行滑移,划分出一组第四语音数据,将划分的第四语音数据分被输入到训练好的神经网络声纹模型中,得到一组声纹特征序列。
115.本技术实施例的一种可选方式中,若确定待处理声纹有效,则方法还包括:
116.将离群声纹特征对应的语音数据从第四语音数据中去除,其中,离群声纹特征为待处理声纹特征的聚类结果中除目标聚类之外的声纹特征。
117.本技术实施例中,对待处理声纹特征的聚类结果中,除了目标聚类之外,可能还存在离群声纹特征。离群声纹特征可能对应的是一长段平稳的语音数据中某小段出现静音或非平稳噪音,会导致在该小段提取的声纹特征与质心的余弦距离较远,由于第四语音数据是采用滑窗提取的,离群声纹特征对应的语音片段与目标聚类中对应的语音片段会出现重复,为了尽可能多的保留语音信号,可以只去除未出现重复并且离群声纹特征对应的语音片段。从而处理得到干净有效的语音数据。
118.作为一个示例,图4中示出了本技术实施例提供的声纹特征的有效性检测方法的一种具体实施方式的流程示意图。
119.如图4中所示,可以先通过滑窗提取声纹特征,而后对声纹特征及进行谱聚类,得到最大类,而后通过计算最大类中各声纹特征与质心的余弦距离实现有效性检测。当确定出所提取声纹特征有效时,则可以去除离群声纹特征对应的语音片段,并输出有效语音。当确定出所提取声纹特征无效时,则可以结束流程。
120.基于与图1中所示的方法相同的原理,图5示出了本技术实施例提供的一种声纹特征的有效性检测装置的结构示意图,如图5所示,该声纹特征的有效性检测装置20可以包括:
121.聚类模块210,用于对待处理声纹特征进行聚类处理,得到目标聚类,目标聚类中的声纹特征在待处理声纹特征中的占比大于预设值;
122.有效性检测模块220,用于基于目标聚类中是否存在与目标聚类的质心的距离不小于预设距离的声纹特征,确定待处理声纹的有效性。
123.本技术实施例提供的装置,通过对待处理声纹特征进行聚类处理,得到目标聚类,并基于目标聚类中是否存在与目标聚类的质心的距离不小于预设距离的声纹特征,确定待处理声纹的有效性。基于本方案,能够实现对声纹特征的有效性的检测,保证用于身份识别的声纹特征的有效性,从而能够为提高声纹识别的识别效果提供基础。
124.可选地,有效性检测模块具体用于:
125.若目标聚类中存在与目标聚类的质心的距离不小于预设距离的声纹特征,则确定待处理声纹无效;
126.若目标聚类中不存在与目标聚类的质心的距离不小于预设距离的声纹特征,则确定待处理声纹有效。
127.可选地,上述装置还包括平稳噪音处理模块,平稳噪音处理模块具体用于:
128.基于预训练的平稳噪音检测模型确定第一语音数据中是否包含平稳噪音;
129.基于第一语音数据中是否包含平稳噪音,对第一语音数据进行处理,得到第二语音数据。
130.可选地,平稳噪音检测模型是将预配置的人声语音数据作为正样本,将样本语音数据作为负样本,进行模型训练得到的,其中,样本语音数据包括融合语音数据以及预配置的噪音数据,融合语音数据是基于人声语音数据与噪音数据融合得到的。
131.可选地,上述平稳噪音处理模块在基于第一语音数据中是否包含平稳噪音,对第一语音数据进行处理,得到第二语音数据时,具体用于:
132.若第一语音数据中包含平稳噪音,则对第一语音数据中的平稳噪音进行处理,得到第二语音数据;
133.若第一语音数据中不包含平稳噪音,则将第一语音数据作为第二语音数据。
134.可选地,上述装置还包括静音处理模块,静音处理模块用于:
135.基于第二语音数据中是否包含静音,对第二语音数据进行处理得到第三语音数据。
136.可选地,上述静音处理模块具体用于:
137.若第二语音数据中包含静音,则对第二语音数据中的静音进行处理得到第三语音数据;
138.若第二语音数据中不包含静音,则将第二语音数据作为第三语音数据。
139.可选地,上述装置还包括声纹特征提取模块,声纹特征提取模块用于:
140.基于预设步长以及预设滑窗,将第三语音数据划分为至少一个第四语音数据;
141.通过第四语音数据提取待处理声纹特征。
142.可选地,上述装置还包括:
143.语音清洗模块,用于在确定待处理声纹有效时,将离群声纹特征对应的语音数据从第四语音数据中去除,其中,离群声纹特征为待处理声纹特征的聚类结果中除目标聚类之外的声纹特征。
144.可以理解的是,本实施例中的声纹特征的有效性检测装置的上述各模块具有实现图1中所示的实施例中的声纹特征的有效性检测方法相应步骤的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块。上述模块可以是软件和/或硬件,上述各模块可以单独实现,也可以多个模块集成实现。对于上述声纹特征的有效性检测装置的各模块的功能描述具体可以参见图1中所示实施例中的声纹特征的有效性检测方法的对应描述,在此不再赘述。
145.本技术实施例提供了一种电子设备,包括处理器和存储器;
146.存储器,用于存储操作指令;
147.处理器,用于通过调用操作指令,执行本技术任一实施方式中所提供的声纹特征的有效性检测方法。
148.作为一个示例,图6示出了本技术实施例所适用的一种电子设备的结构示意图,如图6所示,该电子设备2000包括:处理器2001和存储器2003。其中,处理器2001和存储器2003相连,如通过总线2002相连。可选的,电子设备2000还可以包括收发器2004。需要说明的是,
实际应用中收发器2004不限于一个,该电子设备2000的结构并不构成对本技术实施例的限定。
149.其中,处理器2001应用于本技术实施例中,用于实现上述方法实施例所示的方法。收发器2004可以包括接收机和发射机,收发器2004应用于本技术实施例中,用于执行时实现本技术实施例的电子设备与其他设备通信的功能。
150.处理器2001可以是cpu(central processing unit,中央处理器),通用处理器,dsp(digital signal processor,数据信号处理器),asic(application specific integrated circuit,专用集成电路),fpga(field programmable gate array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本技术公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器2001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,dsp和微处理器的组合等。
151.总线2002可包括一通路,在上述组件之间传送信息。总线2002可以是pci(peripheral component interconnect,外设部件互连标准)总线或eisa(extended industry standard architecture,扩展工业标准结构)总线等。总线2002可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
152.存储器2003可以是rom(read only memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,ram(random access memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是eeprom(electrically erasable programmable read only memory,电可擦可编程只读存储器)、cd

rom(compact disc read only memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
153.可选的,存储器2003用于存储执行本技术方案的应用程序代码,并由处理器2001来控制执行。处理器2001用于执行存储器2003中存储的应用程序代码,以实现本技术任一实施方式中所提供的声纹特征的有效性检测方法。
154.本技术实施例提供的电子设备,适用于上述方法任一实施例,在此不再赘述。
155.本技术实施例提供了一种电子设备,与现有技术相比,通过对待处理声纹特征进行聚类处理,得到目标聚类,并基于目标聚类中是否存在与目标聚类的质心的距离不小于预设距离的声纹特征,确定待处理声纹的有效性。基于本方案,能够实现对声纹特征的有效性的检测,保证用于身份识别的声纹特征的有效性,从而能够为提高声纹识别的识别效果提供基础。
156.本技术实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述方法实施例所示的声纹特征的有效性检测方法。
157.本技术实施例提供的计算机可读存储介质,适用于上述方法任一实施例,在此不再赘述。
158.本技术实施例提供了一种计算机可读存储介质,与现有技术相比,通过对待处理声纹特征进行聚类处理,得到目标聚类,并基于目标聚类中是否存在与目标聚类的质心的距离不小于预设距离的声纹特征,确定待处理声纹的有效性。基于本方案,能够实现对声纹特征的有效性的检测,保证用于身份识别的声纹特征的有效性,从而能够为提高声纹识别的识别效果提供基础。
159.应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
160.以上仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜