一种基于声纹识别的钞票兑换方法及装置与流程

2023-01-15 08:12:55 来源：中国专利 TAG：

1.本技术属于声纹识别技术领域，具体地讲，提供了一种基于声纹识别的钞票兑换方法及装置。

背景技术：

2.随着线上预约渠道的普及和纪念钞的发行量逐年增加，民众对于纪念钞的预约热度逐年攀升，往往造成部分热门网点在纪念钞发行开始的前几分钟便抢购一空的局面，因此纪念钞预约兑换过程中的不公平现象应予以重视。因为有相当一部分情况是一些人员采用网页脚本等技术性手段进行抢购。此外，现有纪念钞预约机制中，预约前一般需要用户输入图形验证码进行验证，考虑到部分中老年客户操作不便，尤其是对手机输入法等操作困难，因此预约效率十分低下。

技术实现要素：

3.本技术提供了一种基于声纹识别的钞票兑换方法及装置，以至少解决现有的纪念钞预约机制中预约前一般需要用户输入图形验证码进行验证，考虑到部分中老年客户操作不便，尤其是对手机输入法等操作困难，因此预约效率十分低下的问题。
4.根据本技术的一个方面，提供了一种基于声纹识别的钞票兑换方法，包括：
5.获取语音信息并利用fbank特征和mfcc特征从语音信息中提取声纹特征；
6.将声纹特征转换为特征向量并分别存储；
7.将存储的声纹特征与数据库中预存的声纹特征进行匹配，并根据匹配结果判断是否能够兑换钞票。
8.在一实施例中，利用fbank特征和mfcc特征从语音信息中提取声纹特征，包括：
9.对语音信息进行预处理；
10.对预处理后的语音信息进行离散傅里叶变换获得频域信息；
11.对频域信息继续宁短时傅里叶变换得到声音频谱并将每一帧频谱按照时间顺序进行拼接；
12.将拼接后的频谱信息转换为梅尔刻度频谱并取对数获得fbank特征；
13.对fbank特征每帧进行离散傅里叶变换，去处特征中的毛刺，获得mfcc特征；
14.对mfcc特征做差分处理获得声纹特征。
15.在一实施例中，对语音信息进行预处理，包括：
16.加重语音信息中的高频语音能量；
17.对语音信息做采样分帧处理，通过重叠取帧方式保证声学特征的平滑性。
18.在一实施例中，将存储的声纹特征与数据库中预存的声纹特征进行匹配，并根据匹配结果判断是否能够兑换钞票，包括：
19.将存储的声纹特征与数据库中预存的声纹特征进行匹配获得相似度；
20.判断相似度是否达到预设得阈值，如果是，则允许兑换钞票。
21.根据本技术的另一个方面，还提供了一种基于声纹识别的钞票兑换装置，包括：
22.声纹特征提取单元，用于获取语音信息并利用fbank特征和mfcc特征从语音信息中提取声纹特征；
23.特征向量存储单元，用于将声纹特征转换为特征向量并分别存储；
24.匹配单元，用于将存储的声纹特征与数据库中预存的声纹特征进行匹配，并根据匹配结果判断是否能够兑换钞票。
25.在一实施例中，声纹特征提取单元包括：
26.预处理模块，用于对语音信息进行预处理；
27.离散傅里叶变换模块，用于对预处理后的语音信息进行离散傅里叶变换获得频域信息；
28.拼接模块，用于对频域信息继续宁短时傅里叶变换得到声音频谱并将每一帧频谱按照时间顺序进行拼接；
29.转换模块，用于将拼接后的频谱信息转换为梅尔刻度频谱并取对数获得fbank特征；
30.毛刺剔除模块，用于对fbank特征每帧进行离散傅里叶变换，去处特征中的毛刺，获得mfcc特征；
31.差分处理模块，用于对mfcc特征做差分处理获得声纹特征。
32.在一实施例中，预处理模块包括：
33.加重模块，用于加重语音信息中的高频语音能量；
34.平滑模块，用于对语音信息做采样分帧处理，通过重叠取帧方式保证声学特征的平滑性。
35.在一实施例中，匹配单元包括：
36.相似度匹配模块，用于将存储的声纹特征与数据库中预存的声纹特征进行匹配获得相似度；
37.判断模块，用于判断相似度是否达到预设得阈值，如果是，则允许兑换钞票。
38.本技术避免了现有技术通过破解脚本进行大量预约兑换钞票，实现了利用声纹进行识别，用户只需要按照提示操作录入语音即可简单易行地完成。
附图说明
39.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
40.图1为本技术提供的一种基于声纹识别的钞票兑换方法流程图。
41.图2为本技术实施例中利用fbank特征和mfcc特征从语音信息中提取声纹特征的流程图。
42.图3为本技术实施例对语音信息进行预处理的方法流程图。
43.图4为本技术实施例将存储的声纹特征与数据库中预存的声纹特征进行匹配的方法流程图。
44.图5为本技术提供的一种基于声纹识别的钞票兑换装置结构框图。
45.图6为本技术实施例中声纹特征提取单元的结构框图。
46.图7为本技术实施例中预处理模块的结构框图。
47.图8为本技术实施例中匹配单元的结构框图。
48.图9为本技术实施例中一种电子设备的具体实施方式。
具体实施方式
49.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
50.随着线上预约渠道的普及和纪念钞的发行量逐年增加，民众对于纪念钞的预约热度逐年攀升，往往造成部分热门网点在纪念钞发行开始的前几分钟便抢购一空的局面，因此纪念钞预约兑换过程中的不公平现象应予以重视。因为有相当一部分情况是一些人员采用网页脚本等技术性手段进行抢购。此外，现有纪念钞预约机制中，预约前一般需要用户输入图形验证码进行验证，考虑到部分中老年客户操作不便，尤其是对手机输入法等操作困难，因此预约效率十分低下。
51.为了解决上述问题，本技术首先需要在预约前通过线上预约系统采集用户的语音声纹信息，构建客户信息库，在纪念钞兑换时，再次采集客户语音声纹信息，通过语音识别做识别，识别通过则予以兑换，不通过则不予兑换。
52.如图1所示，本技术提供了一种基于声纹识别的钞票兑换方法，包括：
53.s101：获取语音信息并利用fbank特征和mfcc特征从语音信息中提取声纹特征。
54.s102：将声纹特征转换为特征向量并分别存储。
55.s103：将存储的声纹特征与数据库中预存的声纹特征进行匹配，并根据匹配结果判断是否能够兑换钞票。
56.在一实施例中，利用fbank特征和mfcc特征从语音信息中提取声纹特征，如图2所示，包括：
57.s201：对语音信息进行预处理。
58.s202：对预处理后的语音信息进行离散傅里叶变换获得频域信息。
59.s203：对频域信息继续宁短时傅里叶变换得到声音频谱并将每一帧频谱按照时间顺序进行拼接。
60.s204：将拼接后的频谱信息转换为梅尔刻度频谱并取对数获得fbank特征。
61.s205：对fbank特征每帧进行离散傅里叶变换，去处特征中的毛刺，获得mfcc特征。
62.s206：对mfcc特征做差分处理获得声纹特征。
63.在一实施例中，对语音信息进行预处理，如图3所示，包括：
64.s301：加重语音信息中的高频语音能量。
65.s302：对语音信息做采样分帧处理，通过重叠取帧方式保证声学特征的平滑性。
66.在一实施例中，将存储的声纹特征与数据库中预存的声纹特征进行匹配，并根据匹配结果判断是否能够兑换钞票，如图4所示，包括：
67.s401：将存储的声纹特征与数据库中预存的声纹特征进行匹配获得相似度。
68.s402：判断相似度是否达到预设得阈值，如果是，则允许兑换钞票。
69.本技术首先需要在预约前通过线上预约系统采集用户的语音声纹信息，构建客户信息库，在纪念钞兑换时，再次采集客户语音声纹信息，通过语音识别做识别，识别通过则予以兑换，不通过则不予兑换。本技术所提出的基于声纹识别的纪念钞预约兑换方法主要包括，线上预约系统客户基础信息采集，声纹特征采集，兑换系统声纹特征库建立，声纹识别，用户兑换等五大部分，从开发角度，技术人员主要负责：
70.1.线上预约系统客户基础信息采集模块的构建。
71.2.线上预约系统客户声纹特征采集模块的构建。
72.3.声纹识别算法的实现。
73.4.识别流程在兑换系统的嵌入。
74.在一具体实施例中，首先客户输入基础信息及语音信息；对语音信息预加重处理，加重高频语音能量，从而使高频信息凸显；对语音信息做采样分帧处理，采用重叠取帧方式保证声学特征的平滑性；对分帧后的语音信息做离散傅里叶变换，提取频域信息；对信号做短时傅里叶变换得到声音频谱，将每一帧频谱之按时间顺序拼接；将频谱信息转换为梅尔刻度频谱并取对数获得fbank特征；对fbank特征每帧进行离散傅里叶变换，去处特征中的毛刺，获得mfcc特征；对mfcc特征做差分处理，获得声纹特征1；将声纹特征1输入兑换系统，兑换系统将特征数据转换为特征向量，并按证件号做分别存储；客户兑换时，需重新输入语音信息，按照上述方法提取声纹特征2，将声纹特征1与声纹特征2做模式匹配获得相似度，相似度达到设定阈值则判定为同一客户，允许客户兑换，否则不许兑换，该笔订单取消。
75.基于同一发明构思，本技术实施例还提供了一种基于声纹识别的钞票兑换装置，可以用于实现上述实施例中所描述的方法，如下面实施例所述。由于该基于声纹识别的钞票兑换装置解决问题的原理与基于声纹识别的钞票兑换方法相似，因此基于声纹识别的钞票兑换装置的实施可以参见基于声纹识别的钞票兑换方法的实施，重复之处不再赘述。以下所使用的，术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。
76.根据本技术的另一个方面，还提供了一种基于声纹识别的钞票兑换装置，如图5所示，包括：
77.声纹特征提取单元501，用于获取语音信息并利用fbank特征和mfcc特征从语音信息中提取声纹特征；
78.特征向量存储单元502，用于将声纹特征转换为特征向量并分别存储；
79.匹配单元503，用于将存储的声纹特征与数据库中预存的声纹特征进行匹配，并根据匹配结果判断是否能够兑换钞票。
80.在一实施例中，如图6所示，声纹特征提取单元501包括：
81.预处理模块601，用于对语音信息进行预处理；
82.离散傅里叶变换模块602，用于对预处理后的语音信息进行离散傅里叶变换获得频域信息；
83.拼接模块603，用于对频域信息继续宁短时傅里叶变换得到声音频谱并将每一帧
频谱按照时间顺序进行拼接；
84.转换模块604，用于将拼接后的频谱信息转换为梅尔刻度频谱并取对数获得fbank特征；
85.毛刺剔除模块605，用于对fbank特征每帧进行离散傅里叶变换，去处特征中的毛刺，获得mfcc特征；
86.差分处理模块606，用于对mfcc特征做差分处理获得声纹特征。
87.在一实施例中，如图7所示，预处理模块601包括：
88.加重模块701，用于加重语音信息中的高频语音能量；
89.平滑模块702，用于对语音信息做采样分帧处理，通过重叠取帧方式保证声学特征的平滑性。
90.在一实施例中，如图8所示，匹配单元503包括：
91.相似度匹配模块801，用于将存储的声纹特征与数据库中预存的声纹特征进行匹配获得相似度；
92.判断模块802，用于判断相似度是否达到预设得阈值，如果是，则允许兑换钞票。
93.本技术避免了现有技术通过破解脚本进行大量预约兑换钞票，实现了利用声纹进行识别，用户只需要按照提示操作录入语音即可简单易行地完成。
94.本技术的实施例还提供能够实现上述实施例中的方法中全部步骤的一种电子设备的具体实施方式，参见图9，所述电子设备具体包括如下内容：
95.处理器(processor)901、内存902、通信接口(communications interface)903、总线904和非易失性存储器905；
96.其中，所述处理器901、内存902、通信接口903通过所述总线904完成相互间的通信；
97.所述处理器901用于调用所述内存902和非易失性存储器905中的计算机程序，所述处理器执行所述计算机程序时实现上述实施例中的方法中的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：
98.s101：获取语音信息并利用fbank特征和mfcc特征从语音信息中提取声纹特征。
99.s102：将声纹特征转换为特征向量并分别存储。
100.s103：将存储的声纹特征与数据库中预存的声纹特征进行匹配，并根据匹配结果判断是否能够兑换钞票。
101.本技术的实施例还提供能够实现上述实施例中的方法中全部步骤的一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例中的方法的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：
102.s101：获取语音信息并利用fbank特征和mfcc特征从语音信息中提取声纹特征。
103.s102：将声纹特征转换为特征向量并分别存储。
104.s103：将存储的声纹特征与数据库中预存的声纹特征进行匹配，并根据匹配结果判断是否能够兑换钞票。
105.本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于硬件
程序类实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。虽然本说明书实施例提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的装置或终端产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境，甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下，并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本说明书实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现，也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。以上所述仅为本说明书实施例的实施例而已，并不用于限制本说明书实施例。对于本领域技术人员来说，本说明书实施例可以有各种更改和变化。凡在本说明书实施例的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书实施例的权利要求范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：基于语音识别的业务办理方法、装置及电子设备与流程

一种基于声纹识别的钞票兑换方法及装置与流程

相关文献

最热文献