语音认证设备、语音认证方法以及记录介质与流程

2021-09-28 23:31:00 来源：中国专利 TAG：语音认证介质记录方法

1.本发明涉及语音认证设备、语音认证方法和记录介质。

背景技术：

2.在接受诸如保险服务、银行账户询问和会员服务等电话询问的服务中，可以进行使用语音认证的身份验证以便仅向具体人员公开信息。
3.专利文献1公开了一种用于指定电话中的说话者是预先注册的客户的系统。系统将从说话者的语音中提取的声纹信息与其中注册有声纹的数据库进行比较，并且指定说话者是预先注册的客户。
4.先前技术参考
5.专利文献
6.专利文献1：日本专利申请特许公开第jp 2010
‑
113167号

技术实现要素：

7.本发明要解决的问题
8.根据专利文献1中所描述的技术，其中注册有声纹的数据库中存在多个群组，并且系统将说话者的声纹与每个群组的参照人的声纹进行比较。然后，系统依次将说话者的声纹与属于最相似群组的已注册人员的声纹进行比较，并且识别出最相似的已注册人员。在这种情况下，依次将说话者的声纹与数据库中注册的声纹进行比较会花费时间。
9.本发明的示例目标是在经由电话进行身份验证的情形下，在短时间内并且以高精度实现语音认证。
10.用于解决问题的手段
11.根据本发明的示例方面，提供了一种语音认证设备，包括：
12.输出单元，相比于与指示回答的文本信息不相关联的问题，该输出单元优先输出与指示回答的文本信息相关联的问题，以及
13.认证单元，该认证单元使用作为对由输出单元输出的问题的回答而获取的语音信息来进行语音认证。
14.根据本发明的另一示例方面，提供了一种语音认证方法，包括：
15.相比于与指示回答的文本信息不相关联的问题，优先输出与指示回答的文本信息相关联的问题，以及
16.使用作为对输出的问题的回答而获取的语音信息来进行语音认证。
17.根据本发明的另一示例方面，提供了一种存储程序的记录介质，该程序使计算机执行：
18.相比于与指示回答的文本信息不相关联的问题，优先输出与指示回答的文本信息相关联的问题的处理，以及
19.使用作为对输出的问题的回答而获取的语音信息来进行语音认证的处理。
20.本发明的效果
21.根据本发明，能够在短时间内并且以高精度通过语音进行认证。
附图说明
22.图1是示例实施例的语音认证系统的功能框图的示例。
23.图2是示例实施例的语音认证设备的功能框图的示例。
24.图3是示意性地图示由示例实施例的语音认证设备处理的信息的示例的图。
25.图4是图示根据示例实施例的语音认证设备的硬件配置的示例的图。
26.图5是图示示例实施例的语音认证设备的处理流程的示例的流程图。
27.图6是示例实施例的语音认证设备的功能框图的示例。
28.图7是图示示例实施例的语音认证设备的处理流程的示例的流程图。
29.图8是示例实施例的语音认证设备的功能框图的示例。
30.图9是图示示例实施例的语音认证设备的处理流程的示例的流程图。
31.图10是示例实施例的语音认证设备的功能框图的示例。
具体实施方式
32.<第一示例实施例>
33.将描述本发明的第一示例实施例。使用图1的功能框图，将描述示例实施例的语音认证系统的总体视图。语音认证设备10连接至接线员终端20，并且发送和接收语音认证所必需的信息。
34.语音认证是一种使用语音的特征量来识别说话人员的认证方法。作为语音认证方法，存在一种用于注册和认证具体短语的语音信息的方法(依赖文本的方法)以及一种不依赖于短语的注册和认证非固定自然对话的语音信息的方法(不依赖文本的方法)。因为依赖文本的方法使用具体短语的话语语音数据进行注册和认证，所以与不依赖短语的不依赖文本的方法相比，能够以更短的话语并且以高精度进行认证。此外，即使在不依赖文本的方法中，如果用于验证的语音所指示的文本信息是已知的，则能够以高精度进行认证。
35.语音认证设备10包括识别信息获取单元11、存储单元12、输出单元13、语音获取单元14和认证单元15。接线员终端20是接线员在呼叫中心等中使用的终端，并且包括通信单元21、输入单元22和显示单元23。这些配置经由诸如互联网等通信网络连接，并且能够互相通信。
36.将参考在呼叫中心从事电话应答工作的接线员使用语音认证在电话上进行客户的识别的示例来描述示例实施例。在示例实施例中，“客户”是作为识别对象的人员。
37.接线员是接收来自客户的电话询问并应答询问的人员。接线员在电话应答工作期间操作接线员终端20。在接线员向通过电话做出询问的客户公开诸如个人信息等限制性信息时，接线员需要在公开信息之前确认该客户是能够向其公开个人信息的人员。在本示例实施例中，语音认证用于确认客户的身份。
38.接线员终端20是例如但不限于个人计算机、智能电话、平板终端、移动电话、专用终端等。
39.输入单元22接收识别客户的识别信息的输入，并将输入的信息发送至识别信息获
取单元11。接线员将从客户听到的识别信息输入到输入单元22。输入单元22可以被实现为一种用于接收来自接线员的输入的设备。输入单元22可以包括但不限于连接到个人计算机的键盘、智能电话或平板终端的触摸面板等。
40.识别信息获取单元11获取客户的识别信息。可以从外部终端接收识别信息，也可以将识别信息输入到语音认证设备10。识别信息是例如但不限于电话号码、注册号、姓名、邮政编码、地址、出生日期、发音短语、虹膜、人脸图像、指纹、掌纹、静脉、步态等。
41.将参考图2描述存储单元12中包括的数据库的概念。存储单元12包括：认证数据库1b，其中记录了客户语音的特征量；以及问题数据库2b，其中记录了用于认证客户的问题。问题数据库2b以彼此相关联的方式记录指示当客户的身份被确认时接线员要向客户询问的问题的信息，以及指示对这些问题的回答的信息。
42.将参考图3描述问题数据库2b中记录的信息。图3是问题数据库2b中记录的信息的示例。问题数据库2b彼此相关联地记录用于认证客户的问题和回答。与客户识别信息相关联地记录问题和回答的组合。
43.在图3中的示例中，将记录的问题“出生日期是什么？”的回答记录为文本信息“ο月ο日”。另一方面，对于记录的问题“您移动电话的后四位数是什么？”，未记录指示回答的文本信息。以这种方式，问题数据库2b记录了回答被记录为文本信息的几种类型的问题以及回答未被记录为文本信息的问题。
44.输出单元13使用由识别信息获取单元11获取的识别信息以从问题数据库2b中记录的问题中指定与识别信息所指示的客户相关联的问题，并优先与文本信息相关联地输出记录有回答的问题。输出单元13可以输出在显示单元23上显示信息的指令，或者输出单元13本身可以具有显示单元23的功能。
45.显示单元23显示接线员参照的信息。显示单元23显示从输出单元13接收到的信息。由显示单元23显示的信息可以包括例如客户的身份验证所必需的信息、指示接线员要向客户询问的问题的信息、语音认证的结果等。显示单元23是输出可视信息的设备，并且例如但不限于显示器、灯等。
46.代替通过显示单元23向接线员传达信息，扬声器(未示出)可以用语音将从输出单元13接收到的信息传达给接线员。而且，显示单元23可以包括扬声器(未示出)。在这种情况下，显示单元23将从输出单元13接收到的信息作为音频信息和可视信息输出。未示出的扬声器是例如但不限于嵌入在个人计算机或连接到平板终端的耳麦中的扬声器，或者是提供在智能电话或平板终端中的扬声器。
47.通信单元21在接线员终端20与客户之间的电话通信期间接收客户的语音，并将接收到的语音发送到语音获取单元14。由通信单元21发送至语音获取单元14的语音包括客户的语音的至少一部分就足够了。例如，通信单元21在接线员向客户询问问题之后，发送客户回答问题的语音。通信单元21可以被设计成在询问问题之后简单地获取客户的声音。
48.通信单元21可以被实现为接线员用来与客户进行电话通信的设备。通信单元21包括但不限于连接到个人计算机或平板终端的耳麦、智能电话或平板终端的传声器和扬声器等。
49.语音获取单元14获取客户的语音，并将该语音发送至认证单元15。由语音获取单元14发送至认证单元15的语音包括客户的语音的至少一部分就足够了。例如，语音获取单
元14在输出单元13输出了信息(例如，要用于认证的问题)之后获取语音。
50.认证单元15参照由语音获取单元14获取的语音或语音的特征量，并将特征量与认证数据库1b中记录的语音的特征量进行比较。如果认证成功，则认证单元15确定客户是识别信息所指示的人员。
51.接着，将描述其中使用一个或多个计算机实现了语音认证设备10和接线员终端20的硬件配置的示例。语音认证设备10和接线员终端20的功能单元由硬件和软件的任何组合实现，诸如任何计算机的cpu(中央处理单元)、存储器、加载到存储器中的程序、诸如用于存储程序的硬盘等存储单元以及网络连接接口。本领域技术人员应当理解，这种实施方式方法和设备存在各种修改。除了在设备出厂之前存储的程序外，存储单元还可以在光盘、磁光盘、诸如半导体快闪存储器的存储介质中存储程序，或者从互联网上的服务器下载的程序。
52.图4是图示语音认证设备10和接线员终端20的硬件结构的框图。如图4中所示，语音认证设备10和接线员终端20包括处理器1a、存储器2a、输入/输出接口3a、外围电路4a、通信接口5a和总线6a。外围电路4a包括各种模块。语音认证设备10和接线员终端20可能没有外围电路4a。附带地，语音认证设备10和接线员终端20可以由物理地和/或逻辑地划分的多个设备构成。在这种情况下，多个设备中的每个可以包括上述硬件配置。
53.总线6a是供处理器1a、存储器2a、输入/输出接口3a、外围电路4a和通信接口5a互相发送和接收数据的数据传输路径。处理器1a是诸如cpu、gpu(图形处理单元)或微处理器的算术处理单元。例如，处理器1a可以根据存储器2a中存储的各种程序来执行该过程。
54.存储器2a例如是诸如ram(随机存取存储器)或rom(只读存储器)等存储器，并且存储程序和各种数据。
55.输入/输出接口3a包括用于从输入设备、外部设备、外部存储单元、外部传感器、相机等获取信息的接口，以及用于将信息输出至输出设备、外部设备、外部存储单元等的接口。输入设备例如是触摸面板、键盘、鼠标、传声器、相机等。输出设备例如是显示器、扬声器、打印机、灯等。
56.处理器1a可以向每个模块发出指令并基于这些操作的结果来进行操作。
57.通信接口5a能够实现语音认证设备10和接线员终端20与外部设备进行通信，并且还能够实现语音认证设备10和接线员终端20彼此通信。应当注意，语音认证设备10或接线员终端20的一些功能可以由计算机配置。
58.接着，将参考图5的流程图描述本示例实施例中的语音认证方法。接线员操作接线员终端20以开始与客户的电话通信。接线员在电话通信期间接收客户的识别信息，并将其输入到输入单元22(s11)。输入单元22将接收到的客户的识别信息发送至识别信息获取单元11。识别信息获取单元11基于接收到的客户的识别信息来指定与来自存储单元12中的问题数据库2b的识别信息相关联的问题的群组。
59.输出单元13从与客户的识别信息相关联的问题的群组中向显示单元23发送与指示回答的文本信息相关联并且被记录的问题。显示单元23显示从输出单元13发送的问题(s13)。接线员通过电话向客户询问显示器23上显示的问题。
60.在接线员询问问题之后，通信单元21获取指示问题的回答的语音，并将该语音发送至语音获取单元14(s14)。也就是说，在输出单元13输出问题之后，通信单元21获取客户的语音。语音获取单元14将接收到的客户的语音发送至认证单元15。认证单元15使用接收
到的语音进行认证(s15)。
61.根据上述示例实施例，当进行客户的语音认证时，语音认证设备10从数据库中记录的问题中选择与指示回答的文本信息相关联并且被记录的问题，并将该问题呈现给接线员，从而让接线员询问问题。因为接线员使客户容易地输出其文本信息是已知的语音，所以与随机生成问题的情况相比，可变得能够在更短的时间内通过语音进行身份验证。
62.<第二示例实施例>
63.第二示例实施例与第一示例实施例的不同之处在于语音认证设备10独立地起作用而不与接线员终端20通信。本示例实施例描述了语音认证设备10。
64.将描述本发明的第二示例实施例。使用图6的功能框图，将描述第二示例实施例的语音认证设备的总体图像。语音认证设备10包括识别信息获取单元11、存储单元12、输出单元13、语音获取单元14和认证单元15。这些单元经由诸如互联网等通信网络连接，并且可以互相通信。
65.识别信息获取单元11获取客户的识别信息。可以从外部终端接收识别信息，或者可以直接输入到语音认证设备10。识别信息是例如但不限于电话号码、注册号、姓名、邮政编码、地址、出生日期、发音短语、虹膜、人脸图像、指纹、掌纹、静脉、步态等。
66.输出单元13使用由识别信息获取单元11获取的识别信息，以从问题数据库2b中记录的问题中指定与识别信息所指示的客户相关联的问题，并优先输出与指示回答的文本信息相关联并且被记录的问题。
67.语音获取单元14获取客户的语音，并将该语音发送至认证单元15。由语音获取单元14发送至认证单元15的语音包括客户的语音的至少一部分就足够了。例如，语音获取单元14在输出单元13输出信息(例如，要用于认证的问题)之后获取语音。
68.认证单元15参照语音获取单元14获取的语音或语音的特征量，并将特征量与认证数据库1b中记录的语音的特征量进行比较。如果认证成功，则认证单元15确定客户是识别信息所指示的人员。
69.接着，将参考图7的流程图描述本示例实施例的语音认证设备10的处理流程的示例。当输入客户的识别信息时(s21)，语音认证设备10从与客户的识别信息相关联的问题中输出与指示回答的文本信息相关联并且被记录的问题(s22)。在输出问题之后，语音认证设备10获取指示问题的回答的语音(s23)，并使用获取的语音进行认证(s24)。
70.根据上述示例实施例，当对客户进行语音认证时，语音认证设备10从数据库中记录的问题中优先输出与指示回答的文本信息相关联并且被记录的问题。因为客户更有可能尝试回答问题并输出文本信息是已知的语音，所以与随机向客户输出问题的情况相比，变得能够在短时间内通过语音进行身份验证。
71.<第三示例实施例>
72.第三示例实施例与第一实施例和第二实施例的不同之处在于，语音认证设备10还包括优先级设置单元16。语音认证设备10的其他元件与第一示例实施例和第二示例实施例的这些元件相同。对于与第一示例实施例和第二示例实施例相同的部分，将省略其描述。
73.使用图8的功能框图，将描述本示例实施例的语音认证设备的总体图像。除了根据第一示例实施例的语音认证设备的配置之外，语音认证设备10还包括优先级设置单元16。
74.优先级设置单元16设置输出单元13从问题数据库2b中输出的问题的优先级。与第
一示例实施例相似，问题数据库2b存储相关联回答被记录为文本信息的多个问题以及相关联回答未被记录为文本信息的多个问题。
75.在问题数据库2b中记录的多个问题当中，相比于回答未被记录为文本信息的问题的优先级，优先级设置单元16为回答被记录为文本信息的问题设置更高的优先级。
76.存储单元12与问题数据库2b中记录的问题相关联地记录由优先级设置单元16设置的优先级。
77.输出单元13基于优先级设置单元16为问题设置的优先级，来从问题数据库2b中记录的问题中选择并输出具有高优先级的问题。例如，输出单元13输出一个或多个问题，并且如果最先选择和输出的问题对客户的身份验证无效，则可以输出次高优先级的问题。
78.接着，将参考图9的流程图描述本示例实施例的语音认证设备10的处理流程的示例。当输入客户的识别信息时(s31)，语音认证设备10基于客户的识别信息来参照数据库，并且设置用于输出问题的优先级(s32)。接着，语音认证设备10与问题相关联地记录设置的优先级(s33)。接着，语音认证设备10从与客户的识别信息相关联的问题中输出优先级最高的问题(s34)。在输出问题之后，语音认证设备10获取指示问题的回答的语音(s35)，并使用获取的语音进行认证(s36)。
79.应当注意，上述处理流程是示例，并且可以适当地改变从s31到s36的每个步骤。例如，可以在输入客户的识别信息的步骤(s31)之前执行设置问题的优先级的步骤(s32)和与问题相关联地记录优先级的步骤(s33)。而且，可以在执行描述的上述处理流程之前设置问题的优先级，或者可以在新问题被记录在问题数据库2b中时的时刻再次设置(更新)问题的优先级。设置问题的优先级的时刻和关于问题记录优先级的时刻不受限制。
80.根据上述示例实施例，当进行客户的语音认证时，语音认证设备10从数据库中记录的问题设置要输出的问题的优先级。因为语音认证设备可以优先询问与文本信息的回答相关联的问题，所以客户更有可能尝试回答问题并输出已知文本信息的语音。因为客户输出的语音文本信息是可以预测的，所以与随机向客户输出问题的情况相比，可以在短时间内实施通过语音的身份验证。
81.<变型>
82.将描述适用于第一示例实施例至第三示例实施例的变型。虽然上述示例实施例的语音认证设备10包括存储设备12，但是在修改的示例中，存储单元12可以安装在不同于语音认证设备10的外部终端上。
83.在这种情况下，语音认证设备10和存储单元12可以经由诸如互联网等通信网络互相通信。
84.将描述另一种变型。在第一示例实施例中，接线员询问从接线员终端20的显示单元23输出的问题，并且使用回答问题的客户的语音进行语音认证。然而，除了将问题输出到接线员终端20之外，输出单元13还可以经由通信单元21通过自动语音等直接向客户询问问题。在这种情况下，客户听取通过用于呼叫的终端(未示出)作为自动语音输出的问题，并说出问题的回答。接线员终端20的通信单元21获取客户说出的语音。
85.在以上变型中，因为接线员不需要向客户询问问题，所以能够减少接线员的识别工作所需的工作量。
86.下面将描述其他变型。接线员终端20中的显示单元23可以显示客户的认证结果，
或者可以根据认证结果显示与客户的识别信息相关联的预定信息。
87.语音认证设备10可以具有接线员终端20的功能。即使在这种情况下也可以获得相同的效果。
88.与语音认证设备10通信的接线员终端20的数目可以是多个，或者语音认证设备10可以包括多个接线员终端20。
89.上述变型可以与第一示例实施例至第三示例实施例适当地组合，并且变型可以彼此组合。第一示例实施例至第三示例实施例中描述的配置可以互相组合。
90.<第四示例实施例>
91.图10示出了根据第四示例实施例的语音认证设备的功能配置。语音认证设备40包括输出单元41和认证单元42。相比于与指示回答的文本信息不相关联的问题，输出单元41优先输出与指示回答的文本信息相关联的问题。认证单元42使用作为对由输出单元41输出的问题的回答而获取的语音信息来进行语音认证。
92.另外，在不脱离本发明的精神的情况下，可以用公知的部件适当地替换上述示例实施例中的部件。而且，本发明的技术内容不限于上述示例实施例，并且可以在不脱离本发明的精神的情况下做出各种变型。
93.还可以将上述示例实施例的部分或全部描述为以下补充说明，但不限于此。
94.(补充说明1)
95.一种语音认证设备，包括：
96.输出单元，相比于与指示回答的文本信息不相关联的问题，该输出单元优先输出与指示回答的文本信息相关联的问题，以及
97.认证单元，该认证单元使用作为对由输出单元输出的问题的回答而获取的语音信息来进行语音认证。
98.(补充说明2)
99.根据补充说明1所述的语音认证设备，还包括记录单元，在记录单元中与用户的识别信息相关联地记录问题，
100.其中，问题包括与指示对问题的回答的文本信息相关联并且指示对问题的回答的文本信息被记录的问题，以及指示对问题的回答的文本信息未被记录的问题。
101.(补充说明3)
102.根据补充说明1或2所述的语音认证设备，其中，语音信息包括在输出单元输出问题之后由用户输出的语音。
103.(补充说明4)
104.根据补充说明1至3中的任一项所述的语音认证设备，还包括优先级设置单元，该优先级设置单元设置问题的优先级，
105.其中，问题的优先级指示输出单元输出问题的优先级，
106.其中，记录单元记录问题的优先级，并且
107.其中，相比于与指示回答的文本信息不相关联的问题，优先级设置单元为与指示回答的文本信息相关联的问题设置更高的优先级。
108.(补充说明5)
109.根据补充说明4所述的语音认证设备，其中，当认证单元认证失败时，输出单元输
出次高优先级的问题。
110.(补充说明6)
111.根据补充说明1至5中的任一项所述的语音认证设备，其中，输出单元提示接线员向用户询问输出单元上显示的问题。
112.(补充说明7)
113.一种语音认证方法，包括：
114.相比于与指示回答的文本信息不相关联的问题，优先输出与指示回答的文本信息相关联的问题，以及
115.使用作为对输出的问题的回答而获取的语音信息来进行语音认证。
116.(补充说明8)
117.一种存储程序的记录介质，该程序使计算机执行：
118.相比于与指示回答的文本信息不相关联的问题，优先输出与指示回答的文本信息相关联的问题处理，以及
119.使用作为对输出的问题的回答而获取的语音信息来进行语音认证的处理。
120.虽然已经参考示例实施例描述了本发明，但是本发明不限于以上示例实施例。在本发明的范围内，可以对本发明的配置和细节做出本领域技术人员能够理解的各种改变。也就是说，不用说，本发明包括本领域技术人员可以根据包括权利要求的范围和技术原理的整个公开内容做出的各种变型和变化。另外，上面提及的专利文献的每个公开内容均以引用的方式并入本文献中。
121.本技术要求基于2019年2月18日提交的日本专利申请第2019
‑
026871号的优先权，并将其全部公开内容并入本文中。
122.附图标记的描述
123.1a 处理器
124.2a 存储器
125.3a输入/输出接口
126.4a 外围电路
127.5a 通信接口
128.6a 总线
129.1b 认证数据库
130.2b 问题数据库
131.10 语音认证设备
132.11 识别信息获取单元
133.12 存储单元
134.13 输出单元
135.14 语音获取单元
136.15 认证单元
137.16 优先级设置单元
138.20 接线员终端
139.21 通信单元
140.22 输入单元
141.23 显示单元

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：音乐流派的识别方法、装置、设备及存储介质与流程

语音认证设备、语音认证方法以及记录介质与流程

相关文章

最热文献