首页 > 乐器,声学设备的制造及制作,分析技术 > 正文

一种测试方法及系统与流程

2021-08-13 19:22:00 来源：中国专利 TAG：计算机测试申请方法系统

本申请涉及计算机技术领域，尤其涉及一种测试方法及系统。

背景技术：

随着人机交互技术的发展，用于进行人机交互性能测试的人机交互测试系统越来越重要。

然而，现有的人机交互测试系统存在缺陷，导致人机交互性能测试的测试准确性比较低。

技术实现要素：

本申请实施例的主要目的在于提供一种测试方法及系统，能够针对任一人机交互设备进行准确性较高的人机交互性能测试，如此有利于提高人机交互性能测试的测试准确性。

本申请实施例提供了一种测试方法，所述测试方法应用于测试系统，所述测试系统包括控制设备、待测试设备、人声模拟设备和至少一个噪声模拟设备，所述方法包括：

在所述控制设备接收到待测试场景的描述信息之后，所述控制设备依据所述待测试场景的描述信息，生成待测试语音和待测试噪音；

所述控制设备将所述待测试语音和所述待测试噪音分别发送至所述人声模拟设备和至少一个噪声模拟设备进行播放，以使所述待测试设备接收到待响应声音信号；其中，所述待响应声音信号是由所述人声模拟设备针对所述待测试语音的播放声音信号和所述至少一个噪声模拟设备针对所述待测试噪音的播放声音信号进行混合得到的；

所述待测试设备针对所述待响应声音信号进行预设处理，得到所述待响应声音信号对应的处理数据；

所述待测试设备将所述待响应声音信号对应的处理数据发送给所述控制设备，以使所述控制设备依据所述待响应声音信号对应的处理数据，确定所述待测试设备在所述待测试场景中的人机交互性能。

在一种可能的实施方式中，所述待响应声音信号对应的处理数据的获取过程，包括：

对所述待响应声音信号进行语音识别，得到所述待响应声音信号对应的识别文本；

对所述待响应声音信号对应的识别文本进行对话回复处理，得到所述待响应声音信号对应的响应文本；

根据所述待响应声音信号对应的识别文本和所述待响应声音信号对应的响应文本，确定所述待响应声音信号对应的处理数据。

在一种可能的实施方式中，所述测试系统还包括校准设备；所述方法还包括：

所述控制设备将参考信号分别发送至所述人声模拟设备和各个噪声模拟设备进行播放，以使所述校准设备接收到系统校准信号；其中，所述系统校准信号是根据所述人声模拟设备针对所述参考信号的播放声音信号和所述各个噪声模拟设备针对所述参考信号的播放声音信号确定的；

所述校准设备将所述系统校准信号发送给所述控制设备，以使所述控制设备依据所述系统校准信号和所述参考信号，确定所述测试系统的系统校准数据；

所述控制设备依据所述待测试场景的描述信息，生成待测试语音和待测试噪音，包括：

所述控制设备依据所述测试系统的系统校准数据和所述待测试场景的描述信息，生成待测试语音和待测试噪音。

在一种可能的实施方式中，若所述参考信号包括第一噪声信号，且所述系统校准信号包括各个噪声模拟设备对应的校准信号和所述人声模拟设备对应的校准信号，则所述控制设备将所述参考信号分别发送至所述人声模拟设备和各个噪声模拟设备进行播放，以使所述校准设备接收到系统校准信号，包括：

在所述校准设备位于所述各个噪声模拟设备对应的预设收声位置时，所述控制设备将所述第一噪声信号分别发送至所述各个噪声模拟设备进行播放，以使所述校准设备接收到所述各个噪声模拟设备对应的校准信号；

在所述校准设备位于所述人声模拟设备对应的预设收声位置时，所述控制设备将所述第一噪声信号发送至所述人声模拟设备进行播放，以使所述校准设备接收到所述人声模拟设备对应的校准信号。

在一种可能的实施方式中，若所述参考信号包括第二噪声信号，且所述系统校准信号包括整体校准信号，则所述控制设备将所述参考信号分别发送至所述人声模拟设备和各个噪声模拟设备进行播放，以使所述校准设备接收到系统校准信号，包括：

所述控制设备将所述第二噪声信号分别发送各个噪声模拟设备进行同时播放，以使所述校准设备接收到整体校准信号。

在一种可能的实施方式中，若所述参考信号包括第一噪声信号和第二噪声信号，且所述系统校准信号包括各个噪声模拟设备对应的校准信号、所述人声模拟设备对应的校准信号、和整体校准信号，则所述测试系统的系统校准数据的确定过程，包括：

根据所述人声模拟设备对应的校准信号和所述第一噪声信号，确定所述人声模拟设备对应的校准信息；

根据所述各个噪声模拟设备对应的校准信号和所述第一噪声信号，分别确定所述各个噪声模拟设备对应的校准信息；

根据所述第二噪声信号、所述整体校准信号和所述各个噪声模拟设备对应的校准信息，分别确定所述各个噪声模拟设备对应的设备校准数据；

将所述人声模拟设备对应的设备校准信息和所述各个噪声模拟设备对应的设备校准数据的集合，确定为所述测试系统的系统校准数据。

在一种可能的实施方式中，若所述测试系统的系统校准数据包括各个噪声模拟设备对应的设备校准数据和所述人声模拟设备对应的设备校准信息，则所述控制设备依据所述测试系统的系统校准数据和所述待测试场景的描述信息，生成待测试语音和待测试噪音，包括：

所述控制设备根据所述待测试场景的描述信息，确定待校正语音和待校正噪音；

所述控制设备依据所述人声模拟设备对应的设备校准信息对所述待校正语音进行校正，得到所述待测试语音；

所述控制设备依据所述各个噪声模拟设备对应的设备校准数据对所述待校正噪音进行校正，得到所述各个噪声模拟设备对应的噪音接收信号；

所述控制设备将所述各个噪声模拟设备对应的噪音接收信号的集合，确定为待测试噪音。

在一种可能的实施方式中，所述描述信息，包括：语音播放语料、噪声播放文件、人声模拟参数、或噪声模拟参数中的至少一个。

本申请实施例还提供了一种测试系统，所述测试系统包括本申请实施例提供的控制设备、待测试设备、人声模拟设备和至少一个噪声模拟设备的任一实施方式。

在一种可能的实施方式中，所述控制设备包括智能终端和声卡；其中，所述智能终端通过所述声卡向所述人声模拟设备和各个噪声模拟设备发送声音信号。

在一种可能的实施方式中，所述至少一个噪声模拟设备包括一个低音炮和多个高保真音箱。

在一种可能的实施方式中，所述多个高保真音箱的增益保持一致，且所述多个高保真音箱在所述待测试设备的四周呈等间距对称摆放。

在一种可能的实施方式中，所述测试系统还包括转台和/或滑轨；其中，所述转台用于调整所述待测试设备与所述人声模拟设备之间的角度；所述滑轨用于调整所述待测试设备与所述人声模拟设备之间的距离。

在一种可能的实施方式中，所述控制设备包括智能终端和控制器；其中，所述智能终端通过所述控制器控制所述转台和/或所述滑轨。

本申请实施例还提供了一种设备，所述设备包括：处理器、存储器、系统总线；

所述处理器以及所述存储器通过所述系统总线相连；

所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行本申请实施例提供的测试方法的任一实施方式。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行本申请实施例提供的测试方法的任一实施方式。

本申请实施例还提供了一种计算机程序产品，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行本申请实施例提供的测试方法的任一实施方式。

基于上述技术方案，本申请具有以下有益效果：

本申请提供的测试系统包括控制设备、待测试设备、人声模拟设备和至少一个噪声模拟设备；而且，在控制设备接收到待测试场景的描述信息之后，由控制设备先依据该待测试场景的描述信息，生成待测试语音和待测试噪音；再将该待测试语音和该待测试噪音分别发送至人声模拟设备和至少一个噪声模拟设备进行播放，以使待测试设备接收到待响应声音信号，针对该待响应声音信号进行预设处理得到待响应声音信号对应的处理数据，并将该处理数据发送给控制设备，以使该控制设备依据该待响应声音信号对应的处理数据，确定该待测试场景的人机交互性能。

可见，因待测试语音和待测试噪音均是由控制设备进行生成并发送的，使得人声模拟设备和各个噪声模拟设备能够在同一个控制设备的控制下进行发声，如此能够有效地避免因人声模拟设备和各个噪声模拟设备在不同设备的控制下进行发声所导致的不良影响，从而如此有利于提高人机交互性能测试的测试准确性。又因测试系统包括多个噪声模拟设备，使得该测试系统能够通过控制噪声模拟设备的发声个数以及控制各个噪声模拟设备的接收信号的方式来还原出更多类型的噪声场景，从而使得待测试设备的人机交互测试场景更全面，如此也有利于提高人机交互性能测试的测试准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种测试方法的流程图；

图2为本申请实施例提供的一种测试系统的示意图；

图3为本申请实施例提供的一种测试系统的结构示意图。

具体实施方式

发明人针对人机交互测试的研究中发现：

(1)因一些人机交互测试系统利用两台电脑分别控制噪声信号播放和语音信号播放，使得噪声信号与语音信号之间的相对播放时间比较难控制，从而使得在不同测试过程中噪声信号与语音信号之间的相对播放时间不一致(例如，在第一次测试过程中，噪声信号与语音信号之间的播放时间差为3秒；在第二次测试过程中，噪声信号与语音信号之间的播放时间差为4秒；……)，导致人机交互性能测试过程中重复测试结果一致性不可控，从而导致同一场景下多次测试结果可能产生较大差异，如此导致人机交互性能测试的测试准确性较低。

(2)因一些人机交互测试系统通常只利用单个音箱播放单点噪声(如电视机噪声、油烟机噪声等)模拟噪声场，使得人机交互测试过程中噪声比较单一，从而使得人机交互性能测试过程中无法准确地还原实际人机交互过程中出现的真实噪声，如此导致人机交互性能测试的测试准确性较低。

基于上述发明人的发现，本申请实施例提供了一种测试系统，其具体包括控制设备、待测试设备、人声模拟设备和至少一个噪声模拟设备；而且，应用于该测试系统的测试方法包括：在控制设备接收到待测试场景的描述信息之后，由控制设备先依据该待测试场景的描述信息，生成待测试语音和待测试噪音；再将该待测试语音和该待测试噪音分别发送至人声模拟设备和至少一个噪声模拟设备进行播放，以使待测试设备接收到待响应声音信号，针对该待响应声音信号进行预设处理得到待响应声音信号对应的处理数据，并将该处理数据发送给控制设备，以使该控制设备依据该待响应声音信号对应的处理数据，确定该待测试场景的人机交互性能。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

方法实施例一

参见图1，该图为本申请实施例提供的一种测试方法的流程图。

本申请实施例提供的应用于测试系统的测试方法，包括s1-s4：

s1：在控制设备接收到待测试场景的描述信息之后，该控制设备依据该待测试场景的描述信息，生成待测试语音和待测试噪音。

控制设备用于对测试系统中人机交互性能测试过程进行控制；而且，本申请实施例不限定控制设备。例如，控制设备可以包括智能终端和声卡，而且该智能终端能够通过声卡向测试系统中各个发声设备(如，人声模拟设备和噪声模拟设备)发送声音信号，也能够通过声卡接收由测试系统中收声设备(如，待测试设备、下文校准设备)采集的声音信号。

另外，本申请实施例不限定智能终端，例如，智能终端可以是智能手机、计算机、个人数字助理(personaldigitalassitant，pda)或平板电脑等。

此外，本申请实施例也不限定声卡，例如，若测试系统包括5个噪声模拟设备、一个人声模拟设备和一个校准设备，则该测试系统中声卡(如图2所示的声卡)可以包括至少6路输出和1路输入，该6路输出分别连接5个噪声模拟设备和一个人声模拟设备，且该1路输入连接校准设备。

需要说明的是，对于图2来说，“spk1”表示第1个噪声模拟设备(如，高保真音箱)；“spk2”表示第2个噪声模拟设备(如，高保真音箱)；“spk3”表示第3个噪声模拟设备(如，高保真音箱)；“spk4”表示第4个噪声模拟设备(如，高保真音箱)；“subwoofer”表示第5个噪声模拟设备(如，低音炮)；“dut”表示待测试设备；“mic”表示校准设备。

在一些情况下，为了更好地进行人机交互性能测试过程，测试系统可以还包括转台和/或滑轨。其中，转台可以用于调整待测试设备与人声模拟设备之间的角度；滑轨可以用于调整待测试设备与人声模拟设备之间的距离；而且，控制设备可以用于控制转台进行转动，和/或，控制滑轨中固定有人声模拟设备的滑块在轨道上进行移动。

需要说明的是，本申请实施例不限定控制设备针对转台(和/或滑轨)的控制方式，例如，若转台(和/或滑轨)自身装设有控制单元，则可以由控制设备直接通过向该转台(和/或滑轨)中控制单元发送控制指令的方式实现对该转台(和/或滑轨)进行控制。又如，为了尽可能地排除测试系统中除了发声设备以外的其他设备产生的干扰，控制设备可以包括智能终端和控制器，以使该智能终端可以通过该控制器控制转台和/或滑轨。其中，因控制器所处的位置不会对待测试设备接收的声音信号造成干扰，使得转台(和/或滑轨)的控制过程不会对人机交互性能测试过程产生影响，如此有利于提高人机交互性能测试的测试准确性。

待测试场景用于代表待测试设备的任一应用场景；而且该待测试场景可以依据该待测试设备的任一应用场景进行确定。

待测试场景的描述信息是指该待测试场景中与人交互过程相关的信息；而且，本申请实施例不限定描述信息，例如，该描述信息可以包括语音播放语料、噪声播放文件、人声模拟参数、或噪声模拟参数中的至少一个。

其中，语音播放语料用于表示待测试场景中真人发出的声音信号。另外，本申请实施例不限定语音播放语料的录制方式，例如，该语音播放语料可以在消声室环境下进行录制。

噪声播放文件用于表示待测试环境中背景噪音。另外，本申请实施例也不限定噪声播放文件的录制方式，例如，该噪声播放文件可以在待测试设备的实际应用场景(如，家居场景、卖场场景等)中进行录制。此外，在一些情况下，在噪声播放文件的录制过程中，还可以记录声卡的最大电压值(也就是，vp值)和该噪声播放文件的收声设备(如，麦克风)的灵敏度以及通道增益。

人声模拟参数是指在利用人声模拟设备模拟待测试场景中真人发出的声音信号时该人声模拟设备应该使用的配置参数；而且本申请实施例不限定人声模拟参数，例如，该人声模拟参数可以包括人声模拟设备的声压幅度(例如，图2中人工头的嘴参考点(mouthreferencepoint，mrp)处声压幅度(dba))、该人声模拟设备与待测试设备之间的距离、以及该人声模拟设备与待测试设备之间的角度中的至少一个。其中，人声模拟设备与待测试设备之间的角度可以用于描述该人声模拟设备与该待测试设备中拾音器之间的相对角度。

噪声模拟参数是指在利用噪声模拟设备模拟待测试环境中背景噪音时应该使用的配置参数；而且本申请实施例不限定噪声模拟参数，例如，该噪声模拟参数可以包括噪声播放通道选择信息(也就是，选择哪些噪声模拟设备进行背景噪声模拟)和/或信噪比。其中，信噪比用于表征在待测试场景中真人发出的声音信号与背景噪音之间的信息占比。

需要说明的是，本申请实施例不限定信噪比，例如，“信噪比”可以被设置为以下两种模式：信噪比模式和幅度还原模式。其中，信噪比模式可以根据设置的信噪比大小控制待测试设备的收声位置处的噪声幅度。幅度还原模式则根据噪声播放文件真实还原该噪声播放文件的录制场景中的噪声幅度。

另外，本申请实施例不限定待测试场景的描述信息的获取方式，例如，若测试人员想要针对待测试设备进行人机交互性能测试，则可以由该测试人员在控制设备(尤其是，智能终端)上设置待测试场景的描述信息，以使该控制设备能够接收到该待测试场景的描述信息。

待测试语音是指在待测试场景中需要由人声模拟设备进行播放的声音信号，以使该待测试语音用于表示在该待测试场景中出现的语音信息。另外，本申请实施例不限定待测试语音的生成过程。

待测试噪音是指在待测试场景中需要由至少一个噪声模拟设备进行播放的声音信号，以使该待测试噪音用于表示该待测试场景中出现的背景噪音。另外，本申请实施例不限定待测试噪音的生成过程。

基于上述s1的相关内容可知，对于测试系统来说，若测试人员在该测试系统中控制设备上配置好待测试场景的描述信息，则该控制设备可以依据该待测试场景的描述信息，生成待测试语音和待测试噪音，以使该待测试语音和待测试噪音分别表示该待测试场景中出现的语音信息和背景噪声，以便后续该测试系统中发声设备能够基于该待测试语音和待测试噪音准确地模拟出在该待测试场景中进行的人机交互过程。

s2：控制设备将待测试语音和待测试噪音分别发送至人声模拟设备和至少一个噪声模拟设备进行播放，以使待测试设备接收到待响应声音信号。

其中，人声模拟设备用于模拟真人发声；而且本申请实施例不限定人声模拟设备，例如，该人声模拟设备可以是图2所示的人工头。另外，本申请实施例也不限定人声模拟设备与控制设备之间的连接方式，例如，若控制设备包括智能终端和声卡，则该智能终端可以通过声卡与该人声模拟设备进行连接(如图2所示的连接)，以使该智能终端可以通过声卡将待测试语音发送至该人声模拟设备进行播放。

需要说明的是的，在一些情况下，可以在声卡与人声模拟设备之间增加一个功放单元，以使该功放单元能够将声卡发送的待测试语音进行放大后发送给该人声模拟设备进行播放。

噪声模拟设备用于模拟环境噪声；而且本申请不限定噪声模拟设备与控制设备之间的连接方式，例如，若控制设备包括智能终端和声卡，则该智能终端可以通过声卡与该噪声模拟设备进行连接(如图2所示的连接)，以使该智能终端可以通过声卡将待测试噪音发送至该噪声模拟设备进行播放。

另外，本申请实施例不限定测试系统中噪声模拟设备，例如，如图2所示，该测试系统可以包括5个噪声模拟设备，而且该5个噪声模拟设备可以包括一个低音炮和四个高保真音箱。其中，因低音炮用于播放50～120hz频段的噪音，而且各个高保真音箱用于播放120～20khz频段的噪音，使得测试系统中噪声模拟设备能够模拟不同频段的噪音，从而使得该测试系统能够通过控制利用哪些噪声模拟设备进行发声且控制那些噪声模拟设备的接收信号的方式呈现出不同类型的噪声，如此能够增加该测试系统的噪声覆盖种类，从而有利于提高该测试系统针对待测试设备的测试性能。

待测试设备是指需要在待测试场景进行人机交互性能测试的人机交互设备。另外，本申请实施例不限定待测试设备，例如，该待测试设备可以是智能语音家居产品、语音汽车以及语音机器人等人机交互设备。

待响应声音信号是由人声模拟设备针对待测试语音的播放声音信号和至少一个噪声模拟设备针对待测试噪音的播放声音信号进行混合得到的。其中，“人声模拟设备针对待测试语音的播放声音信号”是在该人声模拟设备接收到待测试语音之后由该人声模拟设备按照该待测试语音进行声音播放得到的。“噪声模拟设备针对待测试噪音的播放声音信号”是在该噪声模拟设备接收到待测试噪音之后由该噪声模拟设备按照该待测试噪音进行声音播放得到的。

另外，本申请实施例不限定上述“人声模拟设备按照该待测试语音进行声音播放”的触发时间与上述“噪声模拟设备按照该待测试噪音进行声音播放”的触发时间之间的相对时间差。例如，在一些情况下，控制设备还可以依据待测试场景的描述信息，确定待测试语音的发送时间和待测试噪音的发送时间，以使该控制设备能够按照待测试语音的发送时间和待测试噪音的发送时间分别将待测试语音和待测试噪音发送至人声模拟设备和至少一个噪声模拟设备进行播放，如此实现了上述“相对时间差”的控制。

基于上述s2的相关内容可知，对于测试系统来说，在该测试系统中控制设备生成待测试语音和待测试噪音之后，由该控制设备将待测试语音和待测试噪音分别发送至人声模拟设备和至少一个噪声模拟设备进行播放，以使该人声模拟设备针对待测试语音的播放声音信号和各个噪声模拟设备针对待测试噪音的播放声音信号能够在该测试系统的测试环境中进行混合，从而使得该测试环境中呈现待响应声音信号，进而使得在待测试设备采集到该待响应声音信号之后由该待测试设备针对该待响应声音信号进行相应的分析处理。

s3：待测试设备针对待响应声音信号进行预设处理，得到该待响应声音信号对应的处理数据。

其中，预设处理可以预先设定，例如，该预设处理可以包括语音识别处理和/或对话回复处理等等。

待响应声音信号对应的处理数据是指由待测试设备针对该待响应声音信号进行预设处理所产生的数据。另外，本申请实施例不限定待响应声音信号对应的处理数据，例如，该待响应声音信号对应的处理数据可以包括该待响应声音信号携带的语义信息、该待响应声音信号对应的对话回复内容、该待响应声音信号对应的响应时长中的至少一个。

另外，本申请实施例不限定s3的实施方式，为了便于理解，下面结合示例进行说明。

作为示例，s3具体可以包括s31-s33：

s31：待测试设备对待响应声音信号进行语音识别，得到该待响应声音信号对应的识别文本。

其中，待响应声音信号对应的识别文本用于表示该待响应声音信号携带的语义信息。

另外，本申请实施例不限定s31中“语音识别”的实施方式，可以采用现有的或者未来出现的任一种能够针对语音数据进行语音识别的方法进行实施。

s32：待测试设备对待响应声音信号对应的识别文本进行对话回复处理，得到该待响应声音信号对应的响应文本。

其中，待响应声音信号对应的响应文本用于表示针对该待响应声音信号携带的语义信息进行对话回复时所使用的内容。

另外，本申请实施例不限定s32中“对话回复处理”的实施方式，可以采用现有的或者未来出现的任一种能够针对文本数据进行对话回复的方法进行实施。

为了便于理解s32，下面结合示例进行说明。

作为示例，s32具体可以包括s321-s322：

s321：待测试设备对待响应声音信号对应的识别文本进行语义理解，得到该待响应声音信号对应的用户语义。

其中，待响应声音信号对应的用户语义用于表示由该待响应声音信号携带的用户语义信息(如，用户意图和语义槽位填充值)。

另外，本申请实施例不限定s321中“语义理解”的实施方式，可以采用现有的或者未来出现的任一种能够针对文本数据进行语义理解的方法进行实施。

s322：根据待响应声音信号对应的用户语义，确定该待响应声音信号对应的响应文本。

需要说明的是，本申请实施例不限定s322的实施方式，可以采用现有的或者未来出现的任一种能够针对用户语义进行对话回复的方法进行实施。

基于上述s32的相关内容可知，对于待测试设备来说，在该待测试设备获取到待响应声音信号对应的识别文本之后，可以由该待测试设备针对待响应声音信号对应的识别文本进行对话回复处理，确定出该待响应声音信号对应的对话回复内容，并将该待响应声音信号对应的对话回复内容，确定为该待响应声音信号对应的响应文本。

s33：待测试设备根据待响应声音信号对应的识别文本和待响应声音信号对应的响应文本，确定待响应声音信号对应的处理数据。

本申请实施例中，在获取到待响应声音信号对应的识别文本及其响应文本之后，可以依据该待响应声音信号对应的识别文本和该待响应声音信号对应的响应文本，确定该待响应声音信号对应的处理数据(如，可以将待响应声音信号对应的识别文本和该待响应声音信号对应的响应文本的集合，确定为该待响应声音信号对应的处理数据)，以使该处理数据能够准确地表示出该待测试设备针对待响应声音信号的处理性能。

基于上述s3的相关内容可知，对于测试系统来说，在该测试系统中待测试设备接收到待响应声音信号之后，可以由该待测试设备针对该待响应声音信号进行预设处理，得到该待响应声音信号对应的处理数据，以使该处理数据能够准确地表示出该待测试设备针对待响应声音信号的处理性能。

s4：待测试设备将待响应声音信号对应的处理数据发送给控制设备，以使该控制设备依据该待响应声音信号对应的处理数据，确定该待测试设备在该待测试场景中的人机交互性能。

本申请实施例不限定“人机交互性能”，例如，该“人机交互性能”可以包括待测试设备的唤醒率、该待测试设备的误唤醒率、该待测试设备的识别率、该待测试设备的响应时间等基本语音交互评价指标。

可见，对于测试系统来说，在该测试系统中控制设备接收到由待测试设备发送的待响应声音信号对应的处理数据之后，可以由该控制设备先参考该处理数据，分别计算待测试设备的一些基本语音交互评价指标(如，唤醒率、误唤醒率、识别率、响应时间等)；再依据这些基本语音交互评价指标，确定该待测试设备在该待测试场景中的人机交互性能。

基于上述s1至s4的相关内容可知，对于应用于测试系统的测试方法来说，在控制设备接收到待测试场景的描述信息之后，由控制设备先依据该待测试场景的描述信息，生成待测试语音和待测试噪音；再将该待测试语音和该待测试噪音分别发送至人声模拟设备和至少一个噪声模拟设备进行播放，以使待测试设备接收到待响应声音信号，针对该待响应声音信号进行预设处理得到待响应声音信号对应的处理数据，并将该处理数据发送给控制设备，以使该控制设备依据该待响应声音信号对应的处理数据，确定该待测试场景的人机交互性能。

方法实施例二

在一些情况下，测试系统中各个发声设备的自身结构也可能会对该测试系统中声场造成影响，故为了进一步提高人机交互性能测试的测试准确性，本申请实施例还提供了应用于测试系统的测试方法的另一种可能的实施方式，在该实施方式中，该测试系统除了包括上述控制设备、待测试设备、人声模拟设备和多个两个噪声模拟设备以外，还包括校准设备，而且该测试方法包括步骤11-步骤16：

步骤11：控制设备将参考信号分别发送至人声模拟设备和各个噪声模拟设备进行播放，以使校准设备接收到系统校准信号。

其中，校准设备是指针对测试系统进行校准处理时所需使用的收声替代设备。另外，本申请实施例不限定校准设备，例如，该校准设备可以是标准麦克风(如图2所示的“mic”)。

参考信号是指针对测试系统进行校准处理时所使用的声音信号。另外，本申请实施例不限定参考信号，例如，该参考信号可以包括第一噪声信号和/或第二噪声信号。

第一噪声信号是指针对测试系统中各个发声设备的独立发声进行校准处理时所使用的声音信号。另外本申请实施例不限定第一噪声信号，例如，该第一噪声信号可以是粉噪。需要说明的是，本申请实施例不限定粉噪，例如，粉噪的幅值满足aweighted(vpink)＝70dba。其中，aweighted(·)表示a计权声压级；vpink表示粉噪信号的幅值。

第二噪声信号是指针对测试系统中所有噪声模拟设备的整体发声进行校准处理时所使用的声音信号。另外，本申请实施例也不限定第二噪声信号，例如，该第二噪声信号可以是在预先录制好的背景噪声文件中记录的噪声信号。

系统校准信号是根据人声模拟设备针对参考信号的播放声音信号和各个噪声模拟设备针对参考信号的播放声音信号确定的。另外，本申请实施例不限定系统校准信号，例如，该系统校准信号可以包括各个噪声模拟设备对应的校准信号、人声模拟设备对应的校准信号和整体校准信号中的至少一个。

需要说明的是，“噪声模拟设备对应的校准信号”、“人声模拟设备对应的校准信号”和“整体校准信号”的相关内容请参见下文。

本申请实施例不限定步骤11的实施方式，为了便于理解，下面结合三个示例进行说明。

示例一，若测试系统包括n个噪声模拟设备，参考信号包括第一噪声信号，且该系统校准信号包括测试系统中各个噪声模拟设备对应的校准信号和人声模拟设备对应的校准信号，则步骤11具体可以包括步骤21-步骤22：

步骤21：在校准设备位于第n个噪声模拟设备对应的预设收声位置时，控制设备将第一噪声信号发送至该第n个噪声模拟设备进行播放，以使该校准设备接收到该第n个噪声模拟设备对应的校准信号。其中，n为正整数，n≤n，n为正整数。

其中，第n个噪声模拟设备对应的预设收声位置是指预先设定的用于针对该第n个噪声模拟设备的播放声音进行采集的收声设备所处位置。

另外，本申请实施例不限定上文“用于针对该第n个噪声模拟设备的播放声音进行收声处理的收声设备”，例如，其具体可以是指待测试设备中拾音器。

此外，本申请实施例也不限定上文“第n个噪声模拟设备对应的预设收声位置”，例如，若待测试设备包括两个拾音器，且该两个拾音器分别安装于该待测试设备的两侧，则上文“第n个噪声模拟设备对应的预设收声位置”具体可以是指待测试设备中两个拾音器之间的中间位置(如图2中“mic”所处位置)。

第n个噪声模拟设备对应的校准信号用于表示当测试系统中只有第n个噪声模拟设备按照第一噪声信号进行声音播放时由该校准设备采集到的声音信号。

基于上述步骤21的相关内容可知，对于测试系统来说，可以将该测试系统中校准设备放置于第n个噪声模拟设备对应的预设收声位置(如，待测试设备中两个拾音器之间的中间位置)，以便在该第n个噪声模拟设备接收到由控制设备发送的第一噪声信号之后，由该第n个噪声模拟设备按照该第一噪声信号进行声音播放，以使该校准设备能够采集到该第n个噪声模拟设备对应的校准信号，从而使得该第n个噪声模拟设备对应的校准信号能够准确地表示出该第n个噪声模拟设备针对该参考噪声的播放性能，以便后续能够基于该第n个噪声模拟设备对应的校准信号，确定出由该第n个噪声模拟设备的自身结构所产生的发声干扰(如，通道增益和/或频响等方面干扰)。其中，n为正整数，n≤n，n为正整数。

步骤22：在校准设备位于人声模拟设备对应的预设收声位置时，控制设备将第一噪声信号发送至该人声模拟设备进行播放，以使该校准设备接收到该人声模拟设备对应的校准信号。

其中，人声模拟设备对应的预设收声位置是指预先设定的用于针对该人声模拟设备的播放声音进行采集的收声设备所处位置。另外，本申请实施例不限定上文“人声模拟设备对应的预设收声位置”，例如，其具体可以为该人声模拟设备的mrp位置。

人声模拟设备对应的校准信号用于表示当测试系统中只有人声模拟设备按照第一噪声信号进行声音播放时由该校准设备采集到的声音信号。

基于上述步骤22的相关内容可知，对于测试系统来说，可以将该测试系统中校准设备放置于人声模拟设备对应的预设收声位置(如，人声模拟设备的mrp位置)，以便在该人声模拟设备接收到由控制设备发送的第一噪声信号之后，由该人声模拟设备按照该第一噪声信号进行声音播放，以使该校准设备能够采集到该人声模拟设备对应的校准信号，从而使得该人声模拟设备对应的校准信号能够准确地表示出该人声模拟设备针对该参考噪声的播放性能，以便后续能够基于该人声模拟设备对应的校准信号，确定出由该人声模拟设备的自身结构所产生的发声干扰(如，通道增益和/或频响等方面干扰)。

基于上述步骤21至步骤22的相关内容可知，对于测试系统来说，在使用该测试系统针对待测试设备进行人机交互性能测试之前，可以利用校准设备和第一噪声信号针对该测试系统中各个发声设备的各自发声性能进行测试，以便后续能够基于该测试系统中各个发声设备的各自发声性能，分别确定各个发声设备的发声校正参数(如，通道增益和/或频响等方面的校正参数)。

示例二，若参考信号包括第二噪声信号，且系统校准信号包括整体校准信号，则步骤11具体可以包括步骤23：

步骤23：控制设备将第二噪声信号分别发送至各个噪声模拟设备进行同时播放，以使校准设备接收到整体校准信号。

其中，整体校准信号是指当测试系统中所有噪声模拟设备同时针对第二噪声信号进行声音播放时由该校准设备采集到的声音信号。

另外，本申请实施例不限定步骤23中“校准设备”所处位置，例如，其具体可以是图2中“mic”所处位置。

此外，本申请实施例不限定整体校准信号的接收过程，例如，在一些情况下，上述“校准设备接收到整体校准信号”具体可以包括：控制设备先将第二噪声信号按照预设通道增益(如，6db)进行衰减，得到衰减后的第二噪声信号；再将衰减后的第二噪声信号发送给各个噪声模拟设备进行同时播放，以使校准设备接收到整体校准信号。

需要说明的是，本申请实施例不限定第二噪声信号的衰减方式，例如，可以先利用公式(1)计算出第二噪声信号的声压幅值；再根据该第二噪声信号的声压幅值，实现将第二噪声信号衰减预设通道增益。

式中，precord_noise表示第二噪声信号的声压幅值(也就是，该第二噪声信号录制的声压幅值)；vrecord_noise表示记录有第二噪声信号文件的幅值；vprecord表示录制第二噪声信号时所使用声卡的vp值；表示录制第二噪声信号时所使用收音设备(如，麦克风)的的通道灵敏度。

基于上述步骤23的相关内容可知，对于测试系统来说，在使用该测试系统针对待测试设备进行人机交互性能测试之前，可以利用校准设备和第二噪声信号针对该测试系统中所有噪声模拟设备的整体发声性能进行测试，以便后续能够基于该测试系统中所有发声设备的整体发声性能，确定各个噪声模拟设备的发声校正参数(如，通道增益和/或频响等方面的校正参数)。

示例三，若测试系统包括n个噪声模拟设备，参考信号包括第一噪声信号和第二噪声信号，且该系统校准信号包括各个噪声模拟设备对应的校准信号、人声模拟设备对应的校准信号和整体校准信号，则步骤11具体可以包括步骤31-步骤33：

步骤31：在校准设备位于第n个噪声模拟设备对应的预设收声位置时，控制设备将第一噪声信号分别发送至该第n个噪声模拟设备进行播放，以使该校准设备接收到该第n个噪声模拟设备对应的校准信号。其中，n为正整数，n≤n，n为正整数。

步骤32：在校准设备位于人声模拟设备对应的预设收声位置时，控制设备将第一噪声信号发送至该人声模拟设备进行播放，以使该校准设备接收到该人声模拟设备对应的校准信号。

步骤33：控制设备将第二噪声信号分别发送至人声模拟设备和各个噪声模拟设备进行同时播放，以使校准设备接收到整体校准信号。

需要说明的是，步骤31-步骤33的相关内容请分别参见上文步骤21-步骤23的相关内容。

基于上述步骤11的相关内容可知，对于测试系统来说，在使用该测试系统针对待测试设备进行人机交互性能测试之前，可以先由控制设备将参考信号发送至该测试系统中各个发声设备进行播放，以使校准设备能够代替该待测试设备进行收声，以便后续能够基于该校准设备的收声数据(也就是，系统校准信号)来确定该测试系统中各个发声设备因自身结构产生的发声干扰。

步骤12：校准设备将系统校准信号发送给控制设备，以使该控制设备依据系统校准信号和参考信号，确定测试系统的系统校准数据。

其中，系统校准数据用于描述测试系统中各个发声设备对应的发声校正数据(如，通道增益和/或频响等方面校正数据)。

另外，本申请实施例不限定系统校准数据的确定过程，为了便于理解，下面结合示例进行说明。

作为示例，若测试系统包括n个噪声模拟设备，参考信号包括第一噪声信号和第二噪声信号，且系统校准信号包括各个噪声模拟设备对应的校准信号、人声模拟设备对应的校准信号和整体校准信号，则系统校准数据的确定过程具体可以包括步骤41-步骤44：

步骤41：根据第n个噪声模拟设备对应的校准信号和第一噪声信号，确定该第n个噪声模拟设备对应的校准信息。其中，n为正整数，n≤n，n为正整数。

其中，第n个噪声模拟设备对应的校准信息是指从该第n个噪声模拟设备对应的校准信号中提取出的针对该第n个噪声模拟设备的发声校正信息。

另外，本申请实施例不限定校准信息，例如，该校准信息可以包括通道增益校正信息和/或滤波器。

此外，本申请实施例不限定第n个噪声模拟设备对应的校准信息的确定过程，例如，若校准信息包括通道增益校正信息和滤波器，则该第n个噪声模拟设备对应的校准信息的确定过程可以包括步骤51-步骤52：

步骤51：根据第n个噪声模拟设备对应的校准信号和第一噪声信号，确定该第n个噪声模拟设备对应的通道增益校正信息。

本申请实施例不限定步骤51的实施方式，例如，可以利用公式(2)-(3)进行实施。

式中，表示第n个噪声模拟设备对应的通道增益校正信息；aweighted(·)表示a计权声压级；vrefer表示第一噪声信号的幅值，且若第一噪声信号为粉噪信号，则aweighted(vrefer)＝70dba；表示第n个噪声模拟设备对应的校准信号的声压幅值；表示校准设备接收到第n个噪声模拟设备对应的校准信号之后的输出电压值；vpcal表示控制设备中声卡的vp值；表示校准设备的通道灵敏度。

步骤52：根据第n个噪声模拟设备对应的校准信号和第一噪声信号，确定该第n个噪声模拟设备对应的滤波器。

本申请实施例不限定步骤52的实施方式，例如，步骤52具体可以包括步骤521-步骤522：

步骤521：根据第n个噪声模拟设备对应的校准信号的功率谱密度和第一噪声信号的功率谱密度，确定出该第n个噪声模拟设备对应的滤波器的幅频响应。

本申请实施例不限定步骤521的实施方式，例如，步骤521可以利用公式(4)-(5)进行实施。

式中，表示第n个噪声模拟设备对应的滤波器的幅频响应；表示该第n个噪声模拟设备对应的通路频率响应；表示第n个噪声模拟设备对应的校准信号的功率谱密度；srefer(f)表示第一噪声信号的功率谱密度。

步骤522：根据第n个噪声模拟设备对应的滤波器的幅频响应，配置该第n个噪声模拟设备对应的滤波器。

本申请实施例中，在获取到第n个噪声模拟设备对应的滤波器的幅频响应之后，可以基于该幅频响应配置该第n个噪声模拟设备对应的滤波器，以使该第n个噪声模拟设备对应的滤波器能够克服因该第n个噪声模拟设备自身结构造成的频响干扰。

基于上述步骤41的相关内容可知，在控制设备获取到第n个噪声模拟设备对应的校准信号之后，可以由该控制设备依据该第n个噪声模拟设备对应的校准信号以及第一噪声信号，确定该第n个噪声模拟设备对应的校准信息，以便后续能够基于该第n个噪声模拟设备对应的校准信息对该第n个噪声模拟设备的发声过程进行校正。其中，n为正整数，n≤n，n为正整数。

步骤42：根据第二噪声信号、整体校准信号和第n个噪声模拟设备对应的校准信息，确定该第n个噪声模拟设备对应的设备校准数据。其中，n为正整数，n≤n，n为正整数。

其中，第n个噪声模拟设备对应的设备校准数据是指从该第n个噪声模拟设备对应的校准信号和整体校准信号中提取出的针对该第n个噪声模拟设备的发声校正信息。

另外，本申请实施例不限定设备校准数据，例如，设备校准数据可以包括通道增益校正值和滤波器。

此外，本申请实施例不限定步骤42的实施方式，例如，若校准信息包括通道增益校正信息和滤波器，则步骤42具体可以包括步骤421-步骤422：

步骤421：根据第二噪声信号和整体校准信号，对第n个噪声模拟设备对应的通道增益校正信息进行微调处理，得到该第n个噪声模拟设备对应的通道增益校正值。

本申请实施例不限定步骤421的实施方式，例如，可以利用公式(6)-(7)进行实施。

式中，表示第n个噪声模拟设备对应的通道增益校正值；表示第n个噪声模拟设备对应的通道增益校正信息；pattenuation表示预设通道增益；aweighted(·)表示a计权声压级；precord_noise表示第二噪声信号的声压幅值；表示校准设备接收到整体校准信号之后的输出电压值；vpcal表示控制设备中声卡的vp值；表示校准设备的通道灵敏度。

步骤422：根据第n个噪声模拟设备对应的通道增益校正值和该第n个噪声模拟设备对应的滤波器，确定该第n个噪声模拟设备对应的设备校准数据。

本申请实施例中，在获取到第n个噪声模拟设备对应的通道增益校正值之后，可以依据该第n个噪声模拟设备对应的通道增益校正值以及滤波器，确定该第n个噪声模拟设备对应的设备校准数据(如，直接将该第n个噪声模拟设备对应的通道增益校正值以及滤波器的集合，确定为该第n个噪声模拟设备对应的设备校准数据)。

基于上述步骤42的相关内容可知，在控制设备获取到第n个噪声模拟设备对应的校准信息之后，可以由该控制设备依据整体校准信号以及第二噪声信号，针对该第n个噪声模拟设备对应的校准信息进行微调处理，得到该第n个噪声模拟设备对应的设备校准数据。其中，n为正整数，n≤n，n为正整数。

步骤43：根据人声模拟设备对应的校准信号和第一噪声信号，确定该人声模拟设备对应的校准信息。

其中，人声模拟设备对应的校准信息是指从该人声模拟设备对应的校准信号中提取出的针对该人声模拟设备的发声校正信息。

另外，本申请实施例不限定人声模拟设备对应的校准信息的确定过程，例如，若校准信息包括通道增益校正信息和滤波器，则该人声模拟设备对应的校准信息的确定过程可以包括步骤61-步骤62：

步骤61：根据人声模拟设备对应的校准信号和第一噪声信号，确定该人声模拟设备对应的通道增益校正信息。

本申请实施例不限定步骤61的实施方式，例如，可以利用公式(8)-(9)进行实施。

式中，gainmouth表示人声模拟设备对应的通道增益校正信息；aweighted(·)表示a计权声压级；vrefer表示参考信号的幅值，且若第一噪声信号为粉噪信号，则aweighted(vrefer)＝70dba；表示人声模拟设备对应的校准信号的声压幅值；表示人声模拟设备对应的校准信号的输出电压值；vpcal表示控制设备中声卡的vp值；表示校准设备的通道灵敏度。

步骤62：根据人声模拟设备对应的校准信号和第一噪声信号，确定该人声模拟设备对应的滤波器配置信息。

本申请实施例不限定步骤62的实施方式，例如，步骤62具体可以包括步骤621-步骤622：

步骤621：根据人声模拟设备对应的校准信号的功率谱密度和第一噪声信号的功率谱密度，确定出该人声模拟设备对应的滤波器的幅频响应。

本申请实施例不限定步骤621的实施方式，例如，步骤621可以利用公式(10)-(11)进行实施。

式中，表示人声模拟设备对应的滤波器的幅频响应；表示该人声模拟设备对应的通路频率响应；表示人声模拟设备对应的校准信号的功率谱密度；srefer(f)表示第一噪声信号的功率谱密度。

步骤622：根据人声模拟设备对应的滤波器的幅频响应，配置该人声模拟设备对应的滤波器。

本申请实施例中，在获取到人声模拟设备对应的滤波器的幅频响应之后，可以基于该幅频响应配置该人声模拟设备对应的滤波器，以使该人声模拟设备对应的滤波器能够克服因该人声模拟设备自身结构造成的频响干扰。

基于上述步骤43的相关内容可知，在控制设备获取到人声模拟设备对应的校准信号之后，可以由该控制设备依据该人声模拟设备对应的校准信号以及第一噪声信号，确定该人声模拟设备对应的校准信息，以便后续能够基于该人声模拟设备对应的校准信息对该人声模拟设备的发声过程进行校正。

步骤44：将人声模拟设备对应的设备校准信息、第1个噪声模拟设备对应的设备校准数据至第n个噪声模拟设备对应的设备校准数据的集合，确定为测试系统的系统校准数据。

本申请实施例中，控制设备可以将该人声模拟设备对应的设备校准信息、第1个噪声模拟设备对应的设备校准数据、第2个噪声模拟设备对应的设备校准数据、……、第n个噪声模拟设备对应的设备校准数据进行集合，得到该测试系统的系统校准数据，以便后续能够使用该测试系统的系统校准数据对该测试系统中各个发声设备的接收信号进行校正处理。

基于上述步骤12的相关内容可知，对于测试系统来说，在该测试系统中校准设备采集到系统校准信号之后，可以由该校准设备将该系统校准信号发送给控制设备，以使该控制设备能够从该系统校准信号中提取出该测试系统中各个发声设备对应的校准参数(如，人声模拟设备对应的设备校准信息以及噪声模拟设备对应的设备校准数据)，以便后续能够在人机交互性能测试过程中使用各个发声设备对应的校准参数分别对该测试系统中各个发声设备的接收信号进行校正处理，如此有利于提高人机交互性能测试的测试准确性。

步骤13：在控制设备接收到待测试场景的描述信息之后，该控制设备依据测试系统的系统校准数据和该待测试场景的描述信息，生成待测试语音和待测试噪音。

本申请实施例不限定步骤13的实施方式，例如，其具体可以包括步骤131-步骤132：

步骤131：在控制设备接收到待测试场景的描述信息之后，根据该待测试场景的描述信息，确定待校正语音和待校正噪音。

其中，待校正语音是指依据待测试场景的描述信息从大量预先录制的语音播放语料中筛选出来的。另外，本申请实施不限定待校正语音的确定过程。

待校正噪音是指依据待测试场景的描述信息从大量预先录制的噪声播放文件中筛选出来的。另外，本申请实施不限定待校正噪音的确定过程。

步骤132：控制设备依据该测试系统的系统校准数据对待校正语音和待校正噪音进行校正，得到待测试语音和待测试噪音。

另外，本申请实施例不限定步骤132的实施方式，例如，若测试系统包括n个噪声模拟设备，且该测试系统的系统校准数据包括人声模拟设备对应的设备校准信息、第1个噪声模拟设备对应的设备校准数据至第n个噪声模拟设备对应的设备校准数据，则该步骤132具体可以包括步骤1321-步骤1322：

步骤1321：控制设备依据第n个噪声模拟设备对应的设备校准数据对待校正噪音进行校正，得到该第n个噪声模拟设备对应的噪音接收信号。其中，n为正整数，n≤n，n为正整数。

其中，第n个噪声模拟设备对应的噪音接收信号是指对待校正噪音进行校正(尤其是声压幅值校正)之后得到的。

另外，本申请实施例不限定步骤1321的实施方式，例如，步骤1321可以利用公式(12)-(13)进行实施。

式中，表示在待测试场景下第n个噪声模拟设备对应的待校正噪音的通道增益校正值；表示第n个噪声模拟设备对应的通道增益校正值；puse_noise表示待校正噪音的声压幅度；vuse_noise表示记录有待校正噪音文件的幅值；vpcal表示控制设备中声卡的vp值；表示校准设备的通道灵敏度；表示第n个噪声模拟设备对应的噪音接收信号的声压幅度；snr表示测试系统中的信噪比。

步骤1322：控制设备将第1个噪声模拟设备对应的噪音接收信号至第n个噪声模拟设备对应的噪音接收信号的集合，确定为待测试噪音。

本申请实施例中，控制设备可以将第1个噪声模拟设备对应的噪音接收信号、第2个噪声模拟设备对应的噪音接收信号、……、第n个噪声模拟设备对应的噪音接收信号进行集合，得到待测试噪音。

步骤1323：控制设备依据人声模拟设备对应的设备校准信息对待校正语音进行校正，得到待测试语音。

其中，待测试语音是指对待校正语音进行校正(尤其是声压幅值校正)之后得到的。

另外，本申请实施例不限定步骤1323的实施方式，例如，可以采用上文公式(12)以及下文公式(14)-(16)进行实施。

g＝aweighted(puse_noise)(14)

式中，表示在待测试场景下人声模拟设备对应的待校正噪音的通道增益校正值；vuse_mouth表示记录有待校正语音文件的幅值；gainmouth表示人声模拟设备对应的通道增益校正信息；puse_noise表示待校正噪音的声压幅度；i(g)表示伦巴效应中随噪声幅度不同需要给人工嘴通道增加的增益值；g表示待测试设备所处位置的背景噪声幅值。

可见，在控制设备获取到待校正语音之后，可以由该控制设备根据该待校正语音的背景噪声(也就是，上文待校正噪声)和伦巴效应，对该待校正语音的通道增益进行调整，以得到待测试语音。

基于上述步骤13的相关内容可知，对于测试系统来说，在该测试系统中控制设备接收到待测试场景的描述信息之后，该控制设备可以参考该测试系统的系统校准数据和该待测试场景的描述信息，生成待测试语音和待测试噪音，以使该待测试语音以及该待测试噪音更准确，如此有利于提高人机交互性能测试的测试准确性。

步骤14：控制设备将待测试语音和待测试噪音分别发送至人声模拟设备和至少一个噪声模拟设备进行播放，以使待测试设备接收到待响应声音信号。

步骤15：待测试设备针对待响应声音信号进行预设处理，得到该待响应声音信号对应的处理数据。

步骤16：待测试设备将待响应声音信号对应的处理数据发送给控制设备，以使该控制设备依据该待响应声音信号对应的处理数据，确定该待测试设备在该待测试场景中的人机交互性能。

需要说明的是，步骤14-步骤16的相关内容请参见上文s2-s4。

基于上述步骤11至步骤16的相关内容可知，对于应用于测试系统的测试方法来说，可以借助校准设备确定出该测试系统的系统校准数据，以便在后续的人机交互性能测试过程中能够依据该测试系统的系统校准数据对该测试系统中各个发声设备的接收信号进行声压幅值校正，如此能够提高该测试系统中各个发声设备所播放的声音信号的准确性，从而能够进一步提高人机交互性能测试的测试准确性。

基于上述方法实施例提供的测试方法，本申请实施例还提供了一种测试系统，下面结合附图进行解释和说明。

系统实施例

系统实施例对测试系统进行介绍，相关内容请参见上述方法实施例。

参见图3，该图为本申请实施例提供的一种测试系统的结构示意图。

本申请实施例提供的测试系统300，包括控制设备301、待测试设备302、人声模拟设备303和至少一个噪声模拟设备304；

所述控制设备301，用于在接收到待测试场景的描述信息之后，依据所述待测试场景的描述信息，生成待测试语音和待测试噪音；将所述待测试语音和所述待测试噪音分别发送至所述人声模拟设备303和至少一个噪声模拟设备304进行播放，以使所述待测试设备302接收到待响应声音信号；其中，所述待响应声音信号是由所述人声模拟设备303针对所述待测试语音的播放声音信号和所述至少一个噪声模拟设备304针对所述待测试噪音的播放声音信号进行混合得到的；

所述待测试设备302，用于针对所述待响应声音信号进行预设处理，得到所述待响应声音信号对应的处理数据；

所述待测试设备302，还用于将所述待响应声音信号对应的处理数据发送给所述控制设备；

所述控制设备301，还用于依据所述待响应声音信号对应的处理数据，确定所述待测试设备在所述待测试场景中的人机交互性能。

在一种可能的实施方式中，所述待测试设备302，具体用于：对所述待响应声音信号进行语音识别，得到所述待响应声音信号对应的识别文本；对所述待响应声音信号对应的识别文本进行对话回复处理，得到所述待响应声音信号对应的响应文本；根据所述待响应声音信号对应的识别文本和所述待响应声音信号对应的响应文本，确定所述待响应声音信号对应的处理数据。

在一种可能的实施方式中，所述测试系统300还包括校准设备；其中，所述控制设备301，还用于将所述参考信号分别发送至所述人声模拟设备303和各个噪声模拟设备304进行播放，以使所述校准设备接收到系统校准信号；其中，所述系统校准信号是根据所述人声模拟设备303针对所述参考信号的播放声音信号和各个噪声模拟设备304针对所述参考信号的播放声音信号确定的；

所述校准设备，用于将所述系统校准信号发送给所述控制设备301；

所述控制设备301，还用于依据所述系统校准信号和所述参考信号，确定所述测试系统的系统校准数据；

所述控制设备301，具体用于：所述控制设备依据所述测试系统的系统校准数据和所述待测试场景的描述信息，生成待测试语音和待测试噪音。

在一种可能的实施方式中，所述控制设备301，具体用于：若所述参考信号包括第一噪声信号，且所述系统校准信号包括各个噪声模拟设备对应的校准信号和所述人声模拟设备对应的校准信号，则在所述校准设备位于所述各个噪声模拟设备对应的预设收声位置时，将所述第一噪声信号分别发送至所述各个噪声模拟设备进行播放，以使所述校准设备接收到所述各个噪声模拟设备对应的校准信号；在所述校准设备位于所述人声模拟设备对应的预设收声位置时，将所述第一噪声信号发送至所述人声模拟设备进行播放，以使所述校准设备接收到所述人声模拟设备对应的校准信号。

在一种可能的实施方式中，所述控制设备301，具体用于：若所述参考信号包括第二噪声信号，且所述系统校准信号包括整体校准信号，则将所述第二噪声信号分别发送各个噪声模拟设备进行同时播放，以使所述校准设备接收到整体校准信号。

在一种可能的实施方式中，所述控制设备301，具体用于：若所述参考信号包括第一噪声信号和第二噪声信号，且所述系统校准信号包括各个噪声模拟设备对应的校准信号、所述人声模拟设备对应的校准信号、和整体校准信号，则根据所述人声模拟设备对应的校准信号和所述第一噪声信号，确定所述人声模拟设备对应的校准信息；根据所述各个噪声模拟设备对应的校准信号和所述第一噪声信号，分别确定所述各个噪声模拟设备对应的校准信息；根据所述第二噪声信号、所述整体校准信号和所述各个噪声模拟设备对应的校准信息，分别确定所述各个噪声模拟设备对应的设备校准数据；将所述人声模拟设备对应的设备校准信息和所述各个噪声模拟设备对应的设备校准数据的集合，确定为所述测试系统的系统校准数据。

在一种可能的实施方式中，所述控制设备301，具体用于：若所述测试系统的系统校准数据包括各个噪声模拟设备对应的设备校准数据和所述人声模拟设备对应的设备校准数据，则根据所述待测试场景的描述信息，生成待校正语音和待校正噪音；依据所述人声模拟设备对应的设备校准信息对所述待校正语音进行校正，得到所述待测试语音；依据所述各个噪声模拟设备对应的设备校准数据对所述待校正噪音进行校正，得到所述各个噪声模拟设备对应的噪音接收信号；将所述各个噪声模拟设备对应的噪音接收信号的集合，确定为待测试噪音。

在一种可能的实施方式中，所述描述信息，包括：语音播放语料、噪声播放文件、人声模拟参数、或噪声模拟参数中的至少一个。

在一种可能的实施方式中，所述控制设备包括智能终端和声卡；其中，所述智能终端通过所述声卡向所述人声模拟设备和所述至少两个噪声模拟设备发送声音信号。

在一种可能的实施方式中，所述至少一个噪声模拟设备包括一个低音炮和多个高保真音箱(如，四个高保真音箱)。

在一种可能的实施方式中，所述多个高保真音箱的增益保持一致，且所述多个高保真音箱在所述待测试设备的四周呈等间距对称摆放。例如，如图2所示，若高保真音箱的个数为4，则4个高保真音箱的增益保持一致，且该4个高保真音箱在所述待测试设备的四周呈等间距对称摆放。

在一种可能的实施方式中，所述控制设备包括智能终端和控制器；其中，所述智能终端通过所述控制器控制所述转台和/或所述滑轨。

进一步地，本申请实施例还提供了一种设备，包括：处理器、存储器、系统总线；

所述处理器以及所述存储器通过所述系统总线相连；

所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行上述测试方法的任一种实现方法。

进一步地，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行上述测试方法的任一种实现方法。

进一步地，本申请实施例还提供了一种计算机程序产品，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行上述测试方法的任一种实现方法。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者诸如媒体网关等网络通信设备，等等)执行本申请各个实施例或者实施例的某些部分所述的方法。

需要说明的是，本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种融合词汇及音素发音特征的情感语音合成方法及系统与流程

一种测试方法及系统与流程

相关文章

最热文献