车内语音清晰度评价方法、装置、设备及可读存储介质与流程

2022-09-07 23:02:21 来源：中国专利 TAG：

1.本技术涉及nvh性能测试及评价技术领域，特别涉及一种车内语音清晰度评价方法、装置、设备及可读存储介质。

背景技术：

2.随着时代发展，人们的品质意识越来越强。在汽车消费领域，车内语音清晰度已然成为汽车的一项重要性能指标。车内语音清晰度是描述车辆高速行驶时，人们在车内语音交流的清晰程度，其可用百分比来表示：100％表示说话完全听得清楚，0％表示说话完全听不清楚。当前人们对车内语音清晰度越来越关注，因此各大汽车生产厂商也在不遗余力地提升车内语音清晰度性能。
3.相关技术中，对于车内语音清晰度的测试及评价方法通常为：在车内前后排布置若干个传声器，用于测量车内噪声信号；驾驶车辆以某一速度高速(如120km/h)匀速行驶，测量此工况下的车内噪声；然后将传声器测得的噪声信号进行fft(快速傅里叶变换)分析，得到车内噪声频谱数据；再将噪声频谱数据进行频率计权，不同频率下的计权系数不一样；最后将各频率下的计权结果进行求和，即可得到车内语音清晰度。该方法主要用车内噪声的各类特征来表征车内人员语音交流时的清晰程度，其是一种间接表达方式，不仅不直观和不方便，且由于车内噪声的各类特征是车内人员语音交流的噪声环境，而不是语音交流本身，因此，用这种方式表征车内语音清晰度，难免与车辆车内语音清晰度的实际情况(可称为真值)存在差距，即存在车内语音清晰度评价结果精度差的问题。

技术实现要素：

4.本技术提供一种车内语音清晰度评价方法、装置、设备及可读存储介质，以解决相关技术中由于采用车内噪声的各类特征来检测车内语音清晰度而导致的评价结果精度差的问题。
5.第一方面，提供了一种车内语音清晰度评价方法，包括以下步骤：
6.获取不同车速对应的各语音传播方向的短句语音识别正确率和长句语音识别正确率；
7.按照车速大小的顺序基于各语音传播方向的短句语音识别正确率和长句语音识别正确率分别计算各个车速对应的车内语音清晰度；
8.从各个车速对应的车内语音清晰度中筛选出第一车内语音清晰度、第二车内语音清晰度和第三车内语音清晰度，所述第一车内语音清晰度为首次小于第一清晰度阈值的车内语音清晰度，所述第二车内语音清晰度为首次小于第二清晰度阈值的车内语音清晰度，所述第三车内语音清晰度为预设的典型车速对应的车内语音清晰度，所述第一清晰度阈值大于所述第二清晰度阈值；
9.根据第一车内语音清晰度对应的车速、第二车内语音清晰度对应的车速、第三车内语音清晰度以及预设的典型车速计算出整车语音清晰度评价值。
10.一些实施例中，所述语音传播方向包括语音从车辆前排传输至车辆后排的前向传播方向以及语音从车辆后排传输至车辆前排的后向传播方向。
11.一些实施例中，在所述获取不同车速对应的各语音传播方向的短句语音识别正确率和长句语音识别正确率的步骤之前，还包括：
12.当车辆处于第一车速时，使设于车辆前排的语音播放单元依次播放第一短句文字内容和第一长句文字内容；
13.使设于车辆后排的语音接收单元接收第一短句文字内容对应的第一短句语音信号以及第一长句文字内容对应的第一长句语音信号，并将第一短句语音信号和第一长句语音信号发送至语音识别单元；
14.使语音识别单元分别对第一短句语音信号和第一长句语音信号进行语音识别，得到第一短句语音信号对应的识别后的短句文字内容以及第一长句语音信号对应的识别后的长句文字内容；
15.将识别后的短句文字内容和第一短句文字内容进行比较，得到第一车速对应的前向传播方向的短句语音识别正确率；
16.将识别后的长句文字内容和第一长句文字内容进行比较，得到第一车速对应的前向传播方向的长句语音识别正确率。
17.一些实施例中，所述整车语音清晰度评价值的计算公式如下：
[0018][0019]
式中，ai_score表示整车语音清晰度评价值，ai_vel(vz)表示第三车内语音清晰度，y表示第一清晰度阈值，v_y表示第一车内语音清晰度对应的车速，x表示第二清晰度阈值，v_x表示第二车内语音清晰度对应的车速，vz表示预设的典型车速。
[0020]
第二方面，提供了一种车内语音清晰度评价装置，包括：
[0021]
获取单元，其用于获取不同车速对应的各语音传播方向的短句语音识别正确率和长句语音识别正确率；
[0022]
计算单元，其用于按照车速大小的顺序基于各语音传播方向的短句语音识别正确率和长句语音识别正确率分别计算各个车速对应的车内语音清晰度；
[0023]
筛选单元，其用于从各个车速对应的车内语音清晰度中筛选出第一车内语音清晰度、第二车内语音清晰度和第三车内语音清晰度，所述第一车内语音清晰度为首次小于第一清晰度阈值的车内语音清晰度，所述第二车内语音清晰度为首次小于第二清晰度阈值的车内语音清晰度，所述第三车内语音清晰度为预设的典型车速对应的车内语音清晰度，所述第一清晰度阈值大于所述第二清晰度阈值；
[0024]
处理单元，其用于根据第一车内语音清晰度对应的车速、第二车内语音清晰度对应的车速、第三车内语音清晰度以及预设的典型车速计算出整车语音清晰度评价值。
[0025]
一些实施例中，所述语音传播方向包括语音从车辆前排传输至车辆后排的前向传播方向以及语音从车辆后排传输至车辆前排的后向传播方向。
[0026]
一些实施例中，所述装置还包括设于车辆前排的语音播放单元、设于车辆后排的语音接收单元和语音识别单元：
[0027]
当车辆处于第一车速时，设于车辆前排的语音播放单元用于依次播放第一短句文
字内容和第一长句文字内容；
[0028]
设于车辆后排的语音接收单元用于接收第一短句文字内容对应的第一短句语音信号以及第一长句文字内容对应的第一长句语音信号，并将第一短句语音信号和第一长句语音信号发送至语音识别单元；
[0029]
语音识别单元用于分别对第一短句语音信号和第一长句语音信号进行语音识别，得到第一短句语音信号对应的识别后的短句文字内容以及第一长句语音信号对应的识别后的长句文字内容并发送至处理单元；
[0030]
处理单元还用于将识别后的短句文字内容和第一短句文字内容进行比较，得到第一车速对应的前向传播方向的短句语音识别正确率；将识别后的长句文字内容和第一长句文字内容进行比较，得到第一车速对应的前向传播方向的长句语音识别正确率。
[0031]
一些实施例中，所述整车语音清晰度评价值的计算公式如下：
[0032][0033]
式中，ai_score表示整车语音清晰度评价值，ai_vel(vz)表示第三车内语音清晰度，y表示第一清晰度阈值，v_y表示第一车内语音清晰度对应的车速，x表示第二清晰度阈值，v_x表示第二车内语音清晰度对应的车速，vz表示预设的典型车速。
[0034]
第三方面，提供了一种车内语音清晰度评价设备，包括：存储器和处理器，所述存储器中存储有至少一条指令，所述至少一条指令由所述处理器加载并执行，以实现前述的车内语音清晰度评价方法。
[0035]
第四方面，提供了一种计算机可读存储介质，所述计算机存储介质存储有计算机程序，当所述计算机程序被处理器执行时，以实现前述的车内语音清晰度评价方法。
[0036]
本技术提供的技术方案带来的有益效果包括：可有效提高车内语音清晰度评价结果的精度。
[0037]
本技术提供了一种车内语音清晰度评价方法、装置、设备及可读存储介质，包括获取不同车速对应的各语音传播方向的短句语音识别正确率和长句语音识别正确率；按照车速大小的顺序基于各语音传播方向的短句语音识别正确率和长句语音识别正确率分别计算各个车速对应的车内语音清晰度；从各个车速对应的车内语音清晰度中筛选出第一车内语音清晰度、第二车内语音清晰度和第三车内语音清晰度，所述第一车内语音清晰度为首次小于第一清晰度阈值的车内语音清晰度，所述第二车内语音清晰度为首次小于第二清晰度阈值的车内语音清晰度，所述第三车内语音清晰度为预设的典型车速对应的车内语音清晰度；根据第一车内语音清晰度对应的车速、第二车内语音清晰度对应的车速、第三车内语音清晰度以及预设的典型车速计算出整车语音清晰度评价值。本技术综合考虑语音传播方向以及语音长短句类型来计算语音识别正确率，并用语音识别正确率表征各车速下的车内语音清晰度，且综合考虑车内语音清晰度典型值及车内语音清晰度随车速的衰减特性，最终得到车辆整体语音清晰度评价结果，该评价方法更为直观和方便，且由于综合考虑了影响车内语音清晰度的各种因素，因此得出的评价结果与车内语音清晰度的实际情况更接近，有效提高了车内语音清晰度评价结果的精度。
附图说明
[0038]
为了更清楚地说明本技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0039]
图1为本技术实施例提供的一种车内语音清晰度评价方法的流程示意图；
[0040]
图2为本技术实施例提供的车内语音清晰度各测试单元的布设示意图；
[0041]
图3为本技术实施例提供的语音播放单元和语音接收单元在车内位置关系的俯视图；
[0042]
图4为本技术实施例提供的语音播放单元和语音接收单元在车内位置关系的前视图；
[0043]
图5为本技术实施例提供的一种车内语音清晰度评价设备的结构示意图。
具体实施方式
[0044]
为使本技术实施例的目的、技术方案和优点更加清楚，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本技术的一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本技术保护的范围。
[0045]
本技术实施例提供了一种车内语音清晰度评价方法、装置、设备及可读存储介质，其能解决相关技术中由于采用车内噪声的各类特征来检测车内语音清晰度而导致的评价结果精度差的问题。
[0046]
图1是本技术实施例提供的一种车内语音清晰度评价方法，包括以下步骤：
[0047]
步骤s10：获取不同车速对应的各语音传播方向的短句语音识别正确率和长句语音识别正确率；
[0048]
进一步的，所述语音传播方向包括语音从车辆前排传输至车辆后排的前向传播方向以及语音从车辆后排传输至车辆前排的后向传播方向。
[0049]
进一步的，在所述获取不同车速对应的各语音传播方向的短句语音识别正确率和长句语音识别正确率的步骤之前，还包括：
[0050]
当车辆处于第一车速时，使设于车辆前排的语音播放单元依次播放第一短句文字内容和第一长句文字内容；
[0051]
使设于车辆后排的语音接收单元接收第一短句文字内容对应的第一短句语音信号以及第一长句文字内容对应的第一长句语音信号，并将第一短句语音信号和第一长句语音信号发送至语音识别单元；
[0052]
使语音识别单元分别对第一短句语音信号和第一长句语音信号进行语音识别，得到第一短句语音信号对应的识别后的短句文字内容以及第一长句语音信号对应的识别后的长句文字内容；
[0053]
将识别后的短句文字内容和第一短句文字内容进行比较，得到第一车速对应的前向传播方向的短句语音识别正确率；
[0054]
将识别后的长句文字内容和第一长句文字内容进行比较，得到第一车速对应的前
向传播方向的长句语音识别正确率。
[0055]
示范性的，在本实施例中，参见图2所示，可通过在车内布设语音播放单元、语音接收单元、语音识别单元和微处理器单元(含电源模块)来实现语音的识别和语音识别正确率的计算判断等处理。其中，语音播放单元的作用是接收微处理器单元传送过来的数据(文字)，并将数据转换为语音进行播放；语音接收单元的作用是将语音播放单元播放的声音信号转换为数字信号，并将数字信号传输给语音识别单元；语音识别单元的作用是将语音接收单元发送过来的数据转换成文字，并将文字传输给微处理器单元；微处理器单元(含电源模块)的作用是发送数据(文字)给语音播放单元，控制其进行语音播放，并接收语音识别单元传送过来的数据，计算语音识别正确率；微处理器单元的另一个作用是给自身及其它单元供电。
[0056]
具体的，在进行语音识别测试时，语音播放单元、语音接收单元在车内的放置位置可以进行如下设置：参见图3所示，在车辆俯视图的横向方向，语音播放单元或语音接收单元可位于车辆纵轴线上；在车辆俯视图的纵向方向上，语音播放单元或语音接收单元与相应驾乘人员的头部中心线平齐；参见图4所示，在车辆前视图的垂向方向上，语音播放单元或语音接收单元也与相应驾乘人员的头部中心线平齐。
[0057]
一般来说，车速越高，车辆车内噪声会越来越大，以致车内人员的语音交流越不清晰。因此，车速越高，车内语音清晰度越差，所以本实施例在进行车内语音清晰度评价时会充分考虑不同车速下的车内语音清晰度状态。此外，车辆高速行驶时，由于车辆不可避免地存在漏风现象，因此，在车内，语音从车辆前排传到车辆后排与语音从车辆后排传到车辆前排，这两种情况下的语音清晰度是有差别的。因此，本实施例在进行车内语音清晰度测试时会包含上述两种情况。其中，在本实施例中，语音从车辆前排传到车辆后排，称为“前向传播”(此时前排播放语音信号，语音播放单元置于前排；后排接收语音信号，语音接收单元置于后排)；而语音从车辆后排传到车辆前排，则称为“后向传播”(此时后排播放语音信号，语音播放单元置于后排；前排接收语音信号，语音接收单元置于前排)。
[0058]
另一方面，人们在车内进行语音交流时，按语音长短，一般可分为两种情况：短句交流和长句交流。其中，短句和长句是按照两个句子之间的时间间隔来划分的：短句间隔时间较长，长句间隔时间短。此外，短句交流对应的文字长度一般为2—10字，即通常为一句话，如“把音量调大一点”、“空调温度调高一点”等；而长句交流对应的文字长度一般大于300字。由于语音语义内容一般为人的聊天内容，其范围较广。因此，车辆高速行驶时，在短句交流和长句交流的两种情况下，车内人员进行语音交流的顺畅程度、易懂程度也是不同的，即语音清晰度是有差别的。因此，本实施例在进行车内语音清晰度的测试时也会包含上述两种情况。
[0059]
由此可见，本实施例可通过安装于车辆前(后)排的语音播放单元播放存储于微处理器上的文字a，经车辆后(前)排的语音接收单元接收语音信号并将信号传输给语音识别单元；语音识别单元将语音转换成文字b，并将文字b传输给微处理器单元；微处理器单元对比文字a与文字b，即可计算得到语音识别正确率，其综合考虑语音传播方向(即前向传播、后向传播)和语音类型(即短句和长句)，并用语音识别正确率表征各车速下的车内语音清晰度。
[0060]
具体的，关于语音识别单元的识别正确率的计算，本实施例中对于任意车速和任
意语音传播方向的短句语音识别正确率，均可采用式(1)进行计算：
[0061][0062]
其中，succ_ratio_short为短句语音识别正确率，用百分比表示；word_num_succ为识别正确的短句数量；word_num_total为短句的总数量。比如，总共包括20个短句，形成短句组a，这些短句经语音播放单元播放，并经语音接收单元接收，再经语音识别单元识别并转换成短句组(文字)b，其中，短句组(文字)b中有16个短句识别正确(其文字与短句组a中相应的文字完全相同)，则短句语音识别正确率＝16/20
×
100％＝80％。
[0063]
而对于任意车速和任意语音传播方向的长句语音识别正确率，均可采用式(2)进行计算：
[0064][0065]
其中，succ_ratio_long为长句语音识别正确率，用百分比表示；character_num_succ为识别正确的文字数量；character_num_total为文字的总数量。
[0066]
由此可见，通过式(1)和式(2)就可以计算出各个车速下的前向传播方向的短句句语音识别正确率、前向传播方向的长句语音识别正确率、后向传播方向的短句语音识别正确率以及后向传播方向的长句语音识别正确率。
[0067]
当然，本实施例在进行正式的车内语音清晰度测试时，还须先进行测试单元的标定。
[0068]
具体的，以前向传播方向的语音识别率测试为例，可按图3和图4所示布置语音播放单元和语音接收单元，而语音识别单元、微处理器单元的放置位置可根据需求设置，其不会影响语音的传播；再按图2所示，用数据线(即图2中的虚线)和电源线(即图2中的实线)将语音播放单元、语音接收单元、语音识别单元、微处理器单元连接起来；并将车辆放置于安静环境下，如消声室中，且车辆不启动(不点火)；此时，车内最多坐两人，即驾驶员和测试人员，且所坐位置应不影响语音的传播。
[0069]
然后选择适当的短句和长句，其可根据包含语音的数量和语义内容两个方面确定，比如关于语音的数量，对于短句而言，可选择若干个(如10—20个)长短不一的短句，对于长语，则可选择一段文字(文字长度一般大于300字)；而关于语音的语义内容，可随意选择，但须满足如下要求：语音播放单元播放语音，语音接收单元接收语音并将数据传给语音识别单元进行实时识别，且无论是短句还是长句，无论是前向传播还是后向传播，语音识别单元的识别正确率都必须为100％，如果语音的语义内容满足此要求，标定结束；如不满足此要求，重新选择识别不正确的语音的语义内容，重新进行标定，直至满足此要求。之所以设置这样的要求，其目的是要证明采用这些文字进行语音识别正确率的测试是合适的，而另一个作用则是可以抵消不同语音识别单元语音识别性能的差别。
[0070]
在完成上述标定后，即可进行正式的语音识别测试。由于任意车速、任意语音传播方向的短句语音识别正确率和长句语音识别正确率的测试原理和工作流程均相似，因此本实施例以采集车速为40km/h并进行前向传播的语音清晰度数据为例：驾驶车辆，使车辆以40km/h匀速行驶；车辆前排播放语音，后排接收语音并进行实时识别；播放的语音类型包含
短句和长句，且这两种语音类型应按次序进行(一种语音类型结束后再进行另一语音类型)，不能穿插进行。
[0071]
以短句类型测试为例，说明测试过程中的数据传输流程：存储于微处理器单元中的短句(文字)组a经语音播放单元播放，经语音接收单元接收并将信号传输给语音识别单元，经语音识别单元转换成短句组(文字)b；短句组(文字)b经语音识别单元传送至微处理器单元；微处理器单元将短句组a与短句组b进行逐一比对，即可计算出车速为40km/h的前向传播方向的短句语音识别正确率。
[0072]
本实施例中以车速包括40km/h、50km/h、60km/h、70km/h、80km/h、90km/h、100km/h、110km/h、120km/h、130km/h、140km/h为例，则参照40km/h工况的数据采集流程，分别采集50km/h、60km/h、70km/h、80km/h、90km/h、100km/h、110km/h、120km/h、130km/h、140km/h工况下的前向传播方向和后向传播方向的短句语音识别正确率和长句语音识别正确率。需要注意的是，在上述各车速下进行数据采集时，语音播放单元的音量必须是相同的，且与标定时的音量相同。
[0073]
步骤s20：按照车速大小顺序基于各语音传播方向的短句语音识别正确率和长句语音识别正确率分别计算各个车速对应的车内语音清晰度；
[0074]
示范性的，在本实施例中，将按照车速大小顺序分别计算各车速下的车内语音清晰度数据。其中，可按照式(3)计算各车速下的车内语音清晰度。
[0075][0076]
式中，ai_vel为某车速下的车内语音清晰度，用百分比表示；forward_short为某车速下对应的前向传播方向的短句语音识别正确率；forward_long为某车速下对应的前向传播方向的长句语音识别正确率；backward_short为某车速下对应的后向传播方向的短句语音识别正确率；backward_long为某车速下对应的后向传播方向的长句语音识别正确率。其中，forward_short、forward_long、backward_short和backward_long的计算均可按照式(1)与式(2)进行。因此，当某车速下的测试完成后，微处理器会自动计算出对应的语音识别正确率。
[0077]
根据式(3)可知，本实施例用某车速在四种情况下的语音识别正确率均值来表征车辆在某车速下的车内语音清晰度；其相比目前车内语音清晰度测试及评价方法(用车内噪声的各类特征来表征车内人员语音交流时的清晰程度)，式(3)得出的结果更合理、更科学，其综合考虑了语音传播方向的差异(前向传播、后向传播)、语音类型的差异(短句、长句)，是一种更可靠的指标。由此可见，本实施例的评价对象是语音清晰度本身，而不是语音清晰度所在的环境——车内噪声。因此，式(3)所表征的语音清晰度更接近车内语音清晰度的实际情况(可称为真值)。
[0078]
步骤s30：从各个车速对应的车内语音清晰度中筛选出第一车内语音清晰度、第二车内语音清晰度和第三车内语音清晰度，所述第一车内语音清晰度为首次小于第一清晰度阈值的车内语音清晰度，所述第二车内语音清晰度为首次小于第二清晰度阈值的车内语音清晰度，所述第三车内语音清晰度为预设的典型车速对应的车内语音清晰度；
[0079]
示范性的，在本实施例中，对于车辆来说，通常认为120km/h是一种典型车速(一
般，高速公路限速为120km/h；在高速公路上，120km/h是一种常用车速)，因此本实施例可将典型车速预设为120km/h，当然也可根据实际情况进行典型车速的预设，在此不作限定。于是，本实施例将按照式(3)计算得到的车速为120km/h的车内语音清晰度作为车内语音清晰度的代表，并将其值记为ai_120。
[0080]
此外，对于车内语音清晰度而言存在以下规律：车内语音清晰度随着车速的增大而降低。因此按照式(3)依次计算出40km/h、50km/h、60km/h、70km/h、80km/h、90km/h、100km/h、110km/h、120km/h、130km/h、140km/h车速下的车内语音清晰度ai_vel，则ai_vel的值将根据车速的增大而依次递减。
[0081]
本实施例将从各个车速对应的车内语音清晰度中筛选出首次跌破第一清晰度阈值的第一ai_vel值和首次跌破第二清晰度阈值的第二ai_vel值，并根据该第一ai_vel值对应的车速和第二ai_vel值对应的车速确定车内语音清晰度性能的衰减特性；其中，第一清晰度阈值大于第二清晰度阈值，两者的具体值设定可根据实际情况确定，在此不作限定。
[0082]
以第一清晰度阈值是90％、第二清晰度阈值是60％为例，则记v_90为ai_vel值首次跌破90％(即ai_vel《90％)的车速。比如车速50km/h的ai_vel值为91％，车速60km/h的ai_vel值为85％，则v_90为60km/h。其中，v_90的数学表达式如式(4)所示：
[0083][0084]
其中，ai_vel(v)表示ai_vel是车速v的函数；arg是参数的意思；firstv表示ai_vel(v)首次跌破90％对应的的车速。
[0085]
同时，记v_60为ai_vel值首次跌破60％(即ai_vel《60％)的车速。其中，v_60的数学表达式如式(5)所示：
[0086][0087]
其中，ai_vel(v)表示ai_vel是车速v的函数；arg是参数的意思；firstv表示ai_vel(v)首次跌破60％对应的的车速
[0088]
由此可见，v_90与v_60为与车内语音清晰度相关的特征车速。
[0089]
步骤s40：根据第一车内语音清晰度对应的车速、第二车内语音清晰度对应的车速、第三车内语音清晰度以及预设的典型车速计算出整车语音清晰度评价值。
[0090]
进一步的，所述整车语音清晰度评价值的计算公式如下：
[0091][0092]
式中，ai_score表示整车语音清晰度评价值，ai_vel(vz)表示第三车内语音清晰度，y表示第一清晰度阈值，v_y表示第一车内语音清晰度对应的车速，x表示第二清晰度阈值，v_x表示第二车内语音清晰度对应的车速，vz表示预设的典型车速。
[0093]
示范性的，在本实施例中，将第一车内语音清晰度对应的车速、第二车内语音清晰度对应的车速、第三车内语音清晰度以及预设的典型车速代入式(6)中计算，得到整车语音清晰度评价值。
[0094]
[0095]
其中，ai_score为整车语音清晰度评价值，即车辆整体的车内语音清晰度评价结果，ai_vel(vz)表示第三车内语音清晰度，y表示第一清晰度阈值，v_y表示第一车内语音清晰度对应的车速，x表示第二清晰度阈值，v_x表示第二车内语音清晰度对应的车速，vz表示预设的典型车速，其中，中的分母vz也可以是除了典型车速以外的车速参考值，并可根据实际情况进行车速参考值的预设，在此不作限定。
[0096]
同样的，以第一清晰度阈值y是90％、第二清晰度阈值x是60％，且典型车速vz是120km/h为例，则整车语音清晰度评价值ai_score为：
[0097][0098]
式中，ai_vel(120)是车速为120km/h时的车内语音清晰度；v_90是ai_vel首次跌破90％对应的车速，v_60是ai_vel首次跌破60％对应的车速。
[0099]
其中，ai_vel(120)作为车辆典型车速下的车内语音清晰度的代表值；作为车内语音清晰度随车速衰减的代表值，其表征了车内语音清晰度性能的衰减特性，v_60-v_90越大，表示驾乘人员可以在越宽的车速范围内进行较为清晰的语音交流，车内语音清晰度性能衰减得越慢。由于ai_vel(120)为一无量纲的数值(参见式(3))，故式(6)等号右边的最后一项(第二项)也必须为无量纲数据，因此，将v_60-v_90(单位为车速，km/h)除以120(单位为车速，km/h)，即可将其化为无量纲数据。
[0100]
本实施例中计算得到的车辆整体的车内语音清晰度评价结果ai_score是一个综合值，不是某个车速下的车内语音清晰度，而是表征车辆整体的语音清晰度水平，其是一个综合性的语音清晰度指标，表征车辆典型车速下的车内语音清晰度和车辆车内语音清晰度性能随车速的衰减特性。
[0101]
综上，本实施例综合考虑语音传播方向以及语音长短句类型来计算语音识别正确率，并用语音识别正确率表征各车速下的车内语音清晰度，且综合考虑车内语音清晰度典型值及车内语音清晰度随车速的衰减特性，最终得到车辆整体的语音清晰度评价结果，该评价方法更为直观和方便，且由于综合考虑了影响车内语音清晰度的各种因素，因此得出的评价结果与车内语音清晰度的实际情况更接近，有效提高了车内语音清晰度评价结果的精度。
[0102]
本技术实施例还提供了一种车内语音清晰度评价装置，包括：
[0103]
获取单元，其用于获取不同车速对应的各语音传播方向的短句语音识别正确率和长句语音识别正确率；
[0104]
计算单元，其用于按照车速大小的顺序基于各语音传播方向的短句语音识别正确率和长句语音识别正确率分别计算各个车速对应的车内语音清晰度；
[0105]
筛选单元，其用于从各个车速对应的车内语音清晰度中筛选出第一车内语音清晰度、第二车内语音清晰度和第三车内语音清晰度，所述第一车内语音清晰度为首次小于第一清晰度阈值的车内语音清晰度，所述第二车内语音清晰度为首次小于第二清晰度阈值的车内语音清晰度，所述第三车内语音清晰度为预设的典型车速对应的车内语音清晰度，所
述第一清晰度阈值大于所述第二清晰度阈值；
[0106]
处理单元，其用于根据第一车内语音清晰度对应的车速、第二车内语音清晰度对应的车速、第三车内语音清晰度以及预设的典型车速计算出整车语音清晰度评价值；其中，可将获取单元、计算单元、筛选单元和处理单元集成为一个微处理器单元，用于进行车内语音清晰度评价。
[0107]
由此可见，本实施例所涉及的测试装置结构简单，成本低且测试方法简单；此外，本实施例涉及的评价方法直观、方便且简练，综合考虑影响车内语音清晰度的各种因素，得出的评价结果与车内语音清晰度的实际情况更接近，其能适用于各类汽车，尤其是乘用车的车内语音清晰度的评价。
[0108]
进一步的，所述语音传播方向包括语音从车辆前排传输至车辆后排的前向传播方向以及语音从车辆后排传输至车辆前排的后向传播方向。
[0109]
进一步的，所述装置还包括设于车辆前排的语音播放单元、设于车辆后排的语音接收单元和语音识别单元：
[0110]
当车辆处于第一车速时，设于车辆前排的语音播放单元用于依次播放第一短句文字内容和第一长句文字内容；
[0111]
设于车辆后排的语音接收单元用于接收第一短句文字内容对应的第一短句语音信号以及第一长句文字内容对应的第一长句语音信号，并将第一短句语音信号和第一长句语音信号发送至语音识别单元；
[0112]
语音识别单元用于分别对第一短句语音信号和第一长句语音信号进行语音识别，得到第一短句语音信号对应的识别后的短句文字内容以及第一长句语音信号对应的识别后的长句文字内容并发送至处理单元；
[0113]
处理单元还用于将识别后的短句文字内容和第一短句文字内容进行比较，得到第一车速对应的前向传播方向的短句语音识别正确率；将识别后的长句文字内容和第一长句文字内容进行比较，得到第一车速对应的前向传播方向的长句语音识别正确率。
[0114]
进一步的，所述整车语音清晰度评价值的计算公式如下：
[0115][0116]
式中，ai_score表示整车语音清晰度评价值，ai_vel(vz)表示第三车内语音清晰度，y表示第一清晰度阈值，v_y表示第一车内语音清晰度对应的车速，x表示第二清晰度阈值，v_x表示第二车内语音清晰度对应的车速，vz表示预设的典型车速。
[0117]
需要说明的是，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的装置和各单元的具体工作过程，可以参考前述车内语音清晰度评价方法实施例中的对应过程，在此不再赘述。
[0118]
上述实施例提供的车内语音清晰度评价装置可以实现为一种计算机程序的形式，该计算机程序可以在如图5所示的车内语音清晰度评价设备上运行。
[0119]
本技术实施例还提供了一种车内语音清晰度评价设备，包括：通过系统总线连接的存储器、处理器和网络接口，存储器中存储有至少一条指令，至少一条指令由处理器加载并执行，以实现前述的车内语音清晰度评价方法的全部步骤或部分步骤。
[0120]
其中，网络接口用于进行网络通信，如发送分配的任务等。本领域技术人员可以理
解，图5中示出的结构，仅仅是与本技术方案相关的部分结构的框图，并不构成对本技术方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
[0121]
处理器可以是cpu，还可以是其他通用处理器、数字信号处理器(digital signal processor，dsp)、专用集成电路(application specific integrated circuit，asic)、现场可编程逻辑门阵列(fieldprogrammable gatearray，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件分立硬件组件等。通用处理器可以是微处理器，或者该处理器也可以是任何常规的处理器等，处理器是计算机装置的控制中心，利用各种接口和线路连接整个计算机装置的各个部分。
[0122]
存储器可用于存储计算机程序和/或模块，处理器通过运行或执行存储在存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现计算机装置的各种功能。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如视频播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如视频数据、图像数据等)等。此外，存储器可以包括高速随存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘、智能存储卡(smart mediacard，smc)、安全数字(secure digital，sd)卡、闪存卡(flash card)、至少一个磁盘存储器件、闪存器件或其他易失性固态存储器件。
[0123]
本技术实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时，实现前述的车内语音清晰度评价方法的全部步骤或部分步骤。
[0124]
本技术实施例实现前述的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法的步骤。其中，计算机程序包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-only memory，rom)、随机存取存储器(random access memory，ram)、电载波信号、电信信号以及软件分发介质等。需要说明的是，计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。
[0125]
本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、服务器或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0126]
需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
[0127]
本发明是参照根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图
和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0128]
以上所述仅是本技术的具体实施方式，使本领域技术人员能够理解或实现本技术。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下，在其它实施例中实现。因此，本技术将不会被限制于本文所示的这些实施例，而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种在线学习语音识别应答装置及方法

车内语音清晰度评价方法、装置、设备及可读存储介质与流程

相关文献

最热文献