一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种车载语音系统的优化方法、装置及车辆与流程

2022-07-15 23:39:35 来源:中国专利 TAG:


1.本发明实施例涉及自然语言处理技术,尤其涉及一种车载语音系统的优化方法、装置及车辆。


背景技术:

2.随着科学技术的不断发展,车载语音系统得到了人们广泛的喜爱;在用户使用车辆的过程中,通过车载语音系统可以执行用户发出的指令,极大地提升了用户的体验感。现阶段,在车载语音系统出厂前,需要投入大量的语音数据和文本数据对车载语音系统中的自然语言处理模型进行训练,如果想对车载语音系统的性能进行优化,需要继续投入大量的语音数据和文本数据;当车载语音系统投入生产之后,需要开发人员定期投入语音数据和文本数据,对车载语音系统中的自然语言处理模型进行升级,升级困难,且需要大量的人力投入。
3.如何对车载语音系统进行不断优化,以提升车载语音系统的性能,是业内重点关注的问题。


技术实现要素:

4.本发明实施例提供一种车载语音系统的优化方法、装置及车辆,以实现对车载语音系统进行优化。
5.第一方面,本发明实施例提供了一种车载语音系统的优化方法,包括:
6.通过车载语音系统实时获取用户语音数据;
7.根据各所述用户语音数据的音频属性,在各所述用户语音数据中筛选得到可用语音数据;
8.根据所述车载语音系统对各所述可用语音数据的响应结果,在各所述可用语音数据中筛选出语义明确语音数据;
9.使用各所述语义明确语音数据,对所述车载语音系统进行优化。
10.第二方面,本发明实施例还提供了一种车载语音系统的优化装置,包括:
11.用户语音数据获取模块,用于通过车载语音系统实时获取用户语音数据;
12.可用语音数据筛选模块,用于根据各所述用户语音数据的音频属性,在各所述用户语音数据中筛选得到可用语音数据;
13.语义明确语音数据筛选模块,用于根据所述车载语音系统对各所述可用语音数据的响应结果,在各所述可用语音数据中筛选出语义明确语音数据;
14.优化模块,用于使用各所述语义明确语音数据,对所述车载语音系统进行优化。
15.第三方面,本发明实施例还提供了一种车辆,所述车辆包括:
16.一个或多个处理器;
17.存储装置,用于存储一个或多个程序,
18.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理
器实现如权利要求1-7中任一所述的车载语音系统的优化方法。
19.本发明实施例通过车载语音系统实时获取用户语音数据;根据各所述用户语音数据的音频属性,在各所述用户语音数据中筛选得到可用语音数据;根据所述车载语音系统对各所述可用语音数据的响应结果,在各所述可用语音数据中筛选出语义明确语音数据;使用各所述语义明确语音数据,对所述车载语音系统进行优化,可以在车载语音系统投入使用后,对车载语音系统进行优化。
附图说明
20.图1是本发明实施例一中的一种车载语音系统的优化方法的流程图;
21.图2是本发明实施例二中的一种车载语音系统的优化方法的流程图;
22.图3是本发明实施例三中的一种车载语音系统的优化方法的流程图;
23.图4a是本发明实施例三中的一种车载语音系统的优化方法的流程图;
24.图4b是本发明实施例三中的一种语义明确语音数据的筛选流程图;
25.图5是本发明实施例四中的一种车载语音系统的优化装置的结构示意图;
26.图6是本发明实施例五中的一种车辆的结构示意图。
具体实施方式
27.下面结合附图和实施例对本发明实施例作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明实施例,而非对本发明实施例的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明实施例相关的部分而非全部结构。
28.实施例一
29.图1是本发明实施例一中的一种车载语音系统的优化方法的流程图,本实施例可适用于对车载语音系统进行优化的情况,该方法可以由车载语音系统的优化装置来执行,该装置可以通过软件和/或硬件的方式实现,并集成在车辆中;在本实施例中,车辆可以为小轿车、货车或者火车等,本实施例中对其不加以限定。具体的,参考图1,该方法具体包括如下步骤:
30.步骤110、通过车载语音系统实时获取用户语音数据。
31.其中,车载语音系统可以为集成在车辆中的车载助手,其可以与用户进行人机对话,回答用户提出的问题;例如,用户对车载语音系统说“今天最高气温是多少?”,车载语音系统可以答复“今天最高气温是13摄氏度”;车载语音系统还可以执行用户发出的指令;例如,用户对车载语音系统说“请打开空调”,则车载语音系统可像车载控制器发出打开空调的指令,进一步的,车载控制器可以根据指令信息打开空调。
32.需要说明的是,本实施例中涉及到的车载语音系统中可以集成有自然语言处理模型,其可以对语音数据进行识别与理解。例如,车载语音系统可以通过自然语言处理模型识别用户发出的语音数据,并理解得到语音数据的语义信息,并可以根据语义信息对识别到的用户语音数据进行响应。
33.在本实施例的一个可选实现方式中,在车辆的使用过程中,可以通过车载语音系统实时获取用户发出的用户语音数据。示例性的,响应于驾驶员对汽车的启动信号,则自动开启车载语音系统的录音功能,实时的采集用户发出的语音数据。
34.步骤120、根据各用户语音数据的音频属性,在各用户语音数据中筛选得到可用语音数据。
35.其中,用户语音数据的音频属性可以包括:语音数据的信噪比、时长以及声纹等,本实施例中对其不加以限定。
36.在本实施例的一个可选实现方式中,在获取到用户语音数据之后,可以根据获取到的用户语音数据的音频数据,在采集到的用户语音数据中筛选出可用语音数据。
37.示例性的,在通过车载语音系统获取到100条用户语音数据之后,可以进一步的检测这100条用户语音数据的音频属性,并根据音频属性的检测结果,在100条用户语音数据中筛选得到可用语音数据。
38.在本实施例的一个可选实现方式中,在通过车载语音系统实时获取到用户语音数据之后,可以分别对每条用户语音数据的音频属性进行检测,例如,可以分别对每条用户语音的信噪比、时长以及声纹进行检测,根据信噪比检测结果、时长检测结果以及信噪比检测结果,筛选得到可用语音数据。
39.步骤130、根据车载语音系统对各可用语音数据的响应结果,在各可用语音数据中筛选出语义明确语音数据。
40.在本实施例的一个可选实现方式中,在各用户语音数据中筛选得到可用语音数据之后,可以进一步的确定车载语音系统对各可用语音数据的响应结果,并进一步的根据响应结果,筛选得到语义明确语音数据。
41.在本实施例的一个可选实现方式中,在各用户语音数据中筛选得到可用语音数据之后,可以进一步的通过车载语音系统对各可用语音数据进行处理,例如,可以通过车载语音系统中集成的自然语言处理模型对可用语音数据进行理解,以确定可用语音数据的语义信息,并根据可用语音数据的语义信息,确定与可用语音数据对应的响应结果。
42.示例性的,若识别到可用语音数据a的语义信息为“调高空调温度至30摄氏度”,则车载语音系统可以根据可用语音数据a的语义信息生成指令信号,并将生成的指令信号发送至车载控制器,以使车载控制器将空调温度调高至30摄氏度。
43.进一步的,可以根据车载语音系统对可用语音数据的响应结果,在各可用语音数据中筛选得到语义明确语音数据。
44.示例性的,在上述例子中,若可用数据a的语义信息为“调高空调温度至30摄氏度”,最终车载语音系统对可用语音数据a的响应结果为生成“调高空调温度至30摄氏度”的指令信号,则可以理解为车载语音系统可以正确响应可用语音数据a,此时,可用语音数据a即为语义明确语音数据。若可用数据a的语义信息为“调高空调温度至30摄氏度”,最终车载语音系统对可用语音数据a的响应结果为生成“打开音响”的指令信号,则可以理解为车载语音系统不可以正确响应可用语音数据a,此时,可用语音数据a即为语义不明确语音数据。
45.步骤140、使用各语义明确语音数据,对车载语音系统进行优化。
46.在本实施例的一个可选实现方式中,在筛选得到各语义明确语音数据之后,可以进一步的通过各语义明确语音数据,对车载语音系统进行优化。示例性的,可以将各语义明确语音数据以及与各语义明确语音数据对应的文本数据同时输入至车载语音系统中进行训练,进而对车载语音系统进行优化。
47.在本实施例的一个具体例子中,若通过上述步骤筛选得到1000条语义明确语音数
据,则可以进一步的将1000条语义明确语音数据,以及与1000条语义明确语音数据对应的文本数据,同时输入至车载语音系统中进行训练,从而得到优化后的车载语音系统。
48.本实施例的方案,通过车载语音系统实时获取用户语音数据;根据各用户语音数据的音频属性,在各用户语音数据中筛选得到可用语音数据;根据车载语音系统对各可用语音数据的响应结果,在各可用语音数据中筛选出语义明确语音数据;使用各语义明确语音数据,对车载语音系统进行优化,可以在车载语音系统投入使用后,对车载语音系统进行优化。
49.实施例二
50.图2是本发明实施例二中的一种车载语音系统的优化方法的流程图,本实施例是对上述各技术方案的进一步细化,本实施例中的技术方案可以与上述一个或者多个实施例中的各个可选方案结合。如图2所示,车载语音系统的优化方法可以包括如下步骤:
51.步骤210、当车载语音系统处于开启状态时,开启车载语音系统的录音功能,实时获取用户发出的用户语音数据。
52.在本实施例的一个可选实现方式中,当车载语音系统处于开启状态时,或者车载语音系统处于上电状态时,可以开启车载语音系统的录音功能,一旦用户发出语音数据,即可以被车载语音系统获取到。
53.步骤220、检测目标用户语音数据的音频属性是否满足预设的信噪比条件、时长条件以及声纹条件中至少一项;若是,则确定目标用户语音数据为可用语音数据。
54.其中,目标用户语音数据可以为获取到的各用户语音数据中的任一用户语音数据,本实施例中对其不加以限定。
55.其中,信噪比条件可以为信噪比阈值条件;例如,当目标用户语音数据的信噪比大于信噪比阈值,则确定目标用户语音数据满足信噪比条件;其中,信噪比阈值可以为70db、75db或者80db等数值,本实施例中对其不加以限制。
56.其中,时长条件可以为用户语音数据的时长范围条件;在本实施例的一个可选实现方式中,当目标用户语音数据的时长在时长范围条件内,则确定目标用户语音数据满足时长范围条件。示例性的,若预设的时长范围条件为5s-20s,如果目标用户语音数据的时长为10s,则可以确定目标用户语音数据满足时长范围条件。
57.其中,声纹条件可以为发出目标用户语音数据的人数条件;示例性的,若通过目标用户语音数据的声纹,确定是同一个人发出的目标用户语音数据,则确定目标用户语音数据满足声纹条件;否则,确定目标用户语音数据不满足声纹条件。
58.在本实施例的一个可选实现方式中,在获取到用户语音数据之后,可以进一步的检测目标用户语音数据的音频属性(例如,可以对目标用户语音数据的信噪比、时长以及声纹进行检测);进一步的,可以根据检测到的目标用户语音数据的音频属性,确定目标用户的音频属性是否满足信噪比条件、时长条件或者声纹条件;若是,则可以将目标用户语音数据确定为可用语音数据。
59.在本实施例的另一个可选实现方式中,若第一用户语音数据不满足信噪比条件,则可以将第一用户语音数据确定为不可用语音数据;若第二用户语音数据不满足时长条件,则可以将第二用户语音数据确定为不可用语音数据;若第三用户语音数据不满足声纹条件,则可以将第三用户语音数据确定为不可用语音数据。
60.这样设置的好处在于,通过检测目标用户语音数据的音频属性是否满足预设的信噪比条件、时长条件以及声纹条件中至少一项,可以准确的确定可用语音数据,解决了传统的通过人工听音识音的方法,检测速度慢且准确率低的问题,并且可以节省大量的人力成本。
61.步骤230、根据车载语音系统对各可用语音数据的响应结果,在各可用语音数据中筛选出语义明确语音数据。
62.步骤240、将各语义明确语音数据以及与各语义明确语音数据对应的文本数据,输入至车载语音系统,以对车载语音系统中的自然语言处理模型进行优化。
63.在本实施例的一个可选实现方式中,在筛选出语义明确语音数据之后,可以进一步的将各语义明确语音数据以及与各语义明确语音数据对应的文本数据,输入至车载语音系统,以对车载语音系统中的自然语言处理模型进行优化。
64.本实施例的方案,当车载语音系统处于开启状态时,开启车载语音系统的录音功能,实时获取用户发出的用户语音数据;检测目标用户语音数据的音频属性是否满足预设的信噪比条件、时长条件以及声纹条件中至少一项;若是,则确定目标用户语音数据为可用语音数据;根据车载语音系统对各可用语音数据的响应结果,在各可用语音数据中筛选出语义明确语音数据;将各语义明确语音数据以及与各语义明确语音数据对应的文本数据,输入至车载语音系统,以对车载语音系统中的自然语言处理模型进行优化,可以实现对车载语音系统的优化,提升了车载语音系统的性能。
65.实施例三
66.图3是本发明实施例二中的一种车载语音系统的优化方法的流程图,本实施例是对上述各技术方案的进一步细化,本实施例中的技术方案可以与上述一个或者多个实施例中的各个可选方案结合。如图3所示,车载语音系统的优化方法可以包括如下步骤:
67.步骤310、当车载语音系统处于开启状态时,开启车载语音系统的录音功能,实时获取用户发出的用户语音数据。
68.步骤320、根据各用户语音数据的音频属性,在各用户语音数据中筛选得到可用语音数据。
69.在本实施例的一个可选实现方式中,在获取到各用户语音数据之后,可以进一步的根据各用户语音数据的音频属性,筛选得到用户语音数据。
70.在本实施例的一个可选实现方式中,根据各用户语音数据的音频属性,筛选得到用户语音数据,可以包括:检测目标用户语音数据的音频属性是否满足预设的信噪比条件、时长条件以及声纹条件中至少一项;若是,则确定目标用户语音数据为可用语音数据。
71.在本实施例的另一个可选实现方式中,检测目标用户语音数据的音频属性是否满足预设的信噪比条件、时长条件以及声纹条件中至少一项,可以包括:检测目标用户语音数据的信噪比是否满足信噪比条件;若是,则继续检测目标用户语音数据的音频时长是否满足时长条件;若是,则继续检测目标用户语音数据是否满足声纹条件;若是,则确定目标用户语音数据为可用语音数据。
72.示例性的,在获取到目标用户语音数据的音频属性之后,可以确定目标用户语音数据的信噪比是否满足信噪比条件;如果不满足,则目标用户语音数据为不可用语音数据;如果满足,则继续检测目标用户语音数据是否满足时长条件;如果不满足,则目标用户语音
数据为不可用语音数据;如果满足,则继续检测目标用户语音数据是否满足声纹条件;如果不满足,则目标用户语音数据为不可用语音数据;如果满足,目标用户语音数据为可用语音数据。
73.步骤330、根据车载语音系统对各可用语音数据的响应结果,在各可用语音数据中筛选出语义明确语音数据。
74.其中,车载语音系统对各可用语音数据的响应结果可用为语音响应结果,也可以为操作响应结果,本实施例中对其不加以限定。
75.在本实施例的一个可选实现方式中,如果车载语音系统对各可用语音数据的响应结果为语音响应结果,那么根据车载语音系统对各可用语音数据的响应结果,在各可用语音数据中筛选出语义明确语音数据,可以包括:确定与目标可用语音数据对应的语音响应结果的语义信息,与目标可用语音数据是否匹配;若是,则确定目标可用语音数据为语义明确语音数据。
76.示例性的,若目标可用语音数据为“今天天气怎么样?”,如果车载语音系统对其语音响应结果为“对不起,请再说一遍”或者“今天是星期一”,则可以认为与目标可用语音数据对应的语音响应结果的语义信息,与目标可用语音数据不匹配;如果车载语音系统对其语音响应结果为“今天天气阴”,则可以认为与目标可用语音数据对应的语音响应结果的语义信息,与目标可用语音数据匹配。
77.在本实施例的一个可选实现方式中,当与目标可用语音数据对应的语音响应结果的语义信息,与目标可用语音数据匹配时,可以将目标可用语音数据确定为语义明确语音数据。
78.在本实施例的另一个可选实现方式中,如果车载语音系统对各可用语音数据的响应结果为操作响应结果,那么根据车载语音系统对各可用语音数据的响应结果,在各可用语音数据中筛选出语义明确语音数据,可以包括:确定与目标可用语音数据对应的操作响应结果的操作信息,与目标可用语音数据是否匹配;若是,则确定目标可用语音数据为语义明确语音数据。
79.示例性的,若目标可用语音数据为“打开广播”,如果车载语音系统对其操作响应结果为“打开音乐”或者“打开车灯”,则可以认为与目标可用语音数据对应的操作响应结果的操作信息与目标可用语音数据不匹配;如果车载语音系统对其操作响应结果为“打开fm98.8的广播”,则可以认为与目标可用语音数据对应的操作响应结果的操作信息与语义明确语音数据匹配。
80.在本实施例的一个可选实现方式中,当与目标可用语音数据对应的操作响应结果的操作信息与语义明确语音数据匹配时,可以确定目标可用语音数据为语义明确语音数据。
81.步骤340、将各语义明确语音数据以及与各语义明确语音数据对应的文本数据,输入至车载语音系统,以对车载语音系统中的自然语言处理模型进行优化。
82.本实施例的方案,如果车载语音系统对各可用语音数据的响应结果为语音响应结果,那么可以进一步的确定与目标可用语音数据对应的语音响应结果的语义信息,与目标可用语音数据是否匹配;若是,则确定目标可用语音数据为语义明确语音数据;如果车载语音系统对各可用语音数据的响应结果为操作响应结果,那么可以进一步的确定与目标可用
语音数据对应的操作响应结果的操作信息,与目标可用语音数据是否匹配;若是,则确定目标可用语音数据为语义明确语音数据,可以准确的确定出语义明确语音数据,为后续对车载语音系统的优化提供依据。
83.图4a是本发明实施例三中的一种车载语音系统的优化方法的流程图,参考图4a,具体过程包括有:
84.步骤410、实时采集数据。
85.在本实施例中,车载控制器助手即使在不唤醒状态下也进行录音,即只要是在点火装置处于on的状态即启动全程收音。
86.步骤420、对采集到的音频数据进行解析。
87.在本实施例中,通过对采集到的音频数据进行解析,可以时车载控制器执行对应的指令操作,也可以对音频进行识别处理,从而确定可用音频a以及暂不可用音频b。
88.在本实施例中,可以通过特定的音频信号指标检测,对音频质量进行判断。(包含:信噪比检测,query时长检测,和声纹识别技术的应用判断。通过信噪比的判断可以筛掉声音过小听不清晰的音频;通过时长检测是一个音频质量检测的经验值,依据经验,一般一条正常的语音的长度在9-11字左右时长在5-7秒之间,如果音频时长过长可能是录音过程中的音频切分出了问题,将多个人的语音切到了同一句话中;也可能是发音人表达口齿不清吞吞吐吐,这种口齿不清表达不流畅是属于较为复杂的“疑难杂症类”音频,这种音频不在语音优化训练范围之内,也是需要去除的,声纹识别确保单条音频中只有一个发音人在讲话),将时时收录的录音区分为可用音频a和暂不可用音频两类b。
89.在本实施例中,音频质量判断方法可以包括如下步骤:
90.1、音频信噪比是否不低于70db,如果是,则继续接下来的判断,如果不是则是属于暂不可用的音频b类。
91.2、单条音频时长是否在2-10s之间,如果是,则继续第三个指标的判断,如果不是,则归为b类。
92.3、应用声纹识别技术判断音频中是否只有一个人在讲话,如果是,则属于可用的a类音频,如果不是,则划分到暂不可用b类。通过以上三个指标的筛选,将时时收录的录音区分为可用音频a和暂不可用音频两类b。
93.步骤430、将可用音频确定为语义明确部分c以及语义可能不明确的部分d。
94.图4b是本发明实施例三中的一种语义明确语音数据的筛选流程图,其主要包括如下步骤:
95.步骤431、输入可用音频a。
96.步骤432、可用音频a是否可以被系统正常理解。
97.若是,则执行步骤433;
98.否则,则将可用音频a确定为语义不完全明确部分d。
99.步骤433、该命令发出后车载控制器是否进行对应命令的执行。
100.若是,则将可用音频a确定为语义明确部分c;
101.否则,则将可用音频a确定为语义不完全明确部分d。
102.在本实施例中,其中语义是否可以被系统理解的判断标准为:是否有对应的领域、意图或者槽位等结果;如果有,则属于可被系统理解;否则,认为是系统不可理解的语句,
(比如系统判断结果是not a query类)需要分类到d类;命令发出后车载控制器是否对命令进行执行的判断标准是,一个命令发出,车载控制器是否给出相应的车内系统的操作,如果是(比如打开音乐或者打开空调或者查找地图等操作),则划分到c类;如果不是,(比如,系统回复:“抱歉,请再说一遍,”或者,“当前无法进行此操作或者没有找到相关资源”等类似没有对应系统操作的语句)则划分到d类。
103.步骤440、通过语义明确部分c对语音车载语音系统中的自然语言处理模型进行优化。
104.本实施例的方案,可以在语音收录完成后在线进行音频数据的自动化质量检查,而不是传统的将音频上传到云端,再由云端下载到电脑本地人工进行检查的这种方法。这样设置的好处在于,时效性比较好,可以在音频数据收录的同时就对音频质量进行判断分类,具有快速和节约了人力成本的投入的优势。
105.本实施例的方案,可以通过音频信噪比指标、音频时长指标的判断和声纹识别技术三者相结合,进行音频质量是否合格,可以替代人工听音识音的方法,准确、高效并且可以节省大量的人力成本。
106.本实施例的方案可以通过自然语言处理模型对指令的完成的完整度反向来对语义准确性做判断,其内在逻辑是“不能被车机顺畅执行的命令可能准确,可能不准确,因为自然语言处理模型的性能不好会导致执行效果打折扣,此外,语音本身表达不够完美也会表现出命令无法顺畅执行;但是,可以理解的是,可以被车机顺畅执行的命令一定是准确的。”顺畅执行的定义即一个命令发出,车机给出相应的车内系统的操作(打开音乐或者打开空调或者查找地图等操作),而非无法执行或者听不懂类似的回馈”,该方法采用一种反向逻辑,通过执行结果的顺畅性来反推文本的准确性,达到自动化区分文本内容是否准确的目的,替代了人工检查的环节,具有高效且准确的优势。
107.现有的车载语音系统均是阶段性升级,想要获得更好的模型性能表现只能是在加入更多数据训练后取得性能的提升,本实施例的方案实现了模型的时时更新,在使用车机助手的同时即在进行模型的再学习和再升级,具有越用越聪明的效果,具有随着使用时间推移,模型表现越来越精准,且节约数据成本投入的优势。本实施例的方案,可以在车载语音系统投入市场后,可以实现对车载语音系统中的自然语言处理模型的性能的时时提升,且不用额外的数据资金的投入,即产即用,优化模型的资源来源于使用过程,反过来反哺模型性能的表现,节省了用于模型性能提升所需的数据成本。
108.实施例四
109.图5是本发明实施例四中的一种车载语音系统的优化装置的结构示意图,该装置可以执行上述各实施例中涉及到的车载语音系统的优化方法。参照图5,该装置包括:用户语音数据获取模块510、可用语音数据筛选模块520、语义明确语音数据筛选模块530以及优化模块540。
110.用户语音数据获取模块510,用于通过车载语音系统实时获取用户语音数据;
111.可用语音数据筛选模块520,用于根据各所述用户语音数据的音频属性,在各所述用户语音数据中筛选得到可用语音数据;
112.语义明确语音数据筛选模块530,用于根据所述车载语音系统对各所述可用语音数据的响应结果,在各所述可用语音数据中筛选出语义明确语音数据;
113.优化模块540,用于使用各所述语义明确语音数据,对所述车载语音系统进行优化。
114.本实施例的方案,通过用户语音数据获取模块实时获取用户语音数据;通过可用语音数据筛选模块根据各所述用户语音数据的音频属性,在各所述用户语音数据中筛选得到可用语音数据;通过语义明确语音数据筛选模块根据所述车载语音系统对各所述可用语音数据的响应结果,在各所述可用语音数据中筛选出语义明确语音数据;通过优化模块使用各所述语义明确语音数据,对所述车载语音系统进行优化,可以在车载语音系统投入使用后,对车载语音系统进行优化。
115.可选的,所述用户语音数据获取模块510,具体用于
116.当车载语音系统处于开启状态时,开启所述车载语音系统的录音功能,实时获取用户发出的用户语音数据。
117.可选的,所述可用语音数据筛选模块520,具体用于:
118.检测目标用户语音数据的音频属性是否满足预设的信噪比条件、时长条件以及声纹条件中至少一项;
119.若是,则确定所述目标用户语音数据为可用语音数据。
120.可选的,所述可用语音数据筛选模块520,还具体用于:
121.检测所述目标用户语音数据的信噪比是否满足所述信噪比条件;
122.若是,则继续检测所述目标用户语音数据的音频时长是否满足所述时长条件;
123.若是,则继续检测所述目标用户语音数据是否满足所述声纹条件;
124.若是,则确定所述目标用户语音数据为可用语音数据。
125.可选的,所述响应结果包括语音响应结果;
126.所述语义明确语音数据筛选模块530,具体用于:
127.确定与目标可用语音数据对应的所述语音响应结果的语义信息,与所述语义明确语音数据是否匹配;
128.若是,则确定所述目标可用语音数据为语义明确语音数据。
129.可选的,所述响应结果还包括:操作响应结果;
130.所述语义明确语音数据筛选模块530,还具体用于:
131.确定与目标可用语音数据对应的所述操作响应结果的操作信息,与所述语义明确语音数据是否匹配;
132.若是,则确定所述目标可用语音数据为语义明确语音数据。
133.可选的,所述优化模块540,具体用于:
134.将各所述语义明确语音数据以及与各所述语义明确语音数据对应的文本数据,输入至所述车载语音系统,以对所述车载语音系统中的自然语言处理模型进行优化。
135.本发明实施例所提供的车载语音系统的优化装置可执行本发明任意实施例所提供的车载语音系统的优化方法,具备执行方法相应的功能模块和有益效果。
136.实施例五
137.图6是本发明实施例五中的一种车辆的结构示意图,如图6所示,该车辆包括处理器60、存储器61、输入装置62和输出装置63;车辆中处理器60的数量可以是一个或多个,图6中以一个处理器60为例;车辆中的处理器60、存储器61、输入装置62和输出装置63可以通过
总线或其他方式连接,图6中以通过总线连接为例。
138.存储器61作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的车载语音系统的优化方法对应的程序指令/模块(例如,车载语音系统的优化装置中的用户语音数据获取模块510、可用语音数据筛选模块520、语义明确语音数据筛选模块530以及优化模块540)。处理器60通过运行存储在存储器61中的软件程序、指令以及模块,从而执行车辆的各种功能应用以及数据处理,即实现上述的车载语音系统的优化法。
139.存储器61可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器61可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器61可进一步包括相对于处理器60远程设置的存储器,这些远程存储器可以通过网络连接至车辆。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
140.输入装置62可用于接收输入的数字或字符信息,以及产生与车辆的用户设置以及功能控制有关的键信号输入。输出装置63可包括显示屏等显示设备。
141.实施例六
142.本发明实施例六还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种车载语音系统的优化方法,该方法包括:
143.通过车载语音系统实时获取用户语音数据;
144.根据各所述用户语音数据的音频属性,在各所述用户语音数据中筛选得到可用语音数据;
145.根据所述车载语音系统对各所述可用语音数据的响应结果,在各所述可用语音数据中筛选出语义明确语音数据;
146.使用各所述语义明确语音数据,对所述车载语音系统进行优化。
147.当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的车载语音系统的优化方法中的相关操作。
148.通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、闪存(flash)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
149.值得注意的是,上述车载语音系统的优化装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
150.注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,
本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献