一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

声音数据降噪方法、装置、设备、存储介质及程序产品与流程

2021-09-07 21:52:00 来源:中国专利 TAG:计算机 智能 座舱 人工智能 数据处理


1.本公开涉及数据处理技术领域,具体涉及车联网、智能座舱、智能语音、语音识别等人工智能技术领域,尤其涉及一种声音数据降噪方法、装置、电子设备、计算机可读存储介质及计算机程序产品。


背景技术:

2.随着电子信息技术、智能化逐渐向车辆普及,车载终端拥有的功能越来越多。但车载终端因其复杂性和适配难度,更换的难度较大,已经更不上技术的更新速度。
3.现有提供了一种通过加装体积较小、适配难度更小的车载电子设备(例如智能后视镜)的方式,来搭配老旧的车载终端共同提升用户的使用体验。即智能后视镜可将其采集或待显示、待播放的数据传输至车载终端来显示或播放。


技术实现要素:

4.本公开实施例提出了一种声音数据降噪方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
5.第一方面,本公开实施例提出了一种声音数据降噪方法,包括:接收传入待播放的第一声音数据;响应于在第一声音数据的播放过程中未检测到合成语音打断信号,调用预设的第一降噪算法过滤掉除第一声音数据外的噪声数据。
6.第二方面,本公开实施例提出了一种声音数据降噪装置,包括:第一声音数据接收单元,被配置成接收传入待播放的第一声音数据;第一降噪单元,被配置成响应于在第一声音数据的播放过程中未检测到合成语音打断信号,调用预设的第一降噪算法过滤掉除第一声音数据外的噪声数据。
7.第三方面,本公开实施例提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现如第一方面中任一实现方式描述的声音数据降噪方法。
8.第四方面,本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行时能够实现如第一方面中任一实现方式描述的声音数据降噪方法。
9.第五方面,本公开实施例提供了一种包括计算机程序的计算机程序产品,该计算机程序在被处理器执行时能够实现如第一方面中任一实现方式描述的声音数据降噪方法。
10.本公开实施例提供的声音数据降噪方法,首先,接收传入待播放的第一声音数据;然后,在第一声音数据的播放过程中未检测到合成语音打断信号时,调用预设的第一降噪算法过滤掉除第一声音数据外的噪声数据。该方法在车载终端接收并播放其它电子设备传入的声音数据的场景下,根据是否检测到合成语音打断信号,选择不同的降噪方式,尤其在未检测到合成语音打断信号时采用尽可能凸显第一声音数据的原声特征的降噪模式,而不
是常态化的处于尽可能凸显即将出现的人声特征的降噪模式,使得在未出现人声的场景下可以尽可能的保持第一声音数据的原声,同时因该降噪模式下数据运算速度更快带来更低的时延。
11.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
12.通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
13.图1是本公开可以应用于其中的示例性系统架构;
14.图2为本公开实施例提供的一种声音数据降噪方法的流程图;
15.图3为本公开实施例提供的另一种声音数据降噪方法的流程图;
16.图4为本公开实施例提供的在一应用场景下的声音数据降噪方法的流程示意图;
17.图5为本公开实施例提供的一种声音数据降噪装置的结构框图;
18.图6为本公开实施例提供的一种适用于执行声音数据降噪方法的电子设备的结构示意图。
具体实施方式
19.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
20.本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,采取了必要的保密措施,且不违背公序良俗。
21.图1示出了可以应用本公开的声音数据降噪方法、装置、电子设备及计算机可读存储介质的实施例的示例性系统架构100。
22.如图1所示,系统架构100可以包括终端设备101(图中以智能后视镜为例)、车载终端102。终端设备101可通过多种方式与车载终端102建立数据通信,例如通过usb数据线所进行的有线通信,wifi、蓝牙、局域网等无线通信方式等等。
23.用户可以控制终端设备101将其采集或存储的数据传输至车载终端102进行展示,例如传输声音、图像数据等,以充分借助车载终端已由的功能硬件。具体的,上述过程可借助终端设备101和车载终端102上可以安装的应用来实现,例如音频采集类应用、音频传输类应用、降噪类应用等。
24.车载终端102通过内置的各种应用可以提供各种服务,以可以降噪服务的降噪类应用为例,车载终端102在运行该类应用时可实现如下效果:首先,通过usb数据线接收由终端设备101传入的第一声音数据;当在第一声音数据的播放过程中未检测到合成语音打断信号时,调用预设的第一降噪算法过滤掉除第一声音数据外的噪声数据。
25.应该理解,图1中的终端设备101、车载终端的数目仅仅是示意性的。根据实现需
要,可以具有任意数目的终端设备101、车载终端。
26.请参考图2,图2为本公开实施例提供的一种声音数据降噪方法的流程图,其中流程200包括以下步骤:
27.步骤201:接收传入的待播放的第一声音数据;
28.本步骤旨在由声音数据降噪方法的执行主体(例如图1所示的车载终端102)接收传入的待播放的第一声音数据。
29.其中,第一声音数据可以是运行于终端设备(例如图1所示的终端设备101)中的应用所生成的音频,也可以该终端设备所采集到的特定位置或周围位置中出现的声音信号,还可以是读取到的其它用户发布或公开的音频,此处不做具体限定。该终端设备根据表现形态的不同,可以具体为智能后视镜、智能行车记录仪、智能车载播放设备等等,也可以为其它能够传入声音数据的其它功能的车载设备,此处不做具体限定。
30.步骤202:响应于在第一声音数据的播放过程中未检测到合成语音打断信号,调用预设的第一降噪算法过滤掉除第一声音数据外的噪声数据;
31.在步骤201的基础上,本步骤建立在第一声音数据的播放过程中未检测到合成语音打断信号的基础上,旨在由上述执行主体调用预设的第一降噪算法过滤掉除第一声音数据外的噪声数据,也就是说尽可能的凸显第一声音数据中的原声特征。
32.第一降噪算法的调用可通过切换执行主体的降噪模式来实现,例如第一降噪算法为预设的第一降噪模式下的唯一降噪算法,那么第一降噪算法的调用可通过将当前的降噪模式切换至第一降噪模式来实现,因此在第一降噪模式下第一降噪算法处于工作状态。
33.应当理解的是,尽可能的凸显第一声音数据中的原声特征,实际上等同去除一些车内的干扰性噪声,例如风噪、发动机噪声、振动、摩擦类噪声等,此类噪声的去除可通过基于噪声特征的分析、匹配、针对性过滤的方式实现。此类噪声的去除方式较为成熟,处理的数据量较小,因此可使时延尽可能的低。
34.其中,合成语音打断信号也称tts打断信号,其中tts为英文全称text to speech的英文缩写,tts语音指机器语音,tts打断信号实际上等同于触发机器生成机器语音,即tts打断信号是在满足使机器生成或发出机器语音时所生成的标志性信号。由于tts语音大多由各式语音助手发出,因此检测到合成语音打断信号通常等价于语音助手被触发。
35.本公开实施例提供的声音数据降噪方法,在车载终端接收并播放智能车载设备传入的声音数据的场景下,根据是否检测到合成语音打断信号,选择不同的降噪方式,尤其在未检测到合成语音打断信号时采用尽可能凸显第一声音数据的原声特征的降噪模式,而不是常态化的处于尽可能凸显即将出现的人声特征的降噪模式,使得在未出现人声的场景下可以尽可能的保持第一声音数据的原声,同时因该降噪模式下数据运算速度更快带来更低的时延。
36.在上述实施例的基础上,针对在第一声音数据的播放过程中检测到合成语音打断信号的情况,还可以选择调用预设的第二降噪算法过滤掉除第二声音数据中的人声数据外的声音数据,其中,第二声音数据基于合成语音打断信号生成,并在生成后传入上述执行主体。结合上述对合成语音打断信号具体表现的描述,也可以认为第二声音数据通常为触发语音助手的用户后续发出的语音指令。
37.区别于步骤202所针对的未检测到合成语音打断信号的场景,本步骤建立在第一
声音数据的播放过程中检测到合成语音打断信号的基础上,旨在由上述执行主体调用预设的第二降噪算法过滤掉除第二声音数据中的人声数据外的声音数据,也就是说尽可能的凸显第二声音数据中的人声数据。
38.第二降噪算法的调用可通过切换执行主体的降噪模式来实现,例如第二降噪算法为预设的第二降噪模式下的唯一降噪算法,那么第二降噪算法的调用可通过将当前的降噪模式切换至第二降噪模式来实现,因此在第二降噪模式下第一降噪算法处于工作状态。
39.区别于第一降噪算法突出第一声音数据中原声特征的特性,第二降噪算法则是为了在语音助手被唤醒时通过尽可能的凸显第二声音数据中的人声数据,以提升对人声中所包含信息的识别准确率。因此在第二降噪算法中第一声音数据也将被当做一种噪声。
40.本步骤与区别于步骤202所针对的场景的另一场景,即两者分别是针对不同的场景给出了不同的而处理方式。
41.即在一个同时包含两种不同场景的实施例中,该实施例根据是否检测到合成语音打断信号,分别预先配置了两种不同的降噪算法,以分别在未检测到合成语音打断信号时尽可能的凸显第一声音数据的原声特征和在检测到合成语音打断信号时尽可能的凸显第二声音数据中的人声特征,以在不同的场景下对声音数据进行最符合场景需求的降噪处理。
42.在上述任意实施例的基础上,若距上一次检测到合成语音打断信号的时长超过预设时长,则可以重新调用第一降噪算法过滤掉除第一声音数据外的噪声数据。结合上一实施例所提供的第二降噪模式,也可以简单理解为从第二降噪模式切换回第一降噪模式。另外,在检测到电话呼入请求时,还可以暂停播放第一声音数据,以最大限度的保证电话语音质量。
43.请参考图3,图3为本公开实施例提供的另一种声音数据降噪方法的流程图,其中流程300包括以下步骤:
44.步骤301:接收并播放智能后视镜传入的第一声音数据;
45.本实施例具体以智能后视镜为例展开了一种具体的实现方案。
46.步骤302:判断在第一声音数据的播放过程中是否检测到合成语音打断信号,若未检测到,执行步骤303,否则执行步骤305;
47.步骤303:基于预设的车内常规噪声特征集,识别车内常规噪声;
48.其中,车内常规噪声特征集包括:风噪特征、发动机噪声特征、振动噪声特征、摩擦噪声特征中的至少一项。当然,车内常规噪声还可以包含可能出现在车内的其它类型的噪声。
49.步骤304:去除与第一声音数据混杂播放的车内常规噪声;
50.步骤303

步骤304提供了一种具体通过预置的各类型噪声特征,来进行针对性的去除车内常规噪声的方案,具体的,可以直接确定噪声所属的频段来进行基于频段的滤除方式来实现。在上述执行主体具有满足时延要求的运算能力时,还可以通过训练得到去噪模型的方式来实现,以得到更好的降噪效果。
51.步骤305:基于预设的车内常规噪声特征集,识别车内常规噪声;
52.步骤306:将第一声音数据作为车内额外噪声;
53.步骤307:去除与第二声音数据混杂播放的车内常规噪声和车内额外噪声。
54.步骤305

步骤307中,不仅使用了与步骤303相同的方式来确定车内常规噪声,还通过步骤306将第一声音数据作为车内额外噪声,进而在步骤307中去除与第二声音数据混杂播放的车内常规噪声和车内额外噪声。由于第二声音数据通常为触发语音助手的用户后续发出的语音指令,里面基本上绝大部分都属于人声数据,因此降噪重心可以仅作用在去除其它干扰因素即可。
55.在流程200所示的实施例的基础上,本实施例通过如图3所示的流程300给出了一种更具体的实现方式,通过步骤302对当前场景进行判别,针对未检测到合成语音打断信号的场景,具体提供了步骤303

步骤304的处理方式,以尽可能的保留第一声音数据的原声特征;针对检测到合成语音打断信号的场景,具体提供了步骤305

步骤307的处理方式,以尽可能的凸显第二声音数据中的人声数据。
56.在上述任意实施例的基础上,为了尽可能的凸显第二声音数据中的人声数据,还可以依次利用自动增益控制(automatic gain control,agc)技术和非线性失真技术处理第一声音数据、第二声音数据以及车内常规噪声形成的混合声音信号,以借助agc技术对某部分音频的增益处理和非线性失真技术处理的失真处理,来尽可能的凸显人声特征。同时,由于非线性失真技术对经agc技术处理后的音频数据更加敏感,两者按照先agc、再非线性失真处理的处理方式,可实现远比单独使用更好的处理效果。
57.一种具体的处理步骤包括:
58.首先,利用自动增益控制技术对混合声音信号中的人声进行增益放大,得到人声增益后声音数据,该混合声音信号由第一声音数据、第二声音数据以及车内常规噪声混合形成;
59.然后,利用非线性失真技术对人声增益后声音数据中的非人声进行失真处理,得到过滤掉除第二声音数据中的人声数据外的声音数据。
60.在上述任意实施例的基础上,考虑到第一声音数据中的人声数据可能错误的导致上述执行主体生成合成语音打断信号,还可以控制合成语音打断信号的触发机制屏蔽第一声音数据中的人声数据,触发机制包括配置于车载终端上的语音助手的唤醒机制。
61.为加深理解,本公开还结合一个具体应用场景,给出了一种具体的实现方案:
62.本公开实施例将所有场景划分为常规场景和打断场景,其中:
63.正常场景:即使内噪中包含音乐等干扰声,也因为其与人声有足够的差异,较容易区分和消除;而因为环境噪音多数为稳态噪音,降噪难度并不大,因此为了整体的语音交互效果,只增加较轻微的降噪处理便能达到最佳效果,增强降噪程度反而会因为人声被抑制而效果变差;
64.打断场景:因为需要消除正在播报的内噪tts声,而其余人声又十分相近,降噪程度需要足够强,并且还需要加入agc和非线性失真处理等特殊操作,才能达到较为理想的效果。
65.针对正常场景的特性和此场景下的降噪需求,本公开实施例为其预先配置了对其它来源中的人声抑制程度较小的降噪模式a;针对打断场景的特性和此场景下的降噪需求,本公开实施例为其预先配置了其它来源中的人声抑制程度大的降噪模式b。
66.请参见如图4所示的流程示意图:
67.1)车载终端上的语音助手初始化,进入正常场景下的降噪模式a;
68.2)用户通过手动或者语音的方式,唤醒处于待机状态的语音助手,语音助手进行欢迎语的播报;
69.3)用户说出想要执行的语音指令;
70.4)语音助手识别接收到的语音指令,并通过对话管理模块,将语音指令转换为机器可识别的语义结果;
71.5)语音助手根据语义结果,判断是否要进入打断模式:
72.a.如需要进入打断模式,则将当前的降噪模式切换为降噪模式b,在用户指令对应的tts文本播报过程,便开始录制可能的人声;
73.b.如不需要进入打断模式,则降噪模式保持不变;
74.6)语音助手播报tts语音结束,并判别是否需要进入多轮交互:
75.a.需要进入多轮,则将降噪模式还原为降噪模式a,并继续录制可能的指令;
76.b.不需要进入多轮,则将降噪模式还原为降噪模式a,并结束语音交互,等待用户下一次的语音唤醒。
77.可见,本公开实施例所提供的上述方案,通过区分不同的场景,将两类迥异的噪音环境进行了分类,从而实现两类场景都达到更为理想的效果,获得了更好的整体效果,即在正常场景下,采用降噪力度较小的尽可能保留人声质量的情况下、消除内外噪音的降噪模式a;在打断场景下,采用能够更有效消除复杂的类人声噪音、使得语音识别效果更佳的降噪模式b。
78.通过上述两个场景的划分与模式的定义,本发明把因时延抖动而需要添加特殊处理的范围降到最低,保障了常规场景下的唤醒率与识别率,也规避了打断场景下出现的tts误录入问题。
79.进一步参考图5,作为对上述各图所示方法的实现,本公开提供了一种声音数据降噪装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
80.如图5所示,本实施例的声音数据降噪装置500可以包括:第一声音数据接收单元501、第一降噪单元502。其中,第一声音数据接收单元501,被配置成接收传入的待播放的第一声音数据;第一降噪单元502,被配置成响应于在第一声音数据的播放过程中未检测到合成语音打断信号,调用预设的第一降噪算法过滤掉除第一声音数据外的噪声数据。
81.在本实施例中,声音数据降噪装置500中:第一声音数据接收单元501、第一降噪单元502的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201

202的相关说明,在此不再赘述。
82.在本实施例的一些可选的实现方式中,声音数据降噪装置500还可以包括:
83.第二降噪单元503,被配置成响应于在第一声音数据的播放过程中检测到合成语音打断信号,接收基于合成语音打断信号传入的第二声音数据,并调用预设的第二降噪算法过滤掉除第二声音数据中的人声数据外的声音数据。
84.在本实施例的一些可选的实现方式中,第一降噪单元可以被进一步配置成:
85.基于预设的车内常规噪声特征集,识别车内常规噪声;
86.去除与第一声音数据混杂播放的车内常规噪声。
87.在本实施例的一些可选的实现方式中,第二降噪单元可以被进一步配置成:
88.基于预设的车内常规噪声特征集,识别车内常规噪声;
89.将第一声音数据作为车内额外噪声;
90.去除与第二声音数据混杂播放的车内常规噪声和车内额外噪声。
91.在本实施例的一些可选的实现方式中,第二降噪单元可以被进一步配置成:
92.利用自动增益控制技术对混合声音信号中的人声进行增益放大,得到人声增益后声音数据;其中,混合声音信号由第一声音数据、第二声音数据以及车内常规噪声混合形成;
93.利用非线性失真技术对人声增益后声音数据中的非人声进行失真处理,得到过滤掉除第二声音数据中的人声数据外的声音数据。
94.在本实施例的一些可选的实现方式中,声音数据降噪装置500中还可以包括:
95.异常触发项屏蔽单元,被配置成控制合成语音打断信号的触发机制屏蔽第一声音数据中的人声数据;其中,触发机制包括配置于车载终端上的语音助手的唤醒机制。
96.在本实施例的一些可选的实现方式中,所述第一声音数据由智能后视镜、智能行车记录仪或智能车载播放设备传入。
97.在本实施例的一些可选的实现方式中,声音数据降噪装置500中还可以包括:
98.降噪算法切换单元,被配置成响应于距上一次检测到合成语音打断信号的时长超过预设时长,重新调用第一降噪算法过滤掉除第一声音数据外的噪声数据。
99.本实施例作为对应于上述方法实施例的装置实施例存在,本实施例提供的声音数据降噪装置,在车载终端接收并播放其它电子设备传入的第一声音数据的场景下,根据是否检测到合成语音打断信号,选择不同的降噪方式,尤其在未检测到合成语音打断信号时采用尽可能凸显第一声音数据的原声特征的降噪模式,而不是常态化的处于尽可能凸显即将出现的人声特征的降噪模式,使得在未出现人声的场景下可以尽可能的保持第一声音数据的原声,同时因该降噪模式下数据运算速度更快带来更低的时延。
100.根据本公开的实施例,本公开还提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现上述任一实施例描述的声音数据降噪方法。
101.根据本公开的实施例,本公开还提供了一种可读存储介质,该可读存储介质存储有计算机指令,该计算机指令用于使计算机执行时能够实现上述任一实施例描述的声音数据降噪方法。
102.本公开实施例提供了一种计算机程序产品,该计算机程序在被处理器执行时能够实现上述任一实施例描述的声音数据降噪方法。
103.图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
104.如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(rom)602中
的计算机程序或者从存储单元608加载到随机访问存储器(ram)603中的计算机程序,来执行各种适当的动作和处理。在ram 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、rom 602以及ram 603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。
105.设备600中的多个部件连接至i/o接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
106.计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如声音数据降噪方法。例如,在一些实施例中,声音数据降噪方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由rom 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到ram 603并由计算单元601执行时,可以执行上文描述的声音数据降噪方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行声音数据降噪方法。
107.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
108.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
109.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd

rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
110.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
111.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
112.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端

服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决传统物理主机与虚拟专用服务器(vps,virtual private server)服务中存在的管理难度大,业务扩展性弱的缺陷。
113.根据本公开实施例的技术方案,在车载终端接收并播放智能车载设备传入的声音数据的场景下,根据是否检测到合成语音打断信号,选择不同的降噪方式,尤其在未检测到合成语音打断信号时采用尽可能凸显第一声音数据的原声特征的降噪模式,而不是常态化的处于尽可能凸显即将出现的人声特征的降噪模式,使得在未出现人声的场景下可以尽可能的保持第一声音数据的原声,同时因该降噪模式下数据运算速度更快带来更低的时延。
114.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
115.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜