一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种笔触噪声处理方法、装置、设备及存储介质与流程

2023-01-14 16:32:43 来源:中国专利 TAG:


1.本技术实施例涉及数据处理技术领域,尤其涉及一种笔触噪声处理方法、装置、设备及存储介质。


背景技术:

2.随着科技发展的不断进步,众多带有手写输入和声音录制功能的电子装置开始进入市场。用户可在交互平板的屏幕上进行书写操作,同时交互平板会对书写操作进行检测并在屏幕上显示出书写操作对应的书写轨迹。另外,用户可利用交互平板的录音功能进行声音录制并保存。
3.在交互平板上同时进行书写和录音时,由于手写笔的笔锋在书写过程中会与交互平板的屏幕发生接触,导致录制出的音频文件中附带有笔触碰撞屏幕时产生的噪声,影响了录音效果。


技术实现要素:

4.本技术实施例提供一种笔触噪声处理方法、装置、设备及存储介质,以提高录音效果。
5.在第一方面,本技术实施例提供了一种笔触噪声处理方法,包括:
6.获取带有笔触噪声的原始语音数据,对所述原始语音数据进行短时傅里叶变换,以将所述原始语音数据转换为时频域特征;
7.将所述时频域特征输入到训练好的深度神经网络中,利用所述时频域特征对所述时频域特征进行降噪处理,以得降噪语音特征;
8.对所述降噪语音特征进行逆短时傅里叶变换,以将所述降噪语音特征转换为降噪语音数据。
9.在第二方面,本技术实施例提供了一种笔触噪声处理装置,包括语音处理模块、语音降噪模块和语音转换模块,其中:
10.所述语音处理模块,用于获取带有笔触噪声的原始语音数据,对所述原始语音数据进行短时傅里叶变换,以将所述原始语音数据转换为时频域特征;
11.所述语音降噪模块,用于将所述时频域特征输入到训练好的深度神经网络中,利用所述时频域特征对所述时频域特征进行降噪处理,以得降噪语音特征;
12.所述语音转换模块,用于对所述降噪语音特征进行逆短时傅里叶变换,以将所述降噪语音特征转换为降噪语音数据。
13.在第三方面,本技术实施例提供了一种笔触噪声处理设备,包括:存储器以及一个或多个处理器;
14.所述存储器,用于存储一个或多个程序;
15.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的笔触噪声处理方法。
16.在第四方面,本技术实施例提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的笔触噪声处理方法。
17.本技术实施例通过对采集到的原始语音数据进行短时傅里叶变换,以将原始语音数据转换为时频域特征,并将时频域特征输入到深度神经网络中进行降噪处理,由深度神经网络输出降噪后的降噪语音特征,并对降噪语音特征进行逆短时傅里叶变换,得到降噪语音数据,此时降噪语音数据过滤掉了原始语音数据中的笔触噪声,有效提高录音效果。
附图说明
18.图1是本技术实施例提供的一种笔触噪声处理方法的流程图;
19.图2是本技术实施例提供的另一种笔触噪声处理方法的流程图;
20.图3是本技术实施例提供的一种深度神经网络的结构示意图;
21.图4是本技术实施例提供的一种编码卷积层和解码卷积层的连接示意图;
22.图5是本技术实施例提供的一种笔触噪声处理装置的结构示意图;
23.图6是本技术实施例提供的一种笔触噪声处理设备的结构示意图。
具体实施方式
24.为了使本技术的目的、技术方案和优点更加清楚,下面结合附图对本技术具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本技术,而非对本技术的限定。为了便于描述,附图中仅示出了与本技术相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
25.需要说明的是,在本技术中,诸如第一和第二之类的关系术语仅仅用来将一个实体或操作或对象与另一个实体或操作或对象区分开来,而不一定要求或者暗示这些实体或操作或对象之前存在任何这种实际的关系或顺序。例如,第一触碰物品和第二触碰物品的“第一”和“第二”用来区分两个不同时间触碰屏幕的触碰物品。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本技术中的具体含义。此外,在本技术的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
26.为了便于理解,实施例中以交互平板为笔触噪声处理装置进行示例性描述。其中,交互平板可以是通过触控技术对显示在屏幕上的内容进行操作和实现人机交互操作的一体化设备,其集成了投影机、电子白板、幕布、音响、电视机以及视频会议终端等一种或多种功能。在实际应用中,交互平板的硬件部分由屏幕和智能处理系统等部分所构成,由整体结构件结合到一起,同时也由专用的软件系统作为支撑,其中屏幕具有触控功能。实施例中,屏幕显示电子白板,用户可通过手指或触控笔作为手写笔对屏幕进行触控操作,智能处理
系统根据用户输入的触控操作生成书写笔迹绘制在电子白板上,或根据用户输入的触控操作生成控制指令以处理电子白板上的显示内容。进一步的,交互平板配置有麦克风,可通过麦克风进行声音采集并生成原始语音数据。其中,交互平板的屏幕可以是电子墨水屏、电容式触摸屏、红外式触摸屏等,本技术不做限定。
27.典型的,交互平板安装有至少一类操作系统,其中,操作系统包括但不限定于安卓系统、linux系统及windows系统。通过操作系统对通过屏幕接收到的触控操作进行处理。进一步的,交互平板可基于操作系统安装至少一个应用程序,实施例中,以电子白板这一应用程序进行示例性描述。例如,交互平板中安装有电子白板应用程序。其中,该应用程序可以为操作系统自带的应用程序,也可以为从第三方设备或者服务器中下载的应用程序。笔触噪声处理装置也可以为电子白板应用程序。可选的,在电子白板功能下,可以实现书写、插入表格、插入图片、插入多媒体、插入文件(如ppt等)、播放多媒体、插入图形、绘制表格等功能。
28.图1给出了本技术实施例提供的一种笔触噪声处理方法的流程图,本技术实施例提供的笔触噪声处理方法可以由笔触噪声处理装置来执行,该笔触噪声处理装置可以通过硬件和/或软件的方式实现,并集成在笔触噪声处理设备(例如交互平板)中。
29.下述以笔触噪声处理装置执行笔触噪声处理方法为例进行描述。参考图1,该笔触噪声处理方法包括:
30.s101:获取带有笔触噪声的原始语音数据,对所述原始语音数据进行短时傅里叶变换,以将所述原始语音数据转换为时频域特征。
31.本实施例提供的原始语音数据由交互平板进行声音采集得到。示例性的,在交互平板上设置有麦克风,通过麦克风进行声音采集并生成原始语音数据。一般的,在屏幕上进行手写操作并采集语音时,所生成的原始语音数据中记录有目标声音(例如人声)和笔触噪声,其中笔触噪声可理解为手写笔或手指等触摸物在屏幕上书写或触碰屏幕所造成的声音。
32.示例性的,获取带有笔触噪声的原始语音数据,并对原始语音数据进行短时傅里叶变换(stft,short time fouriertransform),从而将原始语音数据转换成时频域特征。
33.可选的,本实施例提供的原始语音数据基于pcm(pulse code modulation,脉冲编码调制)进行编码,即对录制的声音以脉冲形式进行编码,得到原始脉冲数据作为原始语音数据,进一步对原始脉冲数据进行短时傅里叶变换后,得到时频域特征。
34.s102:将所述时频域特征输入到训练好的深度神经网络中,利用所述时频域特征对所述时频域特征进行降噪处理,以得降噪语音特征。
35.本实施例提供的深度神经网络用于对输入的时频域特征进行降噪处理,抹除时频域特征中的噪声,实现对时频域特征的降噪,并输出对时频域特征降噪后得到的降噪语音特征。本实施例预先对深度神经网络进行训练,并将训练好的深度神经网络设置到交互平板中。例如,在建立深度神经网络后,获取安静环境下的纯净人声和包含有笔触噪声的非纯净人声,并利用纯净人声对应的时频域特征作为输出,非纯净人声的时频域特征作为输入,对深度神经网络进行训练,得到训练好的深度神经网络。
36.示例性的,在得到时频域特征后,将时频域特征输入到深度神经网络中,由深度神经网络对时频域特征进行降噪处理,除去时频域特征中的噪声,并将降噪后时频域特征作
为降噪语音特征输出。此时降噪语音特征保留了时频域特征中的人声部分,并抹去了时频域特征中的笔触噪声部分。
37.s103:对所述降噪语音特征进行逆短时傅里叶变换,以将所述降噪语音特征转换为降噪语音数据。
38.示例性的,在得到深度神经网络输出的降噪语音特征后,对降噪语音特征进行逆短时傅里叶变换,从而将降噪语音特征转换为降噪语音数据。此时,降噪语音数据保留了原始语音数据中的人声部分,并抹去了原始语音数据中的笔触噪声部分,在播放降噪语音数据时,播放的人声更清晰,并且抹除了大部分笔锋在屏幕上进行书写的噪声。
39.在一个可能的实施例中,在得到降噪语音数据后,可直接保存降噪语音数据,还可将降噪语音数据转换为目标格式(例如mp3格式)的语音文件再进行保存,方便对语音文件的播放。
40.上述,通过对采集到的原始语音数据进行短时傅里叶变换,以将原始语音数据转换为时频域特征,并将时频域特征输入到深度神经网络中进行降噪处理,由深度神经网络输出降噪后的降噪语音特征,并对降噪语音特征进行逆短时傅里叶变换,得到降噪语音数据,此时降噪语音数据过滤掉了原始语音数据中的笔触噪声,有效提高录音效果。
41.在上述实施例的基础上,图2给出了本技术实施例提供的另一种笔触噪声处理方法的流程图,该笔触噪声处理方法是对上述笔触噪声处理方法的具体化。参考图2,该笔触噪声处理方法包括:
42.s201:获取笔触噪声数据,所述笔触噪声数据在笔触碰撞交互平板时进行声音采集得到。
43.本实施例通过噪声语音样本和纯净人声数据对深度神经网络进行训练,其中噪声语音样本由纯净人声数据和笔触噪声数据合成得到,纯净人声数据可理解为只包含人声,不包含噪声的语音数据,笔触噪声数据可理解为手写笔触碰屏幕产生的声音数据。
44.具体的,在一个安静的环境下,基于不同的力道、时长以及书写方式,利用手写笔在交互平板屏幕的不同位置上进行书写操作,并利用麦克风采集书写笔触碰屏幕时所产生的声音,并基于声音采集结果生成不同触碰情况下的笔触噪声数据。
45.s202:将所述笔触噪声数据与纯净人声数据合成为噪声语音样本。
46.具体的,在采集得到笔触噪声数据后,将笔触噪声数据和纯净人声数据进行合成,得到与纯净人声数据平行的噪声语音样本。此时,噪声语音样本中记录了纯净人声和笔触噪声,相当于在说话的同时进行书写操作的情况下进行声音采集得到的语音数据。并且纯净人声可作为对噪声语音进行降噪后得到的降噪语音。
47.在一个可能的实施例中,在对笔触噪声数据与纯净人声数据进行合成之前,可先对笔触噪声进行切分处理,再将切分后的笔触噪声数据合成到纯净人声数据中,提高噪声语音样本的多样性。基于此,本实施例将所述笔触噪声数据与纯净人声数据合成为噪声语音样本,包括:
48.s2021:对所述笔触噪声数据进行切分,得到多个笔触噪声切片。
49.s2022:将所述笔触噪声切片和与纯净人声数据合成为噪声语音样本。
50.具体的,在得到不同触碰情况下的笔触噪声数据后,对笔触噪声数据进行切分、校对和清洗,得到多个笔触噪声切片。例如将笔触噪声数据切分成多个0.5-10秒的笔触噪声
切片。
51.进一步的,将不同的笔触噪声切片和不同的纯净人声数据进行随机组合,并将同一分组中的笔触噪声切片合成到纯净人声噪声数据中,得到多个噪声语音数据。
52.可以理解的是,一个噪声语音数据中包含一个纯净人声数据以及至少一个的笔触噪声切片,并且同一噪声语音数据中的多个笔触噪声切片可以来自同一个笔触噪声数据,也可以是来自不同的笔触噪声数据。并且同一个纯净人声数据可与不同的笔触噪声切片的组合进行合成,得到不同的噪声语音样本。通过纯净人声数据和笔触噪声切片的随机组合,有效提高噪声语音样本的多样性,提高对深度神经网络的训练效率和训练效果。其中纯净人声可涵盖不同性别、不同年龄的音色,进一步提高噪声语音样本的多样性。
53.s203:利用所述噪声语音样本和所述纯净人声数据,对深度神经网络进行训练。
54.在得到足够数量的噪声语音样本后,对噪声语音样本和所述纯净人声数据进行短时傅里叶变换,利用短时傅里叶变换后的噪声语音样本和纯净人声数据,对深度神经网络进行训练。具体的,将短时傅里叶变换后的纯净人声作为输出,将平行的短时傅里叶变换后的噪声语音样本作为输入,对深度神经网络进行训练。
55.图3是本技术实施例提供的一种深度神经网络的结构示意图,如图3所示,本实施例提供的深度神经网络设置有多层卷积层,其中一半卷积层作为编码器(encoder),另一半卷积层作为解码器(decoder),即本实施例提供的卷积层包括编码卷积层和解码卷积层,利用编码卷积层和解码卷积层进行时频域特征的降维以及编码信息的学习。可选的,本实施例以设置10层卷积层作为编码卷积层,以及10层卷积层作为解码卷积层为例进行描述(图3中仅示意出3层编码卷积层和3层解码卷积层)。
56.图4是本技术实施例提供的一种编码卷积层和解码卷积层的连接示意图,如图4所示,本实施例提供的编码卷积层和解码卷积层之间呈对称设置,编码卷积层的尺寸逐层减半,即相邻的两层编码卷积层之间,在后一层编码卷积层的尺寸是在前一层编码卷积层的尺寸的一半,而在相邻的两层解码卷积层之间,在后一层解码卷积层的尺寸是在前一层解码卷积层的尺寸的两倍。通过逐层减半编码卷积层的尺寸,更有效的进行编码压缩特征,而编码卷积层和解码卷积层呈镜像式的对称设计,有效将压缩后的时频域特征还原为原始特征。进一步的,对称的编码卷积层和解码卷积层之间残差连接,以解决深度神经网络中梯度消失的问题。
57.其中,编码卷积层和解码卷积层的层数可根据实际需要进行设置,本技术不做限定,例如设置10层卷积层作为编码卷积层,以及10层卷积层作为解码卷积层。本实施例通过设置10层编码卷积层,以及10层解码卷积层,编码卷积层和解码卷积层之间呈对称设置,并且编码卷积层的尺寸逐层减半,使得深度神经网络呈现u型,得到dcunet-20深度神经网络。
58.进一步的,深度神经网络训练所使用的损失函数为sdr损失函数,sdr损失函数基于以下公式确定:
[0059][0060]
其中,y为纯净人声数据,为深度神经网络的输出。本实施例利用声音的sdr(源信号失真比,source to distortion ratio)作为深度神经网络训练中损失函数,有效判断
训练过程中信号整体的失真情况,以及降噪语音对于纯净人声的还原度,提高深度神经网络的训练质量。可选的,在完成深度神经网络的训练后,将深度神经网络配置到交互平板中,在深度神经网络接收到时频域特征时,对时频域特征进行降噪处理并输出降噪语音特征。
[0061]
s204:获取带有笔触噪声的原始语音数据,对所述原始语音数据进行短时傅里叶变换,以将所述原始语音数据转换为时频域特征。
[0062]
在一个可能的实施例中,本实施例提供的获取带有笔触噪声的原始语音数据,对所述原始语音数据进行短时傅里叶变换,以将所述原始语音数据转换为时频域特征包括:确定交互平板处于书写模式,获取语音收集得到的带有笔触噪声的原始语音数据。
[0063]
具体的,在确定开始录制语音时,确定当前交互平板是否处于书写模式,若是,认为在录制语音的过程中,存在用户在屏幕上进行书写操作的情况,需要对收集过程中产生的笔触噪声进行降噪,则获取语音收集得到的带有笔触噪声的原始语音数据,并跳转至步骤s205进行下一步的处理分析。若当前交互平板未处于书写模式,可直接输出原始语音数据。
[0064]
在一个可能的实施例中,在录制原始语音数据时,可先判断是否有在屏幕上进行书写操作,并在检测到书写操作时再获取带有笔触噪声的原始语音数据,对原始语音数据进行短时傅里叶变换。基于此,本实施例提供的获取带有笔触噪声的原始语音数据,对所述原始语音数据进行短时傅里叶变换,以将所述原始语音数据转换为时频域特征包括:确定接收到在交互平板的屏幕上进行的手写操作,获取语音收集得到的带有笔触噪声的原始语音数据。
[0065]
其中手写操作可以通过屏幕上传的触摸报点数据进行检测,即在接收到屏幕上传的触摸报点数据时,认为屏幕检测到了书写操作,则获取语音收集得到的带有笔触噪声的原始语音数据,并跳转至步骤s205进行下一步的处理分析。而在未接收到屏幕上传的触摸报点数据时,认为未检测到书写操作,可直接输出原始语音数据。
[0066]
在一个可能的实施例中,在录制原始语音数据时,可先判断是否有在屏幕上进行触摸操作,并在检测到触摸操作时再获取带有笔触噪声的原始语音数据,对原始语音数据进行短时傅里叶变换。基于此,本实施例提供的获取带有笔触噪声的原始语音数据,对所述原始语音数据进行短时傅里叶变换,以将所述原始语音数据转换为时频域特征包括:确定接收到在交互平板的屏幕上进行的触摸操作,获取语音收集得到的带有笔触噪声的原始语音数据。
[0067]
示例性的,在交互平板中设置弹性波检测模块,弹性波检测模块用于检测触摸物对屏幕的触碰,在触摸物触碰屏幕时,弹性波检测模块输出弹性波检测信号。在接收到弹性波检测模块上报的弹性波信号时,认为屏幕检测到了触摸操作,则获取语音收集得到的带有笔触噪声的原始语音数据,并跳转至步骤s205进行下一步的处理分析。而在未接收到弹性波检测模块上报的弹性波信号时,认为未检测到书写操作,可直接输出原始语音数据。
[0068]
s205:将所述时频域特征输入到训练好的深度神经网络中,利用所述时频域特征对所述时频域特征进行降噪处理,以得降噪语音特征。
[0069]
s206:对所述降噪语音特征进行逆短时傅里叶变换,以将所述降噪语音特征转换为降噪语音数据。
[0070]
结合图3,本实施例在接收到原始语音数据x时,对原始语音数据x做短时傅里叶变换(stft)得到时频域特征x,并将时频域特征x输入到深度神经网络(复数域网络)中,由深度神经网络对时频域特征x进行分析处理并输出原始特征信息o,并通过训练确定的复数掩码对原始特征信息o进行掩码处理,抹除原始特征信息o中的噪点,得到降噪特征信息并进一步对降噪特征信息和时频域特征x进行拼接,得到抹除笔触噪声后的降噪语音特征对降噪语音特征进行逆傅里叶变换(istft)后得到降噪语音数据
[0071]
上述,通过对采集到的原始语音数据进行短时傅里叶变换,以将原始语音数据转换为时频域特征,并将时频域特征输入到深度神经网络中进行降噪处理,由深度神经网络输出降噪后的降噪语音特征,并对降噪语音特征进行逆短时傅里叶变换,得到降噪语音数据,此时降噪语音数据过滤掉了原始语音数据中的笔触噪声,有效提高录音效果。同时,深度神经网络通过逐层减半的编码卷积层有效进行编码压缩特征,而编码卷积层和解码卷积层呈镜像式的对称设计,有效将压缩后的时频域特征还原为原始特征,并且对称的编码卷积层和解码卷积层之间残差连接,可有效解决深度神经网络中梯度消失的问题。并且通过笔触噪声数据和纯净人声数据合成多样的噪声语音样本,有效提高深度神经网络的训练质量,并以sdr损失函数作为深度神经网络训练过程中使用的训练函数,有效判断训练过程中信号整体的失真情况,以及降噪语音对于纯净人声的还原度,进一步提高深度神经网络的训练质量。
[0072]
图5给出了本技术实施例提供的一种笔触噪声处理装置的结构示意图。参考图5,该笔触噪声处理装置包括语音处理模块31、语音降噪模块32和语音转换模块33。
[0073]
其中,所述语音处理模块31,用于获取带有笔触噪声的原始语音数据,对所述原始语音数据进行短时傅里叶变换,以将所述原始语音数据转换为时频域特征;所述语音降噪模块32,用于将所述时频域特征输入到训练好的深度神经网络中,利用所述时频域特征对所述时频域特征进行降噪处理,以得降噪语音特征;所述语音转换模块33,用于对所述降噪语音特征进行逆短时傅里叶变换,以将所述降噪语音特征转换为降噪语音数据。
[0074]
上述,通过对采集到的原始语音数据进行短时傅里叶变换,以将原始语音数据转换为时频域特征,并将时频域特征输入到深度神经网络中进行降噪处理,由深度神经网络输出降噪后的降噪语音特征,并对降噪语音特征进行逆短时傅里叶变换,得到降噪语音数据,此时降噪语音数据过滤掉了原始语音数据中的笔触噪声,有效提高录音效果。
[0075]
在一个可能的实施例中,所述语音处理模块31具体用于确定交互平板处于书写模式,获取语音收集得到的带有笔触噪声的原始语音数据。
[0076]
在一个可能的实施例中,所述深度神经网络设置有多层编码卷积层和解码卷积层,所述编码卷积层和所述解码卷积层之间呈对称设置,所述编码卷积层的尺寸逐层减半。
[0077]
在一个可能的实施例中,对称的所述编码卷积层和所述解码卷积层之间残差连接。
[0078]
在一个可能的实施例中,所述装置还包括网络训练模块,所述网络训练模块用于:获取笔触噪声数据,所述笔触噪声数据在笔触碰撞交互平板时进行声音采集得到;将所述笔触噪声数据与纯净人声数据合成为噪声语音样本;利用所述噪声语音样本和所述纯净人声数据,对深度神经网络进行训练。
[0079]
所述网络训练模块在将所述笔触噪声数据与纯净人声数据合成为噪声语音样本时,具体包括:对所述笔触噪声数据进行切分,得到多个笔触噪声切片;将所述笔触噪声切片和与纯净人声数据合成为噪声语音样本。
[0080]
在一个可能的实施例中,所述深度神经网络训练所使用的损失函数为sdr损失函数,所述sdr损失函数基于以下公式确定:
[0081][0082]
其中,y为所述纯净人声数据,为所述深度神经网络的输出。
[0083]
本技术实施例还提供了一种笔触噪声处理设备,该笔触噪声处理设备可集成本技术实施例提供的笔触噪声处理装置。图6是本技术实施例提供的一种笔触噪声处理设备的结构示意图。参考图6,该笔触噪声处理设备包括:输入装置43、输出装置44、存储器42以及一个或多个处理器41;所述存储器42,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器41执行,使得所述一个或多个处理器41实现如上述实施例提供的笔触噪声处理方法。其中输入装置43、输出装置44、存储器42和处理器41可以通过总线或者其他方式连接,图6中以通过总线连接为例。
[0084]
存储器42作为一种计算设备可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本技术任意实施例所述的笔触噪声处理方法对应的程序指令/模块(例如,笔触噪声处理装置中的语音处理模块31、语音降噪模块32和语音转换模块33)。存储器42可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器42可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器42可进一步包括相对于处理器41远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0085]
输入装置43可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置44可包括显示屏等显示设备。
[0086]
处理器41通过运行存储在存储器42中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的笔触噪声处理方法。
[0087]
上述提供的笔触噪声处理装置、设备和计算机可用于执行上述任意实施例提供的笔触噪声处理方法,具备相应的功能和有益效果。
[0088]
本技术实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如上述实施例提供的笔触噪声处理方法,该笔触噪声处理方法包括:获取带有笔触噪声的原始语音数据,对所述原始语音数据进行短时傅里叶变换,以将所述原始语音数据转换为时频域特征;将所述时频域特征输入到训练好的深度神经网络中,利用所述时频域特征对所述时频域特征进行降噪处理,以得降噪语音特征;对所述降噪语音特征进行逆短时傅里叶变换,以将所述降噪语音特征转换为降噪语音数据。
[0089]
存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如cd-rom、软盘或磁带装置;计算机系统存储器或随机存取存储器,诸如dram、ddr ram、sram、edo ram,兰巴斯(rambus)ram等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的第一计算机系统中,或者可以位于不同的第二计算机系统中,第二计算机系统通过网络(诸如因特网)连接到第一计算机系统。第二计算机系统可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。
[0090]
当然,本技术实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的笔触噪声处理方法,还可以执行本技术任意实施例所提供的笔触噪声处理方法中的相关操作。
[0091]
上述实施例中提供的笔触噪声处理装置、设备及存储介质可执行本技术任意实施例所提供的笔触噪声处理方法,未在上述实施例中详尽描述的技术细节,可参见本技术任意实施例所提供的笔触噪声处理方法。
[0092]
上述仅为本技术的较佳实施例及所运用的技术原理。本技术不限于这里所述的特定实施例,对本领域技术人员来说能够进行的各种明显变化、重新调整及替代均不会脱离本技术的保护范围。因此,虽然通过以上实施例对本技术进行了较为详细的说明,但是本技术不仅仅限于以上实施例,在不脱离本技术构思的情况下,还可以包括更多其他等效实施例,而本技术的范围由权利要求的范围决定。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献