一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种轻生活语音识别控制系统的制作方法

2021-06-22 17:08:00 来源:中国专利 TAG:控制系统 智能控制 语音识别 特别 生活
一种轻生活语音识别控制系统的制作方法

本发明涉及智能控制技术领域,特别涉及一种轻生活语音识别控制系统。



背景技术:

语音识别技术,也可以称为自动语音识别(automaticspeechrecognition,asr),其任务是把人所发出的语音中词汇内容转换为计算机可读入的文本。语音识别技术是一种综合性的技术,它涉及到多个学科领域,如发声机理和听觉机理、信号处理、概率论和信息论、模式识别以及人工智能等等。

目前的电视、风扇、空调等设备在使用是往往只能通过遥控器进行控制,如果找不到遥控器就无法对设备进行操作控制,本发明提出了一种轻生活语音识别控制系统,通过红外线控制方式可以在不使用遥控器的情况下,对设备进行控制。



技术实现要素:

本发明提出了一种轻生活语音识别控制系统,通过红外线控制方式可以在不使用遥控器的情况下,对设备进行控制。

本发明提供一种轻生活语音识别控制系统,包括:输入模块,音频转换模块、控制模块、存储模块、播放模块和红外发送模块;

所述输入模块,用于通过mic采集语音信息;

所述音频转换模块,用于将所述语音信息转换成数字信号;

所述控制模块,用于根据所述数字信号进行识别、判断与控制;

所述存储模块,用于存储与控制命令对应的音频;

所述播放模块,用于通过喇叭播放flash中的指令音频;

所述红外发送模块,用于向设备发送红外控制码。

优选的,所述轻生活语音识别控制系统还包括唤醒模块和通讯连接模块;

所述唤醒模块,用于将长时间不使用的轻生活语音识别控制系统唤醒,投入使用状态;

所述通讯连接模块,用于通过连接协议实现控制输入。

优选的,所述控制模块,包括:识别单元、校验单元、判断单元和控制单元;

所述识别单元,用于对所述数字信号进行识别,获得识别结果;

所述校验单元,用于对所述数字信号进行校验,获得校验结果;

所述判断单元,用于所述信号识别信息是否为语音命令的信息,获得判断结果;

所述控制单元,用于根据所述识别结果、校验结果以及判断结果生成控制指令。

优选的,所述控制单元,包括:播放控制单元和红外控制单元;

所述播放控制单元,用于匹配flash中存储的指令音频,并将匹配的指令音频传输至所述播放模块;

所述红外控制模块,用于结合红外协议生成红外控制指令,并将生成的红外控制指令传输至所述红外发送模块。

优选的,所述识别单元获得识别结果的过程包括:

对所述数字信号进行语音检测,获得检测后的语音信号;

对检测后的语音信号做降噪处理,获得降噪后的语音信息;

对降噪后的语音信息进行特征提取,获得语音特征信息;

根据所述语音特征信息结合声学模型进行匹配与比较和/或结合语音模型进行匹配与比较,得到识别结果。

优选的,所述语言模型是根据所述语言信息结合语言数据库通过模拟信号处理、数字信号处理以及统计建模方法训练获得的;

所述声学模型是根据所述语音信息结合语音数据库通过模拟信号处理、数字信号处理以及统计建模方法训练获得的。

优选的,所述红外发送模块向设备发送红外控制码的过程包括:

根据所述红外控制指令在红外码库中匹配确定红外控制码;

将所述红外控制码发送至设备。

优选的,所述红外码库中存储了258000种空调机型的红外控制码,而且红外控制码还通过学习指令学习得到的。

优选的,所述通讯连接模块通过串口协议连接遥控器或者通过互联网连接协议连接特定app实现对设备控制的输入。

优选的,所述获得识别结果的过程包括:

对所述数字信号进行语音检测,获得检测后的语音信号;

对检测后的语音信号进行分帧,并确定检测后的语音信号的峰值;

将峰值系数锐化处理,获得柔和系数值;

根据下述公式对语音加权得到增强帧;

上述公式中,r(k)表示增强帧,σ表示预设阈值,其值为0.1至0.4,φ表示柔和系数值,y(k)表示增强前的语音帧,τ表示峰值,k表示语音帧第一个信号点的在语音序列中序号,h表示峰值的位置;

通过下述公式进行余弦加窗,帧间叠加,得到增强语音;

上述公式中,w(k)表示增强语音,sin表示正弦函数,n表示语音帧中信号点的数目,i表示第i个信号点,r(k i)表示增强帧中第i个信号点的信息;

对所述增强语音重新分帧进行最小均方误差估计增强处理,获得增强后的语音信息;

对所述增强后的语音信息做降噪处理,获得降噪后的语音信息;

对所述降噪后的语音信息进行等响度处理;

对等响度处理后的语音信息进行指数非线性操作;

对指数非线性操作后的语音信息进行变换,得到语音特征;

根据所述语音特征信息结合声学模型进行匹配与比较和/或结合语音模型进行匹配与比较,得到识别结果。

本发明至少具有如下有益效果:

(1)本发明提供的轻生活语音识别控制系统采用红外线控制方式在不需要遥控器的情况下实现对设备的控制,并且通过输入模块、控制模块和播放模块能够实现与用户的语音交互,使得用户能够在发出控制语音指令后能够得到语音反馈,提升用户的使用感,而且通过输入模块、控制模块和红外发送模块能够实现根据用户的语音对设备的红外控制,方便用户使用,快速实现对设备的控制,此外,通过音频转换模块能够将输入的语音信息转换成数字信号的形式,便于在轻生活语音识别控制系统中传输,而且不易出现丢失或者错乱等错误,提升了控制的准确性。

(2)本发明提供的轻生活语音识别控制系统通过唤醒模块使得轻生活语音识别控制系统在长时间不使用的状态下处于睡眠状态,不仅节约资源,而且还有助于延迟使用寿命,并且在想要使用时,通过唤醒词就可以将其唤醒使用,并且唤醒词还可以根据用户的个人喜好进行修改,非常便于使用。

(3)本发明提供的轻生活语音识别控制系统通过通讯连接模块使得控制模块通过串口或者其它连接协议连接其他的控制输入设备进行输入控制,从而使得输入模块不通过mic采集语音信息也能够实现对设备的控制。

(4)本发明提供的轻生活语音识别控制系统不仅能够通过适配器进行供电,也能够通过电池供电,避免出现电量不足无法使用状况的发送。

(5)本发明提供的轻生活语音识别控制系统通过红外发送模块以及控制模块能够实现对红外码库中资源的双向调用,从而能够达到对设备的控制,避免出现控制不匹配,提升控制的适用性。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1为本发明所述的一种轻生活语音识别控制系统的结构示意图;

图2为本发明所述一种轻生活语音识别控制系统的总框图;

图3为本发明所述一种轻生活语音识别控制系统中输入模块的结构示意图;

图4为本发明所述一种轻生活语音识别控制系统中控制模块的识别单元结构示意图;

图5为本发明所述一种轻生活语音识别控制系统中红外发送模块的结构示意图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

如图1至图3所示,本发明实施例提供了一种轻生活语音识别控制系统,包括::输入模块,音频转换模块、控制模块、存储模块、播放模块和红外发送模块;

所述输入模块,用于通过mic采集语音信息;

所述音频转换模块,用于将所述语音信息转换成数字信号;

所述控制模块,用于根据所述数字信号进行识别、判断与控制;

所述存储模块,用于存储与控制命令对应的音频;

所述播放模块,用于通过喇叭播放flash中的指令音频;

所述红外发送模块,用于向设备发送红外控制码。

上述技术方案中,一种轻生活语音识别控制系统,包括:输入模块,音频转换模块、控制模块、存储模块、播放模块和红外发送模块;输入模块通过mic采集语音信息;音频转换模块将所述语音信息转换成数字信号;控制模块根据所述数字信号进行识别、判断与控制;存储模块存储与控制命令对应的音频;播放模块通过喇叭播放flash中的指令音频;红外发送模块向设备发送红外控制码。通过上述技术方案,采用红外线控制方式在不需要遥控器的情况下实现对设备的控制,并且通过输入模块、控制模块和播放模块能够实现与用户的语音交互,使得用户能够在发出控制语音指令后能够得到语音反馈,提升用户的使用感,而且通过输入模块、控制模块和红外发送模块能够实现根据用户的语音对设备的红外控制,方便用户使用,快速实现对设备的控制,此外,通过音频转换模块能够将输入的语音信息转换成数字信号的形式,便于在轻生活语音识别控制系统中传输,而且不易出现丢失或者错乱等错误,提升了控制的准确性,同时,轻生活语音识别控制系统不仅能够通过适配器进行供电,也能够通过电池供电,避免出现电量不足无法使用状况的发送。

本发明提供的一个实施例中,所述轻生活语音识别控制系统还包括唤醒模块和通讯连接模块;

所述唤醒模块,用于将长时间不使用的轻生活语音识别控制系统唤醒,投入使用状态;

所述通讯连接模块,用于通过连接协议实现控制输入。

上述技术方案中,在轻生活语音识别控制系统还设置有唤醒模块和通讯连接模块;通过唤醒模块将长时间不使用的轻生活语音识别控制系统唤醒,投入使用状态;通讯连接模块通过连接协议实现控制输入。通过上述技术方案,使得轻生活语音识别控制系统在长时间不使用的状态下处于睡眠状态,不仅节约资源,而且还有助于延迟使用寿命,并且在想要使用时,通过唤醒词就可以将其唤醒使用,并且唤醒词还可以根据用户的个人喜好进行修改,非常便于使用;通过通讯连接模块使得控制模块通过串口或者其它连接协议连接其他的控制输入设备进行输入控制,从而使得输入模块不通过mic采集语音信息也能够实现对设备的控制。

本发明提供的一个实施例中,所述控制模块,包括:识别单元、校验单元、判断单元和控制单元;

所述识别单元,用于对所述数字信号进行识别,获得识别结果;

所述校验单元,用于对所述数字信号进行校验,获得校验结果;

所述判断单元,用于判断所述信号识别信息是否为语音命令的信息,获得判断结果;

所述控制单元,用于根据所述识别结果、校验结果以及判断结果生成控制指令。

上述技术方案中,在控制模块中设置识别单元、校验单元、判断单元和控制单元;通过识别单元对所述数字信号进行识别,获得识别结果;通过校验单元对所述数字信号进行校验,获得校验结果;通过判断单元判断所述信号识别信息是否为语音命令的信息,获得判断结果;通过控制单元根据所述识别结果、校验结果以及判断结果生成控制指令。通过上述技术方案实现了根据所述数字信号进行识别、判断与控制的目的,不仅对具有红外接口的设备进行信息交互,而且还与用户实现语音交互,此外控制模块还能够根据用户的需求人性化对设备进行定时设置与调控,使得设备满足用户打开、关闭、制冷模式、加热模式、除湿模式、送风模式、自动模式、低速风、中速风、高速风、自动风、打开扫风、关闭扫风、调高温度、调低温度、三十分钟后关闭、一小时后关闭、两小时候后关闭、三小时后关闭、四小时后关闭等需求,提升了用户的使用感。

本发明提供的一个实施例中,所述控制单元,包括:播放控制单元和红外控制单元;

所述播放控制单元,用于匹配flash中存储的指令音频,并将匹配的指令音频传输至所述播放模块;

所述红外控制模块,用于结合红外协议生成红外控制指令,并将生成的红外控制指令传输至所述红外发送模块。

上述技术方案中,控制单元中包括播放控制单元和红外控制单元,在根据所述识别结果、校验结果以及判断结果生成控制指令的过程中,在通过播放控制单元确定播放指令音频的同时通过红外控制模块生成红外控制指令,从而能够实现播放模块通过喇叭播放指令音频的同时红外发送模块向设备发送红外控制指令,提高响应时间以及控制的效率。

如图4所示,本发明提供的一个实施例中,所述识别单元获得识别结果的过程包括:

对所述数字信号进行语音检测,获得检测后的语音信号;

对检测后的语音信号做降噪处理,获得降噪后的语音信息;

对降噪后的语音信息进行特征提取,获得语音特征信息;

根据所述语音特征信息结合声学模型进行匹配与比较和/或结合语音模型进行匹配与比较,得到识别结果。

上述技术方案中,识别单元在获得识别结果时,首先,通过对所述数字信号进行语音检测,实现对数字信号的校验,确保数字信号的完整性,从而获得检测后的语音信号,然后,通过对检测后的语音信号做降噪处理,获得降噪后的语音信息,使得去除噪音对语音指令的干扰,避免噪音对语音指令识别造成干扰与误差;接着,通过对降噪后的语音信息进行特征提取,获得语音特征信息,明确语音信息的特征,为获得识别结果提高匹配与参考基础;最后,根据所述语音特征信息结合声学模型进行匹配与比较和/或结合语音模型进行匹配与比较,得到识别结果。通过上述技术方案,语音检测能够确保语音的完整性,进而确保语音识别的完整性,避免因语音不完整导致识别出错或者识别不出来,并且无法通过检测的语音信息将直接被丢弃,从而避免识别不完整数据造成时间上的浪费;降噪处理能够使得语音信息更加明确,去除噪音等其它无关声音的干扰,从而提高语音识别的准确率,通过根据所述语音特征信息结合声学模型进行匹配与比较和/或结合语音模型进行匹配与比较得到识别结果时,仅仅匹配与比较相适用的模型就可以得到,不仅耗时短,而且还简单方便。

本发明提供的一个实施例中,所述语言模型是根据所述语言信息结合语言数据库通过模拟信号处理、数字信号处理以及统计建模方法训练获得的;

所述声学模型是根据所述语音信息结合语音数据库通过模拟信号处理、数字信号处理以及统计建模方法训练获得的。

上述技术方案中,声学模型和语言模型中的模型是通过训练之后的,也就是说声学模型和语言模型中模型的参数是最优状态下的参数,使得识别误差最小化,从而提高了识别结果的准确性。

如图5所示,本发明提供的一个实施例中,所述红外发送模块向设备发送红外控制码的过程包括:

根据所述红外控制指令在红外码库中匹配确定红外控制码;

将所述红外控制码发送至设备。

上述技术方案中,红外发射信号是由一串0和1的二进制代码组成,不同的芯片对0和1的编码有所不同,红外包括两种方式:脉冲宽度调制(pwm)和脉冲位置调制(ppm或曼彻斯特编码),两种形式编码的代表nec和philips的rc-5,在红外发送模块向设备发送红外控制码时,先是根据所述红外控制指令在红外码库中匹配确定红外控制码;然后再将所述红外控制码发送至设备,无论是哪种设备都可以在红外码库中确定相应红外控制码,实现对不同设备的适配,扩大适用范围。

例如,当输入模块通过mic采集到的语音信息为“格力kfr-35gw/(35592)fnhae-b3型号空调制冷模式下23度”时,能够精准地在红外码库中确定相对应的红外控制码,进而将确定的红外控制码发送至格力kfr-35gw/(35592)fnhae-b3型号空调设备,从而实现将格力kfr-35gw/(35592)fnhae-b3型号空调设备的控制于指令模式下23度。

本发明提供的一个实施例中,所述红外码库中存储了258000种空调机型的红外控制码,而且红外控制码还通过学习指令学习得到的。

上述技术方案中,在红外码库中存储了258000中空调机型的红外控制码,当需要对某种具体的空调机型(如“美的rn02j/bg”机型)进行配对时,只需要说一句“匹配空调遥控器”,然后拿出“美的rn02j/bg”机型的原装遥控器,对准轻生活语音识别控制系统,按一下遥控器上的“开/关”按键,轻生活语音识别控制系统就会根据接收到的遥控器的红外码,在红外码库中快速比对,立即从258000种红外码中精准地找出与“美的rn02j/bg”机型对应的红外码,并将其设置为当前使用的红外码库,当匹配不到红外码库中存储的空调机型的红外控制码时,则需要学习的红外码,如风扇的红外码,则通过红外接收头把学习到的红外码,如“打开摇头”的红外码复制并存储起来,当识别到“打开摇头”语音指令时,就将这一个红外码通过红外发射管发射出去,完成控制动作。上述技术方案能够使得轻生活语音识别控制系统不仅适用于空调,而且这对于红外码库中没有存储的对应的红外控制码也可以通过学习指令学习后获得红外控制码,扩大了轻生活语音识别控制系统的适用范围。

本发明提供的一个实施例中,所述通讯连接模块通过串口协议连接遥控器或者通过互联网连接协议连接特定app实现对设备控制的输入。

上述技术方案中,通过通讯模块使得即使不通过输入模块输入语音也可以通过其他的方式实现对控制的输入指令,从而实现对设备的控制,在通讯模块中,既可以通过串口协议连接遥控器,又可以通过互联网连接协议连接特定app,都可以实现对设备控制的输入,丰富轻生活语音识别控制系统的使用,不仅可以远程控制,而且还能够无论是否有网络都可以实现控制,方便用户使用。

本发明提供的一个实施例中,所述获得识别结果的过程包括:

对所述数字信号进行语音检测,获得检测后的语音信号;

对检测后的语音信号进行分帧,并确定检测后的语音信号的峰值;

将峰值系数锐化处理,获得柔和系数值;

根据下述公式对语音加权得到增强帧;

上述公式中,r(k)表示增强帧,σ表示预设阈值,其值为0.1至0.4,φ表示柔和系数值,y(k)表示增强前的语音帧,τ表示峰值,k表示语音帧第一个信号点的在语音序列中序号,h表示峰值的位置;

通过下述公式进行余弦加窗,帧间叠加,得到增强语音;

上述公式中,w(k)表示增强语音,sin表示正弦函数,n表示语音帧中信号点的数目,i表示第i个信号点,r(k i)表示增强帧中第i个信号点的信息;

对所述增强语音重新分帧进行最小均方误差估计增强处理,获得增强后的语音信息;

对所述增强后的语音信息做降噪处理,获得降噪后的语音信息;

对所述降噪后的语音信息进行等响度处理;

对等响度处理后的语音信息进行指数非线性操作;

对指数非线性操作后的语音信息进行变换,得到语音特征;

根据所述语音特征信息结合声学模型进行匹配与比较和/或结合语音模型进行匹配与比较,得到识别结果。

上述技术方案中,在获得识别结果的过程中,依次根据如下步骤进行获取识别结果:对数字信号进行语音检测,获得检测后的语音信号;对检测后的语音信号进行分帧,并确定检测后的语音信号的峰值;将峰值系数锐化处理,获得柔和系数值;对语音加权得到增强帧;通过余弦加窗,帧间叠加,得到增强语音;对增强语音重新分帧进行最小均方误差估计增强处理,获得增强后的语音信息;对增强后的语音信息做降噪处理,获得降噪后的语音信息;对降噪后的语音信息进行等响度处理;对等响度处理后的语音信息进行指数非线性操作;对指数非线性操作后的语音信息进行变换,得到语音特征;根据语音特征信息结合声学模型进行匹配与比较和/或结合语音模型进行匹配与比较,得到识别结果。上述技术方案通过对检测后的语音信号进行处理得到增强语音,使得语音信号的高频部分增强,以补偿高频分量在传输过程中的过大衰减,而且能够有效地提高了信噪比,能够更加准确的进行去噪处理,进而获得更好的降噪后的语音信息,此外在对语音加权得到增强帧的过程中,通过公式:

能够消除加权对语音信号的削弱,从而达到增强的目的。此外,通过上述技术方案得到的语音特征中不仅提高了语音的信噪比,还有效对噪音等其它干扰声音起到抑制作用,使得语音特征更加鲜明,进而提高识别结果的准确性。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜