农林渔牧食品/饮料服装/饰品纺织/造纸医疗/保健机械/机床家具/门窗喷涂/染料道路/铁路

摄影/光学乐器/声学照明/工业冶金/铸造安全/消防建筑/工具控制/调节计算,推算其他产品

语音交互系统及方法、智能设备与流程

2021-07-30 17:59:00 来源：中国专利 TAG：智能设备交互语音公开

本公开涉及智能设备技术领域，尤其涉及一种语音交互系统及方法、智能设备。

背景技术：

物联网已成为全球新一轮科技革命与产业变革的重要驱动力。现在市面上的智能音箱层出不穷，五花八门，以百度推出的“小度”，和苹果手机上的siri上都属于智能语音技术。其核心非常简要——要让机器在语音对话这一环节拥有近似于人的能力，渗入人们的日常生活空间。麦克风作为智能语音音箱上的重要部件，决定了语音交互的能力。在相关技术中，智能语音音箱若想实现交互，需要麦克风给出指示，告诉消费者语音识别开始。

技术实现要素：

本公开实施例提供了一种语音交互系统及方法、智能设备，能够实现肢体感应打开智能语音音箱，与整个智能设备整机进行交互。

本公开实施例所提供的技术方案如下：

本公开实施例提供了一种语音交互系统，包括：

语音交互单元，用于采集并识别用户的目标语音指令；

光电感应单元，所述光电感应单元与所述语音交互单元连接，用于接收并识别用户的目标肢体指令，并根据所述目标肢体指令控制所述语音交互单元开关；

指令控制单元，所述指令控制单元与所述语音交互单元连接，用于判断语音交互单元是否处于开启状态；若是，根据所述语音交互单元接收和识别用户的目标语音指令，控制智能设备执行与所述目标语音指令相应的动作。

示例性的，所述指令控制单元还用于语音交互单元处于开启状态时，判断在预定时间内所述语音交互单元是否接收到语音指令；若否，向所述语音交互单元发送该语音交互单元的关闭指令。

示例性的，所述语音交互单元还用于：当接收到该语音交互单元的关闭指令时，向所述光电感应单元发送所述光电感应单元的关闭指令。

示例性的，所述指令控制单元还用于接收并识别图像采集单元所采集的图像数据；并当所述图像数据包括目标手势时，向所述语音交互单元发送该语音交互单元的开启指令；

所述语音交互单元还用于接收到所述语音交互单元的开启指令时，向所述光电感应单元发送该光电感应单元的开启指令。

示例性的，所述语音交互单元与所述指令控制单元之间通过串口指令进行通讯，

所述语音交互单元与所述指令控制单元之间通过串口指令进行通讯。

示例性的，所述光电感应单元包括光电开关，所述光电开关包括：

外壳，所述外壳的内部中空，所述外壳包括前端和后端，前端设有指示标识，后端开口；

设置于所述外壳内的光电传感器；

设置于外壳内的线路板，所述线路板与所述光电传感器连接；

扣装在所述外壳的后端的后盖；

信号传输线束，所述信号传输线束一端与线路板连接，另一端伸出所述后盖。

示例性的，所述外壳的后端与所述后盖通过卡扣连接。

示例性的，所述前端上设有第一通孔和第二通孔；

所述光电传感器上设有接收极和发射极，所述接收极位于所述第一通孔处，所述发射极位于所述第二通孔处。

示例性的，所述指示标识包括阴刻镂空标识。

示例性的，所述光电开关还包括：设置于所述外壳内的光源。

示例性的，所述语音交互单元包括麦克风模组，所述麦克风模组包括：

上盖，所述上盖内部中空，所述上盖包括前端和后端，所述前端设有至少两个收音孔，所述后端开口；

设置于所述上盖内部的至少两个收音麦克风，每一所述收音麦克风对应一个所述收音孔设置，且每一所述收音孔处设置一密封圈；

设置于所述上盖内部的印刷电路板，所述印刷电路板与所述收音麦克风连接；

设置于所述上盖的后端的底盖。

示例性的，所述麦克风模组还包括：

连接于所述印刷电路板上的信号传输线束、及设置于所述印刷电路板上用于压住所述信号传输线束的压线板。

示例性的，所述底盖和所述压线板通过卡扣固定在所述上盖，并通过密封胶封装。

本公开实施例还提供一种语音交互方法，包括：

判断语音交互单元是否处于开启状态；

若是，根据所述语音交互单元所接收并识别的用户的目标语音指令，控制智能设备执行与所述目标语音指令相应的动作；

若否，根据光电感应单元所接收和识别的用户的目标肢体指令，控制语音交互单元开启，并根据所述语音交互单元接收和识别用户的目标语音指令，控制智能设备执行与所述目标语音指令相应的动作。

示例性的，所述方法还包括：

语音交互单元处于开启状态时，判断在预定时间内所述语音交互单元是否接收到语音指令；若否，控制语音交互单元关闭。

示例性的，所述方法还包括：

语音交互单元处于开启状态时，判断在预定时间内所述语音交互单元是否接收到语音指令；若否，控制光电感应单元关闭。

示例性的，所述方法还包括：

接收并识别图像采集单元所采集的图像数据；

当所述图像数据包括目标手势时，控制所述光电感应单元和所述语音交互单元开启。

本公开实施例还提供一种智能设备，在所述智能设备上设有本公开实施例提供的语音交互系统。

本公开实施例所带来的有益效果如下：

本公开实施例所提供的语音交互系统及方法、智能设备，将智语音交互单元与光电感应单元结合在一起，可以实现通过肢体动作，控制语音交互单元开关，实现与整机进行交互，解决光电感应单元如何控制语音交互单元打开以及指令控制单元开关语音交互单元与光电感应单元的技术难题。

附图说明

图1所示为本公开实施例中提供的语音交互系统的结构框图；

图2所示为本公开实施例中提供的语音交互系统的逻辑框图；

图3为指令控制单元、语音交互单元和光电感应单元之间的通讯方式示意图；

图4为本公开实施例中的光电开关的一种结构示意图；

图5所示为本公开实施例中光电开关的外壳前端结构示意图；

图6所示为本公开实施例中麦克风模组的结构爆炸图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例的附图，对本公开实施例的技术方案进行清楚、完整地描述。显然，所描述的实施例是本公开的一部分实施例，而不是全部的实施例。基于所描述的本公开的实施例，本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例，都属于本公开保护的范围。

除非另外定义，本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。同样，“一个”、“一”或者“该”等类似词语也不表示数量限制，而是表示存在至少一个。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同，而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系，当被描述对象的绝对位置改变后，则该相对位置关系也可能相应地改变。

本公开实施例所提供的语音交互系统可应用于各种智能设备上，例如，智能冰箱、智能洗衣机、智能电视等。

图1所示为本公开实施例中提供的语音交互系统的结构框图，图2所示为本公开实施例中提供的语音交互系统的逻辑框图。

请参见图1和图2，本公开实施例提供的智能设备的语音交互系统包括：

语音交互单元100，用于采集并识别用户的目标语音指令；

光电感应单元200，所述光电感应单元200与所述语音交互单元100连接，用于接收并识别用户的目标肢体指令，并根据所述目标肢体指令控制所述语音交互单元100开关；

指令控制单元300，所述指令控制单元300与所述语音交互单元100连接，用于判断语音交互单元100是否处于开启状态；若是，根据所述语音交互单元100接收和识别用户的目标语音指令，控制智能设备执行与所述目标语音指令相应的动作。

上述方案中，光电感应单元200、语音交互单元100和指令控制单元300连接构成语音交互系统，可应用于智能设备上，将语音交互单元100与光电感应单元200结合在一起，可以实现通过肢体动作，来控制语音交互单元100开关，实现与整机进行交互，解决光电感应单元200如何控制语音交互单元100打开以及指令控制单元300开关语音交互单元100与光电感应单元200的技术难题。

在一些实施例中，所述指令控制单元300还用于语音交互单元100处于开启状态时，判断在预定时间内所述语音交互单元100是否接收到语音指令；若否，向所述语音交互单元100发送该语音交互单元100的关闭指令。

在一些实施例中，所述语音交互单元100还用于：当接收到该语音交互单元100的关闭指令时，向所述光电感应单元200发送所述光电感应单元200的关闭指令。

在一些实施例中，所述语音交互系统还包括图像采集单元400，所述指令控制单元300与所述图像采集单元400连接，所述指令控制单元300还用于接收并识别图像采集单元400所采集的图像数据；并当所述图像数据包括目标手势时，向所述语音交互单元100发送该语音交互单元100的开启指令；所述语音交互单元100还用于接收到所述语音交互单元100的开启指令时，向所述光电感应单元200发送该光电感应单元200的开启指令。

以下对本公开实施例提供的语音交互系统进行更为详细的说明：

本公开实施例所提供的语音交互系统中，所述语音交互单元100可以包括麦克风模组(mic)等。语音交互单元根据不同的使用环境，对音质质量不同的要求，可以选用不同型号的硅麦，同时可以设计具有不同硅麦数量的麦克风模组。以麦克风模组为例，其采集和识别用户的目标语音指令的方式可以是，麦克风模组开启，开始录制用户语音，并将录制音频发送至指令控制单元300。

所述光电感应单元200可以包括光电开关、激光传感器开关、电磁感应传感器开关、电容感应传感器开关等距离感应开关装置。以光电开关为例，光电开关基于红外传感技术，原理是利用红外线的物理性质，红外信号遇到障碍物距离的不同反射的强度也不同的原理，进行障碍物远近的检测。将红外传感器与开关电路结合在一起，就形成了一种感应距离式的开关。采用光电开关接收并识别用户的目标肢体指令的方式可以是，用户在光电开关的感应距离内进行某种肢体动作，例如，靠近光电开关或者挥手等肢体动作，光电开关根据接收到反射光信号，根据光信号识别肢体动作指令。

所述指令控制单元300可以为计算机、mcu等，例如，所述指令控制单元300可以是智能设备的pc端。

在本公开实施例的语音交互系统中，所述语音交互单元100与所述指令控制单元300之间通过串口指令进行通讯，所述语音交互单元100与所述指令控制单元300之间通过串口指令进行通讯。

关于所述语音交互单元100、所述光电感应单元200和所述指令控制单元300的具体结构后文会进行进一步说明，以下先针对语音交互系统的语音交互实现过程进行更为详细的解释说明。

如图2所示，本公开实施例中提供的智能设备的语音交互系统的语音交互方法可以包括如下过程：

1)用户自主打开所述语音交互单元100，所述指令控制单元300接收语音交互单元100所发送的目标语音指令，并根据所述语音交互单元100接收和识别用户的目标语音指令，控制智能设备执行与所述目标语音指令相应的动作，以实现语音交互。逻辑框图中该过程为序号b→序号c。

2)在所述语音交互单元100处于开启状态时，所述指令控制单元300判断在预定时间内所述语音交互单元100是否接收到语音指令；若否，向所述语音交互单元100发送该语音交互单元100的关闭指令；

具体的，例如，所述指令控制单元300根据算法，当检测到语音交互单元100在一定时间内没有输入语音的时候，所述指令控制单元300会发送给语音交互单元100关闭指令(序号②)，语音交互单元100停止录音，不会再向指令控制单元300发送语音指令(序号③)，同时，语音交互单元100向光电感应单元200发送关闭命令(序号④)，光电感应单元200关闭。

需要说明的是，当用户语音指令完毕后，一段时间无语音指令，指令控制单元300会向语音交互单元100发送关闭指令，此时，语音交互单元100可处于待机状态，这样，不仅可以省电，而且还能够起到保护隐私的作用，此时，用户的语音不会被语音交互单元100录音保存。

3)当所述语音交互单元100处于关闭状态时，所述光电感应单元200感应到用户的目标肢体指令时，向所述语音交互单元100发送指令，控制所述语音交互单元100开启，所述指令控制单元300接收语音交互单元100所发送的目标语音指令，并根据所述语音交互单元100接收和识别用户的目标语音指令，控制智能设备执行与所述目标语音指令相应的动作，以实现语音交互；

例如，当用户靠近光电感应单元200(即，用户与光电感应单元200的距离小于预定距离)或者用户在光电感应单元200的传感器前做目标肢体动作(例如，挥手)时，光电感应单元200向语音交互单元100发送开启指令，语音交互单元100开始录音，并将录音数据发送到指令控制单元300，指令控制单元300根据录制音频识别文字，按照使用者的语音做出相应的动作，在逻辑框图中为序号a→序号b→序号c。

4)指令控制单元300可自主向语音交互单元100发送开启指令(序号y)，语音交互单元100开启，并将接收到的包括目标语音指令的音频数据发送到指令控制单元300(序号z)，语音交互单元100向光电感应单元200发送开启命令，光电感应单元200开启。

例如，以智能设备为智能冰箱为例，所述语音交互系统还包括图像采集单元400，当用户距离光电感应单元200距离较远而超过阈值，或者感应受影响、灵敏性受干扰时，此时可能无法通过肢体动作来打开光电感应单元200和语音交互单元100，那么，指令控制单元300可根据图像采集单元400所采集到的图像，例如，当所采集的图像中包括目标手势时，则指令控制单元300判断用户具有有打开语音交互单元100的意图，从而向语音交互单元100发送开启指令(序号v)，同时，语音交互单元100向光电感应单元200发送开启指令，以打开语音交互单元100和光电感应单元200。

图3为指令控制单元300、语音交互单元和光电感应单元200之间的通讯方式示意图，以指令控制单元300为智能设备的主机(pc端)，语音交互单元100包括麦克风模组(mic)，光电感应单元200包括光电开关led灯为具体实施例，具体的工作流程说明如下：

1)如图3连接，光电感应单元200与语音交互单元100，语音交互单元100与指令控制单元300连接；mic默认muteon状态，此时，mic保持待机状态，不输出语音指令，同时，mic将对应的muteon状态发送给光电感应单元200，光电开关保持关闭(muteon状态)，led灯熄灭；

2)当pc端通过uart(异步收发传输器，universalasynchronousreceiver/transmitter)向mic发送muteon指令后，mic关闭，同时mic通过串口将当前的状态发送给光电感应单元200，光电开关关闭(muteon状态)，led灯关闭；

3)当pc端通过uart向mic发送muteoff指令后，mic开启，同时，mic通过串口将当前的状态发送给光电感应单元200，光电开关打开(muteoff状态)，led灯打开；光电开关只有在muteon的状态下(led关闭)才能接收用户的肢体指令，在muteoff状态下(led打开)，无法接收用户的肢体指令。

具体的，该语音交互系统中控制指令如表1所示：

表1:pc-mic-光电开关控制指令

以上是针对本公开实施例提供的智能设备的语音交互系统的逻辑设计进行的说明，以下对本公开实施例提供的智能设备的语音交互系统中各单元从结构上再进行详细说明。

在一些实施例中，如图4和图5所示，所述光电感应单元200包括光电开关，所述光电开关包括：外壳210、光电传感器220、线路板230、后盖240和第一信号传输线束(图中未示意)，所述外壳210的内部中空，所述外壳210包括前端和后端，前端设有指示标识211，后端开口；所述光电传感器220设置于所述外壳210内；所述线路板230设置于外壳210内，所述线路板230与所述光电传感器220连接；所述后盖240扣装在所述外壳210的后端；所述第一信号传输线束一端与线路板230连接，另一端伸出所述后盖240，所述光电开关还包括设置于所述外壳210内的光源。例如，所述光源可以包括led灯。

在一些实施例中，如图4所示，所述外壳210的后端与所述后盖240通过卡扣连接。例如，所述外壳210的后端可设置卡扣槽，所述后盖240上设卡扣241，通过将后盖240上的卡扣241卡在所述外壳210的卡扣槽内，通过所述后盖240盖住外壳210后，可以防止脱落。

此外，在一些实施例中，如图5所示，所述前端上设有第一通孔213和第二通孔214；所述光电传感器220上设有接收极和发射极，所述接收极位于所述第一通孔213处，所述发射极位于所述第二通孔214处，以便于所述光电传感器220的接收极和发射极露出。

上述方案中，所述第一通孔213和所述第二通孔214的尺寸以露出接收极和发射极为准，例如，所述第一通孔213和所述第二通孔214的直径可以为2.8mm。

此外，在本公开一些实施例中，所述指示标识包括阴刻镂空标识。这样，在外壳210的前端表面具有阴刻镂空标识，能够在光电开关外壳210表面清晰地显示标记，例如，标记为文字，如“wavehandtospeak”，提醒用户可挥手打开光电开关，唤醒麦克风进行录音。

外壳210的前端表面阴刻镂空标识的浮雕设计深度可以为0.3mm左右，采用阴刻镂空标识相较于阳刻镂空标记来说，字体更清晰。阳刻字体较厚，若外壳210为注塑工艺成型，表面喷漆，外壳210光的透过性不好，字体越厚则显示越暗，对比效果越差。若采用阴刻镂空的形式，字体减薄，显示越亮，对比效果越好，解决光电开关工作时外壳210标记显示不清晰的技术问题。

此外，需要说明的是，外壳210可的表面可喷漆，例如，选用pantone656c色号，喷漆厚度可以为0.7～0.12μm，以保证led的光线均匀透过，阴刻镂空标识的字迹显示清晰。

此外，本公开实施例中，所述光电开关中的光电传感器220可以选用红外传感器，该红外传感器可通过外围电阻的大小，决定通电电流的范围，决定红外传感器的感应距离。例如，根据实际使用环境，光电开关的感应距离可以在80mm左右，但是不以此为限。

所述红外传感器的发射极发射红外光线，当用户在感应距离内进行肢体动作(例如，靠近光电开关或挥手等动作)时，发射出的红外光线会在遮挡障碍物的反射下，将光线反射回，此时红外传感器的接收极会收到光信号，并将光信号转换成电信号。所述光电开关根据所述红外传感器的电信号，控制led灯点亮，同时根据uart指令唤醒麦克风模组。

此外，在一种具体示例性实施例中，所述光电开关中的线路板230包括相背设置的第一面和第二面，在第一面设置led灯，用于为所述光电开关提供光源，该led灯点亮后，光线可透过外壳210，显示外壳210前端上的阴刻镂空标识。

在所述第一面还设置所述红外传感器以及外围电阻等。

在所述第二面设置光电感应主芯片和第一信号传输线束，所述光电感应主芯片接收到所述红外感应器所发送的信号，并对信号进行处理，向所述麦克风模组发送开启指令。所述第一信号传输线束一端连接至所述线路板230，另一端穿过所述后盖240中心开设的通孔，与所述麦克风模组的第一信号传输线束相连，所述光电开关接收与发送指令均都通过信号传输线束传输。

此外，在一些实施例中，所述语音交互单元包括麦克风模组。图所示为麦克风模组的一种实施例的结构爆炸图。

如图6所示，所述麦克风模组包括：上盖110、至少两个收音麦克风(图中未示意出)、印刷电路板120、密封圈130和底盖140，其中所述上盖110内部中空，所述上盖110包括前端和后端，所述前端设有至少两个收音孔，所述后端开口；至少两个收音麦克风设置于所述上盖110内部，每一所述收音麦克风对应一个所述收音孔设置，且每一所述收音孔处设置一密封圈130；所述印刷电路板120设置于所述上盖110内部，所述印刷电路板120与所述收音麦克风连接；所述底盖140设置于所述上盖110的后端。

在一些实施例中，所述麦克风模组还包括：连接于所述印刷电路板120上的第二信号传输线束、及设置于所述印刷电路板120上用于压住所述第二信号传输线束的压线板150。所述底盖140和所述压线板通过卡扣固定在所述上盖110，并通过密封胶封装。

作为一种示例性的实施例，所述麦克风模组的上盖110丝印黑色标记(logo)，便于用户识别，所述上盖110的表面上下分别为两个收音孔，对应在密封圈130的位置，更加有利于声音的收集。

作为一种示例性的实施例，所述印刷电路板120包括正面和背面，以麦克风数量为两个为例，两个麦克风设置在正面两端。以该麦克风模组中麦克风数量为两个为例，环境噪音采样后，声音波形经过分析和相位操作，叠加到主麦克风的采样波形上，形成相位抵消，使其中一个麦克风稳定保持清晰录音，另一个麦克风主动消除物理噪音，再经过算法处理，录出来的声音更清晰，解决了麦克风在嘈杂环境中，录音效果差的技术难题，双麦克风在处理变化的、复杂的声音环境时，可以提高信噪比，保持录制声音纯净，后期算法处理更为精准。

在印刷电路板120的正面还设置语音信号主芯片，语音信号主芯片可根据两个麦克风录入的声音数据进行降噪以及算法优化等处理，同时，语音信号主芯片内包括串口接口，用于发送和接收光电开关和pc端的指令。

在印刷电路板120的背面设置有复位键，用于后续升级软件操作。

在印刷电路板120的背面还设有连接线插孔，用于连接第二信号传输线束，保持与光电开关和pc端之间的信号数据传输。

所述底盖140和所述压线盖可通过卡扣方式连接在所述上盖110，并通过密封胶封装，以防止外力受损。

本公开实施例还提供一种语音交互方法，包括：

判断语音交互单元100是否处于开启状态；

若是，根据所述语音交互单元100所接收并识别的用户的目标语音指令，控制智能设备执行与所述目标语音指令相应的动作；

若否，根据光电感应单元200所接收和识别的用户的目标肢体指令，控制语音交互单元100开启，并根据所述语音交互单元100接收和识别用户的目标语音指令，控制智能设备执行与所述目标语音指令相应的动作。

在一些示例性的实施例中，所述方法还包括：

语音交互单元100处于开启状态时，判断在预定时间内所述语音交互单元100是否接收到语音指令；若否，控制语音交互单元100关闭。

在一些示例性的实施例中，所述方法还包括：

语音交互单元100处于开启状态时，判断在预定时间内所述语音交互单元100是否接收到语音指令；若否，控制光电感应单元200关闭。

在一些示例性的实施例中，所述方法还包括：

接收并识别智能设备中图像采集单元400所采集的图像数据；

当所述图像数据包括目标手势时，控制所述光电感应单元200和所述语音交互单元100开启。

对于该语音交互方法的具体语音交互过程，与本公开提供的语音交互系统的具体语音交互过程相同，在此不再赘述。

本公开实施例还提供一种智能设备，在所述智能设备上设有本公开实施例提供的语音交互系统。

本公开实施例提供的智能设备可以包括智能冰箱、智能洗衣机、智能电视等，应用场景不只局限于家用电器，还可应用于服装商场导购、自助便利店等应用场景。

有以下几点需要说明：

(1)本公开实施例附图只涉及到与本公开实施例涉及到的结构，其他结构可参考通常设计。

(2)为了清晰起见，在用于描述本公开的实施例的附图中，层或区域的厚度被放大或缩小，即这些附图并非按照实际的比例绘制。可以理解，当诸如层、膜、区域或基板之类的元件被称作位于另一元件“上”或“下”时，该元件可以“直接”位于另一元件“上”或“下”或者可以存在中间元件。

(3)在不冲突的情况下，本公开的实施例及实施例中的特征可以相互组合以得到新的实施例。

以上，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，本公开的保护范围应以权利要求的保护范围为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种薄层低频水声隔声超材料的制作方法

语音交互系统及方法、智能设备与流程

相关文章

最热文献