一种应用于检测设备的语音控制系统及方法与流程

2022-06-08 22:35:42 来源：中国专利 TAG：

1.本发明涉及仪器控制技术领域，特别涉及一种应用于检测设备的语音控制系统及方法。

背景技术：

2.在当前的仪器仪表市场上，制造商更加专注于仪器仪表性能上的竞争。随着智能设备的普及，对于越来越多的用户来说，人们的注意力已经转移到易用性、交互体验和操作效率等问题。在进行复杂工程实验的过程中，工程人员最为沮丧的是没有足够多的手来进行设备操作和花费大量时间阅读、查询冗长的设备手册。
3.随着仪器智能化程度的普及和提高，语音识别技术逐渐成熟，使用语音控制来完成测量仪器的控制操作已成现实。语音控制仪器有着其实用的意义，例如当人们在用示波器测量时，两只操作手都被占用，需要调整仪器的测量设置，通过语音控制的方式就可以有效地解决上述问题。
4.当前具备语音控制能力的仪器设备非常稀少，且都依赖于特定厂商的具备语言控制能力的特定型号仪器；对绝大多数现有仪器而言，在不升级硬件的前提下，都无法支持语音控制。
5.同时，对于检测设备设备而言，虽然物理面板的旋钮、按键或者鼠标的点击操作均能够接收用户的控制指令，但是上述方式的自动化程度较低，需要工程人员在实验过程中进行手动操作。采用编程方式，通过scpi指令可实现自动化的控制操作。但是，由于scpi命令需要用户查阅仪器控制手册，编写程序来完成控制，灵活性较差，对于仪器设置相对固定的生产环境，具有一定的适应性；对于需要经常调整仪器设置的实验室环境而言，适应性较差，无法满足实际应用的需求。
6.如何更加高效地通过语音提高仪器使用者的操作效率，更加智能地完成对仪器的控制，对输出结果的智能管理，拓宽现有仪器的适用范围，避免硬件升级成本，是本领域技术人员亟需解决的问题。

技术实现要素：

7.基于此，为解决现有技术中的技术问题，特提出了一种应用于检测设备的语音控制方法，包括：
8.客户端设备中的显示器显示一条或多条语音输入提示，其中所述一条或多条语音输入提示中的每一条语音输入提示对应一个或多个语音控制指令；
9.拾音设备中的拾音器阵列拾取音频信号，所述拾音器阵列包括多支拾音器；拾音设备中的波束成形器通过对拾音器阵列拾取的音频信号中的子信号进行语音增强处理而从中提取用户的语音信号；
10.语音设备中的关键词识别器识别预设的关键词；语音设备中的语音识别器用于对语音信号进行语音识别处理，并根据语音信号中被识别的语音内容创建语音控制指令；
11.所述语音识别器通过与其相连接的客户端设备与检测设备进行通信，所述客户端设备接收语音识别器的语音控制指令进行解析后配置相应的检测设备进行对应的检测操作，检测结果反馈至所述客户端设备并通过其显示器进行显示，同时将检测结果发送到语音设备中的语音合成器，所述语音合成器对检测结果进行语音合成并通过客户端设备中的扬声器进行播报；
12.控制设备接收与其相连接的所述关键词识别器发送的关键词识别结果；所述控制设备基于该关键词识别结果对与其相连接的波束成形器进行波束成形控制，以便于对拾音器阵列拾取的音频信号中的第n个子信号进行语音增强处理，所述第n个子信号为来自处于相对于拾音器阵列的第n个方位角度的用户所发出的语音信号，其中n为大于0的整数。
13.在一种实施例中，所述语音识别器对语音信号进行语音识别处理，具体包括：所述语音识别器对其接收到的语音信号进行滤波从而去除其中的冗余信息，利用mel频率倒谱系数方法进行特征提取，提取得到的特征参数与声学模型进行匹配获得初步识别结果，然后通过语音解码和搜索算法结合字典解析得到最终的语音识别结果。
14.在一种实施例中，所述声学模型的建模采用隐马尔可夫模型，对预先识别的检测指令相关语音数据进行训练，将训练好的声学模型移植到语音识别器对中；其中，语音识别器的语言模型采用n-gram模型，通过对检测术语文本信息进行训练获得关键词关联概率。
15.在一种实施例中，所述控制设备基于该关键词识别结果对与其相连接的波束成形器进行波束成形控制，具体包括：所述控制设备在启动时基于第m位用户在第n个方位角度处发出的语音信号而进行校准，所述控制设备控制并调谐波束成形器的波束方向至从与该方位角度匹配的方向，利用拾音器阵列拾取该方位角度所发出的音频信号，其中m为大于0的整数；所述语音设备接收与其相连接的拾音设备所拾取的音频信号并过滤来自与该方位角度不同方向且超出设定阈值的音频信号；
16.当第m位用户移动到其他方位角度并发出包含预设关键字的语音信号时，通过关键词识别器识别用户发出的语音中的关键字并由所述控制系统重新进行校准，控制系统控制并调谐波束成形器的波束方向至第m位用户当前移动到的方向角度。
17.在一种实施例中，所述关键词包括所述唤醒词，所述唤醒词由用户预先设置；
18.在语音设备开始使用语音识别器进行语音识别处理前，所述语音设备首先利用关键词识别器进行唤醒词的识别；当所述关键词识别器识别到用户发出的语音中包含的唤醒词后，所述语音设备响应于唤醒词并激活所述语音识别器。
19.此外，为解决现有技术中的技术问题，特提出了一种应用于检测设备的语音控制系统，包括客户端设备、拾音设备、语音设备、控制设备；所述客户端设备与所述语音设备相连接；所述控制设备分别与所述拾音设备、语音设备相连接；所述拾音设备与所述语音设备相连接；
20.其中，客户端设备包括显示器、扬声器；所述显示器显示一条或多条语音输入提示，其中所述一条或多条语音输入提示中的每一条语音输入提示对应一个或多个语音控制指令；
21.其中，所述拾音设备包括拾音器阵列、波束成形器；所述拾音器阵列用于拾取音频信号，所述拾音器阵列包括多支拾音器；所述波束成形器通过对拾音器阵列拾取的音频信号中的子信号进行语音增强处理而从中提取用户的语音信号；
22.其中，所述语音设备包括关键词识别器、语音识别器、语音合成器；所述关键词识别器用于识别预设的关键词；所述语音识别器用于对语音信号进行语音识别处理，并根据语音信号中被识别的语音内容创建语音控制指令；
23.所述语音识别器通过与其相连接的客户端设备与检测设备进行通信，所述客户端设备接收语音识别器的语音控制指令进行解析后配置相应的检测设备进行对应的检测操作，检测结果反馈至所述客户端设备并通过其显示器进行显示，同时将检测结果发送到语音合成器，所述语音合成器对检测结果进行语音合成并通过客户端设备中的扬声器进行播报；
24.其中，所述控制设备接收与其相连接的所述关键词识别器发送的关键词识别结果；所述控制设备基于该关键词识别结果对与其相连接的波束成形器进行波束成形控制，以便于对拾音器阵列拾取的音频信号中的第n个子信号进行语音增强处理，所述第n个子信号为来自处于相对于拾音器阵列的第n个方位角度的用户所发出的语音信号，其中n为大于0的整数。
25.在一种实施例中，所述语音识别器对语音信号进行语音识别处理，具体包括：所述语音识别器对其接收到的语音信号进行滤波从而去除其中的冗余信息，利用mel频率倒谱系数方法进行特征提取，提取得到的特征参数与声学模型进行匹配获得初步识别结果，然后通过语音解码和搜索算法结合字典解析得到最终的语音识别结果。
26.在一种实施例中，所述声学模型的建模采用隐马尔可夫模型，对预先识别的检测指令相关语音数据进行训练，将训练好的声学模型移植到语音识别器对中；其中，语音识别器的语言模型采用n-gram模型，通过对检测术语文本信息进行训练获得关键词关联概率。
27.在一种实施例中，所述控制设备基于该关键词识别结果对与其相连接的波束成形器进行波束成形控制，具体包括：所述控制设备在启动时基于第m位用户在第n个方位角度处发出的语音信号而进行校准，所述控制设备控制并调谐波束成形器的波束方向至从与该方位角度匹配的方向，利用拾音器阵列拾取该方位角度所发出的音频信号，其中m为大于0的整数；所述语音设备接收与其相连接的拾音设备所拾取的音频信号并过滤来自与该方位角度不同方向且超出设定阈值的音频信号；
28.当第m位用户移动到其他方位角度并发出包含预设关键字的语音信号时，通过关键词识别器识别用户发出的语音中的关键字并由所述控制系统重新进行校准，控制系统控制并调谐波束成形器的波束方向至第m位用户当前移动到的方向角度。
29.在一种实施例中，所述关键词包括所述唤醒词，所述唤醒词由用户预先设置；
30.在语音设备开始使用语音识别器进行语音识别处理前，所述语音设备首先利用关键词识别器进行唤醒词的识别；当所述关键词识别器识别到用户发出的语音中包含的唤醒词后，所述语音设备响应于唤醒词并激活所述语音识别器。
31.实施本发明实施例，将具有如下有益效果：
32.在多用户环境下对移动的特定用户即检测设备操作员的语音信号进行识别，从而准确、高效地对检测设备进行智能化控制，即使用户的操作手被占用也能够对检测设备完成实时交互控制，实现设备的智能化管理。
附图说明
33.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
34.其中：
35.图1为本发明中语音控制系统的示意图。
具体实施方式
36.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
37.本发明公开了一种应用于检测设备的语音控制系统，包括客户端设备、拾音设备、语音设备、控制设备；所述客户端设备与所述语音设备相连接；所述控制设备分别与所述拾音设备、语音设备相连接；所述拾音设备与所述语音设备相连接；
38.其中，客户端设备包括显示器、扬声器；所述显示器显示一条或多条语音输入提示，其中所述一条或多条语音输入提示中的每一条语音输入提示对应一个或多个语音控制指令；
39.其中，所述拾音设备包括拾音器阵列、波束成形器；
40.其中，所述拾音器阵列用于拾取音频信号，所述拾音器阵列包括多支拾音器；
41.其中，所述波束成形器通过对拾音器阵列拾取的音频信号中的子信号进行语音增强处理而从中提取用户的语音信号；
42.特别地，所述波束成形器通过对拾音器阵列拾取的音频信号中的第n个子信号进行语音增强处理而从中提取用户的语音信号，所述第n个子信号为来自处在相对于拾音器阵列的第n个方位角度的用户所发出的语音信号，其中n为大于0的整数；
43.其中，所述语音设备包括关键词识别器、语音识别器、语音合成器；
44.其中，所述关键词识别器用于识别预设的关键词；
45.其中，所述语音识别器用于对语音信号进行语音识别处理，并根据语音信号中被识别的语音内容创建语音控制指令；
46.其中，所述关键词包括所述m条语音输入提示中的词语；
47.特别地，所述语音识别器对语音信号进行语音识别处理，具体包括：所述语音识别器对其接收到的语音信号进行滤波从而去除其中的冗余信息，利用mel频率倒谱系数方法进行特征提取，提取得到的特征参数与声学模型进行匹配获得初步识别结果，接着通过语音解码和搜索算法结合字典解析得到最终的语音识别结果；
48.特别地，所述声学模型的建模采用隐马尔可夫模型，对预先识别的检测指令相关语音数据进行训练，将训练好的声学模型移植到语音识别器对中；其中，语音识别器的语言模型采用n-gram模型，通过对检测术语文本信息进行训练获得关键词关联概率；
49.特别地，所述关键词包括所述唤醒词，所述唤醒词由用户预先设置；
50.在语音设备开始使用语音识别器进行语音识别处理前，所述语音设备首先利用关键词识别器进行唤醒词的识别；当所述关键词识别器识别到用户发出的语音中包含的唤醒词后，所述语音设备响应于唤醒词并激活所述语音识别器；
51.其中，语音设备构建语料库，语料库越丰富则语音识别结果就越准确；
52.所述语音识别器通过与其相连接的客户端设备与检测设备进行通信，所述客户端设备接收语音识别器的语音控制指令进行解析后配置相应的检测设备进行对应的检测操作，检测结果反馈至所述客户端设备并通过其显示器进行显示，同时将检测结果发送到语音合成器，所述语音合成器对检测结果进行语音合成并通过客户端设备中的扬声器进行播报；
53.特别地，启动检测后，所述语音合成器通过语音合成反馈结果提示用户进行参数配置操作，根据检测业务流程引导用户进行检测前及检测中的配置操作，直到检测设备完成检测；
54.其中，控制设备接收与其相连接的所述关键词识别器发送的关键词识别结果；控制设备基于该关键词识别结果对与其相连接的波束成形器进行波束成形控制，以便于对拾音器阵列拾取的音频信号中的第n个子信号进行语音增强处理，所述第n个子信号为来自处于相对于拾音器阵列的第n个方位角度的用户所发出的语音信号，其中n为大于0的整数；
55.具体地，所述控制设备基于该关键词识别结果对与其相连接的波束成形器进行波束成形控制，具体包括：
56.所述控制设备在启动时基于第m位用户在第n个方位角度处发出的语音信号而进行校准，所述控制设备控制并调谐波束成形器的波束方向至从与该方位角度匹配的方向，利用拾音器阵列拾取该方位角度所发出的音频信号，其中m为大于0的整数；所述语音设备接收与其相连接的拾音设备所拾取的音频信号并过滤来自与该方位角度不同方向且超出设定阈值的音频信号；
57.例如，语音识别器将会过滤处于第n 1个方位角度的第m 1位用户相对于麦克风阵列发出的语音信号；
58.特别地，所述控制设备对具有语音特征的音频信号敏感，即对语音信号敏感而对其它类型的音频信号不敏感；例如，波束成形器将会过滤第m位用户附近的扬声器所产生的音乐信号；
59.发出语音的用户是会移动的，当第m位用户移动到其他方位角度时，若不重新校准控制设备，具体来说，在没有重新校准波束成形器的情况下，语音识别器的语音识别处理很大概率会失败而导致语音控制失败；
60.当第m位用户移动到其他方位角度并发出包含预设关键字的语音信号时，通过关键词识别器识别用户发出的语音中的关键字并由所述控制系统重新进行校准，控制系统控制并调谐波束成形器的波束方向至第m位用户当前移动到的方向角度；
61.特别地，在预设的关键字之后，控制设备对第m位用户发出的包含其他词语的语音信号也可以重新进行校准；
62.例如，第m 1位用户开始发出语音信号但是其中没有预设的关键字，其发出语音被认为是不相关的而被过滤，也无法对其进行重新校准；由此可见，即使当第m位用户在移动时，控制设备会持续将波束成形器的波束方向调谐至第m位用户；第m位用户的语音信号是
从拾音器阵列拾取的音频信号中提取得到并且是语音识别处理的基础；由此可见，控制设备可以持续追随某个特定的用户(例如，第m位用户)。
63.此外，本发明还公开了一种应用于检测设备的语音控制方法，包括：
64.客户端设备中的显示器显示一条或多条语音输入提示，其中所述一条或多条语音输入提示中的每一条语音输入提示对应一个或多个语音控制指令；
65.拾音设备中的拾音器阵列拾取音频信号，所述拾音器阵列包括多支拾音器；拾音设备中的波束成形器通过对拾音器阵列拾取的音频信号中的子信号进行语音增强处理而从中提取用户的语音信号；
66.语音设备中的关键词识别器识别预设的关键词；语音设备中的语音识别器用于对语音信号进行语音识别处理，并根据语音信号中被识别的语音内容创建语音控制指令；
67.所述语音识别器通过与其相连接的客户端设备与检测设备进行通信，所述客户端设备接收语音识别器的语音控制指令进行解析后配置相应的检测设备进行对应的检测操作，检测结果反馈至所述客户端设备并通过其显示器进行显示，同时将检测结果发送到语音设备中的语音合成器，所述语音合成器对检测结果进行语音合成并通过客户端设备中的扬声器进行播报；
68.控制设备接收与其相连接的所述关键词识别器发送的关键词识别结果；所述控制设备基于该关键词识别结果对与其相连接的波束成形器进行波束成形控制，以便于对拾音器阵列拾取的音频信号中的第n个子信号进行语音增强处理，所述第n个子信号为来自处于相对于拾音器阵列的第n个方位角度的用户所发出的语音信号，其中n为大于0的整数；
69.其中，所述语音识别器对语音信号进行语音识别处理，具体包括：
70.所述语音识别器对其接收到的语音信号进行滤波从而去除其中的冗余信息，利用mel频率倒谱系数方法进行特征提取，提取得到的特征参数与声学模型进行匹配获得初步识别结果，然后通过语音解码和搜索算法结合字典解析得到最终的语音识别结果；
71.其中，所述声学模型的建模采用隐马尔可夫模型，对预先识别的检测指令相关语音数据进行训练，将训练好的声学模型移植到语音识别器对中；其中，语音识别器的语言模型采用n-gram模型，通过对检测术语文本信息进行训练获得关键词关联概率；
72.其中，所述控制设备基于该关键词识别结果对与其相连接的波束成形器进行波束成形控制，具体包括：所述控制设备在启动时基于第m位用户在第n个方位角度处发出的语音信号而进行校准，所述控制设备控制并调谐波束成形器的波束方向至从与该方位角度匹配的方向，利用拾音器阵列拾取该方位角度所发出的音频信号，其中m为大于0的整数；所述语音设备接收与其相连接的拾音设备所拾取的音频信号并过滤来自与该方位角度不同方向且超出设定阈值的音频信号；
73.当第m位用户移动到其他方位角度并发出包含预设关键字的语音信号时，通过关键词识别器识别用户发出的语音中的关键字并由所述控制系统重新进行校准，控制系统控制并调谐波束成形器的波束方向至第m位用户当前移动到的方向角度；
74.其中，所述关键词包括所述唤醒词，所述唤醒词由用户预先设置；
75.在语音设备开始使用语音识别器进行语音识别处理前，所述语音设备首先利用关键词识别器进行唤醒词的识别；当所述关键词识别器识别到用户发出的语音中包含的唤醒词后，所述语音设备响应于唤醒词并激活所述语音识别器。
76.以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不会使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：用于机器人的语音识别方法、装置及机器人与流程

一种应用于检测设备的语音控制系统及方法与流程

相关文献

最热文献