一种规范执法训练系统的制作方法

2022-04-27 07:43:23 来源：中国专利 TAG：

1.本发明属于特征识别技术领域，特别是涉及一种规范执法训练系统。

背景技术：

2.在执法过程中，通常会因为执法用语、动作不规范而导致执法者与被执法者之间产生矛盾。因此，在执法过程中，执法用语及动作的规范化尤为重要。现有执法训练系统侧重于射击和警械等方面的单项技能训练，没有执法用语及执法动作方面的训练科目，故提出一种规范执法训练系统，填补该类训练的空白。

技术实现要素：

3.本发明目的在于提供一种规范执法训练系统，解决执法者在执法过程中执法不规范的问题。
4.为了实现本发明目的，本发明提供了一种规范执法训练系统，其特征在于，包括语音输入单元、语音识别单元、语音分析单元，动作识别单元，显示单元和考核评估单元；
5.语音输入单元用于拾取训练人员语音信息；语音识别单元用于对语音输入单元拾取的语音进行识别，将语音识别成数据信息；语音分析单元用于分析训练人员的语音数据信息，并根据训练的进展将训练人员的语音数据信息与预设的执法标准语言进行对比分析；动作识别单元用于捕捉训练人员动作，并判断动作是否正确；显示单元用于显示语音与动作识别分析结果；
6.在训练系统使用过程中，训练者根据情景情况使用执法语音和动作；语音输入单元对训练者的语音进行实时捕捉，随后语音识别单元和语音分析单元对训练者的语音进行识别，并与预设的执法标准语言进行比对；同时，动作识别单元实时捕捉训练人员的执法动作，并与预设执法标准动作进行比对；最后，通过显示单元将训练人员的语音、动作分析结果进行显示。
7.进一步地，系统将训练人员的语音、动作数据与预设的标准语言、动作进行比对后，会将比对结果传输至考核评估单元；考核评估单元根据训练人员语音和动作的规范性及时间点，进行成绩判定，并将结果发送至显示单元。
8.进一步地，语音输入单元采用具智能降噪的头戴式采集设备，不干扰训练者训练，并能让采集的语言无杂音无干扰语音；语音识别单元与训练系统的语音输入单元无线通信连接，语音输入单元采集语音后，通过无线传输方式发送给语音识别单元。
9.进一步地，语音识别单元将语音信号转换成相对应的文本信息，主要包括特征提取模块、声学模型，语言模型，字典与解码模块；
10.特征提取模块将声音信号从时域转换到频域，为声学模型训练提供合适的特征向量；声学模型中再根据声学特性计算每一个特征向量在声学特征上的得分；而语言模型则根据语言学基础理论，计算该声音信号对应可能词组序列的概率；最后根据已有的字典，对词组序列进行解码，得到最后可能的文本表示。
11.进一步地，特征提取模块首先对采集的语音信息进行预处理，将需要分析的语音信号从原始信息中提取出来，同时把声音信号从时域转换到频域并进行滤波；随后，将语音首尾端的静音切除，降低对后续步骤造成的干扰，并通过移动窗函数对语音的声音进行分帧；最后，利用有线性预测倒谱系数lpcc和 mel倒谱系数mfcc算法，把预处理后的语音信息每一帧波形变成一个包含声音信息的多维向量。
12.进一步地，声学模型通过对语音数据进行训练获得，输入是语音数据的特征向量，输出为音素信息；语言模型通过对大量文本信息进行训练，得到单个字或者词相互关联的概率。
13.进一步地，字典用于储存字或者词与音素的对应关系；解码模块通过声学模型、语言模型、字典对提取特征后的语音数据进行文字输出。
14.进一步地，动作识别单元采用激光散斑技术，基于预设的人体姿态数据，动作识别单元通过判断场景周围光源照射到人体形成的斑点，进行动作特征提取；根据斑点的运动，抽象出人体关节，并最终生成骨骼和关节结点数据；通过判断各个关节结点的相对位置、速度变量，将人体动作抽象化，提取出具有关节的动作再进行判断，并与结点数据进行结合，形成最终的动作识别方法。
15.进一步地，语音分析单元预设有与当前情节对应的执法标准语言，与语音识别单元识别出的训练人员语音进行对比，根据设置的阈值，给出不同的信号传输至显示单元及声音输出单元；声音输出单元用于播放正确或者错误的提示并记录。
16.进一步地，显示单元为投影机、显示器或电视。
17.与现有技术相比，本发明的显著进步在于：训练系统主要训练和考核在非枪械执法过程中的规范性和有效性，训练过程引入长语音识别、人体动作识别等人工智能技术，通过训练场景中对训练者的标准执法口令、动作等要素的正确与否和使用时机进行实时判断识别及提示，达到规范化日常执法训练的目的。
18.为更清楚说明本发明的功能特性以及结构参数，下面结合附图及具体实施方式进一步说明。
附图说明
19.此处所说明的附图用来提供对本发明的进一步理解，构成本技术的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：
20.图1为本发明的系统组成示意图；
21.图2为本发明的信息处理工作流程图；
22.图3为本发明的信息处理示意图；
23.图4为本发明的语音识别单元工作流程图；
24.图5为本发明的动作识别单元中骨骼和关节结点示意图。
具体实施方式
25.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例；基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实
施例，都属于本发明保护的范围。
26.如图1-2所示，在本实施例中，本系统包括语音输入单元、语音识别单元、语音分析单元，动作识别单元，显示单元和考核评估单元；语音输入单元用于拾取训练人员语音信息；语音识别单元用于对语音输入单元拾取的语音进行识别，将语音识别成数据信息；语音分析单元用于分析训练人员的语音数据信息，并根据训练的进展将训练人员的语音数据信息与预设的执法标准语言进行对比分析，如果识别率达到设置的比例，将信号发送给显示单元及声音输出单元播放正确或者错误提示并记录；动作识别单元用于捕捉训练人员动作，并判断动作是否正确；显示单元用于显示语音与动作识别分析结果；
27.本训练系统用日常执法案例聚焦开发出的12类标准警情：家庭纠纷、精神病人伤人、涉伤警情、巡逻盘查、医患纠纷、债务纠纷、精神病人肇事、征地拆迁、醉酒警情、阻碍执行职务、聚众赌博、烧烤摊打架，通过平时的训练，规范执法行为，避免执法者因言语动作不当而产生不必要的纠纷，确保文明执法，依法执法。
28.在训练系统使用过程中，训练者根据情景情况使用执法语音和动作；语音输入单元对训练者的语音进行实时捕捉，随后语音识别单元和语音分析单元对训练者的语音进行识别，并与预设的执法标准语言进行比对；同时，动作识别单元实时捕捉训练人员的执法动作，并与预设执法标准动作进行比对；最后，通过显示单元将训练人员的语音、动作分析结果进行显示。
29.具体地，在本实施例中，系统将训练人员的语音、动作数据与预设的标准语言、动作进行比对后，会将比对结果传输至考核评估单元；考核评估单元根据训练人员语音和动作的规范性及时间点，进行成绩判定，并将结果发送至显示单元。
30.具体地，在本实施例中，语音识别单元、语音分析单元设置于主控计算机中。语音分析单元获取当前情节对应的执法标准语言，与语音识别单元识别出的训练人员语音进行对比，根据设置的阈值，给出不同的信号给显示单元及声音输出单元。
31.具体地，在本实施例中，主控计算机对训练人员的语音、动作进行识别分析后，将分析结果传输至声音输出单元，声音输出单元用于播放正确或者错误的提示并记录。
32.如图3所示，在本实施例中，语音输入单元为智能降噪的头戴式采集设备，不干扰训练者训练，并能让采集的语言尽量无杂音无干扰语音。语音识别单元、语音分析单元设置于主控计算机中。动作识别单元为动作识别摄像机，用于对待测人员的动作进行识别分析。声音输出单元为音箱，用于播放正确或者错误的提示并记录，显示单元为投影机或电视。
33.如图4所示，在本实施例中，语音识别单元将语音信号转换成相对应的文本信息，主要采取特征提取、声学模型，语言模型以及字典与解码四大部分，此外为了更有效地提取特征往往还需要对所采集到的声音信号进行滤波、分帧等音频数据预处理工作。语音识别单元的工作流程为，将需要分析的音频信号从原始信号中合适地提取出来，特征提取工作将声音信号从时域转换到频域，为声学模型提供合适的特征向量，声学模型中再根据声学特性计算每一个特征向量在声学特征上的得分，而语言模型则根据语言学相关的理论，计算该声音信号对应可能词组序列的概率，最后根据已有的字典，对词组序列进行解码，得到最后可能的文本表示。
34.具体地，在本实施例中，特征提取预处理实施步骤为：首尾端的静音切除，降低对后续步骤造成的干扰，静音切除的操作一般称为vad；声音分帧，也就是把声音切开成一小
段一小段，每小段称为一帧，使用移动窗函数来实现，不是简单的切开，各帧之间一般是有交叠的。
35.具体地，在本实施例中，特征提取的主要算法有线性预测倒谱系数(lpcc) 和mel倒谱系数(mfcc)，目的是把每一帧波形变成一个包含声音信息的多维向量。声学模型(am)是通过对语音数据进行训练获得，输入是特征向量，输出为音素信息。字典是字或者词与音素的对应，例如，中文就是拼音和汉字的对应，英文就是音标与单词的对应。语言模型(lm)是通过对大量文本信息进行训练获得，得到单个字或者词相互关联的概率。解码就是通过声学模型、字典、语言模型对提取特征后的音频数据进行文字输出。
36.如图5所示，在本实施例中，动作采集单元获得深度图像采用激光散斑技术，区别于传统的结构光学方法，光编码的红外线发射机发射的是一个立体编码，该编码具有三维纵深。其形成原理是激光照射到粗糙物体后，得到了具有高度的三维空间随机性的衍射斑点。而这些斑点会随着距离的不同而变换成不同的图案。当在特定场景中，完成初始的光源标定后，整个场景的散斑图案都被动作采集单元记录。因此，当其他外来的物体进入该空间后，动作采集单元获取该物体表面的特有的散斑图案，就可以通过与记录对比，计算出该物体所处的位置，从而获取该场景的深度图像；基于之前存储的人体姿态数据，通过判断场景周围光源照射到人体形成的斑点，进行动作特征提取，根据斑点的运动，抽象出人体关节，并最终生成骨骼和关节结点数据。
37.通过动作采集单元识别人体，红外摄像头看到三维世界后，就要分辨出视野中可能是人体的移动物体。将人体进行特征提取，骨骼系统和关节结点数据，包括头部、左右肩、左右手等25个结点。人体做出的所有动作都是通过各个关节组合完成，这些关节结点跟随人体的移动而在三维场景中移动。因此判断人物动作时，可以通过判断各个关节结点的相对位置、速度等变量，并将人体动作抽象化，提取出具有关键特征的动作再进行判断，然后与结点数据进行结合，形成最终的动作识别方法。
38.需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。
39.尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：作业机械语音交互方法、系统及作业机械与流程

一种规范执法训练系统的制作方法

相关文献

最热文献