一种用于线下多人考试的视觉辅助监考系统的制作方法

2022-04-02 03:48:24 来源：中国专利 TAG：

1.本发明涉及机器学习和计算机视觉领域，具体为一种用于线下多人考试的视觉辅助监考系统。

背景技术：

2.现在的中小学、高校等普遍安装有监控设备，且基本覆盖每间教室。这些教室是众多考试的考场，且一般在大型考试中都会将视频数据传给考试举办机构，用于作弊行为的二次判定。在实际使用中，这些视频数据完全依靠人工来进行作弊行为的判定，需要极大的人力资源成本。且受显示器像素和大小的影响极大，可能出现漏判的情况。
3.近年在线上举办的考试和比赛中，大多都通过设备上的摄像头对单人进行面部识别对比，从而确认考生身份，防止替考、多人考试等作弊行为的的出现。线下考试需在考场中举行，一个考场中会有几十名考生，而每个考场往往只有一个或两个广角摄像头。这些摄像头一般最佳的人脸识别范围在3米之内，而大多考场监控距最后一名考生的距离已经超过3米，所以不能通过像线上考试那样的人脸识别完成线下考试的作弊行为检测。

技术实现要素：

4.本发明的目的在于提供一种技术解决方案，将视频录制到监视器显示的中间部分利用起来。通过计算机的辅助数据分析与准确的作弊行为查找，从而降低人力资源成本，提高作弊行为查找的准确度。
5.为实现上述目的，本发明提供如下技术方案：
6.本发明实施例提供的一种用于线下多人考试的视觉辅助监考系统，其分为人像定位和作弊行为识别两部分。其人像定位部分包括以下步骤：
7.获取本考场的监控帧画面，并按照固定时间间隔，循环获取监控帧画面和执行本部分；
8.将获取的帧画面按照预设尺寸裁除边缘像素，将经过裁除后的帧画面按照固定的像素大小遍历提取多个小图像，并记录每个小图像的坐标；
9.将所有提取的小图像都输入到预训练的卷积神经网络1中，判断本小图像内容是否为人像。若此小图像内容被预训练的卷积神经网络1判断为人像，则记录此人像图像的坐标；
10.将所有相邻的人像图像的坐标进行拼接，合成大坐标并记录，删除拼接前的坐标。若无相邻的人像图像，则使用其原始坐标。返回经处理后的所有坐标(下称坐标数据)。
11.作为本实施例一种可能的实现方式，所述考场应当至少安装有一个监控设备，监控范围应当覆盖考场每一个学生。
12.作为本实施例一种可能的实现方式，所述按照固定时间间隔循环获取监控帧画面和执行本部分是指在考试时间内，每间隔一定时间运行一次本部分，如间隔1分钟、间隔5分钟等。每运行一次本部分，更新一次坐标数据。未运行本部分时沿用上次运行时获得的坐标
数据。
13.作为本实施例一种可能的实现方式，所述边缘像素的计算方式为：
[0014][0015]
其中，x代表帧画面的长度或宽度；y代表用于提取小图像的固定像素的边长；z为需要额外裁除的像素大小。本式的输出为裁除后的画面的左上起始点与原始帧画面的上侧和左侧的距离。单位均为像素。
[0016]
作为本实施例一种可能的实现方式，所述固定的像素大小是指较小尺寸的正方形像素块，例如尺寸为15*15像素、30*30像素、50*50像素的像素块。在正常考场环境下，标准的1920*1080像素的画面中，此像素块的尺寸应不大于50*50像素。
[0017]
作为本实施例一种可能的实现方式，所述坐标是指形状为(x，y，w，h)的张量或形状为(x，y，l)的张量。其中x和y代表本像素块的左上角像素坐标，w是像素宽度，h是像素高度，l是像素边长。单位均为像素。
[0018]
作为本实施例一种可能的实现方式，所述预训练的卷积神经网络1内部具有三个卷积层和最大池化层、一个平铺层、一个正则化层、两个全连接层。具体的网络参数由相应的训练样本的训练和调试结果决定。
[0019]
作为本实施例一种可能的实现方式，所述相邻的人像图像是指若一个人像图像的左上角起始点的纵坐标或横坐标，加上或减去固定的像素边长，等于另一个人像图像的左上角起始点的纵坐标或横坐标，则这两个人像图像为相邻的人像图像。
[0020]
本发明实施例提供的一种用于线下多人考试的视觉辅助监考系统的作弊行为识别部分包括以下步骤：
[0021]
按视频帧率或间隔取帧实时获取监控帧画面并执行本部分；
[0022]
获取人像定位部分的坐标数据，按此坐标数据从帧画面中提取图像；
[0023]
将所有提取的图像都输入到预训练的卷积神经网络2中，判断本图像内容是否为作弊行为。若此图像内容被预训练的卷积神经网络2判断为作弊行为，则记录此时的时间和此图像的坐标，并在监视器上按此图像的坐标显示一个红色矩形提示框，用于提示监考员对此处进行核查。
[0024]
作为本实施例一种可能的实现方式，所述间隔取帧是指每间隔一定帧数执行一次。如现有视频帧率为30帧每秒，每10帧执行一次，则在1秒中只执行3次。
[0025]
作为本实施例一种可能的实现方式，所述预训练的卷积神经网络2内部具有三个卷积层和最大池化层、一个平铺层、一个正则化层、两个全连接层。具体的网络参数由相应的训练样本的训练和调试结果决定。
[0026]
本发明实施例的技术方案可以具有的有益效果如下：
[0027]
本发明在拥有足够多针对于本考场训练的样本数据或使用相似考场的样本数据的情况下，可以适应绝大部分考场的环境，可使用原有监控摄像头，且几乎不受光线和监控摄像头角度的影响；在此基础上，提出了一种用于线下多人考试的视觉辅助监考系统，其中涉及考生定位和作弊行为判断两个部分。此系统将复杂的视频数据识别问题转换为两个二分类问题，极大的降低了计算量，较好的利用了现有设备，提高了监考效率，减轻了人工监考的负担。
附图说明
[0028]
图1是根据一示例性实施例示出的一种用于线下多人考试的视觉辅助监考系统的流程图；
[0029]
图2为考场中6种不同角度的监控的示意图(俯视图)；
[0030]
图3为视频帧画面处理示意图；
[0031]
图4为相邻人像图像(坐标形式)的判定示意图。
具体实施方式
[0032]
下面结合附图与实施例对本发明做进一步说明：
[0033]
为能清楚说明本方案的技术特点，下面通过具体实施方式，并结合其附图，对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开，下文对特定例子的部件和设置进行描述。此外，本发明可以在不同例子中反复参考数字和/或字母。这种重复是为了简化和清楚的目的，其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意，在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
[0034]
图1是根据一示例性实施例示出的一种用于线下多人考试的视觉辅助监考系统的流程图。如图1所示，本发明实施例提供的一种用于线下多人考试的视觉辅助监考系统，包括以下步骤：
[0035]
第一部分为人像定位部分，包括以下步骤：
[0036]
1、获取本考场的监控帧画面，并按照固定时间间隔，循环获取监控帧画面和执行本部分。
[0037]
作为本实施例一种可能的实现方式，所述考场应当至少安装有一个监控设备，其位置应当与图2所示的6个监控中的任意一个的位置相同。监控范围应当覆盖考场中的每一个学生。
[0038]
按照固定时间间隔，循环获取监控帧画面和执行本部分是指：在考试时间内，每间隔一定时间运行一次本部分，如间隔1分钟、间隔5分钟等。
[0039]
2、如图3所示，将获取的帧画面按照预设尺寸裁除边缘像素，将经过裁除后的帧画面按照固定的像素大小遍历提取多个小图像，并记录每个小图像的坐标。
[0040]
图中，1为裁除的边缘像素区域，2为提取的小图像。
[0041]
边缘像素的计算方式为：
[0042][0043]
其中，x代表帧画面的长度或宽度；y代表用于提取小图像的固定像素的边长；z为需要额外裁除的像素大小。本式的输出为裁除后的画面的左上起始点与原始帧画面的上侧和左侧的距离。单位均为像素。
[0044]
裁除，并非真正意义上的画面裁切，而是按照上式的结果，从距离原始帧画面左侧和上侧一定距离开展下一步操作。
[0045]
所有小图像的面积之和应与经裁除后的帧画面面积相等。固定的像素大小是指较小尺寸的正方形像素块，例如尺寸为15*15像素、30*30像素、50*50像素的像素块。在正常考场环境下，标准的1920*1080像素的画面中，此像素块的尺寸应不大于50*50像素。
[0046]
坐标是指形状为(x，y，w，h)的张量或形状为(x，y，l)的张量。其中x和y代表本像素块的左上角像素坐标，w是像素宽度，h是像素高度，l是像素边长。单位均为像素。
[0047]
3、将所有提取的小图像都输入到预训练的卷积神经网络1中，判断本小图像内容是否为人像。若此小图像内容被预训练的卷积神经网络1判断为人像，则记录此人像图像的坐标。
[0048]
作为本实施例一种可能的实现方式，应有足够多本考场的样本数据或使用相似考场的样本数据对卷积神经网络1进行训练。预训练的卷积神经网络1内部具有三个卷积层和最大池化层、一个平铺层、一个正则化层、两个全连接层。具体的网络参数由相应的训练样本的训练和调试结果决定。
[0049]
4、将所有相邻的人像图像的坐标进行拼接，合成大坐标并记录，删除拼接前的坐标。若无相邻的人像图像，则使用其原始坐标。返回经处理后的所有坐标(下称坐标数据)。
[0050]
相邻人像图像的判定方式如图4所示。图中每个正方形都是人像坐标里面的数据代表此正方形左上角顶点的坐标，格式为(x，y)；所有正方形的边长均为15。其中，3、4、5为人像图像。因为3和4的x坐标差为15，3和5的y坐标差为15，所以判定3和4，3和5为相邻人像坐标。
[0051]
第二部分为作弊行为识别部分，包括以下步骤：
[0052]
1、按视频帧率或间隔取帧实时获取监控帧画面并执行本部分。
[0053]
间隔取帧是指每间隔一定帧数执行一次。如现有视频帧率为30帧每秒，每10帧执行一次，则在1秒中只执行3次。
[0054]
2、获取人像定位部分的坐标数据，按此坐标数据从帧画面中提取图像。
[0055]
3、将所有提取的图像都输入到预训练的卷积神经网络2中，判断本图像内容是否为作弊行为。若此图像内容被预训练的卷积神经网络2判断为作弊行为，则记录此时的时间和此图像的坐标，并在监视器上按此图像的坐标显示一个红色矩形提示框，用于提示监考员对此处进行核查。
[0056]
作为本实施例一种可能的实现方式，应有足够多本考场的样本数据或使用相似考场的样本数据对卷积神经网络2进行训练。预训练的卷积神经网络2内部具有三个卷积层和最大池化层、一个平铺层、一个正则化层、两个全连接层。具体的网络参数由相应的训练样本的训练和调试结果决定。
[0057]
本发明针对线下考试，提出了一种基于卷积神经网络的用于线下多人考试的视觉辅助监考系统。其中，系统中应用了2个卷积神经网络，其网络架构相同，具体参数由不同训练样本的训练和调试结果决定。卷积神经网络在处理计算机视觉数据时具有极好的性能。此系统将复杂的视频数据识别问题转换为两个二分类问题，极大的降低了计算量。在拥有足够多针对于本考场训练的样本数据或使用相似考场的样本数据的情况下，可以适应绝大部分考场的环境，可使用原有监控摄像头，且几乎不受光线和监控摄像头角度的影响，是一种有效的视觉辅助监考系统。
[0058]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产
生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0059]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0060]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0061]
最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者等同替换，而未脱离本发明精神和范围的任何修改或者等同替换，其均应涵盖在本发明的权利要求保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于AnsysWorkbench的旋流除砂器高效优化设计方法与流程

一种用于线下多人考试的视觉辅助监考系统的制作方法

相关文献

最热文献