一种能自动甄别作文文体进行智能批量阅卷的系统方法与流程

2022-08-10 21:41:49 来源：中国专利 TAG：

1.本发明属于人工智能领域，涉及一种能自动甄别作文文体进行智能批量阅卷的系统方法。

背景技术：

2.目前，公知的中文作文自动测评技术，都不可以在大批量作文阅卷中自动甄别不同的文体。
3.至今，我国尚无一家公司公开宣称或有证据证明自己的技术能够在阅卷机扫描试卷时可自动甄别不同文体，并依据不同文体评价标准进行快速批量测评。
4.公知的背景技术只能对用户标注过文体或考试只考一种文体的作文进行自动测评，而现在全国高利害作文考试的答题卡上大多强调：“除诗歌外,文体不限。”不能自动甄别作文文体而使用通用测评标准进行大批量无差别自动阅卷，是我国作文考试自动阅卷不准的根本原因和最大痛点。

技术实现要素：

5.本发明属于人工智能领域，涉及一种能自动甄别作文文体进行智能批量阅卷的系统方法。
6.该系统方法要解决的问题是：在我国作文考试大多要求“除诗歌外,文体不限”后，不能自动甄别作文的不同文体，就不能进行批量智能阅卷。
7.该系统的技术方案要点包括：通过系统内置的文体甄别模块搜索并甄别作文标题及副标题关键词的文体表征，对此项文体表征给出权重比；搜索并甄别作文首尾、中间部分及表达方式的文体表征，对此项文体表征给出权重比；搜索并甄别作文表达方式中权重最大的文体表征，对此项文体表征也给出权重比；整合该文体的多项表征，通过参数计算，得到一个综合分数；最后对权重最大的文体进行反事实推理确认，并依据已确认的文体按照其专属文体测评标准进行智能测评，给出精准分值。
8.该系统方法还包括：根据读后感、演讲稿、倡议书等各种特殊文体的呈现方式及其特点甄别文体，取得其中某种特殊文体典型文体表征；根据议论文呈现方式及其特点甄别文体，取得议论文典型文体表征；根据说明方法的呈现方式及其特点甄别文体，取得说明文典型文体表征；根据记叙要素呈现方式及其特点甄别文体，取得记叙文典型文体表征。
9.该系统主要用途是：接入高速扫描识别测评三位一体阅卷机或高速扫描识别测评打印四位一体阅卷机，可以通过内置的文体甄别模块依据各种不同的文体标准同时进行大批量作文的智能阅卷。
10.该系统还内置了作文分文体测评模块，其运行步骤为：
⑴
将作文文体确定后的文本，传给分文体测评模块执行测评任务；
⑵
分文体测评模块无需人为操作而在接受任务后自动启动；
⑶
分文体测评模块会自动依据不同作文文体测评标准进行精准测评；
⑷
分文体测评模块会同时给出相应的百分制分值和所在年级实得分值。
11.该系统可以在文中任意必要的位置自动出示认为必要的眉批，包括：
⑴
显示有关作文文体表征的明显优势；
⑵
显示有关作文文体表征明显劣势；
⑶
给出因文体表征不足扣分数据；
⑷
整合成若干条评价语供需要阅卷把关教师人工审查复核时参考。
12.该系统可以自动生成作文私密查分码，其技术特征包括：将试卷上考生所在年级的2位编码、学校的2位编码、学生考号的4位编码与一个数字字母2位密钥合起来自动生成一个10位数私密查分码，与相应的测评查分系统网站链接，学生可通过学校获得含有密钥的私密查分码，在相关网站凭私密查分码观看自己运用该文体写作的原始成绩以及大数据分析饼图。
13.本发明在所提供的技术方案中，考试部门或学校只需将成批量的作文试卷放在高速扫描识别测评三位一体阅卷机的待评区，按动测评按钮，所有试卷及其测评结果都会以大约6分钟100篇的速度呈现在系统网站的后台。如果是用高速扫描识别测评打印四位整合一体机，所有试卷及其测评结果都会以大约8分钟100篇的速度打印出来。
14.考试部门或学校不同级别的负责人可以凭借不同级别的10位数私密查分码登录相应的测评查分网站；可以看到全部或部分测评原始成绩和更大数据的分析结果，包括标准参照参数和水平参照参数。
15.说明书附图说明为了更清楚地说明本发明实施方式和技术方案，下面将对实施例的附图作简单诠释。
16.图1为一种能自动甄别文体进行作文智能阅卷的系统方法步骤图，本发明仅有一幅附图，与“说明书摘要”的附图相一致。
17.这个步骤图中的四个步骤是我们在阅卷实践中反复印证和总结出来的基本步骤，准确率和人机对比认可率达95%以上。
18.附图显示的操作程序的第一步是导入作文：将待测评作文导入系统的文体甄别模块进行数据分析。
19.第一步所导入的文体并没有范围限制，只是诗歌不在全国高利害考试所设文体之列，即便识别出来也不赋分。
20.附图显示的操作程序的第二步是搜集文体表征：只搜集待测评作文的标题表征、首尾、中段的关键词表征和表达方式异同。
21.第二步搜集文体表征后系统会对上述三类文体表征给出一定比例的判断权重，一般是40%；30%；30%，但是在作文显示文体模糊的特殊情况下也会自动作出调整。
22.附图显示的操作程序的第三步是确定文体：整合其中权重最大的文体进行最后确认。
23.第三步确定文体时，还要进行该文体以外的反事实推理，只有不存在另一种可确认的文体时，该文体才能被最后确认。
24.附图显示的操作程序的第四步是分体智判：即对已确认文体的作文按专属测评标准进行快速智判，即智能阅卷，具体如何进行智能阅卷属于2017年的原有技术，这里不再赘述。
具体实施方式
25.本发明的目的就是要解决全国各地中高考作文强调文体不限之后，虽不影响教师人工网阅判分，却无法进行大批量作文智能阅卷的困难和痛点。
26.下面将提供实施例和附图对本发明的技术方案进行详细描述。
27.目前学校文体虽多，但是作为可以进行高利害考试的作文文体很有限。因此，本发明只介绍有代表性的一部分实施例，而不是全部的实施例。
28.参照图1所示，本发明提供的第一个实施例，作文《《爱的教育》读后感》的自动甄别文体步骤如下：步骤1，系统先将待测评作文导入作文到甄别模块进行数据分析。
29.步骤2，系统开始搜集作文标题及副标题关键词表征、首尾、中段的关键词表征和表达方式异同，发现标题中出现“读”“后”“感”的频率为百分之百，此一项即获得文体表征判断40%的权重；首尾和中间部分中也出现“读”“后”“感”的读后感常用字，此项文体表征权重为30%中的80%；行文中“引-议-联-结”的思路明显，此项文体表征权重为30%中的80%。“读后感”作为特殊文体的文体表征非常显著。
30.步骤3，系统的文体甄别模块接着整合其中权重最大的文体进行最后确认：“读后感”文体表征判断的权重共达到80%以上，“读后感”文体以外可以进行反事实推理的相似文体是“议论文”，但是排除其相似表征后，“议论文”文体特征仅占5%至8%，因此不具备确认议论文及其他任何文体的可能性。
31.步骤4，对已经确认为“读后感”文体的作文按专属测评标准进行智能测评，10位数私密查分码也同时自动生成。
32.该系统的各部分是用硬件、软件，以及它们的组合来实现的。在上述实施例中，多个步骤或方法全部通过用存储在系统中的测评勘误模块、文体甄别模块、分文体测评模块和模块下的独立批改模型，以及由一系列合适的指令的执行来实现。硬件是通过作文高速扫描识别测评三位一体阅卷机或高速扫描识别测评打印四位整合一体机、计算机、平板电脑、手机等和网络服务器连接来实现，软件是用三个模块的三套算法及其组合来实现。
33.实现上述实施例方法，一个普通老师也可以通过简单的硬件操作来完成。例如：
⑴
老师先将一个班40篇不同文体的作文放在作文高速扫描识别测评打印四位整合一体机的扫描识别区，点一下测评按钮；
⑵
一体机5分钟即可完成自动识别手写汉字、文体，测评出分数、给出评语并打印出来；
⑶
学生看评语后发现好几个扣分点，但是课上只能在打印出来的作文纸上修改；
⑷
放学后，他们用老师发给自己的10位数私密查分码，到相应的测评查分系统网站上找到自己的作文电子稿进行再一次认真修改，作文的分数和写作水平都会有不同程度的提升。
34.仍参照图1所示，本发明提供的第二个实施例，作文《珍惜时间，做时间的主人》的自动甄别文体步骤如下：步骤1，系统先将待测评作文导入甄别模块进行数据分析。
35.步骤2，系统开始搜集作文标题及副标题关键词表征、首尾、中段的关键词表征和表达方式异同，发现作文的首尾及中段都出现了“演讲”“题目”“大家好”“结束”“谢谢”等演
讲稿常用语，文题、首尾显示此项文体表征判断的权重为50%；中间部分的表达方式完全符合“演讲稿”文体表征，此项文体表征权重为20%以上。“演讲稿”作为特殊文体的表征非常显著。
36.步骤3，系统的文体甄别模块接着整合其中表征最多、权重最大的文体进行最后确认：“演讲稿”文体表征判断的权重共达到70%以上，“演讲稿”文体以外可以进行反事实推理的相似文体是“议论文”，但是排除两者相似表征后，其文体特征仅占10%，因此不具备确认议论文及其他任何文体的可能性。
37.步骤4，对已经确认为“演讲稿”文体的作文按专属测评标准进行智能测评，10位数私密查分码也同时自动生成。
38.仍参照图1所示，本发明提供的第三个实施例，作文《不争乃大争》的自动甄别文体步骤如下：步骤1，系统先将待测评作文导入甄别模块进行数据分析。
39.步骤2，系统开始搜集作文标题及副标题关键词表征、首尾、中段的关键词表征和表达方式异同，发现标题中出现论点句、判断句等具有议论文特点字眼的频率极高，“不争乃大争”就是论点句和判断句，此一项即获得文体表征判断40%的权重；首尾和中间部分中也出现“分论点句”“诠释句”“分析句”特点明显，行文中大量引用名人名言等道理论据和事实论据，此一项又获得文体表征判断40%以上的权重。
40.步骤3，系统的文体甄别模块接着整合其中权重最大的文体进行最后确认：“议论文”文体表征判断的权重共达到85%以上，“议论文”文体以外可以进行反事实推理的相似文体是“演讲稿”，但是排除其相似表征后，其文体特征仅占5%至8%，不具备确认其他任何文体的可能性。
41.步骤4，对已经确认为“议论文”文体的作文按专属测评标准进行智能测评，10位数私密查分码也同时自动生成。
42.仍参照图1所示，本发明提供的第四个实施例，作文《捏彩泥的老爷爷》的自动甄别文体步骤如下：步骤1，系统先将待测评作文导入甄别模块进行数据分析。
43.步骤2，系统开始搜集作文标题及副标题关键词表征、首尾、中段的关键词表征和表达方式异同，发现标题中出现人名或对人的称谓的频率极高，此一项即获得文体表征判断40%的权重；首尾和中间部分中也出现“人名或称谓，特别是多次出现“老爷爷”三个字，此项文体表征权重为25%；行文中多处出现关于老爷爷的外貌描写、动作描写、心理描写和语言描写，此项文体表征权重为25%。
44.步骤3，系统的文体甄别模块接着整合其中权重最大的文体进行最后确认：“写人记叙文”文体表征判断的权重共达到90%以上，“写人记叙文”文体以外可以进行反事实推理的相似文体是“叙事记叙文”，但是排除两者相似表征后，其文体特征仅占10%，不具备确认“叙事记叙文”及其他任何文体的可能性。
45.步骤4，对已经确认为“写人记叙文”文体的作文按专属测评标准进行智能测评，10位数私密查分码也同时自动生成。
46.仍参照图1所示，本发明提供的第五个实施例，作文《我叫老妈学唱歌》的自动甄别文体步骤如下：
步骤1，系统先将待测评作文导入甄别模块进行数据分析。
47.步骤2，系统开始搜集作文标题及副标题关键词表征、首尾、中段的关键词表征和表达方式异同，发现标题中出现叙事关键词的频率极高，此一项即获得文体表征判断35%的权重；首尾和中间部分也出现表示时间、地点、人物、事件起因、经过、结果、反思的词语，此项文体表征权重为25%；文中对叙事经过的描述远多于对妈妈的优秀品质的描写，叙事记叙文的“叙事线”非常清楚，此项文体表征权重为30%。
48.步骤3，系统的文体甄别模块接着整合其中权重最大的文体进行最后确认：“叙事记叙文”文体表征判断的权重共达到80%以上，“叙事记叙文”文体以外可以进行反事实推理的相似文体是“写人记叙文”，但是排除两者相似表征后，其文体特征仅占18%，因此不具备确认“写人记叙文”及其他任何文体的可能性。
49.步骤4，对已经确认为“叙事记叙文”文体的作文按专属测评标准进行智能测评，10位数私密查分码也同时自动生成。
50.仍参照图1所示，本发明提供的第六个实施例，作文《我的生活少不了它》的自动甄别文体步骤如下：步骤1，系统先将待测评作文导入甄别模块进行数据分析。
51.步骤2，系统开始搜集作文标题及副标题关键词表征、首尾、中段的关键词表征和表达方式异同，发现标题中出现对事物评价和说明的关键词的频率比较高，“生活少不了的它”明显是指向“事物”，具备“事物说明文”标题的显著特点，此一项即获得文体表征判断权重的36%；首尾和中间部分也出现频率很高的多个方位词，还有“下定义”“列数字”“作比较”三种说明方法集中使用的情况，这是其他文体中及少见的，此项文体表征权重为30%；事物说明文的行文思路比较明显，此项文体表征权重为20%。
52.步骤3，系统的文体甄别模块接着整合其中权重最大的文体进行最后确认：“事物说明文”文体表征判断的权重共达到86%以上，“事物说明文”文体以外可以进行反事实推理的相关文体是“记叙文”和“议论文”，但是排除三者之间的相似表征后，其文体表征分别仅占5%和18%，不具备确认“记叙文”“议论文”及其他任何文体的可能性。
53.步骤4，对已经确认为“事物说明文”文体的作文按专属测评标准进行智能测评，10位数私密查分码也同时自动生成。
54.需要强调说明的是，上述实施例都是示例性的，不能理解为对本技术的限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：虚拟现实可视化方法、装置、计算机设备及存储介质与流程

一种能自动甄别作文文体进行智能批量阅卷的系统方法与流程

相关文献

最热文献