一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

小学生识字量测验方法及装置与流程

2021-10-19 20:05:00 来源:中国专利 TAG:数据处理 识字 测验 小学生 装置


1.本发明涉及数据处理技术领域,具体为一种小学生识字量测验方法及装置。


背景技术:

2.识字量,即为识字的数量。识字对于学生个体的发展具有重要作用,识字阅读是学生认识世界的重要途径之一。识字量测验是考查学生识字数量的基本方法,是筛查学生是否具有阅读障碍的重要指标,同时也是分级阅读的基本途径。
3.现有的识字量测验主要分为两种,一种从基于综合语料库形成的字频表中选取一定数量的字作为测试字库,另一种采用中小语文教材生字表作为测试字库。采用上述两种测试字库测查学生的识字量各有优势,也各有不足:前者能反映一般社会用字情况,较多地考虑了学生在社会情境识字的实际,后者能贴近学生在学习情境中识字的实际,但随着互联网和智能移动终端技术的发展,中小学生接触外部信息的频度、渠道和便利度等与过往相比发生了较大的变化,其识字途径、范围等也随之而变,现有的两种识字量测验都与现今中小学生的语言实际存在不小的偏差,得到的识字量测验结果不准确。


技术实现要素:

4.本发明提供了一种小学生识字量测验方法及装置,可以解决现有技术中由于目前的识字量测验采用的字表与现今中小学生的语言实际存在不小的偏差,导致得到的识字量测验结果不准确的问题。
5.为达到上述目的,本发明提供了如下技术方案:
6.一种小学生识字量测验方法,包括:
7.从预设的测试字库中进行分组随机抽样,抽取测试用字;其中,所述预设的测试字库为根据现代汉语语料库字频表、义务教育语文课程标准、人教版语文教材认字表、北师大版语文教材认字表、语文s版语文教材认字表和苏教版语文教材认字表生成的测试字库;
8.根据所述测试用字,采用以字形考查字音、字义的命题方式对学生进行识字量测验,得到测验结果;
9.根据所述测验结果,计算学生的识字量。
10.可选的,所述预设的测试字库的生成过程,包括:
11.将现代汉语语料库字频表和义务教育语文课程标准所附的语文课程常用字表取各自前3500字并集合,在舍弃没有字频数据的柒字、捌字、玖字后,得到包含3719字的字频表;
12.将所述包含3719字的字频表与人教版语文教材认字表、北师大版语文教材认字表、语文s版语文教材认字表和苏教版语文教材认字表进行比对,得到每个汉字的册次值;
13.将每个汉字的字频的对数值和册次值的对数值作为输入,通过kmeans聚类的方法聚类成8组汉字组,并根据各组汉字组的平均字频作为每组的难度等级进行排序,得到所述预设的测试字库。
14.可选的,若测试目标为1-2年级的学生,所述从预设的测试字库中进行分组随机抽样,抽取测试用字,包括:
15.从所述预设的测试字库的1-6组汉字组中进行分组随机抽样,抽取测试用字。
16.可选的,若测试目标为3-5年级的学生,所述从预设的测试字库中进行分组随机抽样,抽取测试用字,包括:
17.从所述预设的测试字库的2-8组汉字组中进行分组随机抽样,抽取测试用字。
18.可选的,所述根据所述测验结果,计算学生的识字量,包括:
19.若测试目标为1-2年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,得到该学生的最终识字量;
20.测试目标为3-5年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,再加上第1组汉字组的全部汉字数,得到该学生的最终识字量。
21.一种小学生识字量测验装置,包括:
22.抽取单元,用于从预设的测试字库中进行分组随机抽样,抽取测试用字;其中,所述预设的测试字库为根据现代汉语语料库字频表、义务教育语文课程标准、人教版语文教材认字表、北师大版语文教材认字表、语文s版语文教材认字表和苏教版语文教材认字表生成的测试字库;
23.测验单元,用于根据所述测试用字,采用以字形考查字音、字义的命题方式对学生进行识字量测验,得到测验结果;
24.计算单元,用于根据所述测验结果,计算学生的识字量。
25.可选的,所述小学生识字量测验装置,还包括:
26.选取单元,用于将现代汉语语料库字频表和义务教育语文课程标准所附的语文课程常用字表取各自前3500字并集合,在舍弃没有字频数据的柒字、捌字、玖字后,得到包含3719字的字频表;
27.比对单元,用于将所述包含3719字的字频表与人教版语文教材认字表、北师大版语文教材认字表、语文s版语文教材认字表和苏教版语文教材认字表进行比对,得到每个汉字的册次值;
28.聚类单元,用于将每个汉字的字频的对数值和册次值的对数值作为输入,通过kmeans聚类的方法聚类成8组汉字组,并根据各组汉字组的平均字频作为每组的难度等级进行排序,得到所述预设的测试字库。
29.可选的,若测试目标为1-2年级的学生,所述抽取单元,用于从所述预设的测试字库的1-6组汉字组中进行分组随机抽样,抽取测试用字。
30.可选的,若测试目标为3-5年级的学生,所述所述抽取单元,用于从所述预设的测试字库的2-8组汉字组中进行分组随机抽样,抽取测试用字。
31.可选的,所述计算单元,用于若测试目标为1-2年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,得到该学生的最终识字量;
32.若测试目标为3-5年级的学生,则用学生作答某组汉字对应题目时的正确率乘以
该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,再加上第1组汉字组的全部汉字数,得到该学生的最终识字量。
33.经由上述技术方案可知,本发明公开了一种小学生识字量测验方法及装置,从预设的测试字库中进行分组随机抽样,抽取测试用字;其中,预设的测试字库为根据现代汉语语料库字频表、义务教育语文课程标准、人教版语文教材认字表、北师大版语文教材认字表、语文s版语文教材认字表和苏教版语文教材认字表生成的测试字库;根据测试用字,采用以字形考查字音、字义的命题方式对学生进行识字量测验,得到测验结果;根据测验结果,计算学生的识字量。本发明综合现代汉语语料库字频表、义务教育语文课程标准以及四种语文教材认字表进行比对修正,使构建的测试字库更加完善,更能反映当前学生的语言实际。
附图说明
34.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
35.图1为本发明实施例公开的一种小学生识字量测验方法的流程图;
36.图2为本发明实施例公开的测试字库分组结果及抽样字数表;
37.图3为本发明实施例公开的一种小学生识字量测验装置的示意图。
具体实施方式
38.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
39.由背景技术可知,现有的识字量测验主要分为两种,一种从基于综合语料库形成的字频表中选取一定数量的字作为测试字库,另一种采用中小语文教材生字表作为测试字库。采用上述两种测试字库测查学生的识字量各有优势,也各有不足:前者能反映一般社会用字情况,较多地考虑了学生在社会情境识字的实际,后者能贴近学生在学习情境中识字的实际,但随着互联网和智能移动终端技术的发展,中小学生接触外部信息的频度、渠道和便利度等与过往相比发生了较大的变化,其识字途径、范围等也随之而变,现有的两种识字量测验都与现今中小学生的语言实际存在不小的偏差,得到的识字量测验结果不准确。
40.有鉴于此,本发明提供了一种小学生识字量测验方法及装置,可以解决现有技术中由于目前的识字量测验采用的字表与现今中小学生的语言实际存在不小的偏差,导致得到的识字量测验结果不准确的问题。
41.如图1所示,本发明实施例公开了一种小学生识字量测验方法,包括以下步骤:
42.s101、从预设的测试字库中进行分组随机抽样,抽取测试用字。
43.其中,所述预设的测试字库为根据现代汉语语料库字频表、义务教育语文课程标准、人教版语文教材认字表、北师大版语文教材认字表、语文s版语文教材认字表和苏教版
语文教材认字表生成的测试字库。
44.可选的,所述预设的测试字库的生成过程,包括:
45.将现代汉语语料库字频表和义务教育语文课程标准所附的语文课程常用字表取各自前3500字并集合,在舍弃没有字频数据的柒字、捌字、玖字后,得到包含3719字的字频表。
46.需要说明的是,语文课程标准将小学段的识字量目标定为3000字,初中段的目标是3500字。并附了3500字标作为教学参考。我们选择3719字已经超出了初中段的识字量目标。2.从现有的识字量测试公布的学生识字量常模来看,小学毕业生的识字量均未超过3200字。所以,3719字是足够用来测试小学生的识字量的。
47.进一步需要说明的是,“柒捌玖”因为字频太低,未能进入语委发布的5708字频表中。2.字频数据系指某个字在语料库中出现出现频次、频率两个数值。3.没有字频数据,那么就无法定义该字的难度值。另这三个字一般不会出现在小学语文教材并要求认读,故舍弃这三个字对识字量的测试结果影响可以忽略。
48.将所述包含3719字的字频表与人教版语文教材认字表、北师大版语文教材认字表、语文s版语文教材认字表和苏教版语文教材认字表进行比对,得到每个汉字的册次值。
49.具体的,以汉字“电”为例,在人教版教材中出现在2年级上册,在北师版出现在1年级下册,出现在语文s版的1年级上册,对于苏教版出现在1年级上册,那么也就可以得到四个册次值,那么我们可以得到的4个册次值分别为:3,2,1,1。其中,某套教材中,“电”字只会在某一册要求认识。后面不会再作这个要求,默认学生已认识。
50.需要说明的是,由于每个汉字在不同版本的教材中出现的册次不同,为得到每个汉字所对应的最终较为合理的册次值,我们将汉字在4个版本的教材所对应的册次值按如下规则进行处理:当一个汉字的某个册次值和其他三个册次值的均值相差大于等于3时,该册次值作废,然后取剩余册次值的均值作为该汉字的最终册次值。
51.将每个汉字的字频的对数值和册次值的对数值作为输入,通过kmeans聚类的方法聚类成8组汉字组,并根据各组汉字组的平均字频作为每组的难度等级进行排序,得到所述预设的测试字库。
52.需要说明的是,聚类分析的目的在于使同一组中的汉字的同质性最大化,不同组之间的汉字的异质性最大化。其主要依据是聚到同一个组中的汉字应该彼此相似,而属于不同组的汉字应该足够不相似。针对本研究,我们聚类分析的方法会综合每一个汉字的字频以及最终册次值,按二者的相似程度将不同的汉字划分为不同的组,使得同一组中的汉字之间的相似性比其它组中汉字相似性更强,即同一组的汉字难度最为相似,不同组汉字的难度具有明显差异。
53.具体的,为了使字频和最终册次值处于相似的维度上,因此我们对数据预处理环节所得到的字频以及最终册次值进行对数转换,得到字频对数值=ln(字频)和册次对数值=ln(最终册次值)。
54.将字频对数值和册次对数值作为数值输入,将用字范围中的汉字通过kmeans聚类的方法聚成8组,使得每组中的字都具有相似的字频和册次值,保证分组抽样的准确性。同时通过计算各组的平均字频排序作为每组的难度等级,并得到最终的测试字库。
55.可选的,若测试目标为1-2年级的学生,所述从预设的测试字库中进行分组随机抽
样,抽取测试用字,包括:
56.从所述预设的测试字库的1-6组汉字组中进行分组随机抽样,抽取测试用字。
57.如图2所示,为测试字库分组结果及抽样字数表。
58.可选的,若测试目标为3-5年级的学生,所述从预设的测试字库中进行分组随机抽样,抽取测试用字,包括:
59.从所述预设的测试字库的2-8组汉字组中进行分组随机抽样,抽取测试用字。
60.s102、根据所述测试用字,采用以字形考查字音、字义的命题方式对学生进行识字量测验,得到测验结果。
61.具体的,命题方式借鉴了以往研究中给出字形要求辨别学生字音、字义的方式。题型均为选择填空。每道题的第一空,以要求学生选出测试用字的同音字或拼音的方式考查字音,第二空以要求学生选出可与测试用字组词的字,或选出测试用字的反义词,或选出由该测试用字组成的词语的意思这三种方式考查字义。每道题选项数量5—7个。
62.例题如下:
[0063]“武”的读音和“()”字相同,“武”可以和“()”字组成词。
[0064]
a.五
ꢀꢀ
b.公
ꢀꢀ
c.术
ꢀꢀ
d.目
ꢀꢀ
e.不知道
[0065]
需要说明的是,命题时还需采用多种办法,尽可能地降低答题时的干扰因素所带来的测验误差,具体包括以下方式:
[0066]
a.鉴于低年级学生对拼音可能存在辨认困难,故1—2年级试卷中以辨认字音为考查目的的选项,尽量避免出现拼音。
[0067]
b.为避免学生在辨认选项中的汉字时发生困难,选项所测试用字的字频顺序均明显低于该题的测试用字。
[0068]
c.如果测试用字为形声字,为避免可能发生的猜测误差,设置了干扰选项。
[0069]
d.每道题均设置了“不知道”选项,以降低猜测误差。
[0070]
s103、根据所述测验结果,计算学生的识字量。
[0071]
可选的,所述根据所述测验结果,计算学生的识字量,包括:
[0072]
若测试目标为1-2年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,得到该学生的最终识字量。
[0073]
需要说明的是,每一道题有2个空,学生全部答对才视为认识该题的测试用字。如图2所示,1-2年级的测试字库为第1至第6组,共2744字。整体上按98:1的比例抽取出28个测试用字。各组按98:1的比例以四舍五入取整(第2组舍去小数)确定各自的测试用字数量。每个测试用字用一道包含两个空的选择题进行考查。用学生作答某组题目时的正确率乘以该组字数,即为学生在该组汉字中的识字量,最终将学生各组识字数量相加,即为该生的最终识字量。
[0074]
测试目标为3-5年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,再加上第1组汉字组的全部汉字数,得到该学生的最终识字量。
[0075]
需要说明的是,每一道题有2个空,学生全部答对才视为认识该题的测试用字。如图2所示,3-6年级的测试字库为3719字,但第1组272字比较简单,默认全部认识,故考查时
只用第1至第7组,共3447字。各组按86.17的比例以四舍五入取整(第5组舍去小数)确定各自的测试用字数量。每个测试用字用一道包含两个空的选择题进行考查。用学生作答某组题目时的正确率乘以该组字数,即为学生在某组汉字中的识字量,在各组识字数量之和的基础上再加上第1组的272字,即为该生的最终识字量。
[0076]
本实施例公开的小学生识字量测验方法,从预设的测试字库中进行分组随机抽样,抽取测试用字;其中,预设的测试字库为根据现代汉语语料库字频表、义务教育语文课程标准、人教版语文教材认字表、北师大版语文教材认字表、语文s版语文教材认字表和苏教版语文教材认字表生成的测试字库;根据测试用字,采用以字形考查字音、字义的命题方式对学生进行识字量测验,得到测验结果;根据测验结果,计算学生的识字量。本发明综合现代汉语语料库字频表、义务教育语文课程标准以及四种语文教材认字表进行比对修正,使构建的测试字库更加完善,更能反映当前学生的语言实际。
[0077]
基于上述本发明实施例公开的小学生识字量测验方法,图3具体公开了应用该方法的小学生识字量测验装置。
[0078]
如图3所示,本发明另一实施例公开了一种小学生识字量测验装置,该装置包括:
[0079]
抽取单元301,用于从预设的测试字库中进行分组随机抽样,抽取测试用字;其中,所述预设的测试字库为根据现代汉语语料库字频表、义务教育语文课程标准、人教版语文教材认字表、北师大版语文教材认字表、语文s版语文教材认字表和苏教版语文教材认字表生成的测试字库;
[0080]
测验单元302,用于根据所述测试用字,采用以字形考查字音、字义的命题方式对学生进行识字量测验,得到测验结果;
[0081]
计算单元303,用于根据所述测验结果,计算学生的识字量。
[0082]
可选的,所述小学生识字量测验装置,还包括:
[0083]
选取单元,用于将现代汉语语料库字频表和义务教育语文课程标准所附的语文课程常用字表取各自前3500字并集合,在舍弃没有字频数据的柒字、捌字、玖字后,得到包含3719字的字频表;
[0084]
比对单元,用于将所述包含3719字的字频表与人教版语文教材认字表、北师大版语文教材认字表、语文s版语文教材认字表和苏教版语文教材认字表进行比对,得到每个汉字的册次值;
[0085]
聚类单元,用于将每个汉字的字频的对数值和册次值的对数值作为输入,通过kmeans聚类的方法聚类成8组汉字组,并根据各组汉字组的平均字频作为每组的难度等级进行排序,得到所述预设的测试字库。
[0086]
可选的,若测试目标为1-2年级的学生,所述抽取单元301,用于从所述预设的测试字库的1-6组汉字组中进行分组随机抽样,抽取测试用字。
[0087]
可选的,若测试目标为3-5年级的学生,所述所述抽取单元301,用于从所述预设的测试字库的2-8组汉字组中进行分组随机抽样,抽取测试用字。
[0088]
可选的,所述计算单元303,用于若测试目标为1-2年级的学生,则用学生作答某组汉字对应题目时的正确率乘以该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,得到该学生的最终识字量;
[0089]
若测试目标为3-5年级的学生,则用学生作答某组汉字对应题目时的正确率乘以
该组汉字组的字数,得到学生在该组汉字组中的识字量,最终将学生各组汉字组的识字量相加,再加上第1组汉字组的全部汉字数,得到该学生的最终识字量。
[0090]
以上本发明实施例公开的小学生识字量测验装置中的抽取单元301、测验单元302和计算单元303的具体工作过程,可参见本发明上述实施例公开的小学生识字量测验方法中的对应内容,这里不再进行赘述。
[0091]
本实施例公开的小学生识字量测验装置,从预设的测试字库中进行分组随机抽样,抽取测试用字;其中,预设的测试字库为根据现代汉语语料库字频表、义务教育语文课程标准、人教版语文教材认字表、北师大版语文教材认字表、语文s版语文教材认字表和苏教版语文教材认字表生成的测试字库;根据测试用字,采用以字形考查字音、字义的命题方式对学生进行识字量测验,得到测验结果;根据测验结果,计算学生的识字量。本发明综合现代汉语语料库字频表、义务教育语文课程标准以及四种语文教材认字表进行比对修正,使构建的测试字库更加完善,更能反映当前学生的语言实际。
[0092]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0093]
本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0094]
以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜