一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

汉字拼音混淆项的生成方法及计算机可读存储介质与流程

2022-02-24 18:11:24 来源:中国专利 TAG:


1.本发明涉及数据生产技术领域,尤其涉及一种汉字拼音混淆项的生成方法及计算机可读存储介质。


背景技术:

2.关于海量题库收集目前大多基于网络爬虫抓取,容易陷入爬取的重复题目、版权等数据清洗、维护,侵犯知识产权等相关问题。
3.传统老师手工定义汉字选择题或判断拼音混淆项,工作量大,易出错,如果题干重新定义,得重新手工出题,效率低下。


技术实现要素:

4.本发明所要解决的技术问题是:提供一种汉字拼音混淆项的生成方法及计算机可读存储介质,可提高汉字拼音混淆项的生成效率。
5.为了解决上述技术问题,本发明采用的技术方案为:一种汉字拼音混淆项的生成方法,包括:
6.获取待考查的汉字的拼音;
7.拆分所述汉字的拼音,得到所述拼音的声母、韵母和声调;
8.根据所述拼音的声母对应的声母干扰项以及所述拼音的韵母和声调,生成声母混淆项;
9.根据所述拼音的韵母对应的韵母干扰项以及所述拼音的声母和声调,生成韵母混淆项;
10.根据所述拼音的声母和韵母以及其他声调,生成声调混淆项;
11.根据所述声母混淆项、韵母混淆项和声调混淆项,生成所述汉字的拼音混淆项。
12.本发明还提出一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上所述的方法的步骤。
13.本发明的有益效果在于:通过划分出拼音的声母、韵母和声调,并分别使用声母干扰项和韵母干扰项对其进行重新组合,得到声母混淆项和韵母混淆项,并将拼音的声调替换为其他声调,得到声调混淆项。本发明可自动生成待考查的汉字的拼音混淆项,提高拼音混淆项的生成效率和准确率,进而可实现汉字拼音单选题的智能生产。
附图说明
14.图1为本发明的汉字拼音混淆项的生成方法的流程图;
15.图2为本发明实施例一的方法流程图;
16.图3为本发明实施例一的声母韵母组合表。
具体实施方式
17.为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图详予说明。
18.请参阅图1,一种汉字拼音混淆项的生成方法,包括:
19.获取待考查的汉字的拼音;
20.拆分所述汉字的拼音,得到所述拼音的声母、韵母和声调;
21.根据所述拼音的声母对应的声母干扰项以及所述拼音的韵母和声调,生成声母混淆项;
22.根据所述拼音的韵母对应的韵母干扰项以及所述拼音的声母和声调,生成韵母混淆项;
23.根据所述拼音的声母和韵母以及其他声调,生成声调混淆项;
24.根据所述声母混淆项、韵母混淆项和声调混淆项,生成所述汉字的拼音混淆项。
25.从上述描述可知,本发明的有益效果在于:可提高汉字拼音混淆项的生成效率。
26.进一步地,所述拆分所述汉字的拼音,得到所述拼音的声母、韵母和声调具体为:
27.根据所述汉字的拼音与预设的正则表达式,匹配得到字符,所述正则表达式包括声母韵母列表;
28.根据预设的声母表,判断所述字符是否为声母;
29.若是,则将所述字符作为所述拼音的声母,并将所述拼音剩余的字符作为所述拼音的韵母;
30.若否,则将所述字符作为所述拼音的韵母,并将所述拼音剩余的字符作为所述拼音的声母;
31.根据预设的带声调的单韵母列表,在所述拼音的韵母中匹配得到带声调的单韵母;
32.将所述拼音的韵母中所述带声调的单韵母替换成对应的不带声调的单韵母,得到所述拼音的不含声调的韵母,并得到所述拼音的声调。
33.由上述描述可知,可准确地划分出拼音的声母、不含声调的韵母和声调。
34.进一步地,所述根据所述拼音的声母对应的声母干扰项以及所述拼音的韵母和声调,生成声母混淆项具体为:
35.判断所述拼音的声母是否存在对应的声母干扰项;
36.若存在,则根据所述声母干扰项以及所述拼音的不含声调的韵母,生成干扰声母韵母组合;
37.根据预设的声母韵母组合表,对所述干扰声母韵母组合进行过滤,得到不含声调的声母混淆项;
38.为所述不含声调的声母混淆项添加所述拼音的声调,得到声母混淆项。
39.由上述描述可知,通过将所述拼音的声母对应的声母干扰项与所述拼音的韵母和声调进行组合,得到声母混淆项;通过过滤无效的声母韵母组合,提高声母混淆项的生成准确率。
40.进一步地,所述根据所述拼音的韵母对应的韵母干扰项以及所述拼音的声母和声调,生成韵母混淆项具体为:
41.判断所述拼音的韵母是否存在对应的韵母干扰项;
42.若存在,则根据所述拼音的声母以及所述韵母干扰项,生成声母干扰韵母组合;
43.根据预设的声母韵母组合表,对所述声母干扰韵母组合进行过滤,得到不含声调的韵母混淆项;
44.为所述不含声调的韵母混淆项添加所述拼音的声调,得到韵母混淆项。
45.由上述描述可知,通过将所述拼音的韵母对应的韵母干扰项与所述拼音的声母和声调进行组合,得到韵母混淆项;通过过滤无效的声母韵母组合,提高韵母混淆项的生成准确率。
46.进一步地,所述根据所述拼音的声母和韵母以及其他声调,生成声调混淆项之前,进一步包括:
47.若所述待考查的汉字为多音字且所述声母混淆项和韵母混淆项中存在所述待考查的汉字的其他拼音,则在所述声母混淆项和韵母混淆项中去除所述汉字的其他拼音。
48.由上述描述可知,通过去除待考查汉字的其他正确拼音,保证后续生成的单选题只存在唯一的正确选项。
49.进一步地,所述根据所述拼音的声母和韵母以及其他声调,生成声调混淆项具体为:
50.若所述声母混淆项和韵母混淆项的总数量小于预设个数,则将所述汉字的拼音的声调替换为其他声调,生成声调混淆项。
51.由上述描述可知,通过保证拼音混淆项的数量,从而保证后续生成的选择题的选项数量。
52.进一步地,所述根据所述声母混淆项、韵母混淆项和声调混淆项,生成所述汉字的拼音混淆项之后,进一步包括:
53.根据所述待考查的汉字、所述汉字的拼音和拼音混淆项以及预设的题干格式,组合得到所述汉字的拼音单选题。
54.由上述描述可知,可实现汉字拼音单选题的智能生产。
55.本发明还提出一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上所述的方法的步骤。
56.实施例一
57.请参照图2-3,本发明的实施例一为:一种汉字拼音混淆项的生成方法,可应用于汉字拼音选择题的构造场景,如图2所示,包括如下步骤:
58.s1:获取待考查的汉字的拼音;即输入要考查的汉字及其拼音。
59.s2:拆分所述汉字的拼音,得到所述拼音的声母、韵母和声调。
60.具体地,本步骤包括如下步骤:
61.s201:根据所述汉字的拼音与预设的正则表达式,匹配得到字符。本实施例中,所述正则表达式包括声母韵母列表,具体为
à
ng|
ē
ng|
é
ng|
ě
ng|
è
ng|
ī
ng|
í
ng|
ǐ
ng|
ì
ng|
ō
ng|
ó
ng|
ǒ
ng|
ò
ng|
ā
ng|
á
ng|
ǎ
ng|
ā
n|
á
n|
ǎ
n|
à
n|
ē
n|
é
n|
ě
n|
è
n|
ī
n|
í
n|
ǐ
n|
ì
n|zh|ch|sh|u
ē
|u
é
|u
ě
|u
è
|
ü
ē
|
üé
|
ü
ě
|
üè
|i
ē
|i
é
|i
ě
|i
è
|
ū
n|
ú
n|
ǔ
n|
ù
n|d|t|z|c|s|f|h|l|n|r|
ī
|
í
|
ǐ
|
ì
|
ǖ
|
ǘ
|
ǚ
|
ǜ

62.s202:根据预设的声母表,判断所述字符是否为声母,若是,则执行步骤s203,若否,则执行步骤s204。其中,所述声母表即包含了所有声母的列表。
63.s203:将所述字符作为所述拼音的声母,并将所述拼音剩余的字符作为所述拼音的韵母;即得到声母后,在完整的拼音中去除声母,即可得到带声调的韵母。然后执行步骤s205。
64.s204:将所述字符作为所述拼音的韵母,并将所述拼音剩余的字符作为所述拼音的声母;即得到韵母后,在完整的拼音中去除韵母,即可得到声母。然后执行步骤s205。
65.s205:根据预设的带声调的单韵母列表,在所述拼音的韵母中匹配得到带声调的单韵母。
66.本实施例中,所述带声调的单韵母列表为{
ā

á

ǎ

à

ō

ó

ǒ

ò

ē

é

ě

è

ū

ú

ǔ

ù

ǖ

ǘ

ǚ

ǜ

ī

í

ǐ

ì
},其中,每个带声调的单韵母均存在其对应的不带声调的单韵母及对应的声调。例如,对于“ā”,其对应的不带声调的单韵母为“a”,对应的声调为第一声;对于“ě”,其对应的不带声调的单韵母为“e”,对应的声调为第三声;以此类推。
67.s206:将所述拼音的韵母中所述带声调的单韵母替换成对应的不带声调的单韵母,得到所述拼音的不含声调的韵母,并得到所述拼音的声调。
68.例如,假设输入的是“年”字的拼音“ni
á
n”,根据正则表达式进行匹配判断后,得到声母“n”和带声调的韵母“i
á
n”;然后匹配到带声调的单韵母
“á”
,将
“á”
替换成“a”,即可得到不含声调的韵母“ian”,并得到该拼音的声调为第二声。
69.s3:判断所述拼音的声母是否存在对应的声母干扰项,若是,则执行步骤s4,若否,则无法生成声母干扰项,执行步骤s5。进一步地,若所述拼音无声母,则也执行步骤s5。
70.在该步骤之前,预先设置互相干扰的声母,例如,l、n、r互相干扰,翘舌和平舌(如zh和z,ch和c,sh和s)互相干扰,h和f互相干扰,d和t互相干扰。互相干扰的声母互为声母干扰项。
71.s4:生成声母混淆项。然后执行步骤s5。
72.具体地,本步骤包括如下步骤:
73.s401:根据所述声母干扰项以及所述拼音的不含声调的韵母,生成干扰声母韵母组合;即分别将各声母干扰与所述拼音的不含声调的韵母进行组合,即可得到干扰声母韵组合。
74.s402:根据预设的声母韵母组合表,对所述干扰声母韵母组合进行过滤,得到不含声调的声母混淆项。其中,所述声母韵母表记录了有效的声母韵母组合,如图3所示。本步骤即过滤掉不存在的声母韵母组合,输出有效的干扰声母韵母组合。
75.s403:为所述不含声调的声母混淆项添加所述拼音的声调,得到声母混淆项。
76.例如,对于“年”字的拼音“ni
á
n”,已得到其声母为“n”,由于l、n、r互相干扰,因此可得到其声母干扰项为“l”和“r”;然后“l”和“r”分别与不含声调的韵母“ian”进行组合,可得到“lian”和“rian”;对照声母韵母组合表,其中“rian”是不存在的拼音,过滤后剩下“lian”;最后加上所述拼音的声调“阳平”,即可得到声母混淆项“li
á
n”。
77.s5:判断所述拼音的韵母是否存在对应的韵母干扰项,若是,则执行步骤s6,若否,则无法生成韵母干扰项,执行步骤s7。
78.在该步骤之前,预先设置互相干扰的韵母。例如,前鼻音-n与后鼻音-ng(如an和ang,on和ong,en和eng,in和ing,ian和iang)互相干扰,ou与uo互相干扰,
ǚ
与u互相干扰,e与o互相干扰,ian、ia、in互相干扰。
79.s6:生成韵母混淆项。然后执行步骤s7。
80.具体地,本步骤包括如下步骤:
81.s601:根据所述拼音的声母以及所述韵母干扰项,生成声母干扰韵母组合;即分别将所述拼音的声母与各韵母干扰项进行组合,即可得到声母干扰韵母组合。
82.s602:根据预设的声母韵母组合表,对所述声母干扰韵母组合进行过滤,得到不含声调的韵母混淆项。声母韵母组合表如图3所示。本步骤即过滤掉不存在的声母韵母组合,输出有效的声母干扰韵母组合。
83.s603:为所述不含声调的韵母混淆项添加声调,得到韵母混淆项。
84.例如,对于“年”字的拼音“ni
á
n”,已得到其不含声调的韵母“ian”,则其韵母干扰项包括“iang”、“in”、“ia”,分别与该拼音的声母“n”组合后,可得到“niang”、“nin”、“nia”;对照声母韵母组合表,其中“nia”是不存在的拼音,过滤后剩下“niang”、“nin”;最后加上所述拼音的声调“阳平”,即可得到韵母混淆项“ni
á
ng”、“n
í
n”。
85.s7:判断所述待考查的汉字是否为多音字且所述声母混淆项和韵母混淆项中存在所述待考查的汉字的其他拼音,若是,则执行步骤s8,若否,则执行步骤s9。
86.s8:在所述声母混淆项和韵母混淆项中去除所述汉字的其他正确拼音。然后执行步骤s9。
87.s9:判断所述声母混淆项和韵母混淆项的总数量是否小于预设个数,若是,则执行步骤s10,若否,则执行步骤s11。
88.其中,由于一般的选择题的选项为4个,对于单选题即包括一个正确选项和三个错误选项,因此优选地,所述预设个数为3个。
89.s10:生成声调混淆项。然后执行步骤s11。
90.具体地,将所述汉字的拼音的声调替换为其他声调,即可生成声调混淆项。例如,对于“爱”的拼音
“à
i”,其对应的声调混淆项即为“ā
i”、
“á
i”和“ǎ
i”。
91.s11:生成所述汉字的拼音混淆项。具体地,当有声调混淆项时,则将所述声母混淆项、韵母混淆项和声调混淆项作为所述汉字的拼音混淆项。当没有声调混淆项时,则将所述声母混淆项和韵母混淆项作为所述汉字的拼音混淆项。
92.s12:根据所述待考查的汉字、所述汉字的拼音和拼音混淆项以及预设的题干格式,组合得到所述汉字的拼音单选题。
93.例如,使用固定的题干格式组合汉字“年”、拼音“ni
á
n”、拼音混淆项“li
á
n”、“ni
á
ng”、“n
í
n”生成字的单选题如下:
94.题干:“年”的拼音是(a)
95.答案:a、ni
á
n;b、ni
á
ng;c、li
á
n;d、n
í
n。
96.下面以生成“爱”字的拼音单选题进行举例说明。
97.首先,输入“爱”字的拼音
“à
i”;根据正则表达式匹配判断后,得到带声调的韵母
“à
i”,无声母。然后匹配到带声调的单韵母
“à”
,替换成不含声调的单韵母“a”,得到不含声调的韵母“ai”,并记录声调为第四声。
98.由于该拼音不含声母,因此不生成声母混淆项。由于“ai”不存在对应的韵母干扰项,因此也无法生成韵母混淆项。
99.此时,声母混淆项和韵母混淆项的总个数小于3,因此生成声调混淆项“ā
i”、
“á
i”、“ǎ
i”。
100.最后,7.使用固定的题干格式组合汉字“爱”、拼音
“à
i”、声调混淆项“ā
i”、
“á
i”、“ǎ
i”生成字的单选题如下:
101.题干:“爱”的拼音是(a)
102.答案:a、
à
i;b、
ā
i;c、
á
i;d、
ǎ
i。
103.本实施例改变传统汉字拼音识别通过老师自定义单选题的低率方式,改为使用声母、韵母混淆规则,自动生成拼音的混淆项,实现汉字拼音单选题的智能生产。
104.实施例二
105.本实施例是对应上述实施例的一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如下步骤:
106.获取待考查的汉字的拼音;
107.拆分所述汉字的拼音,得到所述拼音的声母、韵母和声调;
108.根据所述拼音的声母对应的声母干扰项以及所述拼音的韵母和声调,生成声母混淆项;
109.根据所述拼音的韵母对应的韵母干扰项以及所述拼音的声母和声调,生成韵母混淆项;
110.根据所述拼音的声母和韵母以及其他声调,生成声调混淆项;
111.根据所述声母混淆项、韵母混淆项和声调混淆项,生成所述汉字的拼音混淆项。
112.进一步地,所述拆分所述汉字的拼音,得到所述拼音的声母、韵母和声调具体为:
113.根据所述汉字的拼音与预设的正则表达式,匹配得到字符,所述正则表达式包括声母韵母列表;
114.根据预设的声母表,判断所述字符是否为声母;
115.若是,则将所述字符作为所述拼音的声母,并将所述拼音剩余的字符作为所述拼音的韵母;
116.若否,则将所述字符作为所述拼音的韵母,并将所述拼音剩余的字符作为所述拼音的声母;
117.根据预设的带声调的单韵母列表,在所述拼音的韵母中匹配得到带声调的单韵母;
118.将所述拼音的韵母中所述带声调的单韵母替换成对应的不带声调的单韵母,得到所述拼音的不含声调的韵母,并得到所述拼音的声调。
119.进一步地,所述根据所述拼音的声母对应的声母干扰项以及所述拼音的韵母和声调,生成声母混淆项具体为:
120.判断所述拼音的声母是否存在对应的声母干扰项;
121.若存在,则根据所述声母干扰项以及所述拼音的不含声调的韵母,生成干扰声母韵母组合;
122.根据预设的声母韵母组合表,对所述干扰声母韵母组合进行过滤,得到不含声调的声母混淆项;
123.为所述不含声调的声母混淆项添加所述拼音的声调,得到声母混淆项。
124.进一步地,所述根据所述拼音的韵母对应的韵母干扰项以及所述拼音的声母和声
调,生成韵母混淆项具体为:
125.判断所述拼音的韵母是否存在对应的韵母干扰项;
126.若存在,则根据所述拼音的声母以及所述韵母干扰项,生成声母干扰韵母组合;
127.根据预设的声母韵母组合表,对所述声母干扰韵母组合进行过滤,得到不含声调的韵母混淆项;
128.为所述不含声调的韵母混淆项添加所述拼音的声调,得到韵母混淆项。
129.进一步地,所述根据所述拼音的声母和韵母以及其他声调,生成声调混淆项之前,进一步包括:
130.若所述待考查的汉字为多音字且所述声母混淆项和韵母混淆项中存在所述待考查的汉字的其他拼音,则在所述声母混淆项和韵母混淆项中去除所述汉字的其他拼音。
131.进一步地,所述根据所述拼音的声母和韵母以及其他声调,生成声调混淆项具体为:
132.若所述声母混淆项和韵母混淆项的总数量小于预设个数,则将所述汉字的拼音的声调替换为其他声调,生成声调混淆项。
133.进一步地,所述根据所述声母混淆项、韵母混淆项和声调混淆项,生成所述汉字的拼音混淆项之后,进一步包括:
134.根据所述待考查的汉字、所述汉字的拼音和拼音混淆项以及预设的题干格式,组合得到所述汉字的拼音单选题。
135.综上所述,本发明提供的一种汉字拼音混淆项的生成方法及计算机可读存储介质,可自动生成待考查的汉字的拼音混淆项,提高拼音混淆项的生成效率和准确率,进而可实现汉字拼音单选题的智能生产。
136.以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献