一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

给中文添加拼音时实现多音字拼音添加的方法与流程

2021-11-26 23:21:00 来源:中国专利 TAG:


1.本发明涉及中文添加拼音领域,尤其涉及一种给中文添加拼音时实现多音字拼音添加的方法。


背景技术:

2.中文可以添加拼音,但是,有些汉字的发音不止一种,有的甚至多达七八种读音。
3.虽然用户给中文添加拼音时,如果碰到多音字发音不对,可以在拼音指南ui(拼音指南界面)上通过自定义拼音来修正。现有的技术在给用户实现默认拼音添加时,往往忽略了多音字的使用语境,从而导致对多音字标注拼音可能出现错误。
4.因此,有必要提供一种新的技术方案。


技术实现要素:

5.为解决现有技术中存在的技术问题,本发明公开了一种给中文添加拼音时实现多音字拼音添加的方法,其在给用户实现默认拼音时就能够根据多音字在不同语境的发音,实现对多音字的拼音添加,从而给用户带来更方便,更好的体验。具体技术方案如下所述:
6.本发明提供一种给中文添加拼音时实现多音字拼音添加的方法,包括:
7.选择文档中待加注拼音的汉字;
8.在拼音字典里根据汉字的编码检索与汉字对应的拼音内容;
9.判断拼音内容的个数是否大于1,若是,则该汉字为多音字,在多音字字典中,根据多音字的编码检索与该多音字对应的多个拼音内容;
10.将多个拼音内容分割成由多个字符串组成的字符串数组;
11.在文档中分别选取该多音字之前和该多音字之后的汉字,将多音字以字符“~”替代,多音字之前的汉字、多音字之后的汉字和多音字字符“~”形成新字符串;
12.检索新字符串中是否包含所述字符串数组中的字符串,若是,则根据新字符串在字符串数组中的索引,取对应的多音字拼音。
13.进一步地,判断拼音内容的个数是否大于1,若否,则该汉字为单音字,在拼音字典中,根据该汉字的编码检索与该汉字对应的默认拼音。
14.进一步地,汉字的拼音字典对应的内容从左至右包括编码、等于号和拼音内容,其中,拼音内容至少为一个,多个拼音内容以逗号分隔,每个拼音内容中的声调以数字表示。
15.进一步地,将多音字对应的多个拼音内容含逗号分割,拆成由多个字符串组成的字符串数组。
16.进一步地,选取该多音字之前0-4个汉字,选取该多音字之后0-4个汉字。
17.进一步地,还包括制作多音字字典,具体为:根据多音字的使用频率确定多音字拼音内容的优先级,再收集多音字的常用非默认拼音的词语,组成多音字字典。
18.进一步地,第一个拼音内容作为默认拼音,不添加词语,第一个拼音内容之后的拼音为非默认拼音,第一个拼音内容和第一拼音内容之后的拼音内容按使用频率作为优先级
排列,相邻的拼音内容之间用逗号隔开;
19.从第二个拼音内容始,在第二个拼音内容的右边添加
“-”
作为标记,
“-”
后面列举多个词语,相邻的词语以空格作为分隔,采用字符“~”表示当前的多音字。
20.进一步地,多音字字典的拼音顺序与拼音字典的拼音顺序保持一致,多音字拼音内容中,尾部没有添加列举的词语的拼音可去除。
21.进一步地,检索新字符串中是否包含字符串数组中字符串,若是,则表示该多音字有列举词语,根据新字符串在字符串数组中的索引,取对应的多音字拼音。
22.进一步地,检索新字符串中是否包含字符串数组中字符串,若否,则该汉字为单音字,在拼音字典里根据汉字的编码检索与汉字对应的默认拼音。
23.本发明具有以下有益效果:
24.1、本发明的给中文添加拼音时实现多音字拼音添加的方法,其在给用户实现默认拼音时就能够根据多音字在不同语境的发音,实现对多音字的拼音添加,从而给用户带来更方便,更好的体验。
25.2、本发明的方法,其通过永中软件的yozo office的拼音指南功能,制作多音字字典,给中文添加拼音时,根据该字典的词组优先级,对多音字设置相对正确的默认拼音,让用户使用拼音功能更流畅,同时节省时间。
26.本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
27.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
28.图1本发明给中文添加拼音时实现多音字拼音添加的方法的流程图
29.图2是本发明给中文添加拼音时实现多音字拼音添加的方法在一个实施例中的流程图。
具体实施方式
30.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
31.在本发明的描述中,需要理解的是,术语“上”、“下”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或者元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以使直接相连,也可以通过中间媒介间接相
连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
32.请参阅图1和图2,本发明的给中文添加拼音时实现多音字拼音添加的方法,包括,
33.首先要制作多音字字典:拼音的实现,使用了一个拼音字典,比如“差”字,拼音的字典对应的内容为:“5dee=cha1,cha4,chai1,ci1,chai4,cuo1,jie1”。等号左边的“5dee”是“差”字的编码,右边是拼音内容,以逗号分隔,声调用数字表示,0为“轻声”、1为“阴平”、2为“阳平”、3为“上声”,4为“去声”。表示“差”字有七种读音。
34.多音字字典是参照拼音字典来实现的,根据多音字的使用频率确定多音字拼音内容的优先级,再收集多音字的一些常用的非默认拼音的词语,组成新的字典,即多音字字典。同样的,比如“差”字,多音字字典对应的内容为:“5dee=cha1,cha4-~不多~劲~点儿~生~得远~不离~等成绩~~很远~钱~錢~勁~點兒~得遠~不離成績~~很遠~什么~什麼,chai1-出~~遣~旅费~使~事~役兼~公~当~交~信~官~钦~~人开小~神~鬼使鬼使神~~旅費當~欽~邮~開小~郵~,ci1-参~參”~。
[0035][0036]
等号左边的“5dee”是“差”字的编码,右边是多音字内容,以逗号分隔。第一个拼音作为默认拼音,不添加词语;随后的拼音按使用频率作为优先级排列,在拼音的右边添加
“-”
作为标记,后面跟随列举的词语,多种词语间以空格作为分隔,“~”表示当前的多音字本身。
[0037]
多音字字典的拼音顺序必须与拼音字典的拼音顺序保持一致,多音字拼音内容中,尾部没有添加列举的词语的拼音可以去除,比如上述范例的“差”,尾部的“chai4”,“cuo1”,“jie1”这三种拼音就去除了。同时,不允许在中间去除没有列举词语的拼音。
[0038]
多音字字典的使用:
[0039]
文档中选择部分内容加注拼音,是逐个字符的检索,只给中文加注拼音。每检索一个中文字符,先根据编码在拼音字典检索出拼音内容a,如果是单音字,则直接返回a中的默认拼音。
[0040]
如果是多音字,则需要根据编码在多音字字典检索出多音字内容b,按逗号分割,拆成字符串数组c,在文档中取多音字前面0到4个字,再取后面0到4个字,将多音字本身以字符“~”“替代,形成新字符串d。检索字符串d是否包含数组c中某字符串,如果不包含,则按单音字处理,直接返回a中的默认拼音。如果包含,则根据字符串d在数组c中的索引,取对应的多音字拼音作为返回值。
[0041]
下面对本发明的方案进行进一步描述。
[0042]
s1、选择文档中待加注拼音的汉字。
[0043]
比如给一段文本“我说你差不多就行了”添加拼音,以给“差”字加拼音举例。
[0044]
s2、在拼音字典里根据汉字的编码检索与汉字对应的拼音内容;
[0045]
判断拼音内容的个数是否大于1,若是,则该汉字为多音字,在多音字字典中,根据多音字的编码检索与该多音字对应的多个拼音内容。拼音字典对应的内容从左至右包括编码、等于号和拼音内容,其中,拼音内容至少为一个,多个拼音内容以逗号分隔,每个拼音内容中的声调以数字表示。
[0046]
在拼音字典中检索出“差”字对应的内容a为:“5dee=cha1,cha4,chai1,ci1,
chai4,cuo1,jie1”,拼音内容的个数有7个,确认是多音字。
[0047]
在多音字字典中检索出“差”字对应的内容b为:“5dee=cha1,cha4-~不多~劲~点儿~生~得远~不离~等成绩~~很远~钱~錢~勁~點兒~得遠~不離成績~~很遠~什么~什麼,chai1-出~~遣~旅费~使~事~役兼~公~当~交~信~官~钦~~人开小~神~鬼使鬼使神~~旅費當~欽~邮~開小~郵~,ci1-参~參~”。
[0048]
s3、将多音字对应的多个拼音内容含逗号分割,拆成由多个字符串组成的字符串数组。
[0049]
以逗号分割,拆成的字符串数组c长度为4,有4个字符串,其内容为:
[0050]“cha1”,
[0051]“cha4-~不多~劲~点儿~生~得远~不离~等成绩~~很远~钱~錢~勁~點兒~得遠~不離成績~~很遠~什么~什麼”,
[0052]“chai1-出~~遣~旅费~使~事~役兼~公~当~交~信~官~钦~~人开小~神~鬼使鬼使神~~旅費當~欽~邮~開小~郵~,
[0053]“ci1-参~參~”。
[0054]
s4、在文档中分别选取该多音字之前和该多音字之后的汉字,将多音字以字符“~”替代,多音字之前的汉字、多音字之后的汉字和多音字字符形成新字符串。
[0055]
在文档中取多音字前面0到4个字,再取后面0到4个字,将多音字本身以字符“~”“替代,形成新字符串d的内容为:“我说你~不多就行”。
[0056]
s5、检索新字符串中是否包含所述字符串数组中的字符串,若是,则根据新字符串在字符串数组中的索引,取对应的多音字拼音。
[0057]
检索到新字符串d包含了字符串数组c中第二个字符串的第一个词语“~不多”,表示有列举的词语,则返回多音字的第二个读音结果“cha4”。
[0058]
步骤s2中,判断拼音内容的个数是否大于1,若否,则该汉字为单音字,在拼音字典中,根据该汉字的编码检索与该汉字对应的默认拼音。
[0059]
需要说明的是,步骤s4中,在文档中取多音字前面0到4个字:因为有些多音字的词语前面可能有多个字符,比如“射雕英雄传”的“传”是多音字,这种情况读音“zhuan4”。在文档中取多音字后面0到4个字:因为有些多音字的词语后面可能有多个字符,比如“为人民服务”的“为”是多音字,这种情况读音“wei4”。将多音字本身以字符“~”替代,因为字符在词语中的位置不同,读音可能不同,比如“好不了了”和“差不了了”,两个“了”字,第一个读音“liao3”,第二个读音“le0”。放入替代字符,方能准确的检索正确的读音。
[0060]
步骤s5中,检索新字符串中是否包含字符串数组中字符串,若是,则表示该多音字有列举词语,根据新字符串在字符串数组中的索引,取对应的多音字拼音。
[0061]
步骤s5中,检索新字符串中是否包含字符串数组中字符串,若否,则该汉字为单音字,在拼音字典里根据汉字的编码检索与汉字对应的默认拼音。
[0062]
本发明具有以下有益效果:
[0063]
1、本发明的给中文添加拼音时实现多音字设置的方法,其在给用户实现默认拼音时就能够根据多音字在不同语境的发音,实现对多音字的拼音添加,从而给用户带来更方便,更好的体验。
[0064]
2、本发明的方法,其通过永中软件的yozo office的拼音指南功能,制作多音字字
典,给中文添加拼音时,根据该字典的词组优先级,对多音字设置相对正确的默认拼音,让用户使用拼音功能更流畅,同时节省时间。
[0065]
本发明具有以下有益效果:
[0066]
本发明的给中文添加拼音时实现多音字设置的方法,其在给用户实现默认拼音时就能够根据多音字在不同语境的发音,实现对多音字的拼音添加,从而给用户带来更方便,更好的体验。
[0067]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。此外,本领域人员可以将本说明书中描述的不同实施例或示例进行接合和组合。
[0068]
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改和变型。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献