一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于汉字形态特征的汉字输入法及汉字输入法系统的制作方法

2022-02-22 18:29:18 来源:中国专利 TAG:


1.本发明涉及计算机技术领域,特别涉及一种汉字输入法及汉字输入法系统。


背景技术:

2.目前汉字的解析法有多种,如:五笔解析法、拼音解析法、笔画解析法等,五笔解析法是把所有的汉定都按照一定的规则拆成一些字根,并且将这些字根按类分配到键盘上,输入时需要明确知道各个键位对应哪些字根,懂得如何把汉字拆成五笔字根,因此对使用者要求比较高;拼音解析法虽然无需专门记忆字根,但也要求读音准确,且由于同音字较多,造成选词耗时较大,对于学习拼音有障碍的聋哑人或外国人而言,拼音解析法具有很大的困难;而笔画解析法只要会写,都能输入,但很难提升速度,且笔画识别的正确率也不高。
3.基于上述各种解析法存在的问题,本发明提出一种解析法,基于汉字的形态特征,并通过汉字的各种形态的有无、数量的判断,使大部分汉字得到有效的解析,得到不同汉字的编码,既能保证较快的输入速度,又无需记忆字根,且无需了解汉字读音。


技术实现要素:

4.本发明要解决的技术问题,在于提供一种基于汉字形态特征的汉字输入法及汉字输入法系统,基于汉字的形态特征,并通过汉字的各种形态的有无、数量的判断,使大部分汉字得到有效的解析,得到不同汉字的编码,既能保证较快的输入速度,又无需记忆字根,且无需了解汉字读音。
5.第一方面,本发明提供了一种基于汉字形态特征的汉字输入法,包括下述步骤:
6.s1、接收用户输入的键值串;
7.s2、根据字词解析规则将键值串进行分组,得到键值组,再根据汉字赋值规则对依次解析所述键值组中的每个键值所代表的形态特征的类型,各类型形态特征的有无和数量,得到每个键值的解析结果;
8.s3、综合每个键值的解析结果查询字库,得到所有符合解析结果的单字和词组,若查询结果仅有一个单字或一个词组,直接将查询结果键入光标位置,若查询结果有多个单字和/或词组,则列出查询结果中所有单字和/或词组供用户选择。
9.第二方面,本发明提供了一种基于汉字形态特征的汉字输入法系统,包括:
10.接收模块,用于接收用户输入的键值串;
11.解析模块,用于根据字词解析规则将键值串进行分组,得到键值组,再根据汉字赋值规则对依次解析所述键值组中的每个键值所代表的形态特征的类型,各类型形态特征的有无和数量,得到每个键值的解析结果;
12.查询显示模块,用于综合每个键值的解析结果查询字库,得到所有符合解析结果的单字和词组,若查询结果仅有一个单字或一个词组,直接将查询结果键入光标位置,若查询结果有多个单字和/或词组,则列出查询结果中所有单字和/或词组供用户选择。
13.本发明实施例中提供的技术方案,至少具有如下技术效果或优点:本发明基于图
形思维,提取汉字的形态特征,将键盘与汉字的形态特征对应,并通过输入的键值串进行汉字的各种形态特征的有无,以及数量的判断,使大部分汉字得到有效的解析,得到不同汉字的编码,对于使用者而言,只需记忆少数的几种形态对应的特征键,判断键等,既无需记忆字根,且无需了解汉字读音,又能保证较快的输入速度。利于陌生汉字的输入,也利于外国人和聋哑人的汉字输入。
14.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
15.下面参照附图结合实施例对本发明作进一步的说明。
16.图1为本发明汉字5种形态特征示意图;
17.图2为汉字笔画及其分类示意图;
18.图3为本发明封闭面域的赋值示意图;
19.图4为本发明复杂笔画、交叉形态和十字形态的赋值示意图;
20.图5为本发明数值键和逻辑判断键的设置状态示意图;
21.图6为本发明逻辑判断键和“特征-数值”键的设置状态示意图;
22.图7为本发明“跨”字的“算法-赋值-输入”示范图;
23.图8为本发明“梅”字的“算法-赋值-输入”示范图;
24.图9为本发明实施例一中方法中的流程图;
25.图10为本发明实施例二中系统的结构示意图;
26.图11至图15为本发明各实施例的一级编码列表的部分示例示意图。
具体实施方式
27.本技术实施例通过提供一种基于汉字形态特征的汉字输入法及汉字输入法系统,基于汉字的形态特征,并通过汉字的各种形态的有无、数量的判断,使大部分汉字得到有效的解析,得到不同汉字的编码,既能保证较快的输入速度,又无需记忆字根,且无需了解汉字读音。
28.本技术实施例中的技术方案,总体思路如下:本发明基于图形思维,提取汉字的形态特征,将键盘与汉字的形态特征对应,并通过输入的键值串进行汉字的各种形态特征的有无,以及数量的判断,使大部分汉字得到有效的解析,得到不同汉字的编码,即可通过查询字库得到相应的汉字进行显示。对于使用者而言,只需通过形态辨认即可找到汉字,记忆量极少,比如只需记忆几种(5种)形态对应的特征键,判断键等,既无需记忆字根,又无需了解汉字读音,从而保证较快的输入速度。
29.现先立足于用户输入的角度,对本发明做必要的介绍:
30.请参见图1所示,所述形态特征包括独立笔画、封闭面域、复杂笔画、交叉形态以及十字形态;
31.所述独立笔画是指单个汉字中存在的、独立于其它笔画的笔画,其特点是不与其它笔画相交;判断独立笔画的关键,在于判断该笔画是否与其它笔画相连:相连,则不能算,
不相连,则可以算。如图1的a所示,比如“清”字的三点水,不与其它笔画相连,那么可以认为“清”字有3个独立笔画。
32.所述封闭面域是指单个汉字中由笔画围成的封闭面域,其特点是该面域呈封闭状,与外部隔绝;判断封闭面域的关键,在于判断该面域是否封闭:如果封闭,则可以算,如果不封闭,则不算。本文所讨论的封闭面域不包括三角形或者近似三角形,比如“又”字;本文所讨论的封闭面域包括一般长方形及其变体,比如“母”字,可视为具有2个封闭面域;本文所讨论的封闭面域也包括长方形的组合,比如“凸”字,可视为具有1个封闭面域。如图1的b所示,比如“向”字中间一个“口”形成1个封闭面域。
33.所述复杂笔画是指单个汉字中存在的、由三个或者三个以上基本笔画构成的笔画,其特点是比较复杂;汉字的基本笔画包括“点、横、竖、撇、捺”5项,复杂笔画必须由3个或3个以上的基本笔画组成,两个基本笔画组成的复合笔画不算。如图1的c所示,比如“艺”字的下部“乙”,笔画名称是“横折弯钩”,其形状由“横、撇、横、点”4个基本笔画组成。
34.所述交叉形态是指单个汉字中存在的斜向交叉的笔画,包括类似打叉符号(
×
)的形态,也包括类似打叉符号的1/2(入)或者1/4(∧)形态,判断交叉形态的关键,在于判断该符号两笔是否相交,如果相交,则可以算,如果不相交,则不算。从呈现的角度来看,交叉形态的基本形是其1/4形态(∧),由它可以发展出1/2形态(入),再发展出打叉符号(
×
)形态。如图1的d所示,比如“肴”字,它的上部具有一个典型的、完整的打叉符号。
35.所述十字形态是指单个汉字中存在的正向交叉的笔画,包括类似十字的形态,也包括类似十字的1/2(

)或者1/4(∟)形态,比如“木”字,如图1的e所示,它的横竖两笔构成了十字形态。
36.本发明5种形态特征的算法和赋值是:
37.①
独立笔画:直接计算独立笔画数;无独立笔画即赋值0,有1个独立笔画即赋值1,有2个独立笔画即赋值2,依此类推,有n个,就赋值n。比如“寸”字,左下一点是独立笔画,则赋值1,比如“杭”字,右上两笔是独立笔画,则赋值2,比如“渗”字,左边三点和右下三撇,共6个独立笔画,则赋值6。
38.另外,独立笔画的判断方面如有疑问,应该综合各种字体和手写体考虑:印刷字体与传统手写体有冲突的,应该以手写体为准;各种印刷字体有冲突的,一般以楷体为准,其次以宋体为准。比如判断“情”字树心旁左侧一点与一竖是否相连,宋体相连,楷体“情”字也相连,但黑体“情”字则是断开,此时应该以手写体的常识为准,最终判定它们不相连。
39.②
封闭面域:直接计算封闭面域数;判断封闭面域的关键,在于判断该面域是否封闭:如果封闭,则可以算,如果不封闭,则不算;无封闭面域即赋值0,有1个封闭面域即赋值1,有2个封闭面域即赋值2,依此类推,有n个,就赋值n。如图3所示,“口”字有1个封闭面域即赋值1,“日”有2个封闭面域即赋值2,“目”字有3个封闭面域即赋值3,“田”字有4个封闭面域即赋值4。
40.本发明的封闭面域包括一般长方形及其变体,比如“母”字,可视为具有2个封闭面域;也包括长方形的组合,比如“凸”字,可视为具有1个封闭面域;但不包括三角形或者近似三角形,比如“又”字;
41.封闭面域的判断如有疑问,应该综合各种字体和手写体考虑:印刷字体与传统手写体有冲突的,应该以手写体为准;各种印刷字体有冲突的,一般以楷体为准,其次以宋体
为准。比如“田”字,以宋体和黑体看,它都具有4个封闭面域,但是以楷体看,“田”字似乎只有2个封闭面域,此时应该以书写常识为判断依据,判定“田”有4个封闭面域。
42.③
复杂笔画:直接计算复杂笔画数;复杂笔画必须由3个或3个以上的基本笔画组成,如图4中的a所示,汉字一共包含了10种复杂笔画,其赋值规则为:无复杂笔画即赋值0,有1个复杂笔画即赋值1,有2个复杂笔画即赋值2,依此类推,有n个,就赋值n;某笔画既是复杂笔画,又已计入独立笔画,此处应当重复计算。比如“忆”字,独立笔画赋值4,复杂笔画应当赋值1。
43.复杂笔画的判断方面如有疑问,应该综合各种字体和手写体考虑:印刷字体与传统手写体有冲突的,应该以手写体为准;各种印刷字体有冲突的,一般以楷体为准,其次以宋体为准。比如“道”字,以宋体看,它左边的“横折折撇”被简化了,但是楷体“道”字没有被简化,这是应该以常识为依据判定“道”字具有1个复杂笔画。
44.④
交叉形态:1/4个交叉或1/2个交叉都赋值1,1个交叉形态即赋值2;判断交叉形态的关键,在于判断该符号两笔是否相交,如果相交,则可以算,如果不相交,则不算。如图4中的b所示,交叉形态的算法与赋值,从左到右,它的第2列是1/4交叉,第3列是1/2交叉,第4列是完整的一个交叉,交叉形态的赋值规则为:无交叉形态即赋值0,有1/4个交叉或1/2个交叉都赋值1,有1个交叉形态即赋值2,依此类推。比如“树”字,左侧存在一个1/4交叉形态(∧),赋值1,中间存在一个完整的打叉符号(
×
),赋值2,这样相加,“树”字的赋值为3。
45.交叉形态的判断方面如有疑问,应该综合各种字体和手写体考虑:印刷字体与传统手写体有冲突的,应该以手写体为准;各种印刷字体有冲突的,一般以楷体为准,其次以宋体为准。打叉符号(
×
)的小变形和弧线变形,一般可以视为具有交叉特征,比如“人”、“入”等字,虽然有弧线,但很明显具有交叉的视觉效果,应当视为交叉符号,赋值均为1。
46.⑤
十字形态:1/4十字赋值1,1/2十字赋值2,1个十字形态即赋值4;判断十字形态的关键,在于判断该符号两笔是否相交,如果相交,则可以算,如果不相交,则不算。如图4中的c所示,展示了十字形态的算法与赋值,从左到右,它的第2列是1/4十字,第3列是1/2十字,第4列是一个完整的十字,十字形态的赋值规则为:无十字形态即赋值0,有1/4十字即赋值1,有1/2十字即赋值2,有1个十字形态即赋值4,依此类推。比如“歧”字,左侧存在一个1/2十字形态(

),赋值2,右上角存在一个完整的十字形态,赋值4,这样相加,“歧”字的赋值为6。
47.十字形态的判断方面如有疑问,应该综合各种字体和手写体考虑:印刷字体与传统手写体有冲突的,应该以手写体为准;各种印刷字体有冲突的,一般以楷体为准,其次以宋体为准。十字符号的小变形,一般可以视为具有十字形态。
48.围合成封闭面域的笔画(含该笔画外延部分),不再重复计入十字形态,比如“中”字,具有两个封闭面域,此时不应该再计算其十字形态,也就是说“中”字的封闭面域赋值2,十字形态赋值0;“古”字具有一个封闭面域,但其上面还有一个很明显“十”字,这个十字既不是围成封闭面域的笔画,也不是其笔画外延,所以“古”字的封闭面域赋值1,十字形态赋值4。
49.同一个字内的笔画,只能算一遍,不可重复计算;十字形态的算法,应该以赋值最高的方案为准,其它算法无效。比如“王”字,可以拆解为“十”字加上上下两横,也可以拆解为1/2十字(

)加上上面两横,前者得到赋值4,后者得到赋值2,此时应该选择前一个方案,
因其赋值最高。
50.得到汉字赋值后,需要在键盘上键入,根据需要,本发明对键盘进行了相应设置。输入法的键盘设置主要以数值键、逻辑判断键和“特征-数值”键为主。没有开启本本发明的输入法的情况下,键入数字代表数字;开启本输入法“单字输入”情况下,键入数字代表汉字的赋值(开启本输入法“词组输入”后,可以单使用字母键完成输入,此时键入数字依然代表数字)。
51.如图5所示,展示了数值键和逻辑判断键的位置。数值键包括11个键,即“0,1,2,3,4,5,6,7,8,9,s”,逻辑判断键包括3个键,即“y,n,x”,“特征-数值”键包含22个英文字母,即26个英文字母扣除“y,n,x,s”4键后的所有按键。字母键的第一行(不含“y”键)代表独立笔画及其数值,字母键的第二行(不含“s”键)代表封闭面域及其数值,字母键的第三行(不含“x”和“n”键)代表复杂笔画及其数值。
52.在开启本输入法“单字输入”的情况下,数值键的具体设置规则如下:键入数字不再代表数字输入,而是代表汉字的赋值;数字键0代表汉字某项特征赋值0,数字键1代表汉字某项特征赋值1,数字键2代表汉字某项特征赋值2,依此类推,数字键9代表汉字某项特征赋值9。“s”键代表赋值“≥10”。比如“持”字赋值为“1000s”,该字的十字形态赋值为12,大于10,根据规则将它赋值为“s”。每个汉字默认使用五个数值编码输入,次序固定。第一个数值代表“独立笔画”的赋值,第二个数值代表“封闭面域”的赋值,第三个数值代表“复杂笔画”的赋值,第四个数值代表“交叉形态”的赋值,第五个数值代表“十字形态”的赋值。比如键入“32104”,依次代表该字“独立笔画”赋值3、“封闭面域”赋值2、“复杂笔画”赋值1、“交叉形态”赋值0、“十字形态”赋值4。以上规则适用于传统键盘(台式机键盘),也适用于简化后的笔记本电脑键盘。
53.本输入法的逻辑判断键包括3个:
54.(1)“y”键代表有,代表赋值“≥1”。比如“趟”字可以用“yyyyy”表示,第一个“y”字代表“独立笔画”有,第二个“y”字代表“封闭面域”有,第三个“y”字代表“复杂笔画”有,第四个“y”字代表“交叉形态”有,第五个“y”字代表“十字形态”有。
55.(2)“n”键代表无,代表赋值“=0”。比如“厂”字可以用“nnnnn”表示,第一个“n”字代表“独立笔画”无,第二个“n”字代表“封闭面域”无,第三个“n”字代表“复杂笔画”无,第四个“n”字代表“交叉形态”无,第五个“n”字代表“十字形态”无。
56.(3)“x”键代表不确定有无和数量。比如“坯”字的正确赋值是“20004”,但不少人难以判断该字最下面一横是否独立笔画,所以赋值“x000x”,第一个“x”代表无法判断独立笔画的赋值,第二个“x”代表无法判断十字形态的赋值。
57.本输入法的“特征-数值”键,顾名思义,就是一个按键既表示形态特征,又表示形态特征数量,比如“e”键,代表“独立笔画赋值2”。如图6所示,“特征-数值”键共22个,键盘设置如下:
58.(1)字母键的第一行(不含“y”键)代表独立笔画及其数值,字母键的第二行(不含“s”键)代表封闭面域及其数值,字母键的第三行(不含“x”和“n”键)代表复杂笔画及其数值;对于交叉形态和十字形态,本输入法不设置两者的“特征—数值”键。
59.(2)q键代表“独立笔画0”,简称“独0”,w键代表“独立笔画1”,简称“独1”,依此类推,o键代表“独7”,p键代表“独≥8”。
60.(3)a键代表“封闭面域0”,简称“封0”,d键代表“封闭面域1”,简称“封1”,依此类推,k键代表“封6”,l键代表“封≥7”。
61.(4)z键代表“复杂笔画0”,简称“复0”,c键代表“复杂笔画1”,简称“复1”,依此类推,b键代表“复3”,m键代表“复≥4”。
62.综上,表1展示了输入法状态下的具体键盘设置:
63.表1键盘设置表
[0064][0065]
本发明的基本输入法主要包括单字输入法、二字词组输入法和三字词组输入法。分别对应于“单字输入”、“二字词组输入”和“三字词组输入”模式,各模式可以单独开启或关闭,开启后系统提供对应的解析方法,否则不进行相应解析。
[0066]
如图7所示,根据键盘区分,单字输入方法一共有三种,第一种是以数字为主的输入法,第二种是以字母为主,数字为辅的输入方法,第三种是纯字母的输入方法。
[0067]
第一种以数字为主的单字输入法是最基本的输入方法,该方法需要11个键,即“0,1,2,3,4,5,6,7,8,9,s”,s键代表≥10。第一个数值代表“独立笔画”的赋值,第二个数值代表“封闭面域”的赋值,第三个数值代表“复杂笔画”的赋值,第四个数值代表“交叉形态”的赋值,第五个数值代表“十字形态”的赋值。如图8所示,“梅”字经“算法-赋值-输入”步骤后,按键输入为22114。
[0068]
第二种以字母为主,数字为辅的输入法需要34个键,即24个字母键(“y”,“n”不计
入)和10个数字键。第一个字母代表“独立笔画”的赋值,第二个字母代表“封闭面域”的赋值,第三个字母代表“复杂笔画”的赋值,第四个数值代表“交叉形态”的赋值,第五个数值代表“十字形态”的赋值。每个汉字一般使用3个字母加上2个数字输入,前3个为字母,后2个为数字,次序固定。比如键入“rfc04”,依次代表该字“独立笔画”赋值3、“封闭面域”赋值2、“复杂笔画”赋值1、“交叉形态”赋值0、“十字形态”赋值4。
[0069]
第三种纯字母的输入法需要25个字母键,即26个字母键扣除“s”键。第一个输入字母代表“独立笔画”的赋值,第二个输入字母代表“封闭面域”的赋值,第三个输入字母代表“复杂笔画”的赋值,第四个输入字母代表“交叉形态”的有无,第五个输入字母代表“十字形态”的有无。这种输入法的前3键使用“特征—数值”键,后2键使用逻辑判断键,也就是说,后2键只使用“y,n,x”这三个键,次序固定。比如键入“rfcny”,依次代表该字“独立笔画”赋值3、“封闭面域”赋值2、“复杂笔画”赋值1、“交叉形态”无、“十字形态”有。
[0070]
比如,“清”字可以使用上述三种输入方法得到,第一种方法的编码是“32104”,第二种方法的编码是“rfc04”,第三种方法的编码是“rfcny”。第二、三种方法的前三个字母“rfc”是“特征-数值”键,分别表示独立笔画3,封闭空间2,复杂笔画1。第三种方法的“ny”是逻辑判断键,放在第四、第五位分别表示“交叉形态无,十字形态有”。以“清”字为例,表2展示了3种方法的对比。
[0071]
表2单字的三种输入方法
[0072][0073]
二字词组输入
[0074]
二字词组可以使用3种方法输入,如表3所示。第一种方法是两字完整输入,也是纯字母的输入方法,即“特征—数值”键加上逻辑判断键。比如“黄河”,“黄”字的单字编码是“ejznn”,“河”字的单字编码是“rdzny”,此时,键入“ejznnrdzny”即可得到该词。
[0075]
第二种方法是仅使用“特征—数值”键,这时,只需要6个按键即可打出一个二字词组。比如“黄河”,“黄”字的“特征—数值”键是前三键“ejz”,“河”字的“特征—数值”键是前三键“rdz”,此时仅需键入“ejzrdz”6键即可。
[0076]
第三种方法是将第一种方法和第二种方法混合,比如“黄河”,可以键入“ejzrdzny”,也可以键入“ejznnrdz”。这种方法是为了防止第二种方法无法快速输出文字。
[0077]
表3二字词组输入方法
[0078]
[0079]
三字词组输入
[0080]
三字词组的输入推荐两种方法,第一种方法是仅使用“特征—数值”键输入,第二种方法是以“特征—数值”键为主,以逻辑判断键为辅的输入方法。
[0081]
表4三字词组输入方法
[0082][0083]
如表4所示,使用第一种方法输出“中国人”三个字,“中”字的前三键是“qfz”,“国”字的前三键是“wdz”,“人”字的前三键是“qaz”,此时需要键入“qfzwdzqaz”。
[0084]
为了防止第一种方法无法打出需要的词组,本发明为三字词组输入提供了第二种选择,即“特征—数值”键为主,逻辑判断键为辅的输入方法。比如“中国人”,“中”字的前三键是“qfz”,“国”字的前三键是“wdz”,“人”字的完整字母键是“qazyn”,此时需要键入“qfzwdzqazyn”。
[0085]
输入法简化
[0086]
本发明还对输入法进行了简化,输入法简化的核心任务是减少按键次数,力争用最少的按键次数输出最多的文字。基于此,本发明在此提出输入法简化的规则。
[0087]
简化规则以二字词组的“特征—数值”键输入法为基础,也就是说,正常情况下,二字词组的按键次数最多为6键(每字3键),最少为2键(每字1键)。简化的核心规则是省略“q”,“a”,“z”三键,分别代表3种形态特征的0值,“q”键代表“独立笔画0”、“a”键代表“封闭面域0”、“z”键代表“复杂笔画0”,此三键都是代表汉字形态特征为0的键,不输入该项形态特征时,则该项形态特征默认为0。比如,“黄河”的原输入为“ejzrdz”,“z”可以省略,所以“黄河”一词只需输入“ejrd”,再比如,“中国”一词的原输入是“qfzwdz”,省略后变成“fwd”,只需要3键。
[0088]
按键的省略不能导致文字顺序混淆:比如“发货”一词,原输入为“wazqac”,省略“q”,“a”,“z”三键后,会变成“wc”,此时会被认为是正在打印第一个字,为避免此误解,应该将第二字的第一键“q”键(代表“独立笔画0”)插入,变成“wqc”,这样就不会产生顺序误解,如表5所示。
[0089]
表5二字词组的简化输入
[0090][0091]
省略之后若还是无法得到准确词组,可以在任意一字的末尾加入逻辑判断键:比如“发货”一词,输入“wqc”若无法得到词组,可以在末尾加上逻辑判断键,变成“wqcyy”。
[0092]
三字词组的输入法有两种,第一种跟二字词组的简化输入法一样,此处不再赘述,第二种输入法称为“优势形态输入法”。
[0093]“优势形态”指多个并列字符中比较多的、占据优势的形态(形态共三种:

独立笔画;

封闭面域;

复杂笔画)。比如词组“中华人民共和国”共7个字,“中”、“民”、“共”、“和”、“国”五个字都有“封闭面域”,可以认为“封闭面域”是这个词组的“优势形态”。
[0094]
因此,三字词组的“优势形态输入法”规则如下:首先观察三个字的3种形态特征,看哪一种比较占优势,确定这一种为“优势形态”。顺序输入三个字的“优势形态”值,比如词组“冷冰冰”,通过观察可以看到“独立笔画”是“优势形态”,“冷”字的独立笔画为3,“冰”字的独立笔画为2,此时,键入“ree”就可以了,这三个键都是表示独立笔画的数量。简化输入之后若还是无法得到准确词组,可以在任意一字的末尾加入逻辑判断键。
[0095]
四字词组、四字以上词组推荐使用“优势形态输入法”。以四字词组为例,其规则如下:首先观察四个字的3种形态特征,看哪一种比较占优势,确定这一种为“优势形态”。顺序输入四个字的“优势形态”值,比如词组“风花雪月”,通过观察可以看到“复杂笔画”是“优势形态”,“风”字的复杂笔画为1,“花”字的复杂笔画为1,“雪”字的复杂笔画为0,“月”字的复杂笔画为1,此时,键入“cczc”就可以了,这四个键都是表示复杂笔画的数量。表6展示了四字词组在使用“优势形态输入法”时所需要的综合按键。简化输入之后若还是无法得到准确词组,可以在任意一字的末尾加入逻辑判断键。
[0096]
表6四字词组的优势形态输入法
[0097]
优势形四字词组第一字第二字第三字第四字综合按键独悠然自得yyqeyyqe封足智多谋dgafdgaf复风花雪月cczccczc独循序渐进wwrwwwrw封日积月累fdfhfdfh复随时随地bzbcbzbc
[0098]
表7展示了七字词组在使用“优势形态输入法”时所需要的综合按键:
[0099]
表7七字词组的优势形态输入法
[0100]
优势形态七字词组综合按键封中华人民共和国faadddd独心有灵犀一点通tqeywtw独山雨欲来风满楼qteeqre封柴米油盐酱醋茶aahggka
[0101]
可见,使用“优势形态输入法”可以做到每字仅需一键的效果。
[0102]
实施例一
[0103]
如图9所示,本实施例提供一种基于汉字形态特征的汉字输入法,包括下述步骤:
[0104]
s1、接收用户输入的键值串;
[0105]
s2、根据字词解析规则将键值串进行分组,得到键值组,再根据汉字赋值规则对依次解析所述键值组中的每个键值所代表的形态特征的类型,各类型形态特征的有无和数量,得到每个键值的解析结果;
[0106]
s3、综合每个键值的解析结果查询字库,得到所有符合解析结果的单字和词组,若查询结果仅有一个单字或一个词组,直接将查询结果键入光标位置,若查询结果有多个单字和/或词组,则列出查询结果中所有单字和/或词组供用户选择。
[0107]
所述形态特征包括独立笔画、封闭面域、复杂笔画、交叉形态以及十字形态;
[0108]
所述独立笔画是指单个汉字中存在的、独立于其它笔画的笔画,其特点是不与其它笔画相交;判断独立笔画的关键,在于判断该笔画是否与其它笔画相连,若相连,则不能算,不相连,则算;计算独立笔画数采用直接计算,即无独立笔画即赋值0,有1个独立笔画即赋值1,有2个独立笔画即赋值2,依此类推,有n个,就赋值n;
[0109]
所述封闭面域是指单个汉字中由笔画围成的封闭面域,其特点是该面域呈封闭状,与外部隔绝,类型包括一般长方形及其变体,但不包括三角形或者近似三角形;判断封闭面域的关键,在于判断该面域是否封闭,如果封闭,则算,如果不封闭,则不算;计算封闭面域数采用直接计算,无封闭面域即赋值0,有1个封闭面域即赋值1,有2个封闭面域即赋值2,依此类推,有n个,就赋值n;
[0110]
所述复杂笔画是指单个汉字中存在的、由三个或者三个以上汉字基本笔画构成的笔画,其特点是比较复杂,汉字基本笔画包括“点、横、竖、撇、捺”;计算复杂笔画数采用直接计算,无复杂笔画即赋值0,有1个复杂笔画即赋值1,有2个复杂笔画即赋值2,依此类推,有n个,就赋值n;
[0111]
所述交叉形态是指单个汉字中存在的斜向交叉的笔画,包括全斜向交叉、1/2斜向交叉和1/4斜向交叉,判断交叉形态的关键,是判断两个笔画是否相交,且是否为斜向相交,如果都是则算,否则不算;计算交叉形态数计算方式为:无交叉形态即赋值0,有1/4个交叉或1/2个交叉都赋值1,有1个交叉形态即赋值2,有n个,就赋值n,依此类推;
[0112]
所述十字形态是指单个汉字中存在的正向交叉的笔画,包括十字交叉、1/2正向交叉和1/4正向交叉,判断交叉形态的关键,是判断两个笔画是否相交,且是否为正向相交,如果都是则算,否则不算;计算十字形态数的计算方式为:无十字形态即赋值0,有1/4十字即赋值1,有1/2十字即赋值2,有1个十字形态即赋值4,依此类推,当有多种拆解方案时,以赋值最高的方案为准,但围合成封闭面域的笔画,不再重复计入十字形态;
[0113]
且:同一个字内的笔画,只能算一遍,不可重复计算;所述形态特征的判断以综合
各种字体和手写体考虑,当印刷字体与传统手写体有冲突的,则以手写体为准;各种印刷字体有冲突的,则以楷体为准,其次以宋体为准。
[0114]
所述汉字赋值规则包括类型规则、数量规则、“特征-数值”规则和逻辑判断键规则;
[0115]
所述类型规则是以键值组为单位,使各键值组中每个键值所处的顺序位置对应一形态特征类型;
[0116]
所述数量规则是为所选键值对应赋予一形态特征的数量;所选键值为数字0-9和英文字母“s”,其中,数字0-9分别表示具有某种形态特征的数量为0-9,英文字母“s”键表示某种形态特征的数量≥10;
[0117]
所述“特征-数值”规则是为所选键值同时对应赋予一形态特征的类型和数量;所选键值为英文字母,包括26个英文字母扣除“y、n、x、s”四个键后的所有按键值,共22个英文字母键值,其中,“q、w、e、r、t、u、i、o、p”表示形态特征的类型为独立笔画,数量依次分别为0、1、2、3、4、5、6、7、≥8;“a、d、f、g、h、j、k、l”表示形态特征的类型为封闭面域,数量依次分别为0、1、2、3、4、5、6、7、≥7;“z、c、v、b、m”表示形态特征的类型为复杂笔画,数量依次分别为0、1、2、3、≥4;
[0118]
所述逻辑判断键规则是为所选键值对应赋予一形态特征的有、无或不确定;所选键值为英文字母,其中,“y”表示有某一形态特征,“n”表示没有某一形态特征,“x”表示不确定有无某一形态特征。
[0119]
所述字词解析规则包括常规字词规则和简化字词规则;
[0120]
所述常规字词规则具体是:
[0121]
(11)若所述键值串为5字键值串,解析时是将键值串的5个键值当成一个键值组,用于解析一个单字;
[0122]
(12)若所述键值串为6字键值串,解析时是将键值串每3个键值分为一个键值组,前3键值和后3键值分别用于解析二字词中的一个字;
[0123]
(13)若所述键值串为8字键值串,解析时是将8字键值串分为两个键值组,利用前3键值解析二字词的第一个字,利用后5键值解析二字词的第二个字;
[0124]
(14)若所述键值串为9字键值串,解析时是将键值串每3个键值分为一个键值组,每个键值组用于解析三字词中的一个字;
[0125]
(15)若所述键值串为10字键值串,解析时是将10字键值串平均分为两键值组,前5字键值用于解析二字词中的第一个字,后5字键值用于解析二字词中的第二个字;
[0126]
(16)若所述键值串为11字键值串,解析时是将11字键值串分为三个键值组,利用前3键值解析三字词的第一个字,中3键值解析三字词的第二个字,利用后5键值解析三字词的第三个字;
[0127]
其中,(11)为单字模式,默认开启,(12)、(13)、(15)需在开启二字词模式下进行,(14)、(16)需在开启三字词模式下进行。
[0128]
所述简化字词规则具体是:
[0129]
(21)若所述键值串为2~6字键值串,同时考虑采用简化规则解析为二字词;
[0130]
(22)若所述键值串为3~9字键值串,同时考虑采用简化规则解析为三字词;
[0131]
(23)针对3字以上的键值串,同时考虑采用简化规则解析为三字以上的词。
[0132]
简化字词规则需在开启简化模式下进行。
[0133]
根据所述汉字赋值规则作进一步解析具体是:
[0134]
(a)单字解析规则:针对5字键值串解析一个单字具体包括下述三种情况:
[0135]
a)、数字为主:即接收的5字键值串为数字0-9或“s”,则采用数量规则解析,即将第一个数值解析为“独立笔画”的赋值,将第二个数值解析为“封闭面域”的赋值,将第三个数值解析为“复杂笔画”的赋值,将第四个数值解析为“交叉形态”的赋值,将第五个数值解析为“十字形态”的赋值;
[0136]
b)、字母为主,数字为辅:即接收的5字键值串为3 2形式,前三键值为除“y”和“n”外的24个字母,后两键值为0-9中的数字,则将第一个字母解析为“独立笔画”的赋值,将第二个字母解析为“封闭面域”的赋值,将第三个字母解析为“复杂笔画”的赋值,将第四个数值解析为“交叉形态”的赋值,将第五个数值解析为“十字形态”的赋值;
[0137]
c)、纯字母:即接收的5字键值串为3 2形式,前3键值为“特征-数值”键,即扣除“y、n、x、s”四个键后的所有按键值,共22个英文字母,因此采用“特征-数值”规则进行解析,后2键值为“y、n、x”,因此采用逻辑判断键规则解析;即将第一个字母解析为“独立笔画”的赋值,将第二个字母解析为“封闭面域”的赋值,将第三个字母解析为“复杂笔画”的赋值;将第四个字母解析为“交叉形态”的有无,将第五个字母解析为“十字形态”的有无;
[0138]
(b)二字词规则:
[0139]
针对6字键值串,利用前3键值和后3键值解析时均采用“特征-数值”规则进行解析,即将第一个字母解析为“独立笔画”的赋值,将第二个字母解析为“封闭面域”的赋值,将第三个字母解析为“复杂笔画”的赋值;
[0140]
针对8字键值串,利用前3键值解析时,是采用“特征-数值”规则进行解析,即将第一个字母解析为“独立笔画”的赋值,将第二个字母解析为“封闭面域”的赋值,将第三个字母解析为“复杂笔画”的赋值;利用后5键值解析时,是采用所述(a)中的a1)、a2)、a3)三种情况进行;
[0141]
针对10字键值串,利用前5字键值或后5字键值解析时均采用所述(a)中的a1)、a2)、a3)三种情况进行;
[0142]
(c)三字词规则:
[0143]
针对9字键值串,利用前3键值、中3键值、后3键值解析时均采用所述“特征-数值”规则进行解析;
[0144]
针对11字键值串,利用前3键值、中3键值解析时,均采用所述“特征-数值”规则进行解析,利用后5键值解析时则采用所述(a)中的a1)、a2)、a3)三种情况进行;
[0145]
(d)简化规则:
[0146]
j1)针对省略“q”,“a”,“z”的2~6字键值串,解析为二字词时,默认“独立笔画”、“封闭面域”、“复杂笔画”的形态特征的数量为0;
[0147]
j2)针对省略“q”,“a”,“z”的3~9字键值串,解析为三字词时,默认“独立笔画”、“封闭面域”、“复杂笔画”的形态特征的数量为0;
[0148]
j3)针对3字以上的键值串,解析为三字以上的词时,采用“优势形态”值进行解析,即将每个键值解析为一个字的比较占优势的形态特征。
[0149]
基于同一发明构思,本技术还提供了与实施例一中的方法对应的系统,详见实施
例二。
[0150]
实施例二
[0151]
如图10所示,在本实施例中提供了一种基于汉字形态特征的汉字输入法系统,包括:
[0152]
接收模块,用于接收用户输入的键值串;
[0153]
解析模块,用于根据字词解析规则将键值串进行分组,得到键值组,再根据汉字赋值规则对依次解析所述键值组中的每个键值所代表的形态特征的类型,各类型形态特征的有无和数量,得到每个键值的解析结果;
[0154]
查询显示模块,用于综合每个键值的解析结果查询字库,得到所有符合解析结果的单字和词组,若查询结果仅有一个单字或一个词组,直接将查询结果键入光标位置,若查询结果有多个单字和/或词组,则列出查询结果中所有单字和/或词组供用户选择。
[0155]
其中,作为本实施例更优或更为具体的实现方式,上述系统中:所述形态特征包括独立笔画、封闭面域、复杂笔画、交叉形态以及十字形态;
[0156]
所述独立笔画是指单个汉字中存在的、独立于其它笔画的笔画,其特点是不与其它笔画相交;判断独立笔画的关键,在于判断该笔画是否与其它笔画相连,若相连,则不能算,不相连,则算;计算独立笔画数采用直接计算,即无独立笔画即赋值0,有1个独立笔画即赋值1,有2个独立笔画即赋值2,依此类推,有n个,就赋值n;
[0157]
所述封闭面域是指单个汉字中由笔画围成的封闭面域,其特点是该面域呈封闭状,与外部隔绝,类型包括一般长方形及其变体,但不包括三角形或者近似三角形;判断封闭面域的关键,在于判断该面域是否封闭,如果封闭,则算,如果不封闭,则不算;计算封闭面域数采用直接计算,无封闭面域即赋值0,有1个封闭面域即赋值1,有2个封闭面域即赋值2,依此类推,有n个,就赋值n;
[0158]
所述复杂笔画是指单个汉字中存在的、由三个或者三个以上汉字基本笔画构成的笔画,其特点是比较复杂,汉字基本笔画包括“点、横、竖、撇、捺”;计算复杂笔画数采用直接计算,无复杂笔画即赋值0,有1个复杂笔画即赋值1,有2个复杂笔画即赋值2,依此类推,有n个,就赋值n;
[0159]
所述交叉形态是指单个汉字中存在的斜向交叉的笔画,包括全斜向交叉、1/2斜向交叉和1/4斜向交叉,判断交叉形态的关键,是判断两个笔画是否相交,且是否为斜向相交,如果都是则算,否则不算;计算交叉形态数计算方式为:无交叉形态即赋值0,有1/4个交叉或1/2个交叉都赋值1,有1个交叉形态即赋值2,依此类推;
[0160]
所述十字形态是指单个汉字中存在的正向交叉的笔画,包括十字交叉、1/2正向交叉和1/4正向交叉,判断交叉形态的关键,是判断两个笔画是否相交,且是否为正向相交,如果都是则算,否则不算;计算十字形态数的计算方式为:无十字形态即赋值0,有1/4十字即赋值1,有1/2十字即赋值2,有1个十字形态即赋值4,依此类推,当有多种拆解方案时,以赋值最高的方案为准,但围合成封闭面域的笔画,不再重复计入十字形态;
[0161]
且:同一个字内的笔画,只能算一遍,不可重复计算;所述形态特征的判断以综合各种字体和手写体考虑,当印刷字体与传统手写体有冲突的,则以手写体为准;各种印刷字体有冲突的,则以楷体为准,其次以宋体为准。
[0162]
所述汉字赋值规则包括类型规则、数量规则、“特征-数值”规则和逻辑判断键规
则;
[0163]
所述类型规则是以键值组为单位,使各键值组中每个键值所处的顺序位置对应一形态特征类型;
[0164]
所述数量规则是为所选键值对应赋予一形态特征的数量;所选键值为数字0-9和英文字母“s”,其中,数字0-9分别表示具有某种形态特征的数量为0-9,英文字母“s”键表示某种形态特征的数量≥10;
[0165]
所述“特征-数值”规则是为所选键值同时对应赋予一形态特征的类型和数量;所选键值为英文字母,包括26个英文字母扣除“y、n、x、s”四个键后的所有按键值,共22个英文字母键值,其中,“q、w、e、r、t、u、i、o、p”表示形态特征的类型为独立笔画,数量依次分别为0、1、2、3、4、5、6、7、≥8;“a、d、f、g、h、j、k、l”表示形态特征的类型为封闭面域,数量依次分别为0、1、2、3、4、5、6、7、≥7;“z、c、v、b、m”表示形态特征的类型为复杂笔画,数量依次分别为0、1、2、3、≥4;
[0166]
所述逻辑判断键规则是为所选键值对应赋予一形态特征的有、无或不确定;所选键值为英文字母,其中,“y”表示有某一形态特征,“n”表示没有某一形态特征,“x”表示不确定有无某一形态特征。
[0167]
所述字词解析规则包括常规字词规则和简化字词规则;
[0168]
所述常规字词规则具体是:
[0169]
(11)若所述键值串为5字键值串,解析时是将键值串的5个键值当成一个键值组,用于解析一个单字;
[0170]
(12)若所述键值串为6字键值串,解析时是将键值串每3个键值分为一个键值组,前3键值和后3键值分别用于解析二字词中的一个字;
[0171]
(13)若所述键值串为8字键值串,解析时是将8字键值串分为两个键值组,利用前3键值解析二字词的第一个字,利用后5键值解析二字词的第二个字;
[0172]
(14)若所述键值串为9字键值串,解析时是将键值串每3个键值分为一个键值组,每个键值组用于解析三字词中的一个字;
[0173]
(15)若所述键值串为10字键值串,解析时是将10字键值串平均分为两键值组,前5字键值用于解析二字词中的第一个字,后5字键值用于解析二字词中的第二个字;
[0174]
(16)若所述键值串为11字键值串,解析时是将11字键值串分为三个键值组,利用前3键值解析三字词的第一个字,中3键值解析三字词的第二个字,利用后5键值解析三字词的第三个字;
[0175]
所述简化字词规则具体是:
[0176]
(21)若所述键值串为2~6字键值串,同时考虑采用简化规则解析为二字词;
[0177]
(22)若所述键值串为3~9字键值串,同时考虑采用简化规则解析为三字词;
[0178]
(23)针对3字以上的键值串,同时考虑采用简化规则解析为三字以上的词。
[0179]
根据所述汉字赋值规则作进一步解析具体是:
[0180]
(a)单字解析规则:针对5字键值串解析一个单字具体包括下述三种情况:
[0181]
a)、数字为主:即接收的5字键值串为数字0-9或“s”,则采用数量规则解析,即将第一个数值解析为“独立笔画”的赋值,将第二个数值解析为“封闭面域”的赋值,将第三个数值解析为“复杂笔画”的赋值,将第四个数值解析为“交叉形态”的赋值,将第五个数值解析
为“十字形态”的赋值;
[0182]
b)、字母为主,数字为辅:即接收的5字键值串为3 2形式,前三键值为除“y”和“n”外的24个字母,后两键值为0-9中的数字,则将第一个字母解析为“独立笔画”的赋值,将第二个字母解析为“封闭面域”的赋值,将第三个字母解析为“复杂笔画”的赋值,将第四个数值解析为“交叉形态”的赋值,将第五个数值解析为“十字形态”的赋值;
[0183]
c)、纯字母:即接收的5字键值串为3 2形式,前3键值为“特征-数值”键,即扣除“y、n、x、s”四个键后的所有按键值,共22个英文字母,因此采用“特征-数值”规则进行解析,后2键值为“y、n、x”,因此采用逻辑判断键规则解析;即将第一个字母解析为“独立笔画”的赋值,将第二个字母解析为“封闭面域”的赋值,将第三个字母解析为“复杂笔画”的赋值;将第四个字母解析为“交叉形态”的有无,将第五个字母解析为“十字形态”的有无;
[0184]
(b)二字词规则:
[0185]
针对6字键值串,利用前3键值和后3键值解析时均采用“特征-数值”规则进行解析,即将第一个字母解析为“独立笔画”的赋值,将第二个字母解析为“封闭面域”的赋值,将第三个字母解析为“复杂笔画”的赋值;
[0186]
针对8字键值串,利用前3键值解析时,是采用“特征-数值”规则进行解析,即将第一个字母解析为“独立笔画”的赋值,将第二个字母解析为“封闭面域”的赋值,将第三个字母解析为“复杂笔画”的赋值;利用后5键值解析时,是采用所述(a)中的a1)、a2)、a3)三种情况进行;
[0187]
针对10字键值串,利用前5字键值或后5字键值解析时均采用所述(a)中的a1)、a2)、a3)三种情况进行;
[0188]
(c)三字词规则:
[0189]
针对9字键值串,利用前3键值、中3键值、后3键值解析时均采用所述“特征-数值”规则进行解析;
[0190]
针对11字键值串,利用前3键值、中3键值解析时,均采用所述“特征-数值”规则进行解析,利用后5键值解析时则采用所述(a)中的a1)、a2)、a3)三种情况进行;
[0191]
(d)简化规则:
[0192]
j1)针对省略“q”,“a”,“z”的2~6字键值串,解析为二字词时,默认“独立笔画”、“封闭面域”、“复杂笔画”的形态特征的数量为0;
[0193]
j2)针对省略“q”,“a”,“z”的3~9字键值串,解析为三字词时,默认“独立笔画”、“封闭面域”、“复杂笔画”的形态特征的数量为0;
[0194]
j3)针对3字以上的键值串,解析为三字以上的词时,采用“优势形态”值进行解析,即将每个键值解析为一个字的比较占优势的形态特征。
[0195]
由于本发明实施例二所介绍的系统,为实施本发明实施例一的方法所采用的装置,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该装置的具体结构及变形,故而在此不再赘述。凡是本发明实施例一的方法所采用的装置都属于本发明所欲保护的范围。
[0196]
请参阅图11至图15,为本发明各实施例的一级编码列表的部分示例示意图,目前,该一级编码列表共收录3500个字,此处仅分段截取若干部分示之,以供参考,该一级编码列表会被录到字库中,供键值串被解析后查询使用。
[0197]
虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献