一种笔划部首汉字输入方法 本发明属于计算机信息输入处理领域。
汉字输入方法比较多,主要分为键盘输入、手写识别输入、语音识别输入等三个大类;
其中手写识别输入简单易用,但不足之处在于:输入速度比较慢,识别率受到一定限制。
语音识别输入简单易用,但不足之处在于:识别率容易受到各种因素影响,实用性受到限制。
键盘输入应用范围最广泛,汉字键盘输入的种类主要有音码、形码、音形码、笔划码等。
其中笔划码是在键盘上定义笔划键位,敲击笔划键位对书写过程进行模仿,会写字就会使用,但是码长比较长,敲击的键位比较多,输入速度比较慢。
字根形码利用汉字部首键位组合汉字,输入速度快,效率高,但是记忆量比较大,学习时间比较长,使用难度比较大。
音形码通过利用部首声母发音,安排部首在键位上的排列,帮助记忆。
建立在国家汉语拼音方案基础上的拼音类输入方法,具有简单易用的特点,通过智能处理也可以达到一定的输入速度,在非专业人员中使用比较广泛。
但是中国地域辽阔,南方人以及年长者一般不会拼音,字形类输入方案适合这类人群使用,同时由于字形类输入方案输入效率很高,非常适合对输入速度要求比较高的专业人群使用。
易学易用性和高效性的矛盾是汉字键盘输入需要解决的难点问题。
本发明的目的是提出一种兼顾易学易用性和高效性,使得二者统一的规范通用的键盘输入方法。
本发明的技术方案是通过对比研究目前已有的各种输入方案,取长补短,对笔划码和字根形码进行折衷和融合处理,即在笔划码输入过程中,直接使用常见部首键位加快输入速度;在字根形码输入过程中,使用笔划输入大多数部首,这样降低记忆量和学习难度,从而就可以达到提高笔划码输入速度和同时解决字根形码学习难度大的目的。
该发明的优越性在于:
1.提高了笔划码输入速度;
2.降低了字根形码学习难度;
3.融合了笔划码和字根形码各自的优点;
4.解决国标GB2312包含的6763汉字和大字符集合包含的2万多个汉字的统一输入问题,具有很强通用性;
5.编制的中文输入系统符合汉字书写规范;
6.笔划键位定义在中间一排键位上,易于操作;
7.笔划类型选定九个,旨在克服笔划类型太少导致的重码数量增多以及笔划类型太多导致的输入时不容易区分的问题;
8.部首键位主要通过部首发音地声母指定,便于记忆;
9.设定简码,利用高频先见,提高常用汉字的输入效率;
以下结合附图,说明本发明的具体实际上施方案:
图1是本发明的笔划部件键位图。
通过如下几个方面进行说明:
键位设置,笔划和部首的筛选和键位分配;
取码方式,整字和词汇组码方式;
简码设定,根据汉字频度设定简码;
码表制作,编制汉字笔划和部首代码表;
频度调整,根据频度排列候选汉字显示次序;
输入步骤,汉字输入完整过程。
键位设置:
1.笔划键位设定
把汉字笔划按照形态归纳为九种;
一 丨 丿 丶 乙 乛 ㄋ乚
分别定义在键盘中排的九个字母键位ASDFGHJKL上,即图1所示:
A 乛 S ㄋD 丿 F 丨 G 一 H 丶 J 乙 KL 乚
其中
一,横笔划包含横和提;
丨,竖笔划包含竖和竖钩;
丶,点笔划包含点和捺;
乙,折笔划包含除了A S K L四个键位表示的折笔划之外的各种折笔划。
2.部首键位设定
归纳选定26种部首分别定义在26个字母键位上,即图1所示:
Q车 W王 E礻 R日 T扌 Y月 U雨 I讠 O纟 P土
A足 S氵 D刀 F丷 G广 H火 J钅 K口 L立
Z竹 X忄 C艹 V鱼 B宀 N女 M木
其中
丷,包含部首“丷”和“八”;
刀,包含部首“刀”和“”。
部首键位的安排主要根据部首发音的声母确定,便于记忆。
取码方式:
整字输入分为笔划输入和笔划-部首输入两种方式。
1.笔划输入取码方式:
按照汉字书写的规范笔顺依次输入笔划序列;
整字输入的最大码长可以是固定或者非固定的。
固定码长的情况时码长最长限定为4至10之间的一个数值,超出部分进行裁剪;
非固定码长的情况时最大码长等于笔划个数。
2.笔划-部首输入取码方式:
单体汉字直接输入笔划;
合体汉字首先拆分;
按照汉字规范拆分方式拆分汉字,对于键位上定义的部首直接敲键输入,对于键盘上未定义的部首,输入该部首包含的笔划;
输入部首的笔划时,笔划个数的最大数量可以是固定的或者非固定的;在固定的情况下,最多输入的笔划个数设定在2至5个之间的一个数值,超出部分进行裁剪;该部首输入完成时,转入下一个部首的输入。
整字输入的最大码长可以是固定的或者非固定的。
固定码长的情况时码长最长限定为4至10之间的一个数值,超出部分进行裁剪;
非固定码长的情况时最大码长等于笔划加上部首的个数。
常用汉字简码设置:
根据汉字频度设定简码;
一级汉字,高频汉字使用一个字母键位表示,加上空格键完成输入;
二级汉字,次高频汉字使用两个字母键位,加上空格键完成输入;
三级汉字,三级汉字使用三个字母键位,加上空格键完成输入。
词汇取码方式:
词汇输入是通过采集组成词汇的单个汉字的编码组成词汇编码,分为词汇笔划输入和词汇笔划-部首输入两种方式:
词汇编码采集方法A
二字词汇
取第一个字前两个编码;
取第二个字的编码;
三字词汇
取第一个字前两个编码;
取第二个字前两个编码;
取第三个字的编码;
四字和四字以上词汇
取第一个字前两个编码;
取第二个字前两个编码;
取第三个字前两个编码;
取最后一个字的编码;
词汇编码采集方法B
二字词汇
取第一个字前一个编码;
取第二个字的编码;
三字词汇
取第一个字前一个编码;
取第二个字前一个编码;
取第三个字的编码;
四字和四字以上词汇
取第一个字前一个编码;
取第二个字前一个编码;
取第三个字前一个编码;
取最后一个字的编码;
码表制作:
依据规范拆分汉字,按照取码规则制作码表,包括
汉字笔划代码表;
汉字笔划-部首代码表;
常用字简码码表;
码表汉字集合包括GB2312-80,GBK大字符集合等。
输入步骤:
1.键盘输入:
从键盘上获取输入操作代码;
2.码表检索:
在码表中检索输入操作代码,匹配的汉字组成候选集合;
3.候选提示:
显示候选汉字集合,给每个显示出来的候选汉字分配编号;
4.候选选定:
使用空格键,数字键,鼠标等对于候选汉字进行选择确定。
频度调整:
根据频度排列候选汉字显示次序。
输入举例:
笔划输入 笔划-部首输入
中 fagf kf
国 faggfghg fawhg
汉 hhgah sah
字 hhaafg bafg
输 gjfgdhgfag qdhgyff
入 dh dh
中国 fafaggfghg kffawhg
汉字 hhhhaafg sabafg
输入 gjdh qddh
附图说明:
图1笔划-部首键位设置