汉字二笔数码输入系统及其键盘 一、技术领域:
本发明采用音形结合的数字键盘编码输入概念,把汉字数字编码输入系统与数字键盘相结合,是处理汉字信息指令、实现自动化控制或办公系统自动化管理的一项汉字数字编码的技术方案。
二、技术背景:
依据国家信息产业部“中国电子技术标准化研究所信息处理产品标准”,汉字编码要求规范、易学、快速,但这三项技术参数是相互制约的,而只有同时满足这三个技术指标的,才是优秀的输入法。其中,编码码长和重码率从一定程度上可以反映编码的输入速度,是最重要的技术指标。目前,汉字数码输入方案不断涌现,已进入应用领域的也有近十种,但普遍存在输入频繁,难记,重码过高等不同方面的不足。据调查,现在流行的数字编码方案,多为纯音码输入或纯形码输入。a、纯音码
纯音码输入是以《汉语拼音方案》为依据,按字的读音进行汉字编码及输入的方法。纯音码易学、易记。学习拼音的同时就在学习标准音,标准音是基础教育的必修内容,有着多方面的用途,使用者多。它的缺点是必须会汉字的读音,而且要准确,击键次数较多,重码多,需要选字,这正是它输入速度不快的主要原因。如:输入“忠”字
按(z)9999
按(h)44
Zhong(共击12次键) 按(o)666
按(n)66
按(g)4出现:中、种、忠、仲、众、重、钟、终、肿、等十几个字,一页满,还需用翻页键翻一页,
再选字,一旦输入错误,修改时非常麻烦。b、纯形码
纯形码如笔画输入法、101输入法等,笔画输入法及101输入法是以汉字地笔画笔顺为输入原理设计的。怎么写字就怎么打字,一笔一个键地输入,直到录入汉字为止。目前常用的笔画分类,有分10种笔画的(如101输入法);有分8种笔画的(如ERICSSON使用的输入法);有分5种笔画的(如NOKIA使用的输入法),无论哪一种,都需要一笔一画按笔顺输入,击键数多,输入速度也较慢。
三、发明内容:
本发明的目的在于设计一种同时能够满足:规范、易学、快速、高效、实用的数字编码方案,符合汉字形、音、义的完美结合及人们的认知规律,让人们能使用数字键盘或设备快速录入汉字。
汉字二笔数码输入系统,是利用从0到9的数字键盘,包括移动电话机、电话机、收银机、PDA电脑、掌上电脑、电子字典、PC机、机顶盒、上网机等设备的10个数字按键进行汉字录入的编码系统,其方案为:在数字键盘上采用“音”“形”结合的编码方式输入中文,“音”就是取该字汉语拼音首字母在数字键盘上所对应的数字键,仅只按一次数字键,代表该键的任一拼音字母为首字母的所有汉字,再按“形”的结构、笔画或部首进行分类编码。二笔数码的编码采取10个数字码元,输入时不管是拼音首字母还是汉字笔画或部首,均可以在十个数字键当中找到与其对应的数字进行输入任一汉字。二笔数码键盘设定:
数字“1”,代表笔画“一”;
数字“2”,代表汉语拼音字母“a”、“b”、“c”和笔画“丨”;
数字“3”,代表汉语拼音字母“d”、“e”、“f”和笔画“丿”;
数字“4”,代表汉语拼音字母“g”、“h”、“i”和笔画“、”;
数字“5”,代表汉语拼音字母“j”、“k”、“l”和笔画“”;
数字“6”,代表汉语拼音字母“m”、“n”、“o”和部首“钅”、“日”;
数字“7”,代表汉语拼音字母“p”、“q”、“r”、“s”和部首“木”、“月”;
数字“8”,代表汉语拼音字母“t”、“u”、“v”和部首“氵”、“人(亻)”;
数字“9”,代表汉语拼音字母“w”、“x”、“y”、“z”和部首“土”、“口”;
数字“0”,代表部首“艹”,“扌”。输入汉字时,规则如下:
a.独体字
按第1键,该字拼音首字母对应的数字键,将该键对应的各拼音为首字母的所有汉
字分为第一键字类,显示其中使用频率最多的汉字,称为一码字;如该
字未显示
按第2键,该字第一笔画(或部首)对应的数字键,将第一键字类再次分类,显示
其中使用频率最多的汉字,称为二码字;如该字未显示
按第3键,该字第二笔画对应的数字键,将第二键字类又一次分类,显示其中使用
频率最多的汉字,称为三码字;如该字未显示
按第4键,该字第三笔画对应的数字键,第四键汉字分类,显示其中使用频率最多
的汉字,称为四码字;如该字未显示
按第5键,该字第四笔画对应的数字键,第五键汉字分类,显示其中使用频率最多
的汉字,称为五码字;如该字未显示
按第6键,该字第五笔画对应的数字键,该字肯定显示,称为六码字。b.合体字
按第1键,该字拼音首字母对应的数字键,该键代表的各拼音为首字母的所有汉
字分为第一键字类,显示其中使用频率最多的汉字,称为一码字;如
该字未显示
按第2键,该字前半第一笔画(或部首)对应的数字键,将第一键字类进行再次
分类,显示其中使用频率最多的汉字,称为二码字;如该字未显示
按第3键,该字前半第二笔画对应的数字键,将第二键字类又一次分类,显示其
中使用频率最多的汉字,称为三码字;如该字未显示
按第4键,该字后半第一笔画(或部首)对应的数字键,第四键汉字分类,显示
其中使用频率最多的汉字,称为四码字;如该字未显示
按第5键,该字后半第二笔画对应的数字键,第五键汉字分类,显示其中使用频
率最多的汉字,称为五码字;如该字未显示
按第6键,该字后半第三笔画对应的数字键,该字肯定显示,称为六码字。汉字二笔数码输入系统,其输入词组的操作步骤如下:a.录入二字词组:
按第1键,第一个字拼音首字母对应的数字键,
按第2键,第一个字第一笔画(或部首)对应的数字键,
按第3键,第一个字第二笔画对应的数字键;
按第4键,第二个字拼音首字母对应的数字键,
按第5键,第二个字第一笔画(或部首)对应的数字键,
按第6键,第二个字第二笔画对应的数字键,输入为一个二字词。b、录入三字词组:
按第1键,第一个字拼音首字母对应的数字键,
按第2键,第一个字第一笔画(或部首)对应的数字键;
按第3键,第二个字拼音首字母对应的数字键,
按第4键,第二个字第一笔画(或部首)对应的数字键;
按第5键,第三个字拼音首字母对应的数字键,
按第6键,第三个字第一笔画(或部首)对应的数字键,输入为一个三字词。c、录入四字词或四个字以上词组:
按第1键,第一个字拼音首字母对应的数字键,
按第2键,第一个字第一笔画(或部首)对应的数字键;
按第3键,第二个字拼音首字母对应的数字键,
按第4键,第二个字第一笔画(或部首)对应的数字键;
按第5键,第三个字拼音首字母对应的数字键;
按第6键,第末个字拼音首字母对应的数字键,输入为一个多字词组。本发明的核心在于,采用国家规范的和明确的汉字信息作为汉字数字编码基础,包括: 1、拼音,取首字母,按《汉语拼音方案》的标准; 2、笔画,定义一、丨、丿、丶、五种笔画,符合国家语言工作委员会关于汉字基
本笔画分类的规定;
3、笔顺,按现代汉语通用字笔顺规则的标准;
4、部首设定,钅、木、氵、土、艹、日、月、人(亻)、口、扌十个常用部首,按GF3001
《信息处理用GB13000.1字符集汉字部件规范》的要求;
5、独体字和合体字划分的规范,按《汉字属性字典》的规范;
6、合体字拆分的规范性,鉴于95%的汉字是合体字,且具有“上下(或上中下)、
左右(或左中右)、里外(或包围、半包围)”的结构特征,在编码时,将合体字
一次性的地拆分为两半:前半和后半。
以拼音首字母及笔画或部首为编码元素分别取码,解决了数字键盘输入汉字不重复分类,大大降低数字键盘输入时出现的重码问题,有效提高输入速度。按国家标准信息交换汉字编码GB2312—80标准6763个汉字计: 1、以拼音首字母通常设置在从2到9共8个数字键上,作为汉字取码的第一码,将
汉字分为八大类,每键字类平均约为845个字; 2、以汉字第一笔画或字头部首取第二码,分为十大类,每键字类平均约为85个字; 3、以汉字第二笔画取第三码,又分十大类,每键字类平均约为9个字; 4、以汉字独体字的第三笔画或合体字后半第一笔画或部首取第四码,再分十大类,
每键字类平均仅约一个字; 5、从理论上说,取第五码和第六码,全码重码率平均只约为1%了,如常用的一级
字库3755个字计,重码率又可以降低一半,依上述可推,从编码理论值计:
码级 字数 显示框可显三字(手机类)
一码字 8个字 24个字
二码字 80个字 240个字
三码字 800个字 2400个字
四码字 8000个字 24000个字
五码字 80000个字 240000个字
六码字 800000个字(或词组) 2400000个字(或词组)
据统计,常用的使用频率占99%的汉字约2000个字,以电话机显示框可显三个字推测,理论上按三个键可共有2664个字,已可满足常用汉字快速输入的要求。二笔数码的优点:
二笔数码属于音形码,利用音码和形码各自的优点,兼顾了汉字的音和形,音形结合,减少编码中死记或重复的部分,易学易记,输入快。本发明在汉字注音,字形和笔顺等方面遵循汉字规范,编码原理符合中小学的语文知识系统,符合学习者的思维习惯,令新用户可以迅速掌握,达到学习简易,上手即用的优势。四、二笔数码实施方式:
二笔数码采用10个码元的编码方案,对应10个数字按键,把26个拼音(英文)字母,五类汉字基本笔画(一、丨、丿、丶、)以及10个常用部首归入这10个数字键中。26个拼音字母分别按顺序设置从2到9这8个数字键当中,五个汉字基本笔画(一、丨、丿、丶、)分别由数字从1到5表示,10个常用部首分别是(钅、木、氵、土、艹、日、月、人(亻)、口、扌),记忆口诀为:金木水土草,日月人口手,分别由另外5个数字从6到0表示,输入时,只要按照二笔数码的打字规则,就可以在10个数字键盘上进行汉字输入。
按汉字笔画的国家标准分类,将汉字笔画分成一、丨、丿、丶、五种笔画,定义:
“一”包括“一”、“/”;
“丨”包括“丨”、“”;
“丿”代表“丿”;
“丶”包括“丶”、“\”;
“”包括“乛”、“”、“乙”、等所有带折勾的笔画。
设定数字“1”代表笔画“一”;数字“2”代表笔画“丨”;“3”代表笔画“丿”;“4”代表笔画“丶”;“5”代表笔画“”;也可依实用键位另行设定。独体字与合体字
汉字按其形体结构可以分为独体字与合体字两大类。
独体字是指没有上下、左右、内外(包围或半包围)结构,不能拆分的汉字。如大、中、小、人、丁、口、手、重等。
合体字是指由两部分或几部分组合而成,有上下、左右、内外(包围或半包围)结构,能拆分的汉字。如李、张、国、厅、同、建等。规定:将合体字一次性分为两半:前半和后半。
二笔数码编码规则见下表:
(注:√表示“同上”的意思)
单字编码举例:
第一码 第二码 第三码 第四码 第五码 第六码独体字拼音首字母 第1笔 第2笔 第3笔 第4笔 第5笔例如:重: Z + 丿 + — + 丨 + + —输入“重”字(注:下述以显示框可显三个字为例)
按第1键,“重”的拼音首字母“Z”对应的数字键“9”,显示“9”代表的“WXYZ”
为首字母的所有汉字中最常用的汉字:为、一、在(一码字);
按第2键,“重”的第一笔画“丿”对应的数字键“3”,显示常用字:我、先、
自(二码字);
按第3键,“重”的第二笔画“一”对应的数字键“1”,显示次常用字:怎、重、
秧,可见按“931”,选“重”字就输入了。如果还未显示,可以依“重”
的笔顺笔画对应的数字键再依次按键,最多按六键肯定可以输入“重”
字。二笔数码全码:931251二笔数码简码:931木: M + 木二笔数码全码:67二笔数码简码:67
第一码 第二码 第三码 第四码 第五码 第六码合体字拼音首字母前半第1笔前半第2笔后半第1笔后半第2笔后半第3笔例如:忠: W + 丨 + + 丶 + + 丶输入“忠”字
按第1键,“忠”的拼音首字母“Z”对应的数字键“9”,显示“9”代表的“WXYZ”
为首字母的所有汉字中最常用的汉字:为、一、在(一码字);
按第2键,“忠”字前半“中”第一笔画“丨”对应的数字键“2”,显示常用字:中、
小、些(二码字);
按第3键,“忠”字前半第二笔画“”对应的数字键“5”,显示:央、则、由(三码
字);
按第4键,“忠”字后半“心”第一笔画“丶”对应的数字键“4”,显示:忠、愚、蚊
(四码字),即只按“9254”,选“忠”字就输入了。如果还未显示,可以依
“忠”的笔顺笔画对应的数字键再依次按键,最多按六键肯定可以输入“忠”
字。二笔数码全码:925454二笔数码简码:9254类: L + 丶 + 丿 + 一 + 丿 + 丶二笔数码全码:543134二笔数码简码:5431词组方式的输入:词组编码举例:
第一码 第二码 第三码 第四码 第五码 第六码二字词第1字拼音首字母 第1字 第1笔 第1字 第2笔 第2字拼音首字母第2字第1笔第2字第2笔国家: G + I + + J + 丶 + 丶二笔数码:425544
第一码 第二码 第三码 第四码 第五码 第六码三字词第1字拼音首字母第1字第1笔 第2字拼音首字母第2字第1笔第3字拼音首字母第3字第1笔计算机: J + 丶 + S + 丿 + J + 木二笔数码:547357联网:H + — + L + — + W + 丨二笔数码:415192
第一码 第二码 第三码 第四码 第五码 第六码多字词第1字拼音首字母第1字第1笔第2字拼音首字母第2字第1笔第3字拼音首字母第4(末)字拼音首字母万事如意: W + — + S + — + R + Y二笔数码:917179中华人民共和国:Z + 丨 + H + 亻 + R + G二笔数码:924874标点符号的输入:
第一码输入数字键“1”时,可以列出常用的标点符号供选择。按上页、下页翻页选择。全形方式的输入:
遇到不知道读音的汉字,可以利用“1”键代替拼音首字母,其它输入规则不变,照样可以把所需的汉字打出来。
注:除二笔数码音形版之外,将拼音首字母不作为编码元素,其他编码与上述编码方式一致,则为二笔数码全形版,以满足不懂拼音人士需要。