本发明涉及一种小键盘中文字词编码输入方法及其键盘设计,属计算机汉字输入方法类。 汉字输入是计算机处理中文信息的“瓶颈”阶段。由于汉字是象形方块文字,构件繁杂,同音字多,现有的各种编码输入方法难免顾失彼。
汉字小键盘编码输入的优化目标是合理分解字元及安排键盘布局。使其编码规则简单易记,输入速度快,重码率和误码率都很低。
现有的小键盘汉字编码输入方法归纳起来大致可以分为三类,即:1.汉语拼音输入;2.字元拼形编码输入;3.拼音拼形组合码输入。
全拼音输入的代表方案有邵喻的《STC软汉字系统》。拼音拼形组合码输入的代表方案有张林翔的“头腹尾数码和声韵母码组合式汉字编码输入方法”。这两种方案都要用到拼音。在目前汉语拼音不太普及的情况下有一定的局限性。而且由于汉字同音字多、重码率较高。
字元拼形编码输入方法又可以分为字根拼形编码法和笔形拼形编码法两种。
字根拼形编码输入的代表方案有钱学森的“汉字字形输入法”。这种方法将汉字分解为几十个或上百个字根,安排在键盘上,用字根拼形编码输入汉字。其优点是重码率低,缺点是字根太多,记忆困难。
笔形拼形编码输入方案有李金凯的“多文种电脑输入方法”和王永民的“五笔形五笔划汉字编码方法”。李方案将汉字分解为10种笔形,单字码长6位。王方案将汉字分解为5种笔形,按“前四末一”笔划编码,单字码长5位。这种方案的优点是完全脱离了拼音,也不必记忆大量的字根,编码规则简单,缺点是李方案码位长,王方案笔形分解过于简化,而且编码规则均不尽合理,重码率较高,不能字词兼容。
本发明在充分研究了笔形分解适度性的基础上,根据汉字方块结构表形特征区别规律,以及汉字大量是双字词的规律,提出了“九笔形中文字词编码输入方法及其键盘”的设计方法。本方法将汉字分解为基本笔形,特高频常用字和词组三个层次。包括单字输入法,词组输入法和键盘设计三个部份。单字和词组的输入方法可以自成体系,也可以组合优化,字词兼容。
笔形分解和编码则可以概括为十分简单的口诀,以帮助记忆。
1.笔形编码口诀:
横竖撇点折,一二三四五,
串方八叉空,六七八九零
2.编码规则口诀:
单体字前三末一,双体字各部首尾;
词组首字取全码,次尾两字补简码。
一、单字拼形编码输入方法
1.将汉字分解为“横、竖、撇、点、折、串、方、八、叉”九种基本笔形,用“1~9”九个数字对应编码,用“O”表示空笔划。(图1)是笔形编码表。
2.将汉字归纳为单体、上下和左右三种基本结构,分别规定编码规则。
3.编码规则
①每个字取1~4位不等长数字码。
②优先取复笔形,复笔形被破坏时取简单笔形。同码异字用序数选择。
③单体结构字按书写笔顺依序编码,最少一位码,最多取“首、次、三、尾”四笔四码。例如:
丰=6(串) 士=91(叉、横)
工=121(横、竖、横) 电=2515(竖、折、横-折)
④上下结构字按字头字底分别取其首尾笔划得到两个二位码再按书写顺序组合成四位字码。字头字底只有一笔时各自添“O”补足为二位码。例如:
道=8144(八、横-点、捺),会=8014(八、空-横、点)
召=5370(折、撇-方、空),要=1151(横、横-折、横)
⑤左右结构字按部首偏旁分别取其首尾笔划得到两个二位码再按书写顺序组合成四位字码。部首偏旁只有一笔时各自添“0”补足为二位码。例如:
组=5121(折、挑-竖、横),况=4075(点、空-方、折)
碰=1781(横、方-八、横),件=3236(撇、竖-撇、串)
二、词的编码输入方法
词输入采用首字全码加次尾字简码为补码的方法,从而使字词兼容系统简单可行。
方法一,词的拼形编码输入
1.词输入取首字拼形数字全码加上尾字的首尾笔划简码构成词的3~6位不等长数字码。当首字少于四码时,输完首字码按一下小数点键(或除号键),再接着输尾字数码,一条词输完后按一下空格键。同码异词用序数选择。例如:
工人=121·80 电话=251547
电视机=2515951电子计算机=2515952
丰收在望=6·41 丰收=6·29
2.三字以上的多字词的另一种编码方法是取首字地数字全码加上次字的首笔划码,再加上尾字的尾笔划构成3~6位不等长数码。例如:
电机=251595 电视机=251545
电子计算机=251555
方法二,词的形音组合码输入
1.用首字拼形数字全码加上其余各字的第一个拼音字母码(或注意符号)构成词的形音组合码,同码异词用序数选择。例如:
工人=121R 电视机=2515SJ
电机=2515J 电子计算机=2515ZJSJ
三、键盘设计
1.在键盘上第一排10个数字键上安排了10个极高频常用字即:这、那、只、有、不、在、了、和、的、是。这些字既可以一键定字,也可以编码输入或组词输入。
2.键盘右边10个数字键上标笔名和笔形,对应为:横-1,竖-2,撇-3,点-4,折-5,串-6,方-7,八-8,叉-9,空-0。
3.在英文字母键上标注音符号
(图2)是键盘设计图。原键盘无改动,可用贴纸标示。
与现有的各种汉字编码输入方法相比较,本发明所提出的编码方法具有笔形分解合理,编码规则简单直观,字词兼容,码位极短,输入速度快,重码率低,综合指标较好的优点。按国标一级汉字库3755个汉字编码,单字重码率低于4%。
本发明所提出的汉字编码方法适用于简体和繁体汉字字和词的编码,可用于计算机等高速输入汉字,也可用于编写字典。