部首编码汉字键盘输入系统.pdf

上传人:a1 文档编号:651985 上传时间:2018-03-01 格式:PDF 页数:27 大小:1.11MB
返回 下载 相关 举报
摘要
申请专利号:

CN95106837.7

申请日:

1995.06.07

公开号:

CN1144930A

公开日:

1997.03.12

当前法律状态:

终止

有效性:

无权

法律详情:

专利权的终止(未缴年费专利权终止)授权公告日:2000.12.6|||授权||||||公开

IPC分类号:

G06F3/023

主分类号:

G06F3/023

申请人:

陈贤荣;

发明人:

陈贤荣

地址:

518028广东省深圳市福田区园岭新村9幢404室

优先权:

专利代理机构:

代理人:

PDF下载: PDF下载
内容摘要

本发明公开了一种新的计算机汉字键盘输入系统。它采用《新华字典》的189个部首和少量变形部首作为标准部首,以标准部首作为字元,每个字元都有独立代码,将代码合理地分配在计算机键盘的字母键位或表征数字的键位上。使用本发明键盘,按照汉字书写的字元顺序和大元优先的原则拆分汉字,可以方便迅速地进行汉字编码的输入操作。

权利要求书

1: 一种汉字键盘输入系统,具有计算机通用标准键盘,其特征在于采用标准 部首作为字元,根据汉字书写的字元顺序和大元优先的原则,通过标准键盘上表示 相应字元、汉字代码的字母键位执行下述输入步骤: A、依次输入汉字或词组编码的各位代码: a、一级简码汉字的编码为该字的“声码”; b、二级简码汉字的编码为该字的“声码+首码”,二级简码词组的编码为 “首字声码+末字声码”; c、二元汉字的编码为“首码+末码+首元首码”; d、三元汉字或三级简码汉字的编码为“首码+二码+三码”; e、四元及四元以上汉字的编码为“首码+二码+三码+末码”; f、二字词组的编码为“首字声码+末字声码+首字首码+末字首码”; g、三字词组的编码为“首字声码+二字声码+末字声码+首字首码”; h、四字及四字以上词组的编码为“首字声码+二字声码+三字声码+末字声 码”; B、结束输入: 没有重码的字、词编码不足四码时,击空格键结束输入,编码为四码时自动结 束输入; 有重码的字、词,击数字键选字结束输入,第一个重码字词也可击空格键结束 输入,编码为四码时第一个重码字词还可自动结束输入; 其中,标准键盘各字母键位与各字元、汉字的对应关系为: 字元音码对应其中二十一个字母键位,字元形码对应其中六个字母键 位,字元数码对应其中五个字母键位,V为造词键位,汉字声码对应除I、U、V 以外的二十三个字母键位。
2: 根据权利要求1所述的汉字键盘输入系统,其特征在于标准键盘各字母键位 与字元、汉字的对应关系为: A键:字元“木”,声码为A的汉字; B键:字元“卜、 、八、丷、勹、比、贝、貝、白、疒、 鼻”, “匕”,声码为B的汉字; C键:字元“厂、艹、寸、中、车、車、臣、虫、赤、辰、齿、齒”,声码为 C的汉字; D键:字元“刀、刂、ク、大、歹、斗、鬥、豆”,声码为D的汉字; E键:字元“二、儿、卩、 、阝、耳”,“山”,“冫”,“ リ、 ㄍ、 ”,声码为E的汉字; F键:字元“父、风、風、方、缶”,“ ”,繁体字 及外国语通用汉字的识别码,声码为F的汉字; G键:字元“冖、宀、工、广、弓、戈、瓜、艮、 、谷、革、骨、鬼”,声 码为G的汉字; H键:字元“一、火、户、禾、、黑”, 声码为H的汉字; I键:字元“言、讠、言”,“彡、氵、巛”,“三、 、川、 ”; J键:字元“几、、廴、巾、己、巳、丬、爿、见、見、斤、金、钅、釒、 臼、角”,声码为J的汉字; K键:字元“匚、冂、凵、口、□”,“、 ”,声码为K的汉字; L键:字元“力、彐、 、龙、龍、立、耒、老、卤、鹵、里、鹿”, ,声码为L的汉字; M键:字元“门、門、马、馬、毛、毋、母、目、皿、矛、米、麦、 黾、 黽、麻”,声码为M的汉字; N键:字元“丶、廾、女、牛、牜、 、鸟、鳥,“”,声码为N的汉字; O键:字元“月、曰”,“灬”,“ ”,声码为O的汉字; P键:字元“丿、攴、片、疋、 、皮”,声码为P的汉字; Q键:字元“犬、犭、气、欠、青、其”,声码为Q的汉字; R键:字元“人、入、亻、彳、日、曰、 ”,“”,声码为R的汉字; S键:字元“丨、十、厶、食、饣、飠、尸、水、 石、罒、示、礻、 殳、矢、舌、糸、纟、糹、豕、身、鼠”,“亅、 ”,声码为S的汉字; T键:字元“土、士、田”,声码为T的汉字; U键:字元“手、扌”,“”; V键:造词键位; W键:字元“文、亠、夂、攵、王、韦、韋瓦”,声码为W的汉字; X键:字元“小、、心、忄、、夕、穴、西、覀、血、辛”,声码为X的 汉字; Y键:字元“又、 、尢、弋、幺、肀、 、聿、业、用、衣、衤、页、頁、 羊、 、、羽、酉、雨、 、鱼、魚、音”,声码为Y的汉字; Z键:字元“乙、辶、 、子、 、止、爪、爫、竹、、自、舟、走、足、 、豸、隹”,“ 乛”,声码为Z的汉字。
3: 根据权利要求2所述的汉字键盘输入系统,其特征在于字元代码和汉字声码 用汉字注音符号表示,汉字注音符号与标准键盘各字母键位的对应关系为: A→丫, B→勹,C→彳,ㄘ D→ㄉ,E→ㄜ,    F→匚,  G→ㄍ; H→厂, I→丨  J→ㄐ,   K→ㄎ,L→ㄌ,    M→,  N→ㄋ; O→ㄛ, P→ㄆ,Q→ㄑ,   R→ㄖ,S→ㄕ,厶,T→ㄊ; U→ㄨ   V→万  W→ㄨ     X→,Y→丨,ㄩ  Z→ㄓ,ㄗ; 音节丫、ㄞ、ㄢ、尢、幺的声码用丫表示,音节ㄜ、ㄣ、儿、乀、ㄥ的声码用 ㄜ表示,以丨、ㄩ开头的音节的声码用丨表示,音节ㄛ、ㄡ、ㄨㄥ的声码用ㄛ表示, 以ㄨ开头的音节的声码用ㄨ表示。
4: 一种汉字键盘输入系统,具有计算机通用标准键盘或者其它数字键盘,其特 征在于采用标准部首作为字元,根据汉字书写的字元顺序和大元优先的原则,通过 键盘上表示相应字元、汉字代码的数字键位执行下述输入步骤: A、依次输入汉字或词组编码的各位代码: a、二元汉字的编码为“首码+末码+首元首码+末元首码+识别码(声码或 繁体字代码)”; b、三元汉字的编码为“首码+二码+末码+首元首码+识别码(末元首码或 声码或繁体字代码)”; c、四元及四元以上汉字的编码为“首码+二码+三码+末码+识别码(首元 首码或末元首码或特征码或声码或繁体字代码)”; d、二字词组的编码为“首字声码+末字声码+首字首码+末字首码+末字二 码”; e、三字词组的编码为“首字声码+二字声码+末字声码+首字首码+末字首 码”; f、四字及四字以上词组的编码为“首字声码+二字声码+三字声码+末字声 码+首字首码”; g、一级简码汉字的简码为该字编码的首位; h、二级简码汉字的简码为该字编码的前二位; i、三级简码汉字的简码为该字编码的前三位; j、四级简码汉字的简码为该字编码的前四位; B、结束输入: 没有重码的字词编码不足五码时,击空格键或等号键结束输入,编码为五码时 自动结束输入; 有重码字、词时,击空格键或等号键后,再击数字键选字结束输入,击空格键 或等号键可以默认第一个重码字词的输入; 其中,标准键盘或其它数字键盘各数字键位与字元、汉字的对应关系为: 1键:代码为A、D、Y的字元,声码为A、D、Y的汉字; 2键:代码为E、R、Z的字元,声码为E、R、Z的汉字; 3键:代码为I、M的字元,声码为M的汉字; 4键:代码为O、F、H的字元,声码为O、F、H的汉字; 5键:代码为U、S、W的字元,声码为S、W的汉字; 6键:代码为L、N的字元,声码为L、N的汉字; 7键:代码为X、T、Q的字元,声码为X、T、Q的汉字; 8键:代码为B、P的字元,声码为B、P的汉字; 9键:代码为J、G、K的字元,声码为J、G、K的汉字; 0键:代码为C的字元,声码为C的汉字; ·键:代码为V的造词键。
5: 根据权利要求4所述的汉字键盘输入系统,其特征在于数字键位由标准键盘 中Q、A、Z排键位中的任何一排键位代替。
6: 根据权利要求5所述的汉字键盘输入系统,其特征在于数字键位由标准键盘 中的A排键位代替,其对应关系为:1→H,2→J,3→K,4→L,5→:,6→G,7→F, 8→D,9→S,O→A。
7: 根据权利要求4所述的汉字键盘输入系统,其特征在于数字键位由标准键盘 中的Q、A、Z排键位代替,其对应关系为: 1→Y、H、N, 2→U、J、M, 3→I、K、 , 4→O、L、 , 5→P、:、?, 6→T、G、B, 7→R、F、V, 8→E、D、C, 9→W、S、X, 0→Q、A、Z; 其中Q排键位用于输入三字及三字以上词组,A排键位用于输入汉字单字,Z排键位 用于输入二字词组。

说明书


部首编码汉字键盘输入系统

    本发明涉及一种汉字键盘输入系统,具体地讲,涉及一种利用计算机通用键盘或其它数字键盘的字母或数字键位将汉字按书写的部首顺序拆分编码后向计算机等汉字信息处理设备输入汉字的系统。

    至今已公开的汉字编码方案多达几百种,在社会上广泛应用的也有十几种,但都存在着程度不同的问题,影响了汉字输入技术的广泛应用。

    现有技术中采用的汉字编码方案主要有音码、形码、音形码、数码和序号码等,音码的优点是易学而且可以“听”打,存在的问题是重码多,韵母键位人为安排难以记忆,南方人易因读不准音造成输入错误,且无法输入不认识的汉字,无法区分简、繁体字,无法输入外国语通用汉字;形码的优点是重码少,输入速度较快,但字根多为人为选择、人为分类造成字根代码难以记忆,编码规则多;音形码兼有音码、形码两者的优点也兼有两者的缺点,人为编排需要强记的内容仍然不少;数码输入简单,速度较快,但每个字都要了解汉字的声母、韵母、笔划特征、部首特征等,需要思索的内容也较多;序号码完全靠强记,非一般非专业人员所能掌握。

    中国专利CN1043210A号公开了一种字根编码输入法及其设备,该输入法选取160个单根和18个同位根(其中大部分为字典部首,少部分为非字典部首),划分为横起、竖起、撇起、捺起、弯起、拐起六类,分配在A~H,I~L,M~R,S~W,X~Y,Z等六个根区,难以记住单根的键位分布,对非专业汉字输入人员而言更是如此。

    本发明的目的是提供一种汉字键盘输入系统,该系统把《新华字典》189个部首及其少数变形按其音、形、数的属性分配到计算机通用键盘的对应键位上,把汉字按书写地部首顺序拆分编码后由键盘输入,可以用字母键或数字键输入,汉字输入人员不仅容易学习、记忆,而且重码率低,输入速度快,不仅可以输入简体字,而且可以输入繁体字和外国语通用汉字。

    本发明的实施方案是:采用标准部首作为字元,根据汉字书写的字元顺序和大元优先的原则,通过标准键盘或其它数字键盘上表示相应字元、汉字代码的字母键位或者数字键位执行汉字、词组的输入步骤。

    上述汉字、词组的输入步骤可以这样实现:

    A、依次输入汉字或词组编码的各位代码:

    a、一级简码汉字的编码为该字的“声码”;

    b、二级简码汉字的编码为该字的“声码+首码”二级简码词组的编码为“首字声码+末字声码”;

    c、二元汉字的编码为“首码+末码+首元首码”;

    d、三元汉字或三级简码汉字的编码为“首码+二码+三码”;

    e、四元及四元以上汉字的编码为“首码+二码+三码+末码”;

    f、二字词组的编码为“首字声码+末字声码+首字首码+末字首码”;

    g、三字词组的编码为“首字声码+二字声码+末字声码+首字首码”;

    h、四字及四字以上词组的编码为“首字声码+二字声码+三字声码+末字声码”。

    B、结束输入:

    没有重码的字、词编码不足四码时,击空格键结束输入,编码为四码时自动结束输入;

    有重码的字、词,击数字键选字结束输入,第一个重码字词也可击空格键结束输入,编码为四码时第一个重码字词还可自动结束输入。

    其中,标准键盘各字母键位与各字元、汉字的对应关系为:

    A键:字元“木”,声码为A的汉字;

    B键:字元“卜、、八、丷、勹、比、贝、貝、白、疒、鼻”,“匕”,声码为B的汉字;

    C键:字元“厂、艹、寸、屮、车、車、臣、虫、赤、辰、齿”,声码为C的汉字;

    D键:字元“刀、刂、ク、大、歹、斗、門、豆”,声码为D的汉字;

    E键:字元“二、儿、卩、、阝、耳”,“山”,“冫”,“リ、ㄍ、”,声码为E的汉字;

    F键:字元“父、风、風、方、缶”,“”,繁体字及外国语通用汉字的识别码,声码为F的汉字;

    G键:字元“冖、宀、工、广、弓、戈、瓜、艮、、谷、革、骨、鬼”,声码为G的汉字;

    H键:字元“一、火、户、禾、、黑”,声码为H的汉字;

    I键:字元“言、讠、言”,“彡、氵、巛”,“三、、川、”;

    J键:字元“几、、廴、巾、己、巳、丬、爿、见、見、斤、金、钅、釒、臼、角”,声码为J的汉字;

    K键:字元“匚、冂、凵、口、□”,“、”,声码为K的汉字;

    L键:字元“力、彐、、龙、龍、立、耒、老、卤、鹵、里、鹿”,,声码为L的汉字;

    M键:字元“门、門、马、馬、毛、毋、母、目、皿、矛、米、麦、、黾、黽、麻”,声码为M的汉字;

    N键:字元“丶、廾、女、牛、牜、、鸟、鳥,“”,声码为N的汉字;

    O键:字元“月、日”,“灬”,”,声码为O的汉字;

    P键:字元“丿、攴、片、疋、、皮”,声码为P的汉字;

    Q键:字元“犬、犭、气、欠、青、其”,声码为Q的汉字;

    R键:字元“人、入、亻、彳、日、曰、”,“”,声码为R的汉字;

    S键:字元“丨、十、厶、食、饣、飠、尸、水、、石、罒、示、礻、殳、矢、舌、糸、纟、糹、豕、身、鼠”,“亅、”,声码为S的汉字;

    T键:字元“土、士、田”,声码为T的汉字;

    U键:字元“手、扌”,“”;

    V键:造词键位;

    W键:字元“文、亠、夂、攵、王、韦、韋、瓦”,声码为W的汉字;

    X键:字元“小、、心、忄、、夕、穴、西、覀、血、辛”,声码为X的汉字;

    Y键:字元“又、、尢、弋、幺、肀、、聿、业、用、衣、衤、页、頁、羊、、、羽、酉、雨、、鱼、魚、音”,声码为Y的汉字;

    Z键:字元“乙、辶、、子、、止、爪、爫、竹、、自、舟、走、足、、豸、隹”,“”,声码为Z的汉字。

    上述汉字、词组的输入步骤还可以这样实现:

    A、依次输入汉字或词组编码的各位代码:

    a、二元汉字的编码为“首码+末码+首元首码+末元首码+识别码(声码或繁体字代码)”;

    b、三元汉字的编码为“首码+二码+末码+首元首码+识别码(末元首码或声码或繁体字代码)”;

    c、四元及四元以上汉字的编码为“首码+二码+三码+末码+识别码(首元首码或末元首码或特征码或声码或繁体字代码)”;

    d、二字词组的编码为“首字声码+末字声码+首字首码+末字首码+末字二二码”;

    e、三字词组的编码为“首字声码+二字声码+末字声码+首字首码+末字首码”;

    f、四字及四字以上词组的编码为“首字声码+二字声码+三字声码+末字声码+首字首码”;

    9、一级简码汉字的简码为该字编码的首位;

    h、二级简码汉字的简码为该字编码的前二位;

    i、三级简码汉字的简码为该字编码的前三位;

    j、四级简码汉字的简码为该字编码的前四位。

    B、结束输入:

    没有重码的字词编码不足五码时,击空格键或等号键结束输入,编码为五码时自动结束输入;

    有重码的字、词,击空格键或等号键后,再击数字键选字结束输入,击空格键或等号键可以默认第一个重码字词的输入。

    其中,标准键盘或其它数字键盘各数字键位与字元、汉字的对应关系为:

    1键:代码为A、D、Y的字元,声码为A、D、Y的汉字;

    2键:代码为E、R、Z的字元,声码为E、R、Z的汉字;

    3键:代码为I、M的字元,声码为M的汉字;

    4键:代码为O、F、H的字元,声码为O、F、H的汉字;

    5键:代码为U、S、W的字元,声码为S、W的汉字;

    6键:代码为L、N的字元,声码为L、N的汉字;

    7键:代码为X、T、Q的字元,声码为X、T、Q的汉字;

    8键:代码为B、P的字元,声码为B、P的汉字;

    9键:代码为J、G、K的字元,声码为J、G、K的汉字;

    0键:代码为C的字元,声码为C的汉字;

    ·键:代码为V的造词键。

    由于采取上述方案,每一个具有小学文化程度的汉字输入人员都可以充分利用所学的汉字知识:拼音只需知道汉字读音音节的首字母,而不必分辨南方人难以分辨的翘舌音或非翘舌音声母、前鼻音与后鼻音韵母,更不必理会翘舌音声母与复元音韵母如何在键盘上分布;部首即众所周知的《新华字典》中的部首,主要依其读音而不是人为地在键盘上分配键位;而少数形码和数码有规律地分配在键盘上使编码在码域中分布更加均匀;因此基本不需记忆即可方便地输入汉字,重码率低而且具有较快的输入速度,不仅可以输入简体字,还可以输入繁体字和外国语通用汉字。

    下面结合附图和具体实施例对本发明作进一步的说明。

    图1是汉字标准部首及其代码总表;

    图2是复合部首拆分示例;

    图3是汉字标准部首(字元)拆分首码表;    

    图4是汉字一级简码字表;

    图5是汉字标准部首码键盘输入基本流程图;

    图6是汉字标准部首码输入键盘;

    图7是汉字标准部首全数字码输入键盘(一);

    图8是汉字标准部首全数字码输入键盘(二)。

    实施例一

    本发明认为汉字包括简体字、繁体字和外国语通用汉字。简体字即国家标准G82312-80《信息交换用汉字编码字符集·基本集》所收的6763个通用汉字,也称国标汉字,是当今中国国内通用的汉字;繁体字是文字改革以前在中国国内通用,当今在中国国外华人地区仍然通用,国内文献研究也仍在使用的汉字;外国语通用汉字主要有日本语当用汉字和韩国语通用汉字。国际标准GB13000、ISO/IEC10646《CJK统一汉字编码字符集》共收中、日、韩通用汉字20902个,是一个国际通用汉字的中型字库,本发明的汉字输入法可以解决其输入问题。

    图1是汉字标准部首及其代码总表。本发明认为,汉字由部首组成,部首分为基本部首、变形部首和复合部首,基本部首和变形部首合称标准部首,复合部首可以拆分为标准部首。

    本发明采取小学生人手一册的《新华字典》中的189个部首作为基本部首,基本部首先入为主,潜移默化,众所周知,几乎不用记忆即可掌握,如果人为地选取某些部首作字元,则反而需人为地分类,徒增记忆量,且往往舍弃繁体字部首,给繁体字和外国语通用汉字的拆分编码造成困难。仅用基本部首来拆分汉字的缺点是码区分布不匀,本发明采用增加少量变形部首的办法来解决这个问题,基本部首和变形部首合称标准部首,以标准部首作为字元,对汉字进行拆分和编码,可以使汉字的编码在码域中的分布比较均匀。

    为了实现用标准部首对汉字进行拆分和编码,必须对每一个标准部首赋予一个代码。本发明规定,汉字读音音节的首字母称为该汉字的声码;标准部首具有音、形、数三种属性,某些标准部首名称的特征字的声码称为该标准部首的音码,例如:

    勹=bao=B,=bian=B,=biao=B,屮=cao=C,冖=秃宝gai=G,

    匚、冂、凵=三边kuang=K,彐、=lu字头=L,廾=nong字底=N,

    攴=pu=P,豕=shi=S和某些标准部首“形状”相似的字母称为该标准部首的形码,例如:

    木=A,    山=E,    讠=I,    月=O,    手=U和某些标准部首数的特征相对应的字母称为该标准部首的数码,例如:

    二、=2横=E,                リ、=2竖=E,      =2撇=E

    冫、=2捺=E,  ㄍ、=2折=E,                  三、=3横=I,

    川、=3竖=I,            彡=三撇=I,氵、=3捺=I,    巛、=3折=I标准部首的音码、形码、数码合称为标准部首码。声码和标准部首码是汉字编码的依据。虽然每个基本部首都有其声码,但是为了使汉字编码在码域上的分布比较均匀,少数标准部首的音码舍弃不用,改为用其形码或者数码,如木(树)冠形状与A相似、山字倾倒与E相似、讠与小写字母i相似,满月与O相似、双手高举与U相似,故木、山、言、月、手五组部首不用音码而用其形码A、E、I、O、U,一组形状特点为“左右两块,方向相反,形状相似”的部首取F为形码;同笔划部首取与其特征数1、2、3、4、5相对应的字母A、E、I、O、U为数码。本实施例把计算机通用键盘上的字母键位作为汉字标准部首的码区,其中数码区共五个,代表标准部首码中的五组同笔划部首码,即一同笔划(实际上不存在)、二同笔划、三同笔划、四同笔划和五同笔划(实际上也不存在)部首码,称为1、2、3、4、5码区,对应分布在A、E、I、O、U五个键位,形码区共六个,代表标准部首码中的木、山、言、月、手五组形码和一组结构“相反相似”的形码,称为木、山、言、月、手、“反码”区,对应分布在A、E、I、O、U、F六个键位;音码区共二十一个,代表标准部首码中的二十一组音码,分别称为疒、艹、刀、阝、方、宀、火、金、口、力、目、女、丿、犬、人、糸、土、王、心、鱼、竹码区,对应分布在B~H、J~N、P~T、W~Z等二十一个键位;V则作为造词键位,图5是汉字标准部首码输入键盘。

    汉字的字形分为合体字和独体字,合体字又分为左右型、上下型和包围型三种,左右型包括左中右型,上下型包括上中下型,包围型分为半包围型和全包围型二种。按照汉字字形的部首顺序,可以把汉字分解为线性排列的标准部首系列,并转换为相应的标准部首码。字形分解的原则是:左右型为先左后右或者依次左中右;上下型为先上后下或者依次上中下;包围型为先外后里或者先里后外;独体字为按笔划顺序取标准部首,前笔取最大标准部首优先但兼顾后笔取标准部首的方便,以标准部首数最少为原则,宁散、夹不连,宁连不交。

    图2是复合部首拆分示例,字形分解过程中出现的复合部首必须参照复合部首拆分示例拆分为标准部首,如:

    解→角、→角、刀、牛,            照→昭、灬→日、刀、口、灬,

    厥→厂、欮→厂、丷、一、屮、欠

    按照每个汉字取三至四个字元代码的取码原则:

    当字元数为四个及四个以上时,取首、二、三、末码组成该汉字的编码,例如:

    (即)                (取作)编—纟、户、冂、艹→SHKC

    S、 H、 K、 C输—车、人、一、月、刂→CRHD

    C、 R、 H、 O、 D当字元数为三个时,取首、二、末码组成该汉字的编码,例如:部—立、口、阝→LKE

    L、 K、 E

    当字元数为二个时,除首末码外,首元按前述汉字拆分原则再次拆分为标准部首码,再次拆分得到的首码作为该汉字的末码,例如:

    码—石、马、一→SMH

        S、 M、 H图3是汉字标准部首(字元)拆分首码表。

    当字元数只有一个时该字称为部首字,部首字必须按前述汉字拆分原则拆分为标准部首系列,再按前述汉字取码原则对该汉字编码,例如:

    木—十、八、一→SBH

        S、 B、 H

    鬼—白、儿、厶→BES

         B、 E、 S    但单笔划部首字的编码由字元代码重复四次而成,即:

    一→HHHH,丨→SSSS,丿→PPPP,丶→NNNN,乙→ZZZZ词组的取码方法为:二字词组为“首字声码+末字声码+首字首码+末字首码”,例如:输入—输、入、车、丿→SRCP

      S、 R、 C、 P三字词组为“首字声码+二字声码+末字声码+首字首码”,例如:计算机一计、算、机、讠→JSJI

        J、 S、 J、 I四字及四字以上词组为“首字声码+二字声码+三字声码+末字声码”,例如:众所周知—众、所、周、知→ZSZZ

          Z、 S、 Z、 Z汉字输入法—汉、字、输、法→HZSF

            H、 Z、 S、 F

    汉字输入和词组输入可以混合使用。

    为加快输入速度,可采用简码字和简码词的编码方式:

    高频字采用一级简码编码方式,即高频字的编码为该字的声码。例如:

    的→D,一→Y,是→S,了→L,不→B,在→Z,人→R,我→W,国→G高频字是指在多学科文本中使用频度极高的常用字,本实施例采用每码区取十字的方式,共计可取字228个,228个高频字累计使用频度达60%,图4是汉字一级简码字表。

    常用字采用二级简码编码方式,即常用字的编码为该字的“声码+首码”,例如:

    常→CX,   用→YO,    字→ZG常用字即国标一级汉字,共计3755个,累计使用频度在99%以上。

    常用词采用二级简码编码方式,即常用词的编码为“首字声码+末字声码”,例如:

    我们→WM,不但→BD,而且→EQ二级简码词主要是语法用词,和二级简码字一起编排。

    三级简码编码方式:前三码相同的一组四码字,当不存在一个与其前三码相同的三码字时,则从这组四码字中选出一字,以其前三码作为编码,称为三级简码字,例如:砟、祚的编码均为SRSE,选砟为三级简码字,编码为SRS。

    引入识别码可以减少重码,方法是:编码不足四码的汉字可后加识别码,编码为四码的汉字可将末码改为识别码。引入识别码后:

    二元汉字的编码为“首码+末码+首元首码+识别码(末元首码或声码或繁体字代码)”;

    三元汉字的编码为“首码+二码+末码+识别码(首元首码或末元首码或声码或繁体字代码)”;

    四元及四元以上汉字的编码为“首码+二码+三码+识别码(首元首码或末元首码或特征码或声码或繁体字代码)”;

    词组不设识别码。

    例如:

    二元汉字

    (即)        (改作)        (取作)

    知—矢、口、→矢、口、、冂→SKRK(加末元首码)

        S、 K、 R   S、 K、 R、 K旧—丨、日、丨→丨、日、丨、旧→SRSJ(加声码)

    S、 R、 S   S、 R、 S、 J軸—車、日、丨→車、日、丨、繁→CRSF(加繁体字代码)

    C、 R、 S   C、 R、 S、 F三元汉字神—礻、日、丨→礻、日、丨、丶→SRSN(加首元首码)

    S、 R、 S   S、 R、 S、 N绅—纟、日、丨→纟、日、丨、→SRSE(加首元首码)

    S、 R、 S   S、 R、 S、 E砷—石、日、丨→石、日、丨、一→SRSH(加首元首码)

    S、 R、 S   S、 R、 S、 H量—日、一、里→日、一、里、日→RHLR(加末元首码)

    R、 H、 L   R、 H、 L、 R缉—纟、口、耳→纟、口、耳、缉→SKEJ(加声码)

    S、 K、 E   S、 K、 E、 J歯—止、米、凵→止、米、凵、繁→ZMKF(加繁体字代码)四元及四元以上汉字馒—饣、日、罒、又→饣、日、罒、ク→SRSD(改用首元首码)

    S、 R、 S、 Y   S、 R、 S、 D屐—尸、彳、十、又→尸、彳、十、乛→SRSZ(改用末元首码)

    S、 R、 S、 Y   S、 R、 S、 Z微—彳、山、一、攵→彳、山、一、几→REHJ(改用特征码)

    R、 E、 H、 W   R、 E、 H、 J徵—彳、山、一、攵→彳、山、一、王→REHW(改用特征码)

    R、 E、 H、 W   R、 E、 H、 W徽—彳、山、一、攵→彳、山、一、糸→REHS(改用特征码)

    R、 E、 H、 W   R、 E、 H、 S何—亻、一、丨、口→亻、一、丨、何→RHSH(改用声码)

    R、 H、 S、 K   R、 H、 S、 H馒—食、日、罒、又→食、日、罒、繁→SRSF(改用繁体字代码)

    S、 R、 S、 Y   S、 R、 S、 F对于复合部首拆分及部首顺序容易产生歧义的汉字尽可能给出容错编码,例如:塞—宀、三、、土→GIET(正码)

    G、 I、 E、 T塞—宀、艹、二、土→GCET(容错码)

    G、 C、 E、 T乃—乙、丿、乙→ZPZ(正码)

    Z、 P、 Z乃—丿、乙、丿→PZP(容错码)

    P、 Z、 P

    汉字单字或者词组编码输入的结束方式为:

    没有重码的字、词编码不足四码时,击空格键结束输入,编码为四码时自动结束输入;

    有重码的字、词,击数字键选字结束输入,第一个重码字词也可击空格键结束输入,编码为四码时第一个重码字词还可自动结束输入。

    自造词组的方法为:

    按V键,进入造词状态;

    输入词组编码,此时若没有重码字词,将在提示行显示第一个序号数,若已有重码字词,则在其后面增加一个序号数;

    输入词组各字;

    按V退出造词状态。

    以后按词组正常输入步骤输入该词组即可。

    图5是汉字标准部首码键盘输入基本流程图,图6是汉字标准部首码输入键盘。将汉字编码从键盘输入后,通过计算机将汉字编码转换为一个内码系列,据此,计算机从一个汉字库中选出该汉字,并执行显示、打印、传输或存贮等指令。

    实施例二

    将汉字键盘输入系统实施例一中的字母键位转换为数字键位,即为全数字码汉字键盘输入系统,转换的规则如下表所示:数字键位   1    2  3  4  5  6  7  8    9    0  ·与数字对应的元音   A    E  I  O  U音乐唱名声码,包括某些成对声母   D    R  M  F  S L,N X,T数字声码,包括某些成对声母,在先已用的不再重复   Y W Q B,P   J形似包括某些成对声母   Z  H  G,K    C造词键  V即各数字键位与字元、汉字的对应关系为:

    1键:代码为A、D、Y的字元,声码为A、D、Y的汉字;

    2键:代码为E、R、Z的字元,声码为E、R、Z的汉字;

    3键:代码为I、M的字元,声码为M的汉字;

    4键:代码为O、F、H的字元,声码为O、F、H的汉字;

    5键:代码为U、S、W的字元,声码为S、W的汉字;

    6键:代码为L、N的字元,声码为L、N的汉字;

    7键:代码为X、T、Q的字元,声码为X、T、Q的汉字;

    8键:代码为B、P的字元,声码为B、P的汉字;

    9键:代码为J、G、K的字元,声码为J、G、K的汉字;

    0键:代码为C氮C的字元,声码为C的汉字;

    ·键:代码为V的造词键;图7是汉字标准部首全数字码输入键盘(一)。

    由于数字编码的码域较小,所以汉字全数字编码的码长较字母编码的码长有所增加,为1~5位,输入步骤为:

    A、依次输入汉字或词组编码的各位代码:

    a、二元汉字的编码为“首码+末码+首元首码+末元首码+识别码(声码或繁体字代码)”;

    b、三元汉字的编码为“首码+二码+末码+首元首码+识别码(末元首码或声码或繁体字代码)”;

    c、四元及四元以上汉字的编码为“首码+二码+三码+末码+识别码(首元首码或末元首码或特征码或声码或繁体字代码)”;

    d、二字词组的编码为“首字声码+末字声码+首字首码+末字首码+末字二码”;

    e、三字词组的编码为“首字声码+二字声码+末字声码+首字首码+末字首码”;

    f、四字及四字以上词组的编码为“首字声码+二字声码+三字声码+末字声码+首字首码”;

    g、一级简码汉字的简码为该字编码的首位;

    h、二级简码汉字的简码为该字编码的前二位;

    i、三级简码汉字的简码为该字编码的前三位;

    j、四级简码汉字的简码为该字编码的前四位。

    B、结束输入:

    没有重码的字词编码不足五码时,击空格键或等号键结束输入,编码为五码时自动结束输入;

    有重码字、词时,击空格键或等号键后,再击数字键选字结束输入,击空格键或等号键可以默认第一个重码字词的输入。

    实施例三

    将实施例二中汉字键盘输入系统的数字键位改为由标准键盘中的A排字母键位代替,其对应关系为:1→H,2→J,3→K,4→L,5→:,6→G,7→F,8→D,9→S,0→A;输入步骤与实施例二相同;输入键盘参见图8。

    实施例四

    将实施例二中汉字键盘输入系统的数字键位改为由标准键盘中的Q、A、Z排字母键位代替,其对应关系为:

    1→Y、H、N,2→U、J、M,3→I、K、<,4→O、L、>,5→P、:、?,

    6→T、G、B,7→R、F、V,8→E、D、C,9→W、S、X,0→Q、A、Z;其中Q排键位用于输入三字及三字以上词组,A排键位用于输入汉字单字,Z排键位用于输入二字词组;输入步骤与实施例二相同;图8是汉字标准部首全数字码输入键盘(二)。

    实施例五

    以上几个实施例,均以汉字拼音字母表示字元、汉字的代码,比较适合在中国大陆地区使用,如果以汉字注音符号表示字元、汉字的代码,则更适合在台湾地区使用,为达此目的,只要按下面的对应关系作一简单变换即可:

    A→丫,  B→ㄅ,  C→彳,ㄘ D→ㄉ,   E→ㄜ,    F→,   G→ㄍ;

    H→厂,  I→丨    J→ㄐ,   K→ㄎ,   L→ㄌ,    M→,   N→ㄋ;

    O→ㄛ,  P→タ,  Q→〈,   R→ㄖ,   S→ㄕ,厶,T→ㄊ;

    U→ㄨ    V→万    W→ㄨ     X→,   Y→丨,ㄩ  Z→ㄓ,ㄗ。

    音节丫、ㄞ、ㄢ、尢、幺的声码用丫表示,音节ㄜ、ㄣ、儿、乀、∠的声码用ㄜ表示,以丨、ㄩ开头的音节的声码用丨表示,音节ㄛ、ㄡ、ㄨㄥ的声码用ㄛ表示,以ㄨ开头的音节的声码用ㄨ表示。

部首编码汉字键盘输入系统.pdf_第1页
第1页 / 共27页
部首编码汉字键盘输入系统.pdf_第2页
第2页 / 共27页
部首编码汉字键盘输入系统.pdf_第3页
第3页 / 共27页
点击查看更多>>
资源描述

《部首编码汉字键盘输入系统.pdf》由会员分享,可在线阅读,更多相关《部首编码汉字键盘输入系统.pdf(27页珍藏版)》请在专利查询网上搜索。

本发明公开了一种新的计算机汉字键盘输入系统。它采用新华字典的189个部首和少量变形部首作为标准部首,以标准部首作为字元,每个字元都有独立代码,将代码合理地分配在计算机键盘的字母键位或表征数字的键位上。使用本发明键盘,按照汉字书写的字元顺序和大元优先的原则拆分汉字,可以方便迅速地进行汉字编码的输入操作。。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1