一种电脑汉字音位码输入法及其键盘 【技术领域】
本发明属计算机汉字编码输入法,尤其是一种电脑汉字音位码输入法及其键盘。
背景技术
目前,电脑汉字编码输入法大致可分为:数字码、形码、音码和音形码。形码和音形码输入法对形码设置的基本特征是把汉字看作由字根组成,在众多的字根中选择其中的100-300个字根分配到键位上参与编码。使用这种编码输入方法需要熟记大量的字根码元和折字规则,还要记住一些特例,学习难度大、难学易忘。此外还有用偏旁、笔画或图形等作码元编码的形码输入法,都有很大的码元记忆量。在用笔画参与编码输入法中,绝大多数是用笔画的笔形或笔画的读音作码元编码。然而,在数以万计的汉字中,汉字笔画在字中位置(本文称笔位)是汉字的重要区别信息,如“大”字后再写一“点”,可以是“太”字,也可以是“犬”字,仅仅是因为“点”的位置不同而导致字义上的根本的区别。
在众多的电脑汉字编码输入法中存在一个共同的不足:好学的输入速度不快,输入速度快的不好学。如五笔字型输入法,输入速度快、重码率低,是现阶段运用较广泛的汉字编码输入法,但还存在字根记忆量大,编码规则复杂的不足,不经过专门培训很难学会;又如全拼输入法,利用了人们早期受教育的成果-汉语拼音知识,易入门,但同音重码字较多,需翻页查找,输入速度慢。
在目前语音输入还不够完善,手写输入赶不上键盘输入速度的大背景下,编码输入仍占有重要地位。开发一种比全拼输入法还简单易学,重码率又低的电脑键盘编码输入法定会有广泛的应有领域。
发明内容:
本发明的目的就是提供一种与现代汉语中语言、文字规范相一致,编码规则简单,编码长度短、重码率低,易学习易普及的计算机汉字编码输入法。
本发明一种电脑汉字音位码输入法及其键盘,包括通用键盘、键盘上26个字母键设置为其对应的26个汉语拼音字母输入键,其特征在于,将汉字看作一方块状,设汉字中有横中线1和竖中线2各一条且垂直相交于字正中,将汉字分成“田”字状,依据标准汉字,选取汉字的首笔笔画和末笔笔画,按横(—)、竖(丨)、撇(丿)、捺()、点(丶)、折(所有带折的笔画)在字中与横中线1或/和竖中线2的相对位置以及在字中的其他位置定义笔位码码元,设置笔位码输入键位,制定编码规划,用笔位码结合音码输入汉字、词和短语。
本发明所述标准汉字是指《新华字典》上的字头字;所述首笔笔画和末笔笔画是按1997年国家公布的《现代汉语通用字笔顺规范》取汉字的首笔笔画和汉字的末笔笔画;所述笔位码码元定义可以是:
码元名称 定义 类别 所在字例 首笔横正中 首笔横处于相交于竖中线且被竖中线均分的位置 专指 真友末 首笔横过中 首笔横处于相交于竖中线且不被竖中线均分的位置 专指 达政型 首笔横离中 首笔横处于不触及横中线也不触及竖中线的位置 专指 雅辆魂 首笔横提手 首笔横是字中“扌”的首笔横,随“扌”处字的各位置 特指 折逝誓 首笔横在木 首笔横是字中“木”的首笔横,随“木”处字的各位置 特指 森林树 首笔横中顶 首笔横处于相交于竖中线且被竖中线均分并居字的顶 部位置 特指 要雷画 首笔横草头 首笔横是字中“艹”的首笔横,随“艹”处字的各位置 特指 花鹳草 首笔横酉王 首笔横是字中“酉”或“王”的首笔横,随“酉”或 “王”处字的各位置 特指 酿环琨 首笔横在土 首笔横是字中“土”的首笔横,随“土”处字的各位置 特指 地封块 首笔横在石 首笔横是字中“石”的首笔横,随“石”处字的各位置 特指 硅泵砒 首笔竖正中 首笔竖处于竖中线位置 专指 山堂岁 首笔竖过中 首笔竖不处于竖中线位置,处于与横中线相交位置 专指 旧畔国 首笔竖离中 首笔竖处于不触及横中线也不触及竖中线的位置 专指 骼凿蜀 首笔竖在口 首笔竖是字中“口”的首笔竖,随“口”处字的各位置 特指 吃别足 首笔竖在日 首笔竖是字中“日”的首笔竖,随“日”处字的各位置 特指 时是暑 首笔竖在虫 首笔竖是字中“虫”的首笔竖,随“虫”处字的各位置 特指 蛆蛇蛀 首笔撇居中 首笔撇处于本身三分之一中部区间的任一处与横中 线或竖中线相交位置 专指 香妥九 首笔撇达中 首笔撇处于本身三分之一端部区间的任一处与横中 线或竖中线相交位置 专指 全长么 首笔撇离中 首笔撇处于不触及横中线也不触及竖中线的位置 专指 翁行毯 首笔撇单人 首笔撇是字中“亻”的首笔撇,随“亻”处字的各位置 特指 任凭仪 首笔撇折头 首笔撇处于后一笔画“折”的前端位置 特指 危饭鲤 首笔撇横头 首笔撇处于后一笔画“横”的前端位置 特指 银牡气 首笔撇反犬 首笔撇是字中“犭”地首笔撇,随“犭”处字的各位置 特指 狗狼逛
首笔撇舟禾 首笔撇是字中“舟”或“禾”的首笔撇,随“舟”或 “禾”处字的各位置 特指 船黎秋 首笔点正中 首笔点处于横中线或竖中线位置 专指 宝空心 首笔点离中 首笔点处于不触及横中线也不触及竖中线的位置 专指 礼门衫 首笔点竖心 首笔点是字中“忄”的首笔点,随“忄”处字的各位置 特指 愉恒快 首笔点三水 首笔点是字中“氵”的首笔点,随“氵”处字的各位置 特指 洗裟淑 首笔点横上 首笔点处于后一笔画“横”的上方位置 特指 高旗度 首笔点在讠 首笔点是字中“讠”的首笔点,随“讠”处字的各位置 特指 语话谢 首笔点米火 首笔点是字中“米”或“火”的首笔点,随“米”或“火” 处字的各位置 特指 粮炮炎 首笔折角左 首笔折处于第一个折角向左的位置 专指 妙牟巡 首笔折角右 首笔折处于第一个折角向右的位置 专指 难弹屑 首笔折绞丝 首笔折是字中“纟”的首笔折,随“纟”处字的各位置 特指 给纤绣 首笔折马耳 首笔折是字中“马”或“阝”的首笔折,随“马”或“阝” 处字的各位置 特指 骆陈阳 末笔横正中 末笔横处于相交于竖中线且被竖中线均分的位置 专指 宣女塞 末笔横过中 末笔横处于相交于竖中线且不被竖中线均分的位置 专指 写楼栏 末笔横离中 末笔横处于不触及横中线也不触及竖中线的位置 专指 难络胡 末笔竖过中 末笔竖处于交横中线或在竖中线的位置 专指 邝常冲 末笔竖离中 末笔竖处于不触及横中线也不触及竖中线的位置 专指 鼻需端 末笔撇各位 末笔撇处于字内各位置 泛指 珍廖动 末笔捺交笔 末笔捺处于与其他笔画相交的位置 专指 放设文 末笔捺不交 末笔捺处于不与其他笔画相交的位置 专指 深莫象 末笔点字中 末笔点处于不在字右上角和右下角的位置 专指 衬多虾 末笔点字角 末笔点处于字右上角或字右下角的位置 专指 杰须武 末笔折向左 末笔折处于末折向左出位置(含向左上、左和左下位置) 专指 别今行 末笔折向右 末笔折处于末折向右出位置(含向右上、右和右下位置) 专指 流苍医
本输入法笔位码的输入键位设置可以是:
首笔横正中Z 首笔横过中V 首笔横离中C 首笔横提手N
首笔横在木M 首笔横中顶X 首笔横草头B 首笔横酉王,
首笔横在土. 首笔横在石/ 首笔竖正中、 首笔竖过中F
首笔竖离中D 首笔竖在口G 首笔竖在日A 首笔竖在虫S
首笔撇居中P 首笔撇达中O 首笔撇离中I 首笔撇单人U
首笔撇折头Y 首笔撇横头T 首笔撇反犬] 首笔撇舟禾[
首笔点正中\ 首笔点竖心L 首笔点离中K 首笔点三水H
首笔点横上J 首笔点在讠; 首笔点米火 首笔折角左E
首笔折角右R 首笔折绞丝W 首笔折马耳Q 末笔横正中/
末笔横过中. 末笔横离中, 末笔竖过中V 末笔竖离中]
末笔撇各位[ 末笔捺交笔I 末笔捺不交U 末笔点字中;
末笔点字角 末笔折向左、 末笔折向右\
本输入法的取码编码规则:1、依《现代汉语通用字笔顺规范》确定汉字的首笔和末笔,根据汉字的首笔和末笔所处《新华字典》字头字中的位置、码元定义和“特指优先”的规定确定码元;2、可以按下列规则进行编码:
单字:拼音首字母+首笔笔位码+末笔笔位码;
二字词:第一字拼音首字母+第一字首笔笔位码+第二字拼音首字母+第二字末笔笔位码;
三字词:第一字拼音首字母+第一字首笔笔位码+第二字拼音首字母+第三字拼音首字母+第三字末笔笔位码;
四字及四字以上词:第一字拼音首字母+第一字首笔笔位码+第二字拼音首字母+第三字拼音首字母+末字拼音首字母+末字末笔笔位码(或末字首笔笔位码);
二字常用短语:
V+第一字首笔笔位码+第二字首笔笔位码+第二字末笔笔位码,或
I+第一字首笔笔位码+第二字首笔笔位码+第二字末笔笔位码,或
U+第一字首笔笔位码+第二字首笔笔位码+第二字末笔笔位码;
三字常用短语:
V+第一字首笔笔位码+第二字首笔笔位码+第三字拼音首字母+第三字末笔笔位码,或
I+第一字首笔笔位码+第二字首笔笔位码+第三字拼音首字母+第三字末笔笔位码,或
U+第一字首笔笔位码+第二字首笔笔位码+第三字拼音首字母+第三字末笔笔位码;
四字及四字以上常用短语:
V+第一字首笔笔位码+第二字首笔笔位码+第三字拼音首字母+末字拼音首字母+末字末笔笔位码(或末字首笔笔位码),或
I+第一字首笔笔位码+第二字首笔笔位码+第三字拼音首字母+末字拼音首字母+末字末笔笔位码(或末字首笔笔位码),或
U+第一字首笔笔位码+第二字首笔笔位码+第三字拼音首字母+末字拼音首字母+末字末笔笔位码(或末字首笔笔位码);
本输入法将短语分成三个不同类别编码,用V、I、U作为类别首码:I类为有名词属性的短语类,如:湖南省、国家知识产权局、斯里兰卡;U类为数字(含基数词、位数词和约数词等)打头的短语类,如:十八号、二叔、三哥、四海为家、千万别、少数服从多数等;V类为杂合类:以单音节动词后配“着、了、过、得、到”,“不”后加单音节动词或单音节形容词以及有重叠形成的全部由单音节词组成的短语为主的短语类,如:吃了、吃着、吃过、不吃、不干、不白、不红、看了看、红红火火、绿油油等。
本输入法四字及四字以上词的编码还可以不设第六码:末字末笔笔位码(或末字首笔笔位码)。
本输入法四字及四字以上常用短语的编码还可以不设第六码:末字末笔笔位码(或末字首笔笔位码);
本输入法常用短语的编码还可以是:
二字常用短语:I或U或V+第一字拼音首字母+第一字首笔笔位码+第二字首笔笔位码+第二字末笔笔位码;
三字常用短语:I或U或V+第一字拼音首字母+第一字首笔笔位码+第二字首笔笔位码+第三字拼音首字母+第三字末笔笔位码;
四字及四字以上常用短语:I或U或V+第一字拼音首字母+第一字首笔笔位码+第二字首笔笔位码+第三字拼音首字母+末字拼音首字母。
本输入法常用短语的编码还可以是:
二字常用短语:I或U或V+第一字拼音首字母+第二字拼音首字母+第二字末笔笔位码;
三字常用短语:I或U或V+第一字拼音首字母+第二字拼音首字母+第三字拼音首字母+第三字末笔笔位码;
四字及四字以上常用短语:I或U或V+第一字拼音首字母+第二字拼音首字母+第三字拼音首字母+末字拼音首字母+末字末笔笔位码(或末字首笔笔位码)。
本输入法的首笔笔位码码元还可以定义为18-34个,首笔笔位码的输入键位可以在26个字母键和9个符号键的范围内根据需要设置。
本输入法具有以下特点:
1、规范:编码规则和内容均在现代汉语所规定的语言文字规范内,字词与短语分别编码输入。
2、易学:编码规则少,记忆量小,能见字知码并设有汉字读音检索码;
3、高效:取码直观,词库容量大,可多设短语条,增加输入速度;
4、码长短,重码率低,能三码见字,不需翻页选字。
5、适用范围广:因易学高效而适宜于非专业打字人员用电脑输入汉字。
【附图说明】
图1是本发明“田”字定位框示意图;
图2是本发明音位码键位设置示意图;
图中:横中线1、竖中线2
具体实施方式:
本实施例字词库汉字编码用GB2312-80《信息交换用汉字编码字符集》内的全部6763个汉字,设单字、词和短语音位码存储;词和常用短语分别编码,词用《现代汉语词典》上的所有词编码存储,常用短语以单音节词组成的短语为主且用V、I、U三类别的首码参与编码存储。
本发明所述的拼音首字母是按《汉语拼音方案》的规定取其拼音中的第一个字母。
本发明所述的将汉字看作一方块状,设字中有横中线1和竖中线2各一条且垂直相交于字正中,将汉字分成“田”字状,依据标准汉字,选取汉字的首笔笔画和末笔笔画,按横(—)、竖(丨)、撇(丿)、捺()、点(、)、折(所有带折的笔画)在字中与横中线1或/和竖中线2的相对位置以及在字中的其他位置定义笔位码码元,简称“田”字定位法。
字形依据:按《新华字典》上的字头字,无论是纵向偏长的汉字,如目、日,还是横向偏长的汉字,如一、曰,均看成方块状;
笔顺依据:按国家1997年公布的《现代汉语通用字笔顺规范》取汉字的首笔和末笔。如“达”字首笔是横而不是“走之”;
取码规则:码元凭直观,依规矩和特指优先确定。所述的凭直观:就是由直观笔画在汉字中的位置定笔位,不能以笔画在单个部件中定,如上述的“达”字,首笔横在“大”这个字中是一个首笔横正中,但在“达”这个字中只能取首笔横过中;所述的依规矩是依汉字的构字规范,汉字的构字规范与直观结果是一致的,只是在直观难以确定笔位时,用汉字构字规范作依据。事实上汉字的构字规范早已成为一种常识为中国人所掌握,如“直”字,识字的中国人都知道其首笔横横在正中间,末笔横也横在正中间,所以本输入法“直”的首笔笔位码是首笔横正中、末笔笔位码是末笔横正中。有些笔画直观上不易确定,构字规范也没有明确的界定,就按本输入法的约定,如“心、思、想”,本输入法定其末笔笔位码为:末笔点字中。
特指优先:当一笔画既可取特指类码元,又可取其他类码元时,应取特指类码元,如“折”字,首笔笔位码可取首笔横提手或首笔横离中,按特指优先,则取首笔横提手。本实施例47个笔位码码元中有特指码元22个:首笔横提手、首笔横在木、首笔横中顶、首笔横草头、首笔横酉王、首笔横在土、首笔横在石、首笔竖在口、首笔竖在日、首笔竖在虫、首笔撇单人、首笔撇折头、首笔撇横头、首笔撇反犬、首笔撇舟禾、首笔点竖心、首笔点三水、首笔点横上、首笔点在讠、首笔点米火、首笔折绞丝、首笔折马耳。
编码规则:单字按拼音首字母+首笔笔位码+末笔笔位码编码,即一字三码,第一码为该字汉语拼音的第一个字母,第二码为该字首笔笔位码,第三码为该字的末笔笔位码;如上述“达”字,其读音da,则取第一个字母d,首笔笔位码为首笔横过中,首笔横过中的代码为V,末笔笔位码为末笔捺不交,末笔捺不交的代码为U,则“达”字输入码为:D V U。
特字说明:GB2312-80字符集有单笔字两个,即“一”、“乙”,“一”字首笔笔位码取首笔横正中,末笔笔位码取末笔横正中,“乙”字首笔笔位码取首笔折角右,末笔笔位码取末笔折向右。
1、单字编码方法:
拼音首字母+首笔笔位码+末笔笔位码
(wang)输入方法:w+首笔横酉王+末笔横正中
音位码: W , /
亘(gen)输入方法:g+首笔横中顶+末笔横正中
音位码: G X /
型(xing)输入方法:x+首笔横过中+末笔横正中
音位码: X V /
树(shu)输入方法:s+首笔横在木+末笔点字中
音位码: S M ;
折(she)输入方法:s+首笔横提手+末笔竖过中
音位码: S N V
折(zhe)输入方法:z+首笔横提手+末笔竖过中
音位码: Z N V
山(shan)输入方法:s+首笔竖正中+末笔竖过中
音位码: S 、 V
吃(chi)输入方法:c+首笔竖在口+末笔折向右
音位码: C G \
跑(pao)输入方法:p+首笔竖在口+末笔折向右
音位码: P G \
香(xiang)输入方法:x+首笔撇居中+末笔横正中
音位码: X P /
全(quan)输入方法:q+首笔撇达中+末笔横正中
音位码: Q O /
和(he)输入方法:h+首笔撇舟禾+末笔横离中
音位码: H [ ,
仁(ren)输入方法:r+首笔撇单人+末笔横过中
音位码: R U .
高(gao)输入方法:g+首笔点横上+末笔横正中
音位码: G J /
灯(deng)输入方法:d+首笔点米火+末笔折向左
音位码: D 、
订(ding)输入方法:d+首笔点在讠+末笔折向左
音位码: D ; 、
沙(sha)输入方法:s+首笔点三水+末笔撇各位
音位码: S H [
给(gei)输入方法:g+首笔折绞丝+末笔横离中
音位码: G W ,
给(ji)输入方法:j+首笔折绞丝+末笔横离中
音位码: J W ,
骆(luo)输入方法:l+首笔折马耳+末笔横离中
音位码: L Q ,
宣(xuan)输入方法:x+首笔点正中+末笔横正中
音位码: X \ /
写(xie)输入方法:x+首笔点离中+末笔横过中
音位码: X K .
难(nan)输入方法:n+首笔折角右+末笔横离中
音位码: N R ,
邝(kuang)输入方法:k+首笔点横上+末笔竖过中
音位码: K J V
珍(zhen)输入方法:z+首笔横酉王+末笔撇各位
音位码: Z , [
放(fang)输入方法:f+首笔点横上+末笔捺交笔
音位码: F J I
深(shen)输入方法:s+首笔点三水+末笔捺不交
音位码: S H U
衬(chen)输入方法:c+首笔点离中+末笔点字中
音位码: C K ;
杰(jie)输入方法:j+首笔横在木+末笔点字角
音位码: J M
别(bie)输入方法:b+首笔竖在口+末笔折向左
音位码: B G
流(liu)输入方法:l+首笔点三水+末笔折向右
音位码: L H \
2、二字词和二字以上词编码方法:
2.1、二字词:第一字拼音首字母+第一字首笔笔位码+第二字拼音首字母+第二字末笔笔位码:
汉语(han yu)输入方法:h+首笔点三水+y+末笔横离中
音位码: H H Y ,
地球(di qiu)输入方法:d+首笔横在土+q+末笔点字角
音位码: D . Q
2.2、三字词:第一字拼音首字母+第一字首笔笔位码+第二音拼音首字母+第三字拼音首字母+第三字末笔笔位码:
计算机(jisuanji)输入方法:j+首笔点在讠+s+j+末笔折向右
音位码: J ; S J \
有机物(youjiwu)输入方法:y+首笔横正中+j+w+末笔撇各位
音位码: Y Z J W [
2.3、四字及四字以上词:
第一字拼音首字母+第一字首笔笔位码+第二字拼音首字母+第三字拼音首字母+末字拼音首字母+末字末笔笔位码:
一帆风顺(yifanfengshun)输入方法:y+首笔横正中+f+f+s+末笔点字角
音位码: Y Z F F S
有过之无不及(youguozhiwubuji)
输入方法:y+首笔横正中+g+z+j+末笔捺交笔
音位码: Y Z G Z J I
3、常用短语编码方法:
3.1、二字常用短语
V+第一字首笔笔位码+第二字首笔笔位码+第二字末笔笔位码,或
I+第一字首笔笔位码+第二字首笔笔位码+第二字末笔笔位码,或
U+第一字首笔笔位码+第二字首笔笔位码+第二字末笔笔位码;
V、I、U是本发明设定的常用短语的三个不同类别的首码,下一短语类别首码是V,则:
看了(kan le)输入方法:v+首笔撇居中+首笔折角右+末笔折向左
音位码: V P R 、
3.2、三字常用短语:
V+第一字首笔笔位码+第二字首笔笔位码+第三字拼音首字母+第三字末笔笔位码,或
I+第一字首笔笔位码+第二字首笔笔位码+第三字拼音首字母+第三字末笔笔位码,或
U+第一字首笔笔位码+第二字首笔笔位码+第三字拼音首字母+第三字末笔笔位码;
V、I、U是本发明设定的常用短语的三个不同类别的首码,下一短语类别首码是V,则
想了想(xiang le xiang)输入方法:
v+首笔横在木+首笔折角右+x+末笔点字中
音位码:V M R X ;
3.3、四字及四字以上常用短语编码方法:
V+第一字首笔笔位码+第二字首笔笔位码+第三字拼音首字母+末字拼音首字母+末字末笔笔位码,或
I+第一字首笔笔位码+第二字首笔笔位码+第三字拼音首字母+末字拼音首字母+末字末笔笔位码,或
U+第一字首笔笔位码+第二字首笔笔位码+第三字拼音首字母+末字拼音首字母+末字末笔笔位码;
V、I、U是本发明设定的常用短语的三个不同类别的首码,下一短语类别首码是U,则
二者必居其一(er zhe bi ju qi yi)
输入方法:U+首笔横中顶+首笔横过中+b+y+末笔横正中
音位码: U X V B Y /