万码汉字输入法 本发明属于将所要处理的数据转变成为计算机能够处理形式的技术领域,尤其涉及一种万码汉字输入法。
近年采,汉字编码输入法越来越多,这些输入方法总体来看可以归纳为三类:音码、形码、音形码。音码的编码以拼音为基础,易学,但重码过多,录入速度低;形码的编码虽重码少,但字根太多,不易掌握;音形码结合了前两类的特点,取其长,舍去短,但现有的音形码仍然存在着一些未能克服的缺陷。如发明专利公报第13卷第31号第58页公开的《全能码汉字输入方法》,它由声码、韵码、调码构成音码,由二分法依次分解汉字构成形码,它的编码由声母加韵母加形码构成,仍未离开韵母,增加了记忆的难度,方法繁琐,不易记忆。
本发明的目的在于提供一种易学、易记、直观、灵活方便,重码率低的万码汉字输入法。
本发明的万码汉字输入法,采用以下方法实现:取其声母编码,无论是单字或偏旁部首,均读其声,并按拼音中声母对应在英文字母键上,单字的拆分原则为:首部正向取大,尾部逆向取大,拆分后的两部分确实不能成为可读单字,可选取其中一部分,完全不能形成单字的,则用点、横、竖、撇、捺、钩、挑、折的声母作码,拼音中CH、SH、ZH简化为C、S、Z。本发明的汉字编码,以音近式为主,几个特殊部首按形近式,“纟”编码为“W”,“凵、冂、匚、”编码为“U”,为“U”,“ナ”编码为“f”,“ㄨ”编码为“X”,“ソ”编码为“V”;单字编码分五种类型:(1)双单字:拆分后为两个独立的单字,(2)偏旁字:拆分后左为偏旁,右为单字,(3)部首字:拆分后首部或首笔加单字,(4)部尾字:指左边(或上边)为单字,尾部为偏旁或笔画的字,(5)首尾字:指拆分后不能成为单字,首尾都是笔画的字。双字词的输入采用两字声母之和加“.”加第二字尾部声母;三字词采用三字声母之和加“,”,四字词采用四字声母之和;多字词采用前三字声母之和加末字声母。
以下所述实施例详细说明了本发明。
本发明的万码汉字输入法,以音近式为主,取其声母编码,并按拼音中声母对应在英文字母键上;几个特殊部首按形近式编码,“纟”的编码为“W”,“凵、冂、匚、”地编码为“U”,“ナ”的编码为“f”,“ㄨ”的编码为“X”,“ソ”编码为“V“;单字拆分后,无论是单字或偏旁部首,均读其声,并按拼音中声母对应在英文字母键上,单字的拆分原则为:首部正向取大,尾部逆向取大,拆分后的两部分确实不能成为可读单字,可选取其中一部分,比如“蝶”可拆分为“虫木”,完全不能形成单字的,则用点、横、竖、撇、捺、钩、挑、折对应的声母作码,使其在键盘上有其相应的键位,如:人=rpn。拼音中CH、SH、ZH简化为C、S、Z。如遇不认识的字或拆分不准的部分,则用通配符“?”代替。键盘上的“U”字母设定为全角中文符号,无须转换全角/半角开关,即能输入全角中文标点和特殊符号。
本发明的万码汉字输入方法,单字编码分为五种类型:
(1)双单字:拆分后为两个独立的单字。编码为该字声母+上字(或左字)声母+下字(或右字)声母。
如:双=syy 最=zyq 国=gky
注:凡内外结构的编码均先取外后取内。
(2)偏旁字:拆分后左为偏旁,右为单字。编码为该字声母+偏旁声母+右边的单字声母。
如:把=btb 彻=crq 纶=lwl
(3)部首字:这里的部首字是指拆分后首部或首笔+单字。编码为该字声母+部首声母+单字声母。
如:卑=bps 包=bps 百=bhb 符=fzf
(4)部尾字:这里的部尾字是指左边(或上边)为单字,尾部为偏旁或笔画的字。编码为该字声母+单字声母+部尾声母。
如:亏=keg 尽=jcd 剐=ggg 部=ble
还=hbz 边=blz
注:凡带“廴”或“辶”的字,编码均先取内后取外。
(5)首尾字:是指拆分后不能成为单字,首尾都是笔画的字。编码为该字声母+部首声母+部尾声母。
如:立=ldh 巴=bzg 又=yjn 门=mdg
词组的编码分四种类型:
(1)双字词。编码规则为:两字声母之和+.+第二字尾部声母。
如:编码=bm.m 人民=rm.g 祖国=zg.y
(2)三字词。编码规则为:三字声母之和+,
如:爱祖国=azg, 计算机=jsj, 生产力=scl,
(3)四字词。四字词编码规则为:四字声母之和
如:操作系统=czxt 中华民族=zhmz
(4)五字及五字以上词组。五字及五字以上词组编码规则为:前三字声母之和+末字声母。
如:发展科学技术=fzks
只要功夫深,铁杵磨成绣花针=zygz
为了方便记忆,将不为单字的偏旁部首全部列出。音近式的偏旁部首均对应英文字母键位,形近式码对其形记忆及可。
万灵码偏旁部首键位图相近偏旁部首的归类: 民 的尾码归在 戈 编码为g 黑 的上部归在 里 编码为l 拔 的右部归在 发 编码为f 丐 的上部归在 正 编码为z 快 的右部归在 央 编码为y 奂 的下部归在 央 编码为y 即 的左部归在 艮 编码为g 录 的上部归在编码为x 既 的右部归在 无 编码为w 要 的上部归在 西 编码为x 罢 的上部归在 四 编码为s 练 的右部归在 东 编码为d 东 的下部归在 木 编码为m 紧 的下部归在 系 编码为x 拜 的右部归在 丰 编码为f 龟 的下部归在 电 编码为d 声 的下部归在 尸 编码为s 是 的下部归在 疋 编码为p难字举例: 汉字 编码 码元 汉字 编码 码元 半 bds 丶十 生 snh 牛一 本 bmh 木一 失 spf ノ夫 重 cql 千里 尸 sph 丿一 大 dhr 一人 田 tks 口十 方 fdw 丶万 西 xwk 兀口
夫 fer 二人 乡 xwp 幺ノ
广 gdc 丶厂 雨 yhu 一冂
火 hdr 丶人 又 yjn フ
画 hhu 一凵 月 yue 冂二
堇 jgt 革土 酉 yxh 西一
口 ksh 丨一 用 yys 月丨
临 lsq 丨 由 yys 曰丨
来 lsm 十米 主 zdw 丶王
门 mdg 丶亅 正 zhz 一止
目 mke 口二 中 zks 口丨
面 mhq 一 子 zlh 了一
年 nps ノ十
日 rkh 口一
本发明的万码汉字输入方法,由于采用音近式归类,只取其声母,舍去韵母,只有特殊少量的几个部首才按形近式归炭,大大减少了编码的复杂程度和记忆量,通过实践证明,该汉字输入方法简单、直观、易学、易记、灵活方便、重码率低,避免了其它输入法字根太多太繁,记忆量大和拼音中韵母难记的困难,适用于各种文化程度的人使用,是一种值得推广、普及的汉字输入法。