本发明涉及一种汉字编码技术,确切地说是一种汉字字形计算机输入系统。 汉字编码是实现中文信息的传递和处理的关键,可广泛应用于办公自动化管理,文字处理系统,企事业单位事务管理,印刷排版系统以及计算机网络通讯系统,为适应社会发展的需要,近年来国内提出了数百种汉字编码方案及其配套技术,其中数十种方案具有实用性,有些编码技术产品已被用户所接受,在国内外产生一定的影响。
现有的音形,笔形,字形三类编码方案各有利弊,其中音形编码法编码简便,但重码多,输入速度慢;笔形编码法和字形编码法,规则过多,记忆量大,涉及键码多,操作者必须要经过专门训练,否则难以胜任。为了进一步普及和推广汉字编码技术,需要创造出编码简便,易学易记,重码少,非专业人员也能操作使用的汉字编码方法及其配套技术。
本发明的目的在于提供一种四码汉字字形输入法及其键盘,采用字形特征编码,只涉及17个键码,识别记忆方便,重码少,非专业人员也可上机操作。
以下结合实例叙述本发明的详细内容。
本发明采用17个字形特征元素,其代码,命名,形,范例,特征如下:
确定17个字形特征元素,包括:点(丶),横(一),竖(丨),撇(丿),方(口),转(),乙(乚),拔(),踢(丿),恩(),广(广),勾(),角(),叉(乂),串(),捺(),帽(宀亠),以17个英文字母分别作为17个字形特征元素的代码,其对应关系是:D-点,H-横,S-竖,P-撇,F-方,T-转,E-乙,B-拔,K-踢,I-恩,U-广,G-勾,J-角,X-叉,Y-串,N-捺,M-帽。所有的汉字采用四码制编码,编码的基本规则为:四角取码,先左后右,先上后下,先外后内;同时包括以下编码细则:
一、左右形结构的字,依次按4个角的上左,右上,下左,右下顺序取码,设定每个角都有一条对角的轴线,在轴线上或轴线附近取码,并约定:
1.在一个象限内,优先取完整的,暴露于角边的,靠近角尖的码例:淆(丶乂)
2.在同一个象限内,有2个或2个以上完整的字形特征元素时,应取象限名首位字位置的字形特征元素,即上左象限取上,右上象限取右,下左象限取下,右下象限取右。
例:封(十十丿亅),改()
封→XXKG 上左取上
改→THGX 右上取右
3.在象限内无完整的字形特征元素时,取跨越界线的字形特征元素,取法按照同一象限内有完整的字形特征元素时的取码规则,但已取过的不能在其他象限内重取。
4.若某象限内无字形特征元素可取,则取邻近角位的字形特征元素;若邻近的字形特征元素均已取过,或者无邻近字形特征元素时,则作缺码处理。例:考(十)
考→XXI 缺-码
二.上下形结构的字,取上部字形的上、下字形特征元素为第一,二码,取下部字形地下、上字形特征元素为第三,四码。
例:走(十一丿),室(宀一一十)
走→XHPB
室→MHHX
三.外内形结构的字,先取外,后取内。例:
田→FX 日→FH 国→FHHD
同时约定:
1.对于封闭的笔,若延伸出外部的,按先上后下取码。
例:由(口),甲(口)
由→YF 甲→FY
2.对于封闭形的边,若延伸至外部的,则以一般方式取码,例:皿(一一丨),尸(丿一)
皿→HTHS 尸→PTH
四、跨越2个象限的笔,存在2种字形特征元素的,可在各相应的象限内重复取码;只有一种字形特征元素的,不得重复取码,例:疋(),画(一口丨)
疋→HGPB 重复取码
画→HFTS 不重复取码
按上述编码规则,可在计算机内建立汉字库,或制成汉字软盘供操作者使用。
选字方法:
对每一个象限内的字形特征元素依次取码,当键入第一码后,第一象限内含有该字形特征元素的所有汉字,均可能在屏幕底部出现,如对于“玩”字,编码为HHKE,键入第一码H后,屏幕出现:
H 1 碍 2 巴 3 霸 4 百 5 斑 6 班 7 磅 8 雹 9 碑 0 悲
若再打>键,出现下10个字,直到第一码为H的字显示完为止。当要选的字仅一笔时,键入第一码后,打空格键,便出现相应的字。例:要选的字为“一”,键入H,打空格键,便出现“一”。屏幕显示为:H 一。
打入第一,二键,屏幕出现相应特征的字,例:键入HH。
屏幕出现:
HH.1 斑 2 班 3 悲 4 辈 5 耻 6 顶 7 二 8 非 9 匪 0 攻
若此时打入空键,屏幕出现:
HH.1 二 HH是二的代码.
打入第一、二、三码,屏幕出现相应特征的字,例键入HHK,屏幕出现:
HHK.1 斑 2 班 3 耻 4 攻 5 环 6 颈 7 玫 8 巧 9 玩 0 项这时打>出现鸣叫,说明不再有HHK特征的字。
打完HHKE,出现:
HHKE.1 玩 2 甄 3 琥
接着打入1,选中了“玩”字,编入到正文,被选的字送入正文后,屏幕底部会出现一批与该字可能组合的联想字,本例中出现:
玩
1 具 2 弄 3 耍 4 笑 5 意 6 味 7 世 8 物
以供编缉选用。
本发明的键盘采用17键输入键位,示于图1,为字形特征元素与代码共容的键盘,操作按图2程序进行。
同现有技术比较,本发明有以下优点:
1.编码规则简单明确,容易掌握;
2.采用17个字形特征元素,便可对所有的汉字编码,按4个象限取码,很直观,取码方便;
3.重码很少,统计结果表明:键入第二三码后,应选字出现率达60%;应选字到键入第4码才出现的只占9%,其中多为单字,重码极少;出现应选联想字的几率为35%左右。
4.指采用17个键位,标码清晰直观,操作方便,非专业人员也能操作,对于汉字编码技术的推广应用,必将起较大的作用。
附:汉字输入例
图1为17键输入键位图。
图2.为编码操作程序图。
汉字输入例:
江泽民同志4月在四川考察时的讲话
江 泽 民 同 志 4 月 在 四 川 考 察
DHK DJKY HTG SI / 4 PIH XXS FT PS XXI /
时 指 出,全 党 同 志 , 特 别 是
FXH YPGF / , PBH / SI / , PXYG / FHP
各 级 领 导 干 部, 要 深 刻 理 解
PJF / PHN / HX / , HFX DGK / HFK /
邓 小 平 同 志 提 出 的 科 学 技 术
JJ SN HD SI / YFGB TS PI PXP / YX /
是 第 一 生 产 力 这 个 马 克 思 主
FHP PHPI / PYH / / DMB / HTH / FXD MXH
义 观 点 。 同 时 还 强 调 说 : 科
/ JTX / 。 SI / DHB TFI / DDGE : PXP
技 是 实 现 第 二 步 战 略 目 标 的
/ FHP MX / PHP / / SDF / FHH / PI
关 键 , 电 子 行 业 是 高 科 技 领
DDX / , YFE / PHSG / FHP MF PXP / PHN
域 之 一 , 又 是 带 头 工 业 , 必
/ DJB H , HJX FHP YG / HS / , DX
须 坚 持 以 科 技 为 先 导 , 尊 重
/ SJH / SPG PXP / DXD PXPE / , DDD /
知 识 , 尊 重 人 才 , 要 充 分 发
PFX / , DDD / PB / , BFX MN / PDX
挥 科 技 人 员 的 聪 明 才 智 , 充
/ PXP / PB / PI HDKD / XP / , MN
分 调 动 他 们 对 科 技 事 业 的 积
/ DI / PYSE / JX PXP / YFGX / PI PFPN
极 性 。 在 这 方 面 , 我 国 的 大
/ DYSH 。 XXS DMB MI / , PDGG / PI XB
型 企 业 , 大 研 究 所 , 重 点 高
HSH PBH / , XB HHF / / , PYH / MF
等 院 校 有 极 大 的 潜 力 , 亟 待
PHD JMS / XIS XJPX / PI DYKF / , HJH PX
加 以 发 挥 , 这 也 是 搞 活 大 中
XFI SPG PDX / , DMB YIE FHP YMG DP XB YF
型 企 业 的 一 个 关 键 。 要 使 电
HSH PBHS / PI H PBS DDX / 。 HFX PYSX YF
子 工 业 的 发 展 真 正 转 入 依 靠
HJG HS / PI PDX / XTP / XYYN / PMSB /
科 技 进 步 的 轨 道 。
PXP / DYB / PI XXY / 。
注:/由联想输入,有些字的编码是四码的,如:江DHKH。但实际上打入三码DHK就能找到。