部首式汉字输入法 本发明的名称是部首式汉字输入法,属于计算机汉字输入技术领域。
目前,我国已有各种汉字编码方案1000多种,有10种左右已经得到较为普遍的应用。所有这些方案既各有所长,也各有所短,不同程度地存在着难学易忘,规范性差,重码较多,干扰形象思维的缺陷。本发明的目的就是要使上述共性问题能够得到进一步较好解决,以利于计算机在我国的广泛普及和应用,发展社会生产力,提高人们的生活质量。
汉字是中华民族的宝贵遗产,它对中华民族的团结,对中国历史的进步发挥着重要的作用。随着社会的不断发展,汉字本身也不断发生着演变,现阶段中国汉字表现出较为显著的四大特点:一、一字一音(多音字较为罕见),一音多字;二、由一些最基本的笔画组成;三、书写具有一定笔顺;四、每个汉字都具有一定的部首。根据汉字的四大特点,可以分三个层次区分所有的汉字:一、读音。从众多的读音中区分出同音字;二、部首。部首可以进一步把同音字分成含义各异的汉字。至此,绝大部分汉字已经能够得到区分;三、部首外笔画。还存在着少量同音同部首汉字,它们的部首外笔画组成肯定不同,可以取其少量笔画将其区分(例如取其首笔和末笔)。
根据以上对汉字的研究,本发明的汉字输入编码由以下三部分组成:
第一部分 汉字的读音代码
第二部分 该汉字部首的读音代码
第三部分 该汉字部首外少量笔画的代码
汉字读音代码的编制目前已有多种成熟的方案,如全拼输入法、声韵双拼输入法等。部首外少量笔画代码的编制方法也比较简单,本发明笔画代码表见附表3。那末,部首地代码应当如何编制呢?
让我们再研究一下所谓部首读音问题。
汉字的部首绝大部分具有读音,少量部首没有读音(只有一些人们对它的习惯叫法),前者可称为成字部首,后者称为非成字部首,在成字部首中存在着一些同音部首。本发明对非成字部首赋予其一定的读音,而对同音部首的读音一般用本部首另外一个字的读音去代替(也有个别例外),使汉字部首具有各不相同的读音音节,这样我们在编码过程中就能够避免部首代码的重码问题。本发明对新华字(词)典采用的189个部首中的部分部首还作了适当的合并,统一采用某一个读音(部首还可以作其它形式的调整、合并),在此基础上制定出了部首代码表(蒋氏表),见附表2。
本输入法所称的汉字既包括简体汉字,也包括繁体汉字,在实际的编码过程中,它们是两个不同的编码体系,可以通过功能键实现简体字和繁体字之间的相互转换。本输入法的各种读音均以普通话为准,读音的拼音方法依照国家颁布的汉语拼音方案。本编码的第一、二部分之间的位置也可以互换,即汉字部首读音代码也可以放在汉字读音代码之前。所谓代码,只有一种记号或符号,因此,它可以是汉语拼音符号, 也可以是其它国家的语言符号,或者是其它符号,如数字等。所谓部首外少量笔画,既可以是首笔和末笔,也可以是书写笔顺的其它笔画。根据我国当前的国情,本发明现仅以西文字母为代码,部首外笔画取其首笔和末笔,对国标GB2312-800中所规定的汉字进行输入编码。有以下两种编码方案:
一、全拼拼音
在全拼状态下,汉字读音、部首读音以其全部汉语拼音字母为代码,逐个字母打入,汉字读音代码、部首读音代码、笔画代码之间要加逗号,以免发生混淆。例如,胖字的全拼拼音编码应为:PANG,YUE,DS。
二、声韵双拼
在声韵双拼状态下,汉语拼音的声母和韵母都用相应的代码来表示,见附表1。此时,每个汉字的输入编码长度为6位,汉字读音代码、部首读音代码、笔画代码之间不必再加逗号。如胖字的代码为PGYVDS,鲤字的编码为LIBMSA,吏字的编码为LIHTSK。
应当看到,约占汉字总数70%的汉字只要输入其读音代码和部首代码,便不会发生重码现象。
由上面的编码实例可以看出,本输入法具有方法简单,易于学习掌握的特点,而且编码规范性强,基本与人们的书写习惯、思维习惯相吻合,与语文教学知识联系也很密切,实践证明,本输入法的重码率也比较低,重码率可以达到千分之五以下。
运用拼音法输入汉字,对于所输入的汉字首先必须认识、会读,那么遇到不认识的汉字应当如何办呢?根据以上我们对汉字特点的研究,于此制定出第二种部首式汉字输入方法,它的编码方案仍然由三部分组成:一、汉字的部首读音代码;二、该汉字部首外少量笔画(例如取其首笔和末笔)代码;三、该汉字部首外部分的笔画总数。以上三部分的具体位置可以互换。读音、笔画代码的编制方法,仍从前所规定,笔画数采用十进制。下面对“荮”字进行编码:此字属于草部,纣字由6笔组成,显然该字的声韵双拼代码为:CDLD6。此编码法属于重码编法,它的输入效率自然比较低,但它可作为拼音输入法的重要补充,解决了拼音输入法不能输入不会读的汉字这一重大难题。
本输入法较好地解决了现有输入法所存在的共性问题,破除了人们对计算机输入汉字的神秘感,凡具有小学以上文化程度的人,都能很快掌握本办法,因此,本输入法具有明显的实用推广价值。可以预计,本输入法的推广应用将会产生显著的经济效益和社会效益。
为了加速部首式汉字输入法的推广,使技术发明尽快转换为生产力,首先应当加强宣传工作,使人们了解这种方法的优越性,搞好潜在市场的开发。与此同时,可以开发三种产品:一、部首式汉字输入法扩充板。因为一般计算机都留有功能扩充位置,生产此板可使现有大部分计算机具有此项功能。二、把此项技术和各种学习机结合起来,并使学习机具有真正的打印功能,只要价格适中,现阶段将在我国城市家庭具有广阔的市场前景。三、具有存储功能的打印机。此项产品主要供给专业文字工作者使用。实行上述措施,将是实现本发明的一条有效途径。
附表1. 汉语拼音声母韵母代码表 西 文 字 母 声 母 韵 母 西 文 字 母 声 母 韵 母 A - a O 零声母 o,uo B b ia,ua P p ou C c uan Q q er D d ao R r en E - e S s ai F f an T t eng G g ang U ch u H h iang uang V zh ui,ue I sh i W w ei J j ian X x ü,uai K k iao Y y ong iong L l in Z z un,ün M m ie ; - ing N n iu
附表2 部首代码表(蒋氏表) 毛 MAO MD 舌 SHE IE 父 FU FU 血 XUE XV 欠 QIAN QJ 米 MI MI 文 WEN WR 麦 MAI MS 斗 DOU DP 里 LI LI 龙 LONG LY 采 CAI CS 田 TIAN TJ 青 QING Q; 禾 HE HE 齿 CHI UI 木 MU MU 用 YONG YY 车 CHE UE 皮 PI PI 瓦 WA WA 老 LAO LD 日(曰) RI RI 臣 CHEN UR 见 JIAN JJ 缶 FOU FP 片 PIAN PJ 臼 JIU JN 月 YUE YV 舟 ZHOU VP 风 FENG FT 羽 YU YU 方 FANG FG 卤 LU LU 户 HU HU 身 SHEN IR 业 YE YE 谷 GU GU 皿 MIN ML 其 QI QI 白 BAI BS 佳 JIA JB 瓜 GUA GB 革 GE GE 鸟 NIAO NK 音 YIN YL 耒 LEI LW 鬼 GUI GV 虫 CHONG UY 黑 HEI HW
三、变音部首
附表3
笔画代码表