本发明属于计算机汉字信息处理和符号系统。汉字信息处理和编码是实现中文信息计算机处理的关键问题。汉字象形编码是采用一种简单易行,而且符合汉字的造型及组字规律的科学方法,为大约六千到一万汉字编制,缩简成二十四个象形的符号作为汉字在计算机输入系统的代码,以便有效地实现汉字的输入输出及信息处理。 目前,汉字编码的方法诸多。国内流行的拼音编码,因汉字同音字太多,需不断地在显示屏上选择才能输入,效率颇低。
支秉彝先生提出的“见字识码”也叫“音形码”。往往需要掌握读者与字形两种因素。而且把随便一字,马上想成四个字母,需要经过三到四层思路才能完成,对于文化层次不高的大多数人还是较难掌握。
台湾学者朱邦复先生创造的“天龙码”也叫“仓颉码”。其编码较长,在1-5的不等编码中,4码和5码占大多数,影响输入速度。而且并非简单易学。把汉字拆成许多复杂的零件,一字要打许多码。其方法很难普及到大众易于掌握的程度。
“五笔字形编码”是河南地王永民创造出的最先进的一种方案。其认为汉字的灵魂就是竖、横、撇、捺、折五种笔形,以及一百三十种字根象搭积木一样的组字方法是汉字组字的根本规律。五笔输入形同手抄写字,又笨又慢,实不可取。字根拼字,需要记住每一字根在键面上的每一区位,使人学起来望而却步。将汉字字根印在胶粘标签上,并粘在原英文字母键上,使人望而觉之混乱。要找到所需之字根,需要一定的专业培训。采用现成的汉字字根,反而造成直观性差。表面记忆因素多,实际记忆因素也不少,还是不利于汉字计算机输入方式的普及与运用。
汉字的灵魂并不完全是五种笔画,其组字的规律也不见得就是字根拼合。汉字的灵魂是象形、表意和表音三者,其组字的规律是象形表意符号与表音符号的拼合。
本发明之目的是提供一种汉字象形编码法及其键盘,使汉字象形码与拼音兼容,克服汉语拼音同字多和五笔字形编码难于记忆,不便学习的问题。
本发明:电脑汉字象形编码法及其键盘,正是基于汉字的象形、表意、表音的灵魂及音形拼合的组字规律创造出来的。根本不必要对一万多个汉字进行逐个拆分及分析其笔画字根来烦琐研究。就如同古人根本不必要对人体的上百种器官进行解剖,研究再创造出简单的“人”字一样。所依据的思维方式是形象思维和抽象思维。中国古人就是用这种思维方式创造出了世界上唯一的最美丽的汉字。
电脑汉字象形编码及其键盘,其发明所依据的原理,是采用汉字音形拼合的组字规律,如“汤、沧、沫、沙、汕、泳”等字。我们一看便知与水有关,因为“氵”偏旁是表意部分。而“、仓、末、少、山、永”则是表音部分。而音形拼合便是汉字的组字规律。
本发明依据人们思维方式的原理。在写文章时,人们思维经历了将心中的思想先变成语言。再由语言转化成模糊的字大概形。那么,汉字在被写在纸上之前,仅仅是意念和作为语言的汉字。在当落笔时才可能变成真正字面上的汉字。而介于心理的意念和笔下的汉字之间,只能是音和模糊象形。电脑汉字象形编码方法的发明,正是基于此点:先音后形,将汉字首先作为汉语看待。当人们在进行快速盲打时,首先一句话变成声音在心中说出,其次是字的模糊形象。而字笔划细节完全可以交给机器来完成。而打字员的方法是将看到稿件上的汉字先拆成笔划和字根,再让机器给组合起来,无需自己的思想和语言来表达。显然《五笔字型》的方法,已经误入了字面汉字的歧途。在普及了小学教育的今天,汉语拼音已经得到了普及。否定汉字拼音的优越性和否定汉字的优越性一样不可取。我们是在假定汉语拼音已经普及了的中国,创造出为那些大多数具有小学水平的人所能掌握的汉字输入方法,而不是为打字员创造那种仅仅重复稿件上的文字的方法。
在儿童看来,在纸上画一个圆圈可以表示与圆圈相象的任何形象或事物。而忽略其复杂的细节。中国古人在造字时,也忽略了实物的具体细节、抽象成简单的造型或符号。千百年来的发展,使人们认可了这种方法,而中国人是最善于此种思维方式的伟大民族。
那么,我们完全有理由,将现成的汉字再抽象、再简化,看成是一些横躺着的,竖立着的或歪扭着的方块。完全有理由将枝枝叉叉的笔画削砍成整齐画一的形体,再装入现代的“集装箱”内,形成今天的象形模块。创造出今天的象形编码。使繁多复杂的汉字变成方便简易的计算机可处理的信息。这二十四个象形符如下:
图1是二十四个象形符表。
电脑汉字象形编码法及其键盘,在世界上首先创造出的这二十四个象形符,代表了“新华字典”里六千到一万个汉字的单字的抽象造型,并利用了同音不同形,同形难同音的规律,使汉字的输入作到了字与码一一对应。所有的汉字都可以看成是二十四个象形符号中一个或二个,三个结合的形象,并配合汉语拼音方法准确无误地输入所需之汉字。
本发明经过潜心研究,反复揣摩,将每一个汉字看成一个完整的形象,而忽略其复杂的笔画细节,如“整”字可以看成“”,再看成“”。三个方块组成一个形符号,再如“这”字,装入“集装箱”便成,再变成形符号。而尽量不要过份的注意细节。如“度”字。在键盘上依次打入:声母→韵母→象形符码即可输入,。而重码的可能性非常小。学过拼音的小学生很快就理解了它的方便性。显然比“五笔字形”易学易掌握易记而且快速。使计算机的汉字输入技术完全可以普及在广大的中小学生教育中。
本发明根据人们写地址时依照省、市、区、街的顺序,创造出高效率的汉字词汇输入法。如:中华人民共和国,可以依次键入:声母→第一之象形符→第三字之象形符→最后一字之象形符。其如下所示:。本发明不仅使掌握了汉语的人易于掌握,也使对汉语拼音掌握的不太好的人也易于掌握。其单字的输入也可不打韵母,只打声母和象形码便可输入一千到一千四百个常用单字。
本发明将字母V键专门留作汉字编码程序专用的保留字输入时使用。在打V键之后,再打汉字程序专用保留字的象形符,大大简化了输入,提高了效率。此技术将使计算机程序汉字化成为可能。
本发明将“A”和“Z”键面上,不标形象码符号。以留作机动用,使其代替无法判明的任何汉字或偏旁的象形码。
本发明将输入方法分成音形拼合输入法和拼形输入法。音形拼合输入法又分声母、韵母加象形码方法和只有声母和象形码两种方法。以适应对汉语拼音掌握的不同层次的操作者。而拼形输入法,适应那些只知其形不知其音的操作者。拼形输入法,不定每字的键数,也不定每词汇的键数,而以空格键做为其分隔,类似英文字母的输入方式。
图2是键盘符号安排表。
本发明又根据键位概率及指法要求,将二十四个象形码分类分位,安排在每个英文字母键面的右上方。直观、大方、易记。并将汉语拼音的韵母安排在每个英文字母键面的下方。使其简化到一键便可打入一个韵母或复合韵母,尽可能减少击键的次数。其设计方案比“五笔字形”的键面安排,简洁而且直观。使汉字编码和英文字母键码的兼容,并形成独特的汉字编码键盘。这将确立汉字编码在计算机世界中的地位。
本发明规定了二十四个象形码所代表的汉字形象。其规定如下:
图3是二十四个象形符号及所代表的字形表。
竖形符:该符代表了所有直立形的汉字和偏旁。其整体轮廓可以装进一个直立的方框内,如“直”和“貝”字,和。如分解开看,也可以看成被切开的直立形如和那么“冫”和“氵”也可以看成直立形。而“小”字也可以看成。包括“卜”“目”“自”“耳”“真”“贞”“頁”“方”“赤”等。还有一些很复杂的字,其主要形态是直立形。不必细究其笔划,一概看成简单的一竖。如“冒”“贵”“豊”“盍”“”“畺”等。但是有些复杂的字,似是而非,如“夋”可以看成,也可以看成和的结合体,那么主要看其整体呈什么形。一般取整体形成或只取下面那部分。依此,许多难以归类的直立形字都可归于形。
横形符:呈横躺形的单字或偏旁部首。其整体轮廓可以装进一个横躺着的方框内。如“一、二、三、四”。分解开看,可以看成被切开的方块,如。也可以看成并行的,如。那么“灬”看成一横,是很自然的。如“血、共、舞、亘、竹”等。丁形符:呈丁字形上大下小的字或偏旁部首。如“辛”字放进的方框内。那么如:“开、午、争、彳、亻、个、羊、手、予、子、平、了、丫、卞”等。像“亻”也应看成丁形。将可以分解成是可以理解的。那么,像“臂、盟、骂、聋”等就不难理解了。
土形符:呈土形上小下大的字或偏旁部首,可以装进一个凸形的框架内,都可以看成土形符。分解开来看,也可看成断开的或。那么像“曲、丑、虫、业、主、士、止、出、齿、占、且、由”等,再如“磊、晶、品、垚、崩、矗、鑫、赑”等就不难理解了。
门形符:呈门形的单字和部首偏旁。如分解开看。那么,如“门、、巾、、冉、角、雨、亮、高、风、几、丹、門、用、冈、同、肉、周、、尚、丙、而、爾、两、甫”等是不难理解的。
凹形符:呈凹形的单字和部首。如:“函、、画、凶、凼、山、甘”等。
区形符:呈区形的单字和部首。如:“叵、巨、臣、匡、区、匠、匣、医、匹”等。同时也包括“巴、已”等。
彐形符:呈彐形的偏旁。如“雪、归、当、浸、彗”等字的偏旁。
世形符:呈世形的单字和偏旁。如辶、廴、道、赵、还、廷、也、题、七、毛、毯等。
其特点是字型结构主要占去了左下角部分。
少形符:呈少形的单字和部首。其特点是其结构主要占去了右下角部分。如:“彡、刂”以及“形、抄、妙、以、彬”等字的右边部分,也可将“月”归入此类。
厂形符:呈厂形的单字和部首。其特点是其结构主要占去了左上角部分。如“广、尸、卢、厅、仄、历、厄、压、虎、反、产、耂、尹、石、成、藏、左、右、灰、、片、爪、辰、麦、皮、严”等。
可形符:呈可形的单字和偏旁部首。其结构占去了右上角部分。如“哥、寸、句、勾、匀、乃、力、为、武、飞、牙、气、欠、矛、身、、勿、或”等。
十形符:呈十形的单字和偏旁部首。如:“中、串、非、册、井、扌、川、丰、、牛、并、屮、韦、車、车、申、斗、聿”等。
义形符:呈义形的单字和偏旁部首。从整体上总离不开一个大交叉形。如“叉、又、父、文、夂、龙、爻、、犭、戈、吏、更、交、及”等。
火形符:呈火形或大形的单字和偏旁部首。如:“大、尤、犬、龙、失、天、光”等。其特点是呈五角或六角形。如“兵”字可以装进一个五角形的框子内。
那么“奥、黄、典、关、臭”等也可以这样看。
米形符:呈米形的单字和偏旁部首。呈中心开花的放射状。如:“采、米、来、举、衣、衤”等。
口形符:呈口形的单字和偏旁部首。如“国、田、囡、日、母、图、因、西、因、白”等。“器”也可看成单一的口形符。
公形符:呈公形的单字和偏旁部首。如“八、人、入、谷、仓、食、合、会、全、今、丛、金、个、垒、么”等。其特点呈三角形。
夕形符:呈夕形或者棱形的单字或偏旁部首。如:“歹、多、鱼、糸、纟、万、、女、麥”等。
儿形符:呈儿形或者心形的单字或偏旁部首。如:“几、兄、九、瓦、兔、见、心、疋、鬼、凡、久、丸、甩、、乱、胤”等,“飈”和“彪”也属此类。特别指出“忄”旁,是唯一不以形状而以表意来归入此类的。
工形符:呈“工”字形的单字和偏旁。如:“吕、王、玉、立、正、缶、舌、虽、豆、里、生、星、互、亟、主、、罣”等,有时也可看成简单的竖形符。但是还是可以曲别的。
木形符:呈木字形或春形的单字和偏旁。如:“本、禾、春、兼、泰、秦、恭、奉、忝、齐、录、水、衮、亲”等。
之形符:呈之字形的单字或偏旁。如:“乙、讠、乞”等。
与形符:呈与字形的单字或偏旁。如:“鸟、马、弓、丐、丂、、夷、”等。
本发明按先音后形的次序在键盘上输入汉字。也可以按先形后音的次序进行输入。由于形象思维快于念出声音,故此法更佳。每一汉字最多四码。其顺序如下:
声母→韵母→象形码→象形码或补码,或空格键。
例如:河:南:
按先形后音便如下:
河:南:
结构比较复杂的字,其左边偏旁部分一定要作为特征打出来,右边部分可取其最后一部分作为特征打出来。
例如:照:或者
如果取整体形象可以打一个整体形,再打一个特征部分。其特征部分一般取偏旁或最后一部分。
照:
再如:赣:
概:
对少于四个键的汉字,可补打一个空格键与下一字曲别开来。
如:图:→空格键
家:→空格键
只打声母和象形符也可以输入汉字。对于出现重码的汉字。可补打一个数字键,以曲别之。输入四个字的成语词汇时,可以只打第一个字的声母。然后,打第一字象形符,第二字的象形符。
例如:爱之如一:
而多于四个字的词汇,可以按第一、第三,最末的顺序输入。
例如:爱国主义者:
少数民族自治区
有些常用字可用以上两种方式表达。视操作者的选择,而不致重码。
每个象形符键上,都可以代表一个使用率特别高的汉字。打一键加打一空格键便可输入一字。这二十四个汉字如下:
图4是二十四个象形代码所代表的常用字表
以一个声母键一个象形符键,再加打一个空格键,二键一字的方法可以输入720个常用单字。而有17280左右个汉字可采用一个声母键、两个象形键或一个声母键、一个韵母键、一个象形键加打一个空格键。三键一字的方法输入。而四键一字,不加空键的方法可以将6000到51840个汉字输入。因为二十四个象形符可以拼出576个不同的造型,再加声母和韵母可以拼出五万以上不同的音形结合体。而《新华字典》所收之单字,包括异体、繁体字在内,共计一万一千一百左右。如果,保留四键一字的标准打法。估计可以保证八千以上汉字输入的单义性。在遇到重码字时,可打该字在显示屏提示行中的序号相同的数字键即可。
图5是二十四象形码所代表的区位码。
在进行拼形输入时,需按下拼形状态的功能键,使之处于拼形状态。而二十四个象形符又可代表不同的区位代码。在拼形输入之前,先键入区位代码。使用拼形输入往往重码很多,可以打数字键来弥补其不足。其输入方法,不定键数。但每两个字之间和两词汇之间必须键入空格键以示区别。
本发明,其输入方法,音形拼合和拼形输入必须以功能键,或区别开来。
使用电脑汉字象形编码及键盘,可以向计算机输入上万个汉字和五千条以上的常用中文词汇。按标准打法每字四键,输入效率大为888提高。基本实现了单义性、方便性、高速性和可靠性。而且有一定的容错率。
如“鬓”字,在我们记不清具体笔画和偏旁部首时,我们可以根据其整体印象,三个垒起的方块。我们打出声母、韵母之后,打一键,便完成了。本输入方法可以帮助我们回忆复杂易忘的汉字。使大多数文化水平不高的人也能掌握汉字的输入。当然,本发明肯定会有其不足之处。这有待于在使用中发现问题使之改进。
图6是汉字象形编码输入方法