一种新型字典及与之匹配的查字打字同码方案.pdf

上传人:Y0****01 文档编号:5797456 上传时间:2019-03-20 格式:PDF 页数:25 大小:1.60MB
返回 下载 相关 举报
摘要
申请专利号:

CN200810013767.2

申请日:

2008.01.11

公开号:

CN101224680A

公开日:

2008.07.23

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):B42D 1/00公开日:20080723|||实质审查的生效|||公开

IPC分类号:

B42D1/00; G06F3/023; G06F17/28

主分类号:

B42D1/00

申请人:

徐洪常

发明人:

徐洪常

地址:

265300山东省烟台市栖霞市教师进修学校

优先权:

专利代理机构:

代理人:

PDF下载: PDF下载
内容摘要

本发明涉及一种新型纸质字典及电子字典,及与之匹配的查字打字同码方案,属字典编撰技术。本发明依据字典查字通用部首,把34个不成字部首归并为5种基本笔画,把173个成字部首按读音首字母归并为20种读音首字母。设置个性化字词库,采取纸质字典设置翻口处标记等有助于快速查字的措施。本发明优点:(1)将汉字查字法与电脑及手机汉字输入用同一种编码方案,消除各种汉字录入纯音码方案不适合不懂普通话的人使用和不能录入不认识字的缺点;(2)将汉字输入法由单一的打字功能变为既能打字又可查字、学字的双重功能,打字的同时可以学字;(3)字典内容可根据使用者的特殊需求进行增删;(4)用纸质字典查字,认识的字和不认识的字都可直接翻页查字,提高查字速度。

权利要求书

权利要求书
1.  一种新型字典,为电子字典或纸质字典,其特征是:
(1)增收GB2312-80字符集中前15区的部分常用符号,包括标点符号;
(2)按照查字打字同码方案中的编码规则对字、符号进行编码;
(3)字典所收字在检字表和正文的排序以上述(2)编码规则中的部首读音首字母的音序为序;
对字数不超过10个的二级重码字组中的重码字按使用频率排序,高频字在前;
(4)对字数超过10个的二级重码字组中的重码字先按其所属的三级重码字组顺序排序,对三级重码字组再按其使用频率排序,高频字在前;
(5)纸质字典的翻口处设计一级重码字组标记及字典正文每一页的页眉处标明该页所收字的编码;
(6)纸质字典设篇章页,把检字表按各一级重码字组分列在各个篇章页上,检字表中一个字典正文页码对应该正文页码所包括的所有汉字;
(7)纸质字典各相邻一级重码字组页幅宽度不同;
(8)设置各种分类字表;
(9)介绍汉字学习方法和具体的识字方法;
(9)设置一个作为整个汉字系统的独立的子系统多字词语库,其中收录三字以上的词语、成语,歇后语、格言、名言警句,同时字典正文不再收入三字以上词语条目;
(10)字典内容尤其是附录中的内容可根据使用者的特殊需求进行增删。

2.  根据权利要求1所述的一种新型字典,其特征是:纸质字典设有区别码:
(1)在第一码相同的几个部首中按部首笔画设部首字形区别码,按首笔及次笔编区别码,其编码及排序规则是:
(1.1)把部首的第一、二笔笔画划分为“一、丨、丿、丶、乛”五种笔画,且分别以1、2、3、4、5为代码编码,只有一笔的第二码为“0”。再按其编码数字大小排序,数字小的在前;
(1.2)第一二笔均相同的加一个第三码,或根据部首字笔画数排序,笔画数小的在前,或根据第三笔笔画“一、丨、丿、丶、乛”排序,第三码按部首排序依次编码为6、7、8、9、0;
在检字表和正文中,把第一码相同的字按部首分组,各组字的排列顺序按部首区别码数字大小排序;
(2)在同部首且第二码相同的重码字中设第二码字形区别码:
第二码是部首字的一类不加区别码;第二码是笔画码的一类,加区别码为“/”;
在检字表和正文中,第二码不加第二码区别码的字在前,第二码加区别码的字在后。

3.  根据权利要求1所述的一种新型字典,其特征是:设立个性化的分类字表,纸质字典附录部分可采用活页式装订。

4.  根据权利要求1所述的一种新型字典,其特征是:附设同音字检字法,于同音字检字表中,在每一个同音字的后面加上该字在字典正文的页码,同音字的排序按使用频率排序,高频字在前;
同音字定义为声母韵母相同,不计声调。

5.  权利要求1-4中任一权利要求所述一种新型字典的查字打字同码方案,其特征是:编码规则如下:
(1)按成字部首读音首字母及非成字部首首笔画编码:
部首设置及部首代码
第1组计21个
部首代码a:山纟—仅用于第一码,计2个;部首代码b:髟比卜贝白鼻八匕疒,计9个;部首代码c:寸厂虫辰车臣赤齿长彳,计10个,另有“艹”-仅限于第二码用;
第2组计25个
部首代码d:成字部首:豆大歹斗刀,计5个,不成字部首:丶冫“曾”的上面两点灬冖辶礻衤,计8个,另有“亠;宀”仅限于第二码;部首代码e:竹,包括竹字头,—仅用于第一码,限于笔顺在前,计1个;部首代码f:成字部首:非缶父风方,计5个,不成字部首:乛彐阝卩廴巛,计6个;其中“点“”包含“捺”,“折”包含除“竖钩”以外的单笔划“折”笔;
第3组计26个
部首代码g:干工甘革鬲鼓戈骨鬼瓜谷高广弓艮,计15个;部首代码h:成字部首:黄黑禾火户,计5个,不成字部首:一廾匚,计3个;部首代码i:亠;宀言讠—仅用于第一码,计3个;
其中“横”包含“提”;
第4组计10个
部首代码j:巾见臼斤金钅几,包括风字框,角己,计8个;部首代码k:口,计1个;部首代码o:忄—仅用于第一码,计1个;
第5组计28个
部首代码l成字部首:耒老龙卤里立鹿隶力,计9个;不成字部首:丨虍刂冂囗“肖”字上一半,计6个,;部首代码M:麦面目皿毛麻门米矛马母糸,计12个,另有“木”-仅用于第二码;部首代码u木—仅用于第一码,计1个;其中“竖”包含“竖钩”;
第6组,计18个,部首代码n:鸟牛女,计3个,部首代码p:成字部首:爿皮片支疋,计5个,不成字部首:丿攵彡“番”的上一半,勹“危”的上一半,犭夂饣、,计9个;部首代码V人亻—仅用于第一码,计1个;
第7组,计12个,部首代码q:青其犬气欠,计5个,另外一些常用符号,包括标点符号的首码代码亦为“q”;部首代码r:二耳而儿日,“曰”并入“日”,肉,计6个,另有“人亻”-仅用于第二码,部首代码“,”:氵,计1个;
第8组,计23个,部首代码S:示十士石豕四手生矢舌身鼠食殳氏色首尸巳厶,计20个,另有“纟扌氵水山”-仅用于第二码;部首代码t:土田,计2个;部首代码“。”扌,计1个—仅用于第一码;
第9组,计16个,部首代码w:6王无韦尢瓦文毋,计7个;部首代码x:西小香血夕辛穴心,计8个,另有“忄”-仅用于第二码;部首代码“/”:艹—仅用于第一码,计1个;
第0组,计28个,部首代码y:雨尤页弋牙业用衣音羊,包括“差”的上半,“羔”的上半聿又羽幺,计14个,另有“月鱼言,讠”-仅用于第二码;部首代码z:支走至止足,包括足字旁,自隹爪,包括爫,舟豸子  ,计11个,另有“竹字头”-限于第二码;部首代码“;”酉月鱼—仅用于第一码,计3个;
其中“,”“。”“/”“;”4个标点符号和a、e、u、i、o、v 6个字母一码两用,一是作10个特殊部首所属字首码,二是作高频字的尾码;
另设1个常用符号(包括标点符号)首码“q”;
(2)每字最多三码,第一二码,成字部首取读音首字母码,不成字构件取首笔笔画码,第三码均取笔画码;第三码或为显性码或为隐性码,为显性码时,主要用于手机及其他数字键盘的汉字录入;为隐性码时,用于查字和电脑的汉字录入;
(3)编码时首先把汉字分为独体字和合体字两类,再按下列规则编码:
(3.1)独体字编码规则:
(3.1.1)成字部首独体字:
第一码为成字部首读音首字母,第二码仍为成字部首读音首字母;第三码成字部首首笔笔画,第三码按其首笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”;
(3.1.2)非成字部首独体字:
第一码首笔笔画,第二码次笔笔画,第三码为第三笔笔画,第三码按其笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”;
(3.2)合体字编码规则:
(3.2.1)两半中均为成字部首或两笔以上非成字部首各自独占一半的:
第一码为独占一半的前半成字部首读音首字母或两笔以上非成字部首首笔画;第二码为独占一半的后半成字部首读音首字母或两笔以上非成字部首首笔画;第三码根据第二码取码,第二码是成字部首的,取成字部首首笔笔画,按其成字部首的首笔笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”;第二码是两笔以上非成字部首首笔画的,笔画取该半次笔笔画,按其笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”;
(3.2.2)两半中有一个成字部首或两笔以上非成字部首独占一半的:
第一码为独占一半的前半或后半成字部首读音首字母,或两笔以上非成字部首首笔画;
第二码:(a)另一半只有一笔的,取该笔笔画码,(b)另一半中有成字部首构件位于该半前一部分或后一部分的,取成字部首读音首字母码,否则则取该半首笔码注意:成字部首构件位于该半中间的,亦取该半首笔码;
第三码根据第二码取码,第二码是成字部首的,取其第二码成字部首的首笔笔画,按其成字部首的首笔笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”;第二码是取笔画码的,取余下部分首笔笔画,按其笔画“一”“丨”“丿”“丶”“乛”编码为“6”“7”“8”“9”“0”;
(3.2.3)两半都不是成字部首或两笔以上非成字部首各自独占一半的,按笔顺取第一二码;第一码取前半的首笔画,第二码取后半的首笔画,第三码取后半的次笔笔画,后半只有一笔的,第三码与第二码同,按其笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”;
(3.2.4)特殊部首字所属字的编码规则:
特殊部首字所属字的定义:按编码规则其首码其为特殊部首的,
特殊部首字所属字的编码规则:首码为特殊部首码;第二码据去掉部首后余下字形依一般字编码规则取码;
第三码取码规则:1.第二码是成字部首的,取其第二码成字部首的首笔笔画;按其成字部首的首笔笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”;2.第二码是取笔画码的,取余下部分首笔笔画;按其笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”;3.后半只有一笔的,按其第二码笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”;
(3.3)高频字包括“,。/;”四个标点,编码规则:
第一码相同字的集合组成一个一级重码字组,分别将30个一级重码字组中使用频率最高的前11个高频字的尾码分别编为空格键、a、e、u、i、o、v、“,”、“。”、“/”、“;”;
为了有规律的记忆或寻找各个高频字所对应的键位,特规定每个一级重码字组中使用频率最高的3个字分别对应空格、“a”和“;”键,其他字按第一码的首笔画“一丨丿丶乛”的顺序排列,第一码首笔画相同的按使用频率高低的顺序排列;
特别规定“纟山竹言(包括“讠”)亠宀忄木人(包括“亻”)水(包括“氵”)扌艹月鱼酉”15个部首各自所属的8个高频字按去掉部首后剩余部分的首笔画“一丨丿丶乛”的顺序排列,其中属成字部首的高频字,即去掉部首无剩余笔画的,排在有剩余笔画高频字的前面;
“,。/;”4个最常用标点的编码分别为“,,”、“。。”“//”“;;”;
(3.4)多字词语编码
三字以上常用词语按一字一码编码,只取词语每个字的首码。

6.  根据权利要求5所述的查字打字同码方案,其特征是,在上述(3.1.2)非成字部首独体字编码规则中,非成字部首编码规则为:非成字部首的第一、二、三码同为首笔画,第三码按其首笔画编码为“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”。

7.  根据权利要求5所述的查字打字同码方案,其特征是,在上述(3.2)合体字编码规则中,特殊编码规则规定如下:
(1)上中下结构的字按不同分法可分为两个不同成字部首的,成字部首就大不就小;
(2)上下或上中下结构的字仅从字形上看,既有相接处又有相离处的,一般从相离处划分为两部分,若无相离处,则可从相接处分为两部分;
(3)上中下结构的字其首码只能从上下取码,不能从中间取首码,取第一码后,余下部分从形体上看仍为上中下结构的,第二码亦只能从上部或下部取码;
若其首码取的是上部或下部的一个独占一半的成字部首或两笔以上不成字部首,第二码仍同其他合体字一样按笔顺优先从余下部分的上部或下部取成字部首码,余下部分无成字部首的取余下部分的首笔笔画码;
若其上部和下部均无独占一半的成字部首或两笔以上不成字部首,第一、二、三码则分别取第一、二、三笔画;
(4)两半都无成字部首、也无明显界限的上下结构的字,按独体字编码;
(5)左中右结构的字其首码只能从左右取码,左右均为成字部首或两笔以上非成字部首的按笔顺从左部取首码码,尾码根据余下部分仍按一般规则取码;
(6)难以确定编码的字可有两种编码的容错码。

8.  根据权利要求5所述的查字打字同码方案,其特征是,查一个字的步骤如下:
(1)为要查的字a确定两个部首并根据这两个部首的读音首字母为字a确定一个由汉语拼音字母或标点组成的两码编码;
(2)根据这个编码在检字表中查到字a在字典正文的页码;
(3)从字a在字典正文的页码找到字a并阅读其释义

9.  根据权利要求8所述的查字打字同码方案,其特征是,查一个字的步骤如下:省略其中的第二个步骤,直接按字a的编码根据字典翻口处及字典正文页眉处的标记直接翻到字a所在的页码或字a所在页码附近再翻页找到字a并阅读其释义。

说明书

说明书一种新型字典及与之匹配的查字打字同码方案
一、技术领域
本发明涉及一种新型字典(包括纸质字典和电子字典)及与之匹配的查字打字同码方案,属字典编撰技术。
二、背景技术
目前字典编撰方面存在如下缺陷:1、字典内容上单一,基本上全是字词的释义,虽有附录,也不过是诸如“元素周期表”、“汉语拼音方案”、“中国历代纪元表”、“常用标点符号用法简表”、“计量单位表”一类的内容,字典的内容不能反映汉字系统的概貌,大量的关于语言文字的基础知识在字典中查不到,需要在其他工具书中查找,也不便于利用字典自学汉字。2、查字速度慢。笔者在查字时深感目前通用的各种查字法既有优点又有缺点。如,音序查字法的优点是查认识的字可直接翻页,查字速度比部首查字法快;缺点是不知声调的字难查,不认识的字没法查,把多音字分列两处不方便查阅。部首查字法的优点是能查不认识的字,缺点是速度慢且有时数不准笔画。3、纸质字典成稿付印或电子字典完稿后,内容就无法更改,不能满足使用者的特殊需求。
另外,从目前对电脑及手机输入汉汉字录入研究的角度看,使用电脑及手机过程中,输入汉字和电子字典查字未融合在一起,笔者认为,纸质字典、电子字典、电脑及手机打字三者本来相通,完全可以用同一种编码方案,让打字程序既具有输入汉字功能又具有查字学字功能,浏览网页和打字时遇到生字新词,用打字程序就可查字,不必再另启用查字程序。
三、发明内容
基于上述认识,以及为了改进已有技术存在的缺陷,本发明提供了一种新型字典(包括纸质字典和电子字典)及与之匹配的查字打字同码方案,设计一种部首音形结合码查字打字法,其基本思路是:
(1)将汉字查字法与电脑及手机汉字输入用同一种编码方案,会查字就会打字,会打字就会查字,消除目前各种纯音码汉字输入方案不适合不懂普通话的人使用和不能录入不认识字的缺点;
(2)将汉字输入法由单一的打字功能变为既能打字又可学字的双重功能,打字的同时可以学字。
(3)字典内容可根据使用者的特殊需求进行增删。
(4)用纸质字典查字,认识的字和不认识的字都可直接翻页查字,提高查字速度。
具体技术方案表述如下:
1、一种新型字典,特点是:
(1)增收GB2312-80字符集中前15区的部分常用符号(包括标点符号);
(2)按照查字打字同码方案中的编码规则对字、符号进行编码;
(3)字典所收字在检字表和正文的排序以上述(2)编码规则中的部首读音首字母的音序为序;
对字数不超过10个的二级重码字组中的重码字按使用频率排序,高频字在前;
(4)对字数超过10个的二级重码字组中的重码字先按其所属的三级重码字组顺序排序,对三级重码字组再按按使用频率排序,高频字在前;
(5)纸质字典的翻口处设计一级重码字组标记及页眉处设标记;
(6)纸质字典设篇章页,把检字表按各一级重码字组分列在各个篇章页上,检字表中一个字典正文页码对应该正文页码所包括的所有汉字;
(7)纸质字典各相邻一级重码字组页幅宽度不同;
(8)设置各种分类字表;
(9)设置一个作为整个汉字系统的独立的子系统多字词语库,其中收录三字以上的词语、成语,歇后语、格言、名言警句,同时字典正文不再收入三字以上词语条目。
(10)字典内容可根据使用者的特殊需求进行增删。
2、为了增加重码字组的数量、减少各重码字组的字数,纸质字典设有区别码:
(1)在第一码相同的几个部首中按部首笔画设部首字形区别码,按首笔及次笔编区别码,其编码及排序规则是:
(1.1)把部首的第一、二笔笔画划分为“一、丨、丿、丶、乛”五种笔画,且分别以1、2、3、4、5为代码编码,只有一笔的第二码为“0”。再按其编码数字大小排序,数字小的在前;
(1.2)第一二笔均相同的加一个第三码,或根据部首字笔画数排序,笔画数小的在前,或根据第三笔笔画“一、丨、丿、丶、乛”排序,第三码按部首排序依次编码为6、7、8、9、0;
在检字表和正文中,把第一码相同的字按部首分组,各组字的排列顺序按部首区别码数字大小排序。
(2)在同部首且第二码相同的重码字中设第二码字形区别码:
第二码是部首字的一类不加区别码;第二码是笔画码的一类,加区别码为“/”;
在检字表和正文中第二码不加第二码区别码的字在前,第二码加区别码的字在后。
3、在上述的一种新型字典中,还可设立个性化的分类字表,纸质字典的附录部分采用活页式装订。
4、在上述的一种新型字典中,还可附设同音字(不计声调)检字法,于按使用频率排序(高频字在前)的同音字检字表中,在每一个同音字的后面加上该字在字典正文的页码。
5、一种与上述新型字典匹配的查字打字同码方案,特点是:编码规则如下:
(1)按成字部首读音首字母及非成字部首首笔画编码:
(1.1)部首设置(合计207个)及部首代码
第1组计21个(部首代码a):山纟-仅用于第一码(计2个);(部首代码b):髟比卜贝白鼻八匕疒(计9个);(部首代码c):寸厂虫辰车臣赤齿长彳(计10个)(另有“艹”-仅限于第二码用)。
第2组(计25个),(部首代码d)成字部首:豆大歹斗刀(计5个),不成字部首:丶冫“曾”的上面两点灬冖辶礻衤(计8个)另有“亠;宀”仅限于第二码;(部首代码e)竹(包括竹字头)-仅用于第一码(限于笔顺在前)(计1个);(部首代码f)成字部首:非缶父风方(计5个),不成字部首:乛彐阝卩廴巛(计6个)。其中“点”包含“捺”,“折”包含除“竖钩”以外的单笔划“折”笔;
第3组(计26个),(部首代码g):干工甘革鬲鼓戈骨鬼瓜谷高广弓艮(计15个);(部首代码h)成字部首:黄黑禾火户(计5个),不成字部首:一廾匚(计3个);(部首代码i):亠;宀言(讠)-仅用于第一码(计3个)。
其中“横”包含“提”;
第4组(计10个),(部首代码j):巾见臼斤金(钅)几【包括风字框】角己(计8个);(部首代码k):口(计1个)(部首代码o):忄-仅用于第一码(计1个)。
第5组(计28个),(部首代码l)成字部首:耒老龙卤里立鹿隶力(计9个);不成字部首:丨虍刂冂口“肖”字上一半(计6个);(部首代码M):11麦13面256目257皿31毛41麻42门43米54矛556马557母558糸(计12个)(另有“木”-仅用于第二码);(部首代码u)木-仅用于第一码(计1个)。
其中“竖”包含“竖钩”;
第6组(计18个)(部首代码n):鸟牛女(计3个)(部首代码p):成字部首:爿皮片攴疋(计5个),不成字部首:丿攵彡“番”的上一半,勹“危”的上一半,犭夂饣、(计9个);(部首代码)V人(亻)-仅用于第一码(计1个)。
第7组(计12个)(部首代码q):青其犬气欠(计5个)另外一些常用符号(包括标点符号)的首码代码亦为“q”;;(部首代码r):二耳而儿日[“曰”并入“日”]肉(计6个)[另有“人(亻)”-仅用于第二码](部首代码“,”):氵(计1个)。
第8组(计23个)(部首代码)S:示十士石豕四手生矢舌身鼠食殳氏色首尸巳厶(计20个),(另有“纟扌氵水山”-仅用于第二码);(部首代码)t:土田(计2个);(部首代码“。”)扌(计1个)-仅用于第一码。
第9组(计16个)(部首代码)w:6王无韦尢瓦文毋(计7个);(部首代码x):西小香血夕辛穴心(计8个),(另有“忄”-仅用于第二码));(部首代码“/”):艹-仅用于第一码((计1个)。
第0组(计28个)(部首代码)y:雨尤页弋牙业用衣音羊(包括“差”的上半,“羔”的上半)聿又羽幺(计14个),[另有“月鱼言(讠”)-仅用于第二码);(部首代码)z:支走至止足(包括足字旁)自隹爪(包括爫)舟豸子(计11个),(另有“竹字头”-限于第二码);(部首代码“;)”酉月鱼-仅用于第一码(计3个)。
其中“,”“。”“/”“;”4个标点符号和a、e、u、i、o、v 6个字母一键位两用,一是作10个特殊部首字首码,二是作高频字的尾码。
(1.2)1个常用符号(包括标点符号)首码“q”;
(2)每字最多三码,第一、二码,成字部首取读音首字母码,不成字构件取首笔笔画码,第三码均取笔画码;第三码或为显性码或为隐性码,为显性码时,主要用于手机及其他数字键盘的汉字录入;为隐性码时,用于查字和电脑的汉字录入;
(3)编码时首先把汉字分为独体字和合体字两类,再按下列规则编码:
(3.1)独体字取码规则:
(3.1.1)成字部首独体字:
第一码为成字部首读音首字母,第二码仍为成字部首读音首字母;第三码成字部首首笔笔画,第三码按其首笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”)。
(3.1.2)非成字部首独体字:
第一码首笔笔画,第二码次笔笔画,第三码为第三笔笔画,第三码按其首笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”。
(3.2)合体字编码规则:
(3.2.1)两半中均为成字部首或两笔以上非成字部首各自独占一半的:
第一码为独占一半的前半成字部首读音首字母或两笔以上非成字部首首笔画;
第二码为独占一半的后半成字部首读音首字母或两笔以上非成字部首首笔画;
第三码根据第二码取码。第二码是成字部首的,取成字部首首笔笔画,按其成字部首的首笔笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”;第二码是两笔以上非成字部首首笔画的,笔画取该半次笔笔画,按其笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”或“0”。
(3.2.2)两半中有一个成字部首或两笔以上非成字部首独占一半的:
第一码为独占一半的前半(或后半)成字部首读音首字母(或两笔以上非成字部首首笔画),
第二码:(a)另一半只有一笔的,取该笔笔画码,(b)另一半中有成字部首构件位于该半前一部分或后一部分的,取成字部首读音首字母码,否则则取该半首笔码(注意:成字部首构件位于该半中间的,亦取该半首笔码)。
第三码根据第二码取码,第二码是成字部首的,取其第二码成字部首的首笔笔画,按其成字部首的首笔笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”。第二码是取笔画码的,取余下部分首笔笔画,按其笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”。
(3.2.3)两半都不是成字部首或两笔以上非成字部首的各自独占一半的,按笔顺取第一二码;第一码取前半的首笔画,第二码取后半的首笔画,第三码取后半的次笔笔画(后半只有一笔的,第三码与第二码同),按其笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”。
(3.2.4)特殊部首字所属字的编码规则:
特殊部首字所属字的定义:按编码规则其首码其为特殊部首的,
特殊部首字所属字的编码规则:首码为特殊部首码;第二码据去掉部首后余下字形依一般字编码规则取码;
第三码取码规则:1.第二码是成字部首的,取其第二码成字部首的首笔笔画。按其成字部首的首笔笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”。2.第二码是取笔画码的,取余下部分首笔笔画。按其笔画“一”“丨”“丿”“丶”“乛”编码为“1”“2”“3”“4”“5”;3.后半只有一笔的,按其第二码笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”。
(3.3)高频字编码(包括“,。/;”四个标点符号)规则分别将30个一级重码字组中使用频率最高的前11个高频字的尾码分别编为空格键、a、e、u、i、o、v,。/;
为了有规律的记忆或寻找各个高频字所对应的键位,特规定每个一级重码字组中使用频率最高的最高的3个字分别对应空格、a和“;”键,其他字按第一码的首笔画“一丨丿丶乛”的顺序排列,第一码首笔画相同的按使用频率高低的顺序排列。
特别规定“纟山竹言(包括“讠”)亠宀忄木人(包括“亻”)水(包括“氵”)扌艹月鱼酉”15个部首各自所属的8个高频字按去掉部首后剩余部分的首笔画“一丨丿丶乛”的顺序排列,其中属成字部首的高频字,即去掉部首无剩余笔画的,排在有剩余笔画高频字的前面;
“,。/;”4个最常用标点的编码分别为“,,”、“。。”“//”“;;”;
(3.4)多字词语编码规则
三字以上常用词语按一字一码编码,只取词语每个字的首码。
6、上述的查字打字同码方案中,在(3.1.2)非成字部首独体字编码规则中,非成字部首编码规则为:非成字部首的第一、二、三码同为首笔画,第三码按其首笔画编码为“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”)。
7、上述的查字打字同码方案中,在(3.2)合体字编码规则中,特殊编码规则规定如下:
(1)上中下结构的字按不同分法可分为两个不同成字部首的,成字部首就大不就小;
(2)上下或上中下结构的字仅从字形上看,既有相接处又有相离处的,一般从相离处划分为两部分,若无相离处,则可从相接处分为两部分;
(3)上中下结构的字其首码只能从上下取码,不能从中间取首码,取第一码后,余下部分从形体上看仍为上中下结构的,第二码亦只能从上部或下部取码;
若其首码取的是上部(或下部)的一个独占一半的成字部首或两笔以上不成字部首,第二码仍同其他合体字一样按笔顺优先余下部分的上部或下部取成字部首码,余下部分无成字部首的取余下部分的首笔笔画码;
若其上部和下部均无独占一半的成字部首或两笔以上不成字部首,第一、二、三码则分别取第一、二、三笔画;
(4)两半都无成字部首、也无明显界限的上下结构的字,按独体字编码;
(5)左中右结构的字其首码只能从左右取码,左右均为成字部首或两笔以上非成字部首的按笔顺从左部取首码码,尾码根据余下部分仍按一般规则取码;
(6)难以确定编码的字可有两种编码的容错码。
8.查字方法
本发明所创设的“部首音形结合码查字打字同码方案”要查一个不认识字的理论上的步骤有如下3个:1.为要查的字a确定两个部首并根据这两个部首的读音首字母为字a确定一个由汉语拼音字母或标点组成的两码编码;2.根据这个编码在检字表中查到字a在字典正文的页码;3.从字a在字典正文的页码找到字a并阅读其释义。
实际查字过程中,一般情况下应该省略其中的第二个步骤。按字a的编码根据字典翻口处及字典正文页眉处的标记直接翻到字a所在的页码或字a所在页码附近再翻页找到字a并阅读其释义。这就如同用现在的字典要查知道读音的字a,按字a的读音可直接翻到字a所在的页码或字a所在页码附近再翻页找到字a并阅读其释义。且一般来说比现在要查认识的字a还要快捷。因为用现在的字典要查认识的字,对大多数人来说,是把“知道读音”定义为“知道声母和韵母”,并不包括声调。而且对全部所谓“知道读音的字”中的大部分字的声调他们也不能确定,只能确定一小部分字的声调。由于不知道字的声调,对同音字多的音节,往往要翻多页才能找到要查的字,有时甚至可能要把该音节的同音字从头找到尾才能找到。而用本发明方案查不认识的字,虽然也有同码字,但同码字数量少,且按使字频排序,很容易找到。
本发明的查字打字同码方案的编码规则简单易学,把34个不成字部首归并为5种基本笔画,把173个成字部首按读音首字母归并为20种读音首字母,部首本身的归类及与字的读音音序的对应关系都极有规律,在很短时间内就可记牢,遇到不认识的字也会编码。另外,在字典的翻口处设计一级重码字组标记、页眉处设标记、设立篇章页、各相邻一级重码字组页幅宽度加以区别等,通过以上几项改进措施减少了查字步骤,借以实现查阅字典所收字无论认识与否都可直接翻页快速查字,且极便于已会用传统的部首查字法查字的人改用笔者的查字法。而且利用本方案可以把查字与打字用同一种编码方式,由于要学打字的人在学打字以前就已熟练掌握编码,可以使其在初学打字时,比新学任何一种编码都能节省很多的熟练掌握编码的时间。
四、具体实施方式
下面结合实施例对本发明做具体的解释说明。
(一)一种新型字典,在内容及编撰上进行如下创新:
内容上加以增扩:
1、增收gb2312-80字符集中前15区的一些常用符号(包括标点符号);
2、以附录的形式增加汉字学习方法和各种具体识字方法介绍:
总原则是“全方位多形式识字”,具体识字形式很多,如:集中识字、分散识字、拆字识字……;
3、可增加如下各种分类字词表:
(1)会意字集录;(会意字的认定:从流俗字源学的角度认定,只要能自圆其说,利于汉字识记即可,不必非要从科学字源学的角度去认定。如:“孙”字,从字形上可以分析为“比儿子小一辈的是孙子”,既可认定为会意字,而不必考虑当初是否是按“比儿子小一辈的是孙子”的字理造该字。
(2)形声字集录(形声字形旁表意的标准是形旁与字的主要义和常用义相关,一般不考虑与主要义和常用义已不搭边的造字之初的本义;形声字声旁表音的标准是声母韵母均相同、不考虑声调。把一些形旁表意、声旁表音又表意的形声字另划归为形声兼会意字);
(3)可读半边字集录;
(4)记号字集录;
(5)半记号字集录(即传统上划归为“形声字”但实际上只有形旁表意、声旁已不表音的一部分字);
(6)易误读字集录;
(7)易写错笔顺字集录;
(8)易写错字形字集录;
(9)形声兼会意字集录(把一些形旁表意、声旁表音又表意的形声字划归于此);
(10)形近字集录;
(11)多音字集录;
(12)常用同义词、反义词集录;
(13)自用生僻字集录;
(14)××年度流行词语;
(以上各种分类字表不求全,但除了“自用生僻字集录”和“××年度流行词语”外,不可空项,可随时增加);
以上14类字词表的内部排序原则上以部首音序为序。
4、可以设置部分非成字部首的释义,这样有助于从造字法的角度识记其他汉字;
5、增设一个作为整个汉字系统的独立的子系统多字词语库,其中收录三字以上的词语、成语,歇后语、格言、名言警句(多字词语库亦不求全)。同时字典正文不再收入三字以上词语条目。
多字词语库所收三字以上词语的排序一律以部首音序为序。
利用以上增扩的内容,不但可以进一步增强字典的识字和巩固识字功能,让使用者系统了解整个汉字系统,更重要的是有助于弘扬中华传统文化的精华。
6、使用者可根据自己的的特殊需求对字典内容尤其是及时对其中的各种分类字表和多字词语库进行增删。
(二)查阅方法上和外观设计上作如下改进:
1、字典所收字在检字表和正文的排序与匹配的查字打字同码方案中的部首读音首字母的音序相同,
(1)对字数不超过10个的二级重码字组中的重码字按使用频率排序(高频字在前)
(2)对字数超过10个的二级重码字组中的重码字先按其所属的三级重码字组顺序排序,对三级重码字组再按按使用频率排序(高频字在前)。
2、在纸质字典的翻口处设计一级重码字组标记及每页的页眉处设二级重码字组标记;
3、设篇章页(即中扉页)且把检字表按各一级重码字组分列在篇章页,检字表中不是一个汉字对应一个字典正文页码,而是一个字典正文页码对应该正文页码所包括的一个或多个汉字;
4、各相邻一级重码字组页幅宽度稍有区别(相差1.5-2.5毫米即可)。
通过以上几项改进措施减少查字步骤,借以实现查阅纸质字典所收字无论认识与否都可直接翻页快速查字;且极便于已会用传统的部首查字法查字的人改用笔者的查字法。
5、纸质字典持有者还可建立个性化的分类字表,能及时在附录的分类字表中增加内容,纸质字典附录部分可采用活页式装订。
6、考虑到现实中,小学中高年级学生因言语学习与文字学习不同步,有一部分词语会说不会写,往往需要在同音字中选择所要用的字。针对这一需要,在字典中可附设一个按使用频率排序的同音字(不计声调)表,并在每一个同音字的后面加上该字在字典正文的页码。同音字表的作用有二:一是反映汉字体系的同音字状况,二是作为一种辅助的同音字查字法的检字表。
在笔者看来,同音字查字法利用同音字检字表查字的速度对于不能准确掌握大部分汉字声调的人来说,据经验估计比目前在同音字按声调排序的字典直接翻页查字应该基本相同。
(三)本发明设有与之匹配的查字打字同码方案,其具体编码规则如下:
编码范围:
以GB2312-80字符集的6763字为准(或字典以6763字为准,单字词库以一级常用字3755字为准)。另外把标点符号亦纳入汉字系统,将其作为高频字来编码。把区位码01-15区(即《GB2312字符集》中01-15区)一些较常使用的其他符号如“(一)(1)≌üáāǎà、log ∑『『『』』』”也纳入汉字系统,将其作为一般字来编码。
编码规则:
1.部首设置:
以原中国文字改革委员会和国家出版局1983年颁布的的《汉字统一部首表(草案)》所推荐使用的201部首为基础,适当删去几个按汉字书写笔顺在后且所数字很少的几个不成字部首(部首成字与否以属于一般中小型字典所收有读音的字在为准,下同),如,取消或归并了“仓”字下半、肀”“凵”“出”字上半,另外又把几个部首的变形也算作独立部首,如,把小和“肖”字上一半分为两个部首。共设部首207个(从长远考虑还可增加“古甫出交娄莫单同尚千肖屯占章者五旦丁佥全去宛壬乍各夫”,当然这需要经过论证)。其中:
部首设置(合计207个)及部首代码
第1组21个(部首代码a):山纟-仅用于第一码(计2个);(部首代码b):髟比卜贝白鼻八匕疒(计9个);(部首代码c):寸厂虫辰车臣赤齿长彳(计10个)(另有“艹”-仅限于第二码用)。
第2组(计25个),(部首代码d)成字部首:豆大歹斗刀(计5个),不成字部首:丶冫“曾”的上面两点灬冖辶礻衤(计8个)另有“亠;宀”仅限于第二码;(部首代码e)竹(包括竹字头)-仅用于第一码(限于笔顺在前)(计1个);(部首代码f)成字部首:非缶父风方(计5个),不成字部首:乛彐阝卩廴巛(计6个)。
其中“点”包含“捺”,“折”包含除“竖钩”以外的单笔划“折”笔;
第3组(计26个),(部首代码g):干工甘革鬲鼓戈骨鬼瓜谷高广弓艮(计15个);(部首代码h)成字部首:黄黑禾火户(计5个),不成字部首:一廾匚(计3个);(部首代码i):亠;宀言(讠)-仅用于第一码(计3个)。其中“横”包含“提”;
第4组(计10个),(部首代码j):巾见臼斤金(钅)几【包括风字框】角己(计8个);(部首代码k):口(计1个)(部首代码o):忄-仅用于第一码(计1个)。
第5组(计28个),(部首代码1)成字部首:耒老龙卤里立鹿隶力(计9个);不成字部首:丨虍刂冂口“肖”字上一半(计6个);(部首代码M):11麦13面256目257皿31毛41麻42门43米54矛556马557母558糸(计12个)(另有“木”-仅用于第二码);(部首代码u)木-仅用于第一码(计1个)。
其中“竖”包含“竖钩”;
第6组(计18个)(部首代码n):鸟牛女(计3个)(部首代码p):成字部首:爿皮片攴疋(计5个),不成字部首:丿攵彡“番”的上一半,勹“危”的上一半,犭夂饣、(计9个);(部首代码)V人(亻)-仅用于第一码(计1个)。
第7组(计12个)(部首代码q):青其犬气欠(计5个)另外一些常用符号(包括标点符号)的首码代码亦为“q”;;(部首代码r):二耳而儿日[“曰”并入“日”]肉(计6个)[另有“人(亻)”-仅用于第二码](部首代码“,”):氵(计1个)。
第8组(计23个)(部首代码)S:示十士石豕四手生矢舌身鼠食殳氏色首尸巳厶(计20个),(另有“纟扌氵水山”-仅用于第二码);(部首代码)t:土田(计2个);(部首代码“。”)扌(计1个)-仅用于第一码。
第9组(计16个)(部首代码)w:6王无韦尢瓦文毋(计7个);(部首代码x):西小香血夕辛穴心(计8个),(另有“忄”-仅用于第二码));(部首代码“/”):艹-仅用于第一码((计1个)。
第0组(计28个)(部首代码)y:雨尤页弋牙业用衣音羊(包括“差”的上半,“羔”的上半)聿又羽幺(计14个),[另有“月鱼言(讠”)-仅用于第二码);(部首代码)z:支走至止足(包括足字旁)自隹爪(包括爫)舟豸子(计11个),(另有“竹字头”-限于第二码);(部首代码“;)”酉月鱼-仅用于第一码(计3个)。
其中“,”“。”“/”“;”4个标点符号和a、e、u、i、o、v 6个字母一码两用,一是作10个特殊部首所属字首码,二是作高频字的尾码;
另外设一个“,。/;”以外的标点和区位码中一些较常使用的其他符号首码键位q。把数学、物理、化学等学科的常用符号的第一、二码分别编为“qs”、“qw”、……“qh”。
2、编码规则:
(1)按成字部首读音首字母及非成字部首首笔画编码(非成字部首亦规定一个读音,重码字按其使用频率排序,高频字在前)。
(2)每字最多三码,第一二码,成字部首取读音首字母码,不成字构件取首笔笔画码,第三码均取笔画码;第三码或为显性码或为隐性码,为显性码时,主要用于手机及其他数字键盘的汉字录入;为隐性码时,用于查字和电脑的汉字录入;
(3)编码时首先把汉字分为独体字和合体字两类,再按各自规则编码。
先简述一下独体字和合体字的认定:
独体字认定标准:现代汉语词典所用的成字部首都认定为独体字,不论其能否再拆分出其它独体字与否。对那些凡分不清上下、左右、内外、包围半包围结构的称为独体字,如“事串专”等一类有一笔与其他笔画相交的字均算独体字,再如“朱失”等一类单笔划与独体字所构成的字仍为独体字。另规定:1、“乘爽”一类的字亦算独体字;2、首笔是单笔画且与其余部分相离的上下或上中下结构的如“丽画”等字亦算是独体字。
合体字认定标准:凡汉字内部有明显界线可以分为二或三个构字偏旁(前半不能是单笔划)并根据各部分间相互位置可称之为左右结构、上下结构、外内结构、包围及半包围结构、上中下结构的谓之合体字。
(3.1)单字编码规则
(3.1.1)独体字取码规则:
(3.1.1.1)成字部首字(所属字多的特殊部首“亻艹扌纟钅忄讠“竹字头”疒氵爫”亦算成字部首)。
第一码成字部首读音首字母;第二码仍为成字部首读音首字母;第三码成字部首首笔笔画。第三码按其首笔笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”或“3”“4”“5”)。如,“车”的编码为“cc1”,“马”的编码为“mm5”。
(3.1.1.2)非成字部首独体字取码规则
第一码首笔笔画;第二码次笔笔画;第三码为第三笔笔画(只有一笔的字,第二、三码与第一码相同。只有两笔的字第三码与第二码相同)。第三码按其首笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”)。如,“于”的编码为“hh7”,“由”的编码为“lf6”。
个别属单笔画与成字部首构成的上下结构的独体字(包括单笔画与成字部首相接,如,“丘百”属相接;不包括单笔画与成字部首相交,如,“本”属相交),不按独体字编码规则取码,按合体字规则编码。不考虑其笔顺,成字部首为第一码,单笔画为第二码。如“百千丘甚”第一码分别为“白十斤其”,第二码分别为“一丿一乛”,其他类推。“本”属相交,仍按独体字规则取码(这样规定,主要是为了第三码与第二码同,编码可更快捷)。
(3.1.1.3)非成字部首编码规则(“gb2312字符集”中有非成字部首)
非成字部首的第一、二、三码同为首笔画,第三码按其首笔画编码为“一”(或“丨”或“丿”或“丶”或“乛”)编码为“1”(或“2”或“3”或“4”或“5”)。这样编码与录入会更快捷。例如,“匚”的编码为“hh1”“刂”的编码为“LL2”、“犭”的编码为“pp3”、“宀”的编码为“dd4”、“彐”的编码为“ff5”“阝”的编码为“ff5”
(3.1.2)合体字编码规则:
(3.1.2.1)两半中均为成字部首或两笔以上非成字部首各自独占一半的:
第一码:独占一半的前半成字部首读音首字母或两笔以上非成字部首首笔画;
第二码:独占一半的后半成字部首读音首字母或两笔以上非成字部首首笔画;
第三码:根据第二码取码。第二码是成字部首的,取成字部首首笔笔画,按其成字部首的首笔笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”)。第二码是两笔以上非成字部首首笔画的,取该半次笔笔画,按其笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”。如,“码”的编码为“sm5”;“独”的编码为“pc2”;“邓”的编码为“yf7”;“祁”的编码为“df7”。
(3.1.2.2)两半中有一个成字部首或两笔以上非成字部首独占一半的(包括个别成字部首或两笔以上非成字部首与单笔画构成的字,如“轧札扎礼”等字):
第一码:独占一半的前半(或后半)成字部首读音首字母(或两笔以上非成字部首首笔画);
第二码:(a)另一半只有一笔的,取该笔笔画码,(b)另一半中有成字部首构件位于该半前一部分或后一部分的,取成字部首读音首字母码,否则则取该半首笔码(注意:成字部首构件位于该半中间的,亦取该半首笔码)。
第三码根据第二码取码:(1)第二码是成字部首的,取其第二码成字部首的首笔笔画。按其成字部首的首笔笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”。(2)第二码是取笔画码的,取余下部分首笔笔画。按其笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”。如,“部”的编码为“fl9”;“规”的编码为“jh6”;“轧”的编码为“cf0”;
(这样确定上述两类合体字的第一、二码主要是为了与目前通用的查字法中字的部首归类基本一致,也为了使各一级重码字组的字数尽量不相差悬殊)
这样确定上述两类合体字第三码的优越之处在于:一是第二码是成字部首的字在确定第二码的同时就确定了第三码(这类字占绝大多数,据粗略统计这类字约有4500字,约占6763字的66%。),几乎不用再费心去确定第三码。二是使第三码虽只有一种编码手段,但同一种编码符号用两种标记,5种编码符号共有10种标记。这样有一些二级重码字组可以分成10个三级重码字组,可以减少三级重码字组的平均字数,从而在查字打字时可以提高首码准确率,用纸质字典查字则可更快捷。
(3.1.2.3)两半都不是成字部首或两笔以上非成字部首的各自独占一半的,按笔顺取第一二码;第一码取前半的首笔画,第二码取后半的首笔画,第三码取后半的次笔笔画(后半只有一笔的,第三码与第二码同),按其笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“6”“7”“8”“9”“0”)。(这类字这样编码而不考虑各半中有无成字部首,编码可更快捷。这类字不多,基本不影响二级重码字组字的分布)如,“能”的编码为“fp0”;“成”的编码为“hf0”;
左中右、上中下结构的字另有规定;
(3.1.2.4)特殊部首所属字编码规则:
为了使各重码字组的字数尽可能少,并使各一级重码字组的字数尽可能平均;选定一些所属字较多的部首作为特殊部首,把其从同音部首中分离出来。
特殊部首字所属字的定义:按编码规则其首码其为特殊部首的,
特殊部首字所属字的确定:按编码规则其首码为特殊部首的才算,第二码为特殊部首的不算。如:设“人”为特殊部首。“合”为特殊部首“人”所属字,“队”不为特殊部首“人”所属字。
特殊部首字所属字的编码规则:首码为特殊部首码;第二码据去掉部首后余下字形依一般字编码规则取码;第三码取码规则:1.第二码是成字部首的,取其第二码成字部首的首笔笔画;按其成字部首的首笔笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”;2.第二码是取笔画码的,取余下部分首笔笔画;按其笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”;3.后半只有一笔的,按其第二码笔画“一”“丨”“丿”“丶”“乛”分别对应编码为“1”“2”“3”“4”“5”;
(3.1.2.5)特殊规定:
(3.1.2.5.1)部首字的变形一般不将其视为成字部首,如,“忝”的部首为单笔画横,不为“心”,但如下成字部首的变形亦算成字:足(如“路”的右半)、爫(如“采”的上半)、羊[如“盖”的上半“差”的上半]
(3.1.2.5.2)成字部首字一律不再拆分,如,“麻鼻示”一类字不再拆分。
(3.1.2.5.3)上下、上中下结构的字编码规则特殊规定:
上下、上中下结构的字编码规则:在编码的过程中,体会到按本法规则查字的难点在于,部分上中下结构字第一二码有时难以确定,个别上下结构字的第二码有时也难以确定。现根据试编码实践,对上下、上中下结构的字编码在遵循一般合体字编码规则的前提下,再作如下特殊规定:
(a)上中下结构不同分法可分为两个不同成字部首的就大不就小,如,“章”取“音”不取“立”;“三)取“二”不取“一”;
(b)“衷亵”一类字的部首为“亠”不为“衣”;
(c)上下或上中下结构的字仅从字形上看,既有相接处又有相离处,一般从相离处划分为两部分如“共”前半不取“艹”,按后半取“八”编码。“盍”按后半取“皿”编码。若无相离处,则可从相接处分为两部分。如“去”分为“土”和“厶”两部分,“云亏”第一码均取“二”,第二码分别取“厶”和“乛”;
在下面的特殊情况下可从相接处分为两半:
即在从相离处分为两半,两半均没有成字部首或两笔以上非成字部首,而从相接处分为两半,下部有成字部首的特殊情况下,可从下部有成字部首的相接处分为两半。如“党堂常”一类仅从字形上看可分成四部分的字按规则应从相离处分为两半,但分成两半后,两半都不是独占一半的成字部首或两笔以上非成字部首,但其最下部为成字部首,故变通处理,第一码从下部取成字部首码,第二码按规则从余下部分的上部或下部优先取成字部首码,若上部与下部均无成字部首,则取余下部分的首笔笔画。“党堂常”的首码分别取“儿土巾”,其第二码均取“口”;
(d)上中下结构的字其首码只能从上下取码,不能从中间取首码。取第一码后,余下部分从形体上看仍为上中下结构的,第二码亦只能从上部或下部取码。如,“拿”第一码取“人”后,余下部分从形体上看仍为上中下结构,按规则第二码只能从余下部分的上部或下部取码,不能从中部取码,故只能取“手”不能取“口”。
若其首码取的是上部(或下部)的一个独占一半的成字部首或两笔以上不成字部首,第二码仍同其他合体字一样按笔顺优先从余下部分的上部或下部取成字部首码,余下部分无成字部首的取余下部分的首笔笔画码。
若其上部和下部均无独占一半的成字部首或两笔以上不成字部首,第一、二、三码则分别取第一、二、三笔画(如,“复囊亘”一类字第一、二、三码分别取第一、二、三笔笔画。
(这样编码不用考虑从何处把要编码的字分为两半(左中右结构的字如何分成两半一目了然),编码可更快捷)
(e)部分两半都无成字部首、也无明显界限(即上下相接)上下结构的字,按独体字编码。如,“予表亡丧”第一、二、三码分别取其第一二三笔笔画。(这样编码不用考虑从何处把要编码的字分为两半(左右结构的字自然分成两半))
(3.1.2.5.4)左中右结构的字其首码只能从左右取码,左右均为成字部首或两笔以上非成字部首的按笔顺从左部取首码码。如“做树嬲”一类字其首码分别取“亻木丨”,“嬲”的首码不取“女”。尾码根据余下部分仍按一般规则取码。
(3.1.2.5.5)个别难以确定编码的字可有两种编码这类似于“五笔输入法”的容错码。
难以确定编码的字有如下两种情况:
(a)易混笔顺字,如“万”等字也可按两种笔顺编码。
(b)个别分成两半时可以有不同分法的的字(以上中下结构的字为多)可按两种分法编码。
如“丞”可编码为“fh”也可编码为“fl”。如“棼”可编码为“hp”也可编码为“db”。如“毅”的第二码可取部首“立”也可取部首“豕”;“彦”的第一码取“亠”,“丶丿”(中间的一丶一丿)。
(3.1.2.5.6)成字部首“二儿耳”以“r”为代码,“日”、“曰”因其在合体字中难以区分其编码均为“r”。
上述取码例字:
“词垢司后”一类字第二码取“口”,理由是无论怎么分,除了“口”之外,再没有两笔以上部首。“铜洞”等字的第二码取“冂”不取“口”,因“冂”是两笔以上部首。
“燮”第二码取“火”;“叟”第二码取“丿”;“爵奚叠”第二码分别取“四幺乛”;“式区”第一码分别取“匚弋”;
“毅”的第二码可取部首“立”也可取部首“豕”;
“死”第一码取“歹”;“哀衷褒”一类字第一码取“丶”不取“衣”;“坐”一类字第一码取“人”,第二码取“土”。
“成咸戌”一类字算合体字,“戊”部分为前半,余下部分为后半,第一码均取“一”(即“戊”的首笔),第二码分别取“乛口一”;“裁截”一类字亦算合体字,“衣隹”为前半,余下部分为后半,第一码分别取“衣隹”,第二码均取“一”;
(3.2)高频字编码(包括“,。/;”四个标点符号)规则
分别将30个一级重码字组中使用频率最高的前11个高频字的尾码分别编为空格键、a、e、u、i、o、v,。/;
为了有规律的记忆或寻找各个高频字所对应的键位,特规定每个一级重码字组中使用频率最高的最高的3个字分别对应空格、a和“;”键,其他字按第一码的首笔画“一丨丿丶乛”的顺序排列,第一码首笔画相同的按使用频率高低的顺序排列。
特别规定“纟山竹言(包括“讠”)亠宀忄木人(包括“亻”)水(包括“氵”)扌艹月鱼酉”15个部首各自所属的8个高频字按去掉部首后剩余部分的首笔画“一丨丿丶乛”的顺序排列,其中属成字部首的高频字,即去掉部首无剩余笔画的,排在有剩余笔画高频字的前面;
“,。/;”4个最常用标点的编码分别为“,,”、“。。”“//”“;;”;
(3.3)多字词语编码规则
三字以上常用词语按一字一码编码,只取词语每个字的首码。
(4)为了增加重码字组的数量、减少各重码字组的字数,纸质字典设有区别码:
(4.1)在第一码相同的几个部首中按部首笔画设部首字形区别码,按首笔及次笔编区别码,其编码及排序规则是:
(4.1.1)把部首的第一、二笔笔画划分为“一、丨、丿、丶、乛”五种笔画,且分别以1、2、3、4、5为代码编码,只有一笔的第二码为“0”。再按其编码数字大小排序,数字小的在前;
(4.1.2)第一二笔均相同的加一个第三码,或根据部首字笔画数排序,笔画数小的在前,或根据第三笔笔画“一、丨、丿、丶、乛”排序,第三码按部首排序依次编码为6、7、8、9、0;如,把首码为b的各同读音首字母分别编码排序如下:髟12;比15;卜24;贝25;白326;鼻327;八34;疒41;
在检字表和正文中,把第一码相同的字按部首分组,各组字的排列顺序按部首区别码数字大小排序。
(4.2)在二级重码字组设第二码字形区别码
在电子字典第二码以“h、l、p、d、f”为代码的二级重码字组中,第二码是成字部首字的字与第二码是笔画的字按使用频率混排在一起,为了把这两类字分别归类排序,纸质字典在第二码“h、l、p、d、f”为代码的二级重码字组中设第二码字形区别码。
第二码是部首字的一类不加区别码;第二码是笔画码的一类(成字部首字除外),加区别码为“/”。如,把第一二码是“bh”二级重码字组的字,分为两类,一类是第二码是部首字的,其代码仍为“bh”;一类是第二码是笔画码的,其代码为“bh/”。
同一个二级重码字组的字在检字表和正文中第二码不加第二码区别码的字在前,第二码加区别码的字在后。
在字典中设区别码,其实质是把一个重码字组分成了几个重码字组,可以起到减少重码字组字数的作用,又从而可使查阅字典更方便快捷。
(四)查字方法
本发明所创设的“部首音形结合码查字打字同码方案”要查一个不认识字的理论上的步骤有如下3个:1.为要查的字a确定两个部首并根据这两个部首的读音首字母为字a确定一个由汉语拼音字母或标点组成的两码编码;2.根据这个编码在检字表中查到字a在字典正文的页码;3.从字a在字典正文的页码找到字a并阅读其释义。
实际查字过程中,一般情况下应该省略其中的第二个步骤。按字a的编码根据字典翻口处及字典正文页眉处的标记直接翻到字a所在的页码或字a所在页码附近再翻页找到字a并阅读其释义。这就如同用现在的字典要查知道读音的字a,按字a的读音可直接翻到字a所在的页码或字a所在页码附近再翻页找到字a并阅读其释义。且一般来说比现在要查认识的字a还要快捷。因为用现在的字典要查认识的字,对大多数人来说,是把“知道读音”定义为“知道声母和韵母”,并不包括声调。而且对全部所谓“知道读音的字”中的大部分字的声调他们也不能确定,只能确定一小部分字的声调。由于不知道字的声调,对同音字多的音节,往往要翻多页才能找到要查的字,有时甚至可能要把该音节的同音字从头找到尾才能找到。而用本发明方案查不认识的字,虽然也有同码字,但同码字数量少,且按使字频排序,很容易找到。
可以省略其中的第二个步骤的理由在于,即使按第二个步骤在检字表查到字a在字典正文的页码c,一下直接翻到字a的页码c的几率也很少,多数情况下是第一次只能翻到c页的附近,要经过至少两次的翻页才能翻到c页。也就是说用与不用第二个步骤,第三个步骤所用时间基本相等,即使稍慢一点,也不会比加上第二个步骤所用的时间还长。既然所用时间总和不长,就完全应该省略第二个步骤。
现在通用的运用部首查字法的字典,其检字表中都有“难检字表”,而其中的难检字几乎全属于独体字和无成字部首或两笔以上非成字部首独占一半的合体字。若按本方案查字,则难检字极少,加之本方案对难以确定编码的字可用两种编码查字,因而取消了“难检字表”。
本发明与已有技术相比具有如下突出特点和显著进步:
1、在字典中用附录的形式,从不同角度编撰各种分类字表,增加汉字学习方法和各种具体识字方法介绍,还增设一个作为整个汉字系统的独立的子系统多字词语库,其中收录三字以上的词语、成语,歇后语、格言、名言警句。利用以上增扩的内容,不但可以进一步增强字典的识字和巩固识字功能,让使用者系统了解整个汉字系统,更重要的是有助于弘扬中华传统文化的精华。
2、查字打字同码,会查字就会打字,因凡识字之人都要会查字典,可以省去人们学习并熟练掌握某种汉字输入法编码的过程(对能熟练运用汉语拼音拼写汉字的人来说,全拼法也可省略这一过程,不过,全拼法是一种好学不好用的输入法)。
3、把输入法和电子词典合二为一,使输入法由单一的打字功能变为既能打字又可学字的双重功能,更适合人们随时随地查字学字。本项改进用于手机,由于手机具有便携性,等于手机持有者随身携带了一本字典。比用于电脑更佳。
4、字典内容尤其是其中的各种分类字表和多字词语库可进行增删,能满足使用者的特殊需求
5、查字法方面的创新:继承了传统的部首查字和音序查字的优点,克服了其各自的缺点,把通用的部首查字法进行如下改进:
(1)所收部首与一般字典的部首基本相同,本发明方案把34个非成字部首归并为5种基本笔画;把173个成字部首按读音首字母归并为20种读音首字母,部首本身的归类及与键盘键位的对应关系都极有规律,把部首目录的排序由以笔画为序改为以部首读音首字母为序,使记忆全部部首及部首代码及其容易。在很短时间内就可记牢。
本查字法简便易学,不但初学查字典的人可以很快学会,而且因其所选取的部首与目前通用的查字法相同,已会用部首查字法查字者学习本查字法会更快。
(2)在字典正文中把所收单字的排序由以整字读音为序改为以部首读音首字母为序。
(3)查字步骤比通用的部首查字法减省。
通用的部首查字法在纸质字典中要查一个不认识字的一般步骤有如下5个:1.为要查的字(假定为a)确定一个部首(假定为b);2.在部首目录中查到部首b所属字在检字表的起始页码;3.根据该部首所属字在检字表的起始页码找到部首b所属字;4.在检字表中根据字a除去部首的笔画数和起笔笔画查到字a在字典正文的页码;5.从字a在字典正文的页码找到字a并阅读其释义。
本发明所创设的“部首音形结合码查字打字同码方案”要查一个不认识字的理论上的步骤有如下3个:1.为要查的字a确定两个部首并根据这两个部首的读音首字母为字a确定一个由汉语拼音字母或标点组成的两码编码;2.根据这个编码在检字表中查到字a在字典正文的页码;3.从字a在字典正文的页码找到字a并阅读其释义。
实际查字过程中,一般情况下应该省略其中的第二个步骤。按字a的编码根据字典翻口处及字典正文页眉处的标记直接翻到字a所在的页码或字a所在页码附近再翻页找到字a并阅读其释义。这就如同用现在的字典要查知道读音的字a,按字a的读音可直接翻到字a所在的页码或字a所在页码附近再翻页找到字a并阅读其释义。且一般来说比现在要查认识的字a还要快捷。因为用现在的字典要查认识的字,对大多数人来说,是把“知道读音”定义为“知道声母和韵母”,并不包括声调。而且对全部所谓“知道读音的字”中的大部分字的声调他们也不能确定,只能确定一小部分字的声调。由于不知道字的声调,对同音字多的音节,往往要翻多页才能找到要查的字,有时甚至可能要把该音节的同音字从头找到尾才能找到。而用本发明方案查不认识的字,虽然也有同码字,但同码字数量少,且按使字频排序,很容易找到。
可以省略其中的第二个步骤的理由在于,即使按第二个步骤在检字表查到字a在字典正文的页码c,一下直接翻到字a的页码c的几率也很少,多数情况下是第一次只能翻到c页的附近,要经过至少两次的翻页才能翻到c页。也就是说用与不用第二个步骤,第三个步骤所用时间基本相等,即使稍慢一点,也不会比加上第二个步骤所用的时间还长。既然所用时间总和不长,就完全应该省略第二个步骤。
现在通用的运用部首查字法的字典,其检字表中都有“难检字表”,而其中的难检字几乎全属于独体字和无成字部首或两笔以上非成字部首独占一半的合体字。若按本方案查字,则难检字极少,加之本方案对难以确定编码的字可用两种编码查字,因而取消了“难检字表”。
依据本查字法查字,无论要的字认识与否都可直接翻页查字,查生字要比用了1000多年直至现在还通用的“部首查字法”和“笔画查字法”快许多。
6.编码规则符合人们识记称说汉字字形的习惯
人们在识记称说汉字字形时,通常采取如下模式:
独体字(包括非成字部首)1无字根的直接分成几个笔画;2有字根的,先分解成字根与笔画,再把构件分别分解成几个笔画。
合体字:1先把汉字合体字分为两半,把部首分作一半,把其余笔形分作另一半(如人们称谓姓氏常说“古月胡、弓长张、言午许、双人徐”。2再把各半分别分为一个或几个成字部首字(或构件)-这里的构件特指非成字部首独体字和两笔以上非部首笔形,如“申夫”非成字部首独体字、“釜”字的后半的笔形、“敖”字左半的笔形、“复”字第一二笔的笔形等都称之为构件。该概念的外延大于通常所说的字根。下同-取该半的次笔笔画)3最后把构件分解为笔画。
上述模式与本方案的编码顺序和编码特点相比,我们有充分的理由说本方案的编码规则与人们识记称说汉字的习惯正相吻合。

一种新型字典及与之匹配的查字打字同码方案.pdf_第1页
第1页 / 共25页
一种新型字典及与之匹配的查字打字同码方案.pdf_第2页
第2页 / 共25页
一种新型字典及与之匹配的查字打字同码方案.pdf_第3页
第3页 / 共25页
点击查看更多>>
资源描述

《一种新型字典及与之匹配的查字打字同码方案.pdf》由会员分享,可在线阅读,更多相关《一种新型字典及与之匹配的查字打字同码方案.pdf(25页珍藏版)》请在专利查询网上搜索。

本发明涉及一种新型纸质字典及电子字典,及与之匹配的查字打字同码方案,属字典编撰技术。本发明依据字典查字通用部首,把34个不成字部首归并为5种基本笔画,把173个成字部首按读音首字母归并为20种读音首字母。设置个性化字词库,采取纸质字典设置翻口处标记等有助于快速查字的措施。本发明优点:(1)将汉字查字法与电脑及手机汉字输入用同一种编码方案,消除各种汉字录入纯音码方案不适合不懂普通话的人使用和不能录入。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 作业;运输 > 装订;图册;文件夹;特种印刷品


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1