太极全息码及多途径分类处理技术.pdf

上传人:Y94****206 文档编号:522043 上传时间:2018-02-20 格式:PDF 页数:17 大小:608.92KB
返回 下载 相关 举报
摘要
申请专利号:

CN93104936.9

申请日:

1993.04.28

公开号:

CN1082215A

公开日:

1994.02.16

当前法律状态:

撤回

有效性:

无权

法律详情:

||||||公开

IPC分类号:

G06F3/023

主分类号:

G06F3/023

申请人:

黄宗炯;

发明人:

黄宗炯

地址:

510030广东省广州市东风中路都士地巷旧余庆里三号

优先权:

专利代理机构:

代理人:

PDF下载: PDF下载
内容摘要

本发明“太极全息码及多途径分类处理技术”,简称“太极全息码”。是一种全方位、多功能、多途径的编码体系。它充分发挥了中文的形、声、义特点和键盘录入时的多维空间,以最简炼最直接的途径与方式设计了中文形声内外分类码、0—9部件八卦分类码、纯数字分类码和纯声母分类码。诸种方法都简单易学、宏观快速,为中文信息处理建起了一座多途径立交桥。太极全息码的科学原理和创作灵感来自中华古老的《易经》,是先人智慧和现代科技文明相结合的结晶,是信息编码领域的重大突破。

权利要求书

1: 本发明《太极全息码及多途径分类处理技术》是应用于电讯和电脑文字信息处理的新技术。它的主要特征和权利要求如下: A.太极全息码包括了: (1)中文字库声形内外码; (2)中文八卦分类输入码; (3)中文纯数字分类码; (4)中文纯声母分类码。 字形编码的部件组合和代码(如附图1)所示;八卦分类码的键位则如图2所示。说明书讲的声母是指汉语拼音方案中的声母;数字是指通用电脑键盘上的数字。编码方法如说明书中陈述过的内容和举例。 B.根据权利要求A.所述内容,中文字库内外声形分类码。字库最大的位码是一声四形码,形码参照附图1。此种声形结合的编码,既可以作为电子计算机中文内码的编制使用,也可以直接作为外部输入码使用。 C.根据权利要求A.所述内容,八卦分类输入码的键盘(如附图2)。其中数字键属乾卦(汉字字根区),空格键属坤卦(单字生成区);字母键属六个儿女卦(六组词区)。词区上的文字内容,在软件制作过程中,可根据不同使用者的目标需求而灵活定义。 D.根据权利要求A.所述内容,中文纯数字分类码的最 大码位是五位数字,其中首位是字词分类处理号码,其余均属字形信息码。 E.根据权利要求A.所述内容,中文纯声母分类输入码,最大码位为五位声母,其中前两位作为事物的分类使用,后两位至三位作为具体事物的名称和信息使用。例如:由鸟类(NL)可以产生出“鸟类--猫头鹰”(NLMTY)。

说明书


迄今应用于电子电脑信息处理的编码已有上千种,进入实用阶段的编码也有几十种,众多的编码专家与电脑专家都为人类信息处理技术的发展付出了辛勤劳动,并取得了丰硕的成果。目前社会上热衷于编码的人士很多,但如果再重复别人的劳动和成果,或者换汤不换药地稍加改进,显然已没什么意义。因为目前社会上流行的诸种编码方案,无论是音码、形码、或者音形结合码都只是在一定范围和意义上表达了中文的有限信息而已;有的编码方案,除了编码字根多、规则繁琐难学以外,其处理字词的能力也是非常有限的。同一个中文系统,要同时配上十几、二十种不同的输入方法来满足不同档次和新旧用户的需求,从长远来看,这绝非理想的办法。真正科学的、理想的编码应该是多维的,是允许用户在已有的形维、音维和音形结合维中对编码进行自由选择和任意增删的,把编码专家永远无法完成和满足的编码(特别是词组录入的编码)交给用户。国家标准只适宜通用的文种符号和字词。你可以指定两万个汉字和四万多条词汇,所谓常用不常用是相对来讲地,文学家认为“静悄悄”这个词非常有用,而搞汽车材料管理的用户则认为“化油器”更加实际。因此,所谓国家标准的字库和词库都应为用户留有足够容量的字词扩展空间,让用户自由选植汉字和造词。编码方案也一样,应该交给用户一个完美的文字处理环境,同时交给用户几种最直接、最简捷的编码空间与途径,让用户在可以随意选择的编码形维、音维和音形结合维内灵活使用;既体会到你的编码方案的简练与宏大,又能在你的编码方案中自由发挥;无论繁简字词或别种文字符号都能呼之则来,挥之则去,任君选择,各取所需;无论是使用音码或形码;无论是使用通用键盘或数字小键盘,都能准确地达到预定的目的……这就是本发明所追求和力图解决的信息处理技术上的特大难题。

    本发明“太极全息码及多文种分类处理技术”简称太极全息码或太极码。它是本发明人近二十年编码研究的心得和总结,也是发明人以往多项发明成果的升华,太极全息码包括了以下几方面内容:

    1.太极全息码中的0-9部件代码。

    2.太极全息码中的字库内外分类码。

    3.太极全息码中的八卦数字分类码。

    4.太极全息码中的纯数字分类码。

    5.太极全息码中的纯声母分类码。

    现将此系统中的五个方面内容及其特点介绍如下:

    〈一〉太极全息码中的0-9部件代码

    任何按字形设计的编码方案都离不开汉字的基本笔画和部件(有的方案叫字根或字元)。汉字的基本笔画和部件是汉字的固有属性,是根据造字需要而设计的;电脑键盘上的0-9数字键和ABCD字母键也是前人设计的。因此,衡量一个方案是否有独创性,不是看其应用了哪些笔画部件或字母、数字;而是看其是否运用得巧妙合理;是否富有独创性。

    本发明《太极全息码》是一个按字形、形声及声形集合交叠和分类处理的中文全息编码,此方案不可避免地涉及到汉字基本的笔画、部件、字母和数字代码。本发明设计的太极全息码“中文0-9五言部件代码”(参照附图1)是个人长期对汉字笔画部件的研究、分析和高度浓缩精选的结果,也是个人在90106610.9及92110525.8两项发明专利设计内容中提炼优化出来的。它以独特的构思与巧妙的方式表述和概括了所有繁简汉字的基本部件和笔画特征。其主要内容如下:

    1.中文数目字“一二三四五六七八九0”分别对应阿拉伯数字键位“1234567890”,中间穿插常用笔画部件,组成十组五言口诀联想记忆。例如:“三水宝心”,笔画部件位于“3”键上。

    2.大部首“日月水火土金木人手口”位于十组五言代码的中行位置上,做到彼此隔离,一码定江山,有利于分解同部首的汉字。

    3.从数字联想。例如“一雨日工厂”,前两字后两字都属“一”开首,“日字中间有一横也可看成“一”。由“日”字又可以联想出与其相似的部件。又例如“月耳目”三个部件中间都有两横,可以联想到数字2;四(皿)字形都属4;“王”,字形象五,代码5;“匕”字形象七,代码7;“冫”字形象八,代码8……

    4.根据从字形和字义去联想。例如:氵同水,火同灬;同月;“”同十;“六广言”之首形都象六。“艹廾竹米”植物类,代码7;“女”字古体本意也是一个“口”,与“0”结合也并非牵强;如此……等等。

    5.本发明中的部件代码不仅适宜字词编码输入;而且繁简体兼容。例如“”同“门”;“讠”同“言”;“钅”同“金”。做到一码贯通,(今后0-9码表中的部件可根据其使用需要作局部的调整,但并不影响本编码方案的设计思想和编码原理。)

    ☆总结:本发明创新优化的“中文0-9数字部件代码”,从简易、宏观、直觉和实用角度出发,综合了所有汉字的属性(包括字型方面、字义方面和结构方面的特征),经过近二十年的不断研究、分析和筛选出来的,是一种独辟蹊径的数字字型编码。把众多的中文部件从ABCD字母编码键位上解放出来,使汉字编码更符合中国人分解事物的层次概念,把繁杂的字母编码变成简单易记的五言口诀联想式的数字编码。它既不象传统的四角号码,又有别于北师大李金铠先生的“笔形码”,是一种新颖而又宏观快速的数字部件编码,实践将证明它具有极为深远和广泛的科学意义和实用价值。

    〈二〉太极全息码中的字库内外分类码

    纵观目前国内外的中文系统,其内码基本上都是按流水帐方式排序的,例如:电报码、国标区位码、台湾的BIG-5和即将推出的国际大字库内码。以上内码的优点是占用内存空间较少,并具有唯一性。缺点是:可读性差,查询检索困难,同时没能为用户留有足够的自造字、词空间。所谓标准化,带有很大的局限,与目前流行的输入编码方法结合不起来,造成了计算机的字符内部处理码与外部识别码格格不入、严重脱节的现象,两者之间必需另加复杂的处理程序与手续,使程序动作效率和内存空间等技术指标受到了限制。

    针对上述问题,“太极全息码”不仅为未来的字库设计了汉字内外兼容码,同时也设计了词组内外兼容码,使其成为非标准化(非国家和国际标准的“动态”代码)而又灵活实用的电脑输入码和内部处理码。本发明一旦付予实现,将是文字信息处理技术又一重大突破。

    太极全息码中的字库内外兼容码,包括了以下几方面的内容与特征:

    1.建立“太极中文全息系统”收集二万个国际通用汉字,并做到繁简字体兼容并蓄。例如收入“国”字的同时也收集“國”字。

    2.利用汉语拼音的声母和太极全息码中的数字部件代码(1-4位)作为具体汉字的字库内码和输入码。例如:

    中=Z02    国=G053    广=G6    东=D78    國=G0103

    廣=G6718    東=D118。

    3.太极汉字声形全息码长为“一声四形”,不足四形的汉字按空格键结束。太极汉字声形全息码中的冗余空间,可通过软件的巧妙处理留给声形词码和用户自由扩展使用。

    4.太极形声码(即词库内外码),其处理方式也是先声后形,这里讲的声就是组成词组的1.2.3尾字的声母;形,就是太极全息码中的0-9部件笔画代码(参照附图1)。例如:

    双字词:中国=ZG020    中文=ZW026(声声首尾首形码)

    三字词:广东省=GDS62(声声声首尾形码)

    四字词:科学技术=KXJS3(声声声声尾形码)

    多字词:中华人民共和国=ZHRMG(声声声声尾声码)。

    ☆总结:本发明太极全息码中的“字库内外码”简称为“太极内码”是一种声形结合,繁简兼容,字词分区分类处理的编码,将汉语拼音的声母和太极全息系统中的笔画部件代码巧妙地结合在一起,用极其简易的方法从单字到词组组成有五种类别的声形分类编码体系(字母与数字结合编码,每一字词最多不超过五位码)。太极内码,也可作为外部输入码使用;打破了传统中文系统字库内码的结构框架和处理模式的局限,打开了人机对话的最简易、最直接的通道,是中文信息处理技术领域的大胆创新,它的科学性与实用性将在本发明“太极全息编码系统”实施后得到证明。

    〈三〉太极全息码中的八卦分类码

    本发明人曾于1990年申请了“中文1-4位数字快速分类输入法”的专利(专利号90106610.9),1992年又补充申请了“八卦分类码及其键盘”的发明(申请号92110525.8)。本系统是在上述两项专利发明的基础上逐步优化发展起来的。新的“八卦分类码”无论在编码设计技术和软件实施技术上都有多方面的突破与升华。其主要技术特征如下:

    1.对数字键盘上的中文部件作了更加合理的增删与调整(详细情形参照附图1及本发明的第一章内容说明)。

    2.对八卦分类输入的键盘也作了更加合理的调整(详细情形参照附图2)。

    3.常用双字词取首字首尾码与后字首尾码,直接显示;同码词从Y键起分别显示,例如:

    中国=0203    中文=0269    中共=0278    中央=0228

    4.上下结构单字编码,改成取123尾码;左右结构汉字编码先取左边首尾码再取右边首尾码,然后按空格键结束。

    例如:

    汉=39    字=351    编=6307    码=1051

    5.遇到同码字时用该字声母作为区分键处理。例如附图1中的同类部件可以用该字的声母区分:

    八=8    大=8D    人=8R    小=8X    气=8Q

    6.多字词先取123尾字首码,然后按多字词区“T”起首的字母键结束。例如:

    北京市=266T    中外合资=0488T    电子工业部=1516T

    7.八卦分类键盘上的全部词区全面开放,用户可根据各自需求自由录入、增删和调整词组位置,把编码的主动权交给用户灵活调整和使用。

    ☆总结:上述经过全面优化升华后的八卦分类码,它的简易程度和宏观快速的效果必将受到社会上广大计算机用户的欢迎,根据此一编码思想与技术,可以开发出各种适应不同部门和用户需求的技术产品,为社会服务。

    (四)太极全息码中的纯数字分类码

    这是一种纯字形数字分类输入编码,可同时设计在通用键盘和数字小键盘上使用,方便电报通讯,BB机台传呼和喜欢用单手输入中文字词的用户使用。所有字词码长均为1-5位数字键。首位为分类内容标志键,其余四位为字词编码。不足四位编码的字词用空格键结束。同码字词按提示键选择。对字词编码拆字时,采用附图1中的代码。

    A.用首位数字码对下述内容进行分类:

    “0”代表多文种字符分类代码;“5”代表多字词编码代码;

    “1”代表单字编码代码;“6”代表扩展汉字代码;

    “2”代表双字词编码代码;“7”代表用户自造词语代码;

    “3”代表三字词编码代码;“8”代表专业词语代码;

    “4”代表四字词编码代码;“9”代表动态字符处理代码。

    B.字词编码规则:

    (1)单字,先取代码1,再取1.2.3.尾码(不足五码按空格)。

    (2)双字,先取代码2,再取前字首尾码后字首尾码。

    (3)三字,先取代码3,再取1.2.3.字首码与尾字尾码。

    (4)四字,先取代码4,再取1.2.3.4字首码。

    (5)多字,先取代码5,再取1.2.3.尾字首码。

    其余内容编码方法同上,只是起首的分类代码不同而已。

    C.字词编码举例:

    [1]单字:中=102    文=169    电=116    脑=12696

    [2]双字:中文=20269    电脑=21626    信息=28643

    [3]三字:我国的=34043    新技术=36973

    [4]四字:科学技术=44897    万里长城=41445

    [5]多字:中华人民共和国=50880

    ☆总结:太极全息码中的“纯数字分类码”是迄今世界上处理信息量最大、最简单快速的数字代码,它一旦实施,将在电脑信息处理领域和电报通讯、BB机台等场合中发挥无可估量的作用。

    〈五〉太极全息码中的声母分类号码

    这是一种用于建立大词库和处理大辞海的编码。目前用汉语拼音的声母对词组进行单字拆声的方案已很多,例如:

    科学技术=KXJS(取各字首位声母)。

    迄今为止,还没有一种全面地、系统地提出“声母分类”处理中文大辞海的方案。1991年5月,本发明人在“中文1-4位数字快速分类输入法”的修改方案中,首次提出了“声母分类”此一崭新的技术,由于超出了原申请的范围,故未被国家专利局采纳。如今重申这一内容作为太极全息码的组成部分。

    声类码作为“太极全息码”体系中的一个组成部分,从各个方面充实“太极全息码”的内容。将完整的信息网络通过“太极全息码”系统奉献给广大用户。“太极全息码”源于社会,它也必将归于社会,受益于全人类。

    声母分类的重点是辞海,不是旁敲侧击定字取码,而是从广义的角度摄取包罗万有的信息:从天文、地理到人类;从山脉、河流到昆虫;从飞机、楼宇到家具……等都可以进行分类取码。可以说它是迄今世界上最简练、最直接、最具体的,囊括所有事物信息的分类代码。而它的素材仅是汉语拼音的声母。发明者预料:此发明一旦全面实现,将成为全人类容纳和攫取信息的载体,也将成为中文电脑处理语料库的最佳模式。

    汉语拼音的声母只有二十三个,如何分类?这就得有个科学的方法。中国人有自己独特的感观与思维,中国人对自己身外的事物通常都习惯于用两个音(两个汉字)去表达。例如:地理、心脏、汽车、飞机、花盆、老虎、蚂蚁……等等。这就是说,用两位声母就可以表达自己想说的哪一类事物。中国人对某些具体事物又有用两个或三个音去描述的习惯。例如:中国的、古代的、现代的、广东省、广州市、工商局、财务科、邓小平……等等。也就是说,用两个或三个声母又可以表达某一类事物中的具体内容。超过三个声的事物内容怎么办?笔者认为可以“去中间取两头”。例如:“美利坚合众国”,可以看成“美利国”“乌鲁木齐”看成“乌鲁齐”,“神州热水器”可以看成“神州器”……等等。

    依据上述分析,发明人认为,太极全息码中的“声母分类码”可以用两个声母表示所指的事物的种类,外加两位或三位声母就足以表示所需种类中的具体内容。例如:

    〈A〉国家=GJ(国家的声母分类码)

    中国=GJZG    美国=GJMG    英国=GJYG    法国=GJFG

    加拿大=GJJND    新加坡=GJXJP    阿尔巴尼亚=GJAEY

    〈B〉城市=CS(城市的声母代码)

    北京=CSBJ    上海=CSSH    广州=CSGZ    纽约=CSNY

    多伦多=CSDLD    洛杉矶=CSLSJ    巴塞罗那=CSBSN

    〈C〉河流=HL(河流的声母分类码)

    黄河=HLHH    长江=HLCJ    珠江=HLZJ    鸭绿江=HLYLJ

    红水河=HLHSH    尼罗河=HLNLH    阿马逊河=HLAMH

    〈D〉鸟类=NL(鸟类的声母分类码)

    画鹛=NLHM    鹦鹉=NLYW    相思鸟=NLXSN

    八哥=NLBG    布谷鸟=NLBGN    猫头鹰=NLMTY

    〈E〉家具=JJ(家具的声母分类码)

    沙发=JJSF    餐桌=JJCZ    热水瓶=JJRSP

    茶杯=JJCB    饭碗=JJFW    热水器=JJRSQ

    由此可见,自然界和社会上的一切事物都是可以按声母分类的,五位声母等于235,等于七百六十多万个单元的信息容量,使用者可以根据各自的需要自由定义分类内容,用此方法处理事物信息的能量的确是个天文数字。完全可以包罗宇宙间的万事万物。偶然遇到个别重码时,再用数字代码区分。

    ☆总结:用汉语拼音的声母对不同事物进行编码可以省去拆字根的繁难。这是一种与人类思维十分近似的编码,能想、能听、能讲、能写、能用。此项发明一旦被人们认识和接受,它不仅会带来电脑信息处理技术的变革,对各种辞书字典的编篡和检索都是非常有用的,对国际间信息交流和文字翻译也将带来无穷的好处。

    结束言

    以上介绍的几种编码新技术,都是本发明太极全息码体系中的框架、特征和全部内容。在电脑中文卡的支持下,上述各种编码方案都可以在同一系统中自由动作,任君选择,分别使用,各取所需。《太极全息码》中文系统全面实施和推广后,将会推进我国乃至世界的电子、电讯和电脑高新科技的发展,同时带来相应的社会效益与经济效益,对国家和人类有百利而无一害。

    个人是渺小的,我仅以近二十年的心血和结晶通过申请专利寻求保护的途径和方式,逐步开拓实施。本发明的最终目的是无偿地奉献给社会,以报答生养我的祖国和人民。

太极全息码及多途径分类处理技术.pdf_第1页
第1页 / 共17页
太极全息码及多途径分类处理技术.pdf_第2页
第2页 / 共17页
太极全息码及多途径分类处理技术.pdf_第3页
第3页 / 共17页
点击查看更多>>
资源描述

《太极全息码及多途径分类处理技术.pdf》由会员分享,可在线阅读,更多相关《太极全息码及多途径分类处理技术.pdf(17页珍藏版)》请在专利查询网上搜索。

本发明“太极全息码及多途径分类处理技术”,简称“太极全息码”。是一种全方位、多功能、多途径的编码体系。它充分发挥了中文的形、声、义特点和键盘录入时的多维空间,以最简炼最直接的途径与方式设计了中文形声内外分类码、09部件八卦分类码、纯数字分类码和纯声母分类码。诸种方法都简单易学、宏观快速,为中文信息处理建起了一座多途径立交桥。太极全息码的科学原理和创作灵感来自中华古老的易经,是先人智慧和现代科技文明。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1