汉字全规范笔顺编码法 【技术领域】
本发明涉及一种汉字信息处理方法,特别是一种完全按照规范笔顺拆分汉字笔形的电脑汉字编码输入方法。背景技术
现有的电脑汉字编码输入技术,可分为拼音编码输入和笔形编码输入两类。拼音编码输入简单易学,但重码字多;笔形编码输入重码字少,但规则多。王永民教授发明的五笔字型编码法,将汉字的笔划和笔划组合编排为二十五组“码元”,用二十五个英文字母编码,按汉字笔划书写顺序排列“码元”在汉字中的先后顺序,是现有技术中应用最广泛的汉字笔形编码方法,其98版可以输入国标扩展字库所收21003个字汉字,但是也有笔顺不规范的缺点,而且同一个汉字的简体字和繁体字重码太多,使用不便。发明内容
本发明地目的是要提供一种完全按照规范笔顺拆分汉字笔形、可以输入国标扩展字库所收21003汉字,而且同一个汉字的简体字和繁体字不重码的电脑汉字编码输入方法。
本发明由以下方法实现:
本发明将21003个汉字的笔划组合编排为三十组笔形,给出三十组笔形的代码,同组笔形同码,将汉字的笔划归纳为七种,给出七种笔划的代码,同种笔划同码。
三十组笔形的代码及对应输入键位关系如下:1)月、几、笔形的代码及对应输入键位都是“A”,2)犭、力、笔形的代码及对应输入键位都是“B”,3)纟、予、习、笔形的代码及对应输入键位都是“C”,4)金、八、丷、笔形的代码及对应输入键位都是“D”,5)火、爫、灬、笔形的代码及对应输入键位都是“E”,6)亻、人、笔形的代码及对应输入键位都是“F”,7)、笔形的代码及对应输入键位都是“G”,8)王、笔形的代码及对应输入键位都是“H”,9)木、束、笔形的代码及对应输入键位都是“I”,10)言、二、亠、冫 笔形的代码及对应输入键位都是“J”,11)氵、三、彡镸笔形的代码及对应输入键位都是“K”,12)石、厂、笔形的代码及对应输入键位都是“L”,13)山、凵、ㄇ 笔形的代码及对应输入键位都是“M”,14)、止、笔形的代码及对应输入键位都是“N”,15)扌、笔形的代码及对应输入键位都是“O”,16)钅、七、笔形的代码及对应输入键位都是“P”,17)衤、又、乂、笔形的代码及对应输入键位都是“Q”,18)疒、大、ナ笔形的代码及对应输入键位都是“R”,19)魚、、勹、笔形的代码及对应输入键位都是“S”,20)宀、冖、门、笔形的代码及对应输入键位都是“T”,21)艹、廿、廾、笔形的代码及对应输入键位都是“U”,22)女、戈、笔形的代码及对应输入键位都是“V”,23)忄、小、心、 笔形的代码及对应输入键位都是“W”,24)糹、匕、笔形的代码及对应输入键位都是“X”,25)土、士、、笔形的代码及对应输入键位都是“Y”,26)讠、辶、笔形的代码及对应输入键位都是“Z”,27)虫、十、笔形代码为“1”,对应输入键位为“:”,28)口、笔形代码为“2”,对应输入键位为“<”,29)日、曰、笔形代码为“3”,对应输入键位为“>”,30)目、罒、笔形代码为“4”,对应输入键位为“?”
本发明规定每一个笔形的所有笔划都必须按照规范的笔划书写顺序笔顺相连,笔顺不相连接的笔划一律拆开另组笔形。
例如:“划”字中的“戈”,有“一”、“丿”、“丶”四个笔划,现在这四个笔划全部笔顺相连,是一个符合规定的笔形;但是“成”字中的“戈”,笔划“一”的后面是一个“丿”,“一”和“丿”、“丶”笔顺不相连接;笔划“一”必须拆开,和另一个笔顺相连的笔划“丿”另组成笔形“厂”又如:“申”字中的“日”有“丨”、“一”、“一”四个笔划,现在这四个笔划全部笔顺相连,是一个符合规定的笔形。但是“由”字中的“日”,笔划“丨”、“一”和最后一笔“一”笔顺不相连接,这一个“日”必须拆开,组合为“冂”和“土”这两个笔划顺序全部相连的笔形。
本发明规定笔划数目多的笔形,不得拆分为笔划数目少的笔形;笔划数目少的笔形,不得占用笔划数目多的笔形的笔划;按照规范的笔划书写顺序,笔顺在前的笔形可以占用笔划数目相同的笔形的笔划。
例如:“三”不得拆分为“二”、“一”,不得拆分为“一”、“一”、“一”;“木”不得拆分为“十”、“八”,不得拆分为“十”、“丿”、“ ”;“天”不得拆分为“二”、“人”,因为“二”是两笔笔形,不得占用三笔笔形“大”的笔划;“天”折分为“一”、“大”;可以拆分为“三”、“人”,因为“三“和”大“都是三笔笔形,“三”的笔顺在“大”之前可以占用“大”的一横。
本发明按照规范的笔顺拆分汉字的笔形,按照规范的笔顺排列笔形在汉字中的顺序,按照规范的笔顺取每一个汉字的前四个笔形和最后一个笔形的代码作为每一个汉字的代码。
由于本发明完全按照规范笔顺折分汉字的笔形和排列笔形的先后顺序,所以规则简单、明确,无二义性,由于本发明规定的同码笔形每组只有四个,容易记忆。本发明可以输入国标扩展字库所收21003个汉字,而且同一个汉字的简体字和繁体字不重码,使用方便。附图说明
附图1为三十组笔形的代码及对应输入键位图
附图2为七种笔划的代码及对应输入键位图具体实施例
本发明附图1用三十个小方格标出三十组笔形及其代码,每一个小方格内四角四个笔形为同组同码笔形,方格中的英文字母或阿拉伯数字为该组笔形的代码。
本发明附图2用七个小方格标出七种笔划及其代码,每一个小方格内为同种同码笔划,小方格中的英文字母为该种笔划的代码。
本发明输入国标扩展字库所收21003个汉字时,取每一个汉字的前四个笔形和最后一个笔形的代码作为该汉字的代码,每一个字最多击键五次。
本发明单独输入国标一、二级6763个汉字时,取每一个汉字的前三个笔形和最后一个笔形的代码作为该汉字的代码,每一个字最多击键四次。
例如:在“臊”字中,笔形依次为“月”、“口”、“口”、“口”、“木”,“臊”字的代码为“A222I”;在“挽”字中,笔形依次为“扌”、“”、“口”、“丿”、“乚”,“挽”字的代码为“OS2GX”;在“镠”字中,笔形依次为“金”、“习”、“习”、“人”、“彡”,“镠”字的代码为“PCCFK";在“樘”字中,笔形依次为“木”、“小”、“冖”、“口”、“土”,“樘”字的代码为“IWT2Y”;“蘑”字的前四个笔形和最后一个笔形依次为“艹”、“亠”、“丿”、“木”、“石”,“蘑”字的代码为“UJGIL”;“普”字的前四个笔形和最后一个笔形依次为“丷”、“一”、“丨”、“丨”、“日”,“普”字的代码为“DLND2”;“曉”字的前四个笔形和最后一个笔形依次为“日”、“土”、“土”、“土”、“乚”,“曉”的代码为“3YYYX”;“邀”字的前四个笔形和最后一个笔形依次为“丿”、“日”、“亠”、“勹”、“辶”,“邀”的代码为“G3JSZ”;“讝”字的前四个笔形和最后一个笔形依次为“言”、“口”、“口”、“厂”、“乂”,“讝”字的代码为“J22LQ”;“爚”字的前四个笔形和最后一个笔形依次为“火”、“人”、“一”、“口”、“艹”,“爚”的代码为“EFH2U”。
实施本发明时,代码为英文字母的笔形或笔划,其输入键位和代码相同;代码为阿拉伯数字的笔形,其输入键位为:代码为“1”的笔形输入键位是“:”;代码为“2”的笔形输入键位是“<”;代码为“3”的笔形输入键位是“>”;代码为“4”的笔形输入键位是“?”。
实施本发明时,一个汉字的笔形数目只有四个或四个以下,击键次数不足五键时,加击空格键一次。
实施本发明时,应将国标6763个一、二级汉字单独制作一个附加版本,规定只用每一个汉字的前三个笔形和最后一个笔形的代码输入,每个字最多击键四次,不足四次者击空格键一次,以供不需要输入繁体字和港、台、韩、日汉字的用户选择使用。
使用本发明时,可以将三十组笔形标示于各自的输入键位的键帽上,由于每组都是整齐的四个笔形,所以操作时可以清楚地看到每一个笔形的输入键位。操作者只要学会了拆分笔形的规则即可以上机练习。
本发明将折弯笔划归纳为三种,其中顺时针方向折弯一次的笔划代码相同,逆时针方向折弯一次的笔划代码相同,一笔折弯两次以上的笔划代码相同。