聚散字型汉字输入法 一、技术领域
本发明涉及一种汉字编码计算机输入技术及其键盘。
二、技术背景
现有的计算机汉字编码输入方案少说也有几百种,部件式的形码(包括音形码、形音码)有高效易用的特点,但难学易忘,形码的难学难在对构字部件的记忆,构字部件的记忆与构字部件如何归并定位息息相关,部件的归并定位决定了部件的易记程度、记忆能否持久。现在应用比较多的部件式形码有五笔字型、表形码、自然码,五笔字型根据部件的笔画对部件进行归组定位,并没有解决部件记忆难的问题,不得不靠助记词来解决部件记忆这一难题,用大众熟悉的汉字记忆部件能与初学者的背景知识相衔接,但助记词助记不直接、不明确,对助记词又不得不加以解释说明;表形码主要根据部件与对应键位字母的形似辅以部件的音和义对部件归组定位,部件与键位字母的形状相似牵强附会,有的部件没有读音,部件的助记规律不一、繁多复杂;自然码的形码部件主要根据部件的读音对部件归组定位,但有的部件根本没有读音,有地部件对初学者来说非常陌生,部件读音脱离大众背景知识。现有的部件式形码构字部件一般在200个左右,大多只有形、无音、无义,有形无音且数量众多使部件记忆变得晦涩、难记、易忘。
福建省福清市叶氏发明的母字码利用25个汉字对构字要素进行记忆,使母字码更易学、不易遗忘,但对于母字码的纯形码,它采用形似合并、依形拓展增加构字部件,初学者对这些增加的构字部件已不能直接利用本身熟悉的汉字进行记忆,母字码并没有真正的做到直接利用汉字记忆构字要素。
三、发明内容
本发明从简体汉字中选出若干汉字,由组成这些汉字的部件和五种单笔画(如图1)作为构成全部简体汉字的构字要素,依据汉字之间的意思,把这些汉字及五种单笔画分成26组,并使各组汉字包含的部件各不相同,然后与26个英文字母键对应(如图2),它的特征在于:部件的分组是依据汉字及汉字间的意思,除个别单笔画部件外,每个键位上的部件刚好可以组成若干汉字。例如:“篝”是本发明的选定汉字,部件“”、“冉”依据“篝”归并在同一组与x键对应,“火”字也是本明的选定汉字,“篝”与“火”根据汉字间的意思组成词“篝火”,这样部件“火”依据字间的意思与部件“”、“冉”归并在同一组对应x键,代码同为x。例如:“有”字是本发明的选定汉字,部件“ナ”与“月”依据“有”归并在同一组,依据句子“有了九果月兆丸”,部件“九”、“果”、“月”、“儿”、“丸”、“了”与部件“ナ”与“月”也归并在同一组与h键对应,代码同为h。这样对部件的记忆就可上升至对字、词、句的记忆,记忆建立在初学者原有知识的基础上,易学不易忘。
本发明选出的若干汉字是本发明部件分组归并的依据,本发明把这些汉字叫做它们所包含的部件的部件记忆字(如图2)。例如:“仓”字是本发明选定的汉字,部件“人”和依据“仓”字归并在键位q上,“仓”就叫做部件“人”和的部件记忆字。本发明规定,非成字部件的读音与其部件记忆字相同,成字部件和五种单笔画(点、横、竖、撇、折)的读音取本身的读音。例如,部件的部件记忆字为“仓”,为非成字部件,则也读成cāng,“人”的部件记忆字也为“仓”,但“人”是成字部件,“人”的读音取其本身读音rén。
在本发明的部件键盘图上,部件(除个别单笔画外)先组成完整汉字——部件记忆字,然后放置于对应的键位上(如图3),对照部件及部件记忆字总表(如图2),对位于同一部件记忆字中的多个部件用不同颜色着色区分,这样便可制成一张部件学习键盘图,从而使初学者能用汉字记忆部件(也可按照部件及部件记忆字总表进行学习),部件记忆与大众背景知识相衔接,顺畅自然。
此外,本发明根据汉字的字型特点,将汉字归纳概括为二种字型,即左右型和杂合型,这两种字型的区分是以组成汉字的部件在汉字中的位置划分的,本发明规定:若一个汉字由至少两个部件组成,且其中有一个部件位于其他部件的左边或右边,该汉字字型为左右型;一个汉字由至少两个部件组成,其中没有任何一个部件完全位于其他部件的左边或右边,该汉字字型为杂合型;由单个部件组成的汉字也为杂合型。
本发明以部件作为构字要素,以26个英文字母为编码代码,依书写顺序由部件首笔画确定部件出现的先后顺序,按照部件出现的顺序对汉字编码,每一汉字最多四码,并规定每字分解后的部件数应最少,因笔画相交而连在一块的部分不能拆分为非单笔画部件,必须拆成笔画,相离部分、相连部分可拆。本发明规定:若两个笔画在平面空间上有共同点,该点不是其中任何一个笔画的终点或起点,这两个笔画称为相交;若两个笔画在平面空间上有共同点,该点是其中一个笔画的终点或起点,这两个笔画称为相连;汉字中有两部分笔画在平空间上没有共同点称为彼此相离。
四、具体实施方式
对于四个部件的汉字,输入时按部件出现顺序键入全部部件,部件出现顺序由部件首笔在字中的书写顺序决定,汉字经分解后部件数超过四个时,只键入第一、第二、第三和末一个部件。
例如:
<照>取日、刀、口、灬
<侠>取亻、丷、丶
<赣>取立、日、十、贝
汉字经分解后的部件数应最少。
例如:
<囹>取囗、人、丶、マ
说明:根据书写顺序,首笔“丨”最先出现,根据部件最少的原则,含有首笔的最大部件是“囗”,不是部件“冂”,不能分解为“冂、人、丶、マ、一”
<嘉>取十、豆、力、口
说明:根据部件最少的原则,不能分解为:士、口、、力、口,应分解为:十、豆、力、口。
汉字中因笔画相交而连在一块的部分不能拆分为非单笔画部件,必须拆成笔画按书写顺序取码。
例如:
<夷>取一、乙、一、丶
说明:“夷”除了末笔外,其他笔画因相交而连在一块,不能拆分为更小的非单笔画部件,交连部件只按笔画拆字取码,不能拆为“一、弓、人”。
对于少于四个部件的汉字,取组成该字的全部部件后,再加识别码。左右型汉字的识别码为该汉字最后一个部件的末笔画;杂合型汉字的识别码为该汉字最后一个部件拼音的首字母,最后一个部件是“辶”、“廴”的杂合型汉字的识别码为该字的次末部件拼音首字母。
例如:
<汉>取氵、又、丶(说明:“汉”是左右型汉字,末部件“又”的末笔画是“丶”)
<仔>取亻、子、一(说明:“仔”是左右型汉字,末部件“子”的末笔画是“一”)
<字>取宀、子、z(说明:“字”是杂合型汉字,末部件“子”的部件拼音首字母是“z”)
<仓>取人、c(说明:“仓”是杂合型汉字,末部件是非成字部件,它的部件读音与其部件记忆字“仓”相同,所以末部件的拼音首字母是“c”)
<边>取力、辶、1(说明:“边”是杂合型汉字,但最后的部件是“辶”,取次末部件“力”的拼音首字母“1”作为识别码)
键盘部件的编码为:
<部件本身键位代码>+<部件拼音首字母>+<部件末笔画代码>例如:
<土>取土、t、一
<士>取士、s、一
每一个部件键位上,都安排一个使用频率特别高的汉字,其输入码为所在键打一下加空格键,称为一级简码;约有676个汉字采用只取其全部部件的前两个部件加空格键键入,称为二级简码;约有几千个汉字采用只取其全部部件的前三个部件加空格键键入,称为三级简码。同时,保留具有简码汉字的全码输入方式。
本汉字编码法也规定了词组取码方法,词组输入与单字输入一致相容,不用切换。
两字词只取每个汉字的前两个部件即可。
例如:
<物理>取牛、勹、王、里
三字词取第一汉字的前两个部件、第二个和第三个汉字的第一个部件。
例如:
<打字员>取扌、丁、宀、口
四字词取每个汉字的第一个部件。
例如:
<社会主义>取礻、人、丶、丶
五个字以上的组词取前三个汉字的第一个部件和最后一个汉字的第一个部件即可:
例如:
<中华人民共和国>取中、亻、人、囗
本发明适用于简体汉字输入,它为各行各业提供一种能直接用大众熟悉的汉字记忆构字部件、易学不易忘的计算机汉字输入法,部件的记忆建立在大众原有知识的基础上,只用26个英文字母键作为编码代码,并保证常用偏旁的完整,拆字规范简单,重码极少。
五、附图说明
图1:单笔画主附形对照表
图2:聚散字型汉字输入法部件及部件记忆字总表
图3:聚散字型汉字输入法键盘图