汉语语素编码及其计算机键盘输入 本发明涉及有关汉语语素的编码方法。具体,涉及一种经过汉化改造和补充的准拉丁化长短符字母的汉语语素编码及其计算机键盘输入。
人类社会已进入网络时代,引人注目的是出现了一大批网络词汇。许多具有显性语法模式的语言和文字,在网上常常被删去形态成分,如同元素字一般被普遍使用;更值得深思的是网上还出现类似象形文字的表情符号。汉语是语素语,汉字是词素字,其本质是最适合在网上运用;可是就世界范围而言,汉语和汉字在网络上的地位与其人口所占的比例极不相称。这里的问题:一是,汉语尚未真正走向世界;二是,国内推广普通话成效有限;三是,汉字标音不准,部件繁多,构型复杂,难以为世界上其他民族人民所接受。
其实,汉字本就是汉语语素的编码,而且是历史悠久和社会基础极其稳固的编码;但由于字形复杂,所以汉字要进入电脑、进入网络,其本身还得再编码;汉字即使可以通过手写进入网络,但汉字的应用毕竟存在很多制约。
再就“汉字编码”而言:当今已有五笔字型输入法,智慧新拼音输入法等等,“汉字编码”的目的已经基本实现;但因为“汉字编码”的目的,只局限于录入和传输汉字,所以多数“编码”方案都没有考虑想解决汉语与汉字所存在的更基本的问题,其中也包括网络时代汉语能否真正走向世界的问题。
长期以来,意欲拼写或编码汉语的方案还是不少。大致可分为两类:一类是搞汉字笔划式,标音、标意、标调,看来都能解决,但写起来比汉字更复杂;另一类是主张彻底拉丁化,象[北拉]、[国罗]是比较有影响的方案,但在汉字强大的标意阵容之前,也实在难有作为。
本发明的目的:就是要为编码汉语提供一套适合表演汉语,并能通盘处理标意、标调、标字性,以及适合分词连写地字母方案和编码方法;并从整体上解决汉字的计算机键盘输入和网络通讯中的应用等问题。
本发明的目的是通过如下技术方案实现的:
结合汉语语音中的“声、韵、调”三大要素,采用独特的准拉丁化长短符字母。其具体内容为:声母采用上伸的长符;韵母采用居中的短符;标调及标意所需要的隔离字母采用下延长符;标意的代码(义符),在特定的格式下由韵母兼职;所有语素的编码都由上伸的声母开始,其基本音节为上伸长符与居中短符相配合的声韵双拼制。
本方案有:声母26个;韵母30个;音/类及音/意隔离字母各1个。
根据汉语是语素语,汉字是词素字这一特点:本方案从短符韵母中选出25个字母,兼任三套义符的代码,即“形符”、“类符”和“意符”。汉语语素码是“字码兼用型”编码方案,具体是:以现代汉语语素为对象;以准拉丁化长短符字母为构件;以常用汉字为参考、为“接口”;以简约、双拼、标意、标调、标字性等等为方法;并以可诵的“助记字表”为约定的一种编码;因此具备:习、读、写、传、显、打等,多种必要的功能和用途。
汉语语素码用作汉字键盘输入时,采取码元补足提示和码元补足选字。
汉语语素码以标准的(104键)电脑键盘为基础,开发专用的“软键盘”:即在标准电脑键盘的基础上,设置(虚拟的)语素码主页和副页盘面;主页为“声母/数字页”,副页为“韵母页”;处于主页状态,小写体声母和数字可直接打出,大写声母采取高打法打出;处于副页状态,短符和下延字母也直接打出,带符的六个组合字符采取高打法打出;所述键盘当主页状态击发声母之后,系统自动进入副页;系统能识别(-ee,-ge)两类标志码文完整输入形式,并自动返回主页;只有简约码、纯双拼码和标调名词字,须按Alt键返回主页。
语素码的键打指法:声母在主页上与英文指法全面兼容;韵母等在副页上有26个字母与英文指法兼容;其余10个字母因安排在副页的最上一排键位,不影响上述已经存在的兼容。
为方便同时掌握上述两种指法,对语素码字母排序作如下安排:
声母:
A b d f g h J k l
2 t 韵母及其它:
a e g H j k l m
n o p q R s t u v w x y z
π 组合字符:
韵母排序接在声母排序之后,六个带冠的组合字符,不算作独立的字母,但可一次键入,可以有独立内码和名称,其排序可接在韵母排序之后。
由于本发明采用了以上的技术方案,其产生的优点是明显的。
(1)语素码是字码兼用型方案,全码输入时码文具有可读性、可记忆性。
(2)语素码采用码元补足提示和补足选字,因而日常的汉字输入过程,也就是最好的学习普通话和学习语素码过程,而且能逐步实现盲打。
(3)语素码由于存在大量便于记忆的形符码,可减少查字次数和范围。
(4)与“新双拼”相比:语素码如果卸去其标意与标调,基本上就是一个长短符字母纯双拼方案,除了声母需要(按Alt键)引导之外,几乎可以直接外挂在“新双拼”上使用。当然,平均击键次数将略高于“新双拼”,但其优点是在于:长短符字母的声母、韵母,符形上存在显著区别,彻底解决了“双拼汉字编码法”的一符两读和声母位、韵母位的纠葛,更方便初学者跨过双拼的门槛。
(5)与五笔字型输入法比较;学习本方案62个字母及其中25个短符字母所代表的形符、类符、意符,肯定要比掌握五笔码的125个字根容易,而且容易找到标意成分的键位;五笔码588个二级简码,其数量与本方案的双拼码(448个)加上声/调简码(128个)大致相当;语素码的双拼码以韵母为核心编制助记字表,声/调简码可结合四声练习,两者都较容易背诵和记忆,但语素码单字的击键次数将少于五笔码;语素码实际定型约4000个汉字,但大部分不要求死记硬练;语素码主要依靠简约码、双拼码、大量的形符码提高单字的输入速度;对于未定型的罕用字,可通过能表明:声、韵、调的模糊码,由查找输入;语素码也可通过联想法和容错码提高双音节和多音节词(或词组)的输入速度。
(6)语素码简洁、精密、易学,可帮助外国人学习汉语,扩大汉语的影响,满足网络通讯和交际的需要;语素码还可作为推广普通话的有效工具。
下面结合实施例对本发明作进一步说明:
(一)通过“拉丁化+汉化”提供一套与英不会混淆,而键打指又能兼容的字母方案;语素码长短符字母字形如下:
1、声母大写体 A B C D F G H J K L T
2、声母小写体 A b d f g h J k l 2 t
3、韵母及其它字母(不设大写体) a e g H j k L m n o p q R s t u v w x y z π
(二)语素码的拼音音值(拼音读法)规定如下: a 啊 安 昂 哎 [ei] 熬 e n m o 鹅 恩 [eng] 喔 欧 [ong] L K R X 医 因 英 腰 烟 央 z u H 椰 悠 月 乌 温 汪 v t w π 宇 委 蛙 宛 外 (寺)
以上字母主要由汉字标注音值,个别处用【汉拼】标音值;韵母o在:b、f、A之后读作[o],在其他声母之后读作[uo];其中韵母H[un]、[uan]的条件变读法则,可参考【汉拼】规定。
(三)语素码音节拼法的自然等价与约定等价
语素码声母系统中,有些声母自身带有[i]的成分,在韵母系统中也存在大量以[i]、[ü]音素为首的复合韵母;而这类声母和韵母的组合,一般正是同音音素密集的音节。对此,可以分别情况设置等价拼法。以下用∥表示等价。
I自然等价拼法:Jk∥Jn [-in] [-ing] [-iao] [-ian] [-iang]Jz∥Je [ie] [-iou]
Ⅱ条件与约定等价拼法: [-i] [-i] [-i]Jv∥Ju [-ü] [yu] [yuan] [wei]
Ⅲ以下为特殊规定: (1) =[er] fu∥fr (2)个别字的特殊处理.如: 常用字:那 克 的①② 为省去复韵母[ia],规定:“嗲”写作;“俩”写作 (3)汉语中真正多音节语素(或称连绵词)为数不多,一般内部也存在轻重关系。 次要成分只需加j处理;主要成分可作标意处理。 如:枇杷 蝴蝶 hujdzz 鸳鸯 琵琶 葡萄 (4)轻声成分,一般可加处理。如:萝卜什么 (四)语素码的义符系统 语素码凭借长短符字母的符形特点,在短符范围内挑选一批字母,并以特定的格式,设置多重义符系统。具体由:n、m、s、o、u、V、R、 w、 z、 π、k、e、x、H。25个字母兼任“形符”、“类符”、“意符”,三套义符的职能。其中:形符直接加在基本音节后面,最紧凑、直观,适合定型较常用的语素;类符码能区分名、动、形词性,适合定型次常用语素;标意码适合处理不常用的语素,如金属元素等等。举例如下:
语素码总的义符代码及其对应的汉字偏旁,列于下表:
语素码形符、类符、意符对照
(五)编码汉语语素的原则与形式
总的原则是:繁用者“简”;常用者“易”;间用者“密”;罕用者“并”。
形式:语素码具体的定型形式如下表举例。
(六)语素码键盘的设置、键位安排及计算机键盘输入法
“准拉丁化长短符字母”是独特的符号系统,结合语素码的结构特点可在(104键)标准电脑键盘上由虚拟的“声母/数字页”(主页)和“韵母页”(副页)组成语素码“软键盘”。由于语素码字母与拉丁字母字形方面的差别,因此,真正的语素码键盘,其键帽上的字符应该用语素码字形表示,其中除语素码与英文I(i)字形差别较大之外,在其余25个主要键上都保留着英文的大写或小写体,所以除了软件之外,硬件的兼用不会有困难。具体说明如下:
(1)语素码字母总数为62个。其中26个声母(上伸长符),数量上正好与英文字母相等,可按符形或字母名称相近(英文)的原则,安排在主页相应的键位上;声母的大写体安排在上档位置。
(2)语素码中的短符字母和下延字母,采取了混合的统一排序,而且更多地采用了标准拉丁字母,因此同样可以按符形或名称相近的原则,将其中最接近(英文的)26个字母,安排在副页的相应键位上(不设大写体);只有10个短符字母需要占用副页的最上一排键位;由于语素码是有规律的字码,键打韵母、或标调、或标义符时,不会同时使用数字,因此在副页上可不设置数字键(当短符或下延字母被用作科学符号时,数字字符也可由小键盘处理)。
(3)语素码计算机键盘设置如下:键打方法如下:
键帽左上方的声母与数字在主页,可直接打出;声母大写体与小写体同一键,用高打法打出;数字键右上方的符号在主页,采取高打法打出;键帽下方的字母在副页,可直接打出;带冠的组合字母在副页,用高打法打出。Alt键,用于返回主页;T符键,用于退回副页;为标意查字键;为声母锁定键;C/L为韵母锁定键;为汉语儿化专用,在主、副页均可用高打法打出。
(4)由英文键盘切换至语素码键盘时,所有字母键都处于“声母待击发”状态;而数字键亦处于“数字可用”状态。这一状态可看作为语素码键盘的“初始化”状态,亦即主页状态,而这一页即“声母/数字页”。
在“声母/数字页”中:数字可任意次使用,但声母则限用一次;当声母键击发(输出)后,系统自动进入“字码后续处理态”,即“副页”状态,处此状态,最上排键即为:π、十个韵母键。
(5)六个带冠的组合字符:不算作独立的字母,但在副页状态下,可以用高打法一次键入。
以上六个组合字符可安排在:r、g、p…相应键的高打位置;或为操作方便集中安排在副页对应于数字键4、5、6、7、8、0的高打位置。
(6)语素码字母拟采用高位置“1”的八位码作为传输码。
(7)以上安排,键打指法可与英文键打指法兼容(包容),软件设计也较容易,主要是解决主、副页之间的切换问题。
语素码是字码兼用型编码,与汉字有全面的约定。在熟练的情况下,可以象输入英文一样:全码输入和盲打。但现阶段,首先要解决的是:作为汉字的编码,用于汉字的字处理。这里实际有两个问题:一是,单字查找和选字输入的方法;二是,词或词组的输入方案。
结合语素码结构特点,语素码可以采取“码元补足提示和补足选字”为单字查找和选字的方法。这一方法:一是,便于汉字处理;二是,具有学习和加深记忆功能;三是,有利于语素码可以参照汉字提示,方便语素码自身写屏和码文输出。
关于词或词组的汉字输入方案,可借鉴类似【中文之星】的新全拼输入法,但重点字的查字和选字还是采用“码元补足提示和补足选字”法。
下面结合语素码键盘的特点,叙述和举例语素码汉字键盘输入法,并以此展示有关语素码全码汉字输入法的特点。举例中:用代表空格键;用或代表Alt键(用于汉字输入结束,按键切回主页)。
I单字输入的查找和补足(兼叙词的处理)
1、声母字与声母提示范围:语素码26个声母各自代表一个高频汉字。
本方案规定:
由声母直接提示的,只限于声系内简约编码字。
如过程1:当按下相关声母后,该声母进入窗口输入区,同时,提示行将自动显示声系内属于简约编码的汉字及其相应的补足码元。
如按J键,声母J进窗口输入区。提示行显示以声母字“基”字为主的一群带有码元提示的简约编码字。
若提示行中有当选字:
其中“基”字,可用J或键直接选定;
按J键,“基”字进入输入区;按键,直接上大屏(光标处。)
其余待选字需先补足码元进行选定,再按J或键,以定去向。
2、“声母+韵母”选字法:
过程2:当声母已驻留在输入区情况下,若还知道待查字的韵母成分,可直接按韵母键。如键入a。
窗口输入区为:Ja,提示行则以标准双拼字“加”字带头,将标调字和一般字性定型字组成“一般查字页”;(除标准双拼字外,其余字将按频度排队和用翻页法查找。)
提示行中:q、y…为后续补足方式,如按,“价”字被选中进输入区;
若按,则“价”字被直接送上大屏;
p/j/…表示插入补足;作为选字操作,不需调整码元排列。
插入补足式当选字将自动进入输入区,如欲上大屏,可再按ㄩ键。
3、标意选字法:
过程3:若知道待输入的字,是属于标意编码类型的字,则在输入声母、韵母之后,可直接按¥(标意查字键)。如:Ja¥其时,输入区还是Ja提示行则是“标意查字页”内的字。
提示行中标意汉字所带的码元,均为后续补足码元;补足后,当选字自动进入输入区(待选词处理),如欲送大屏,可按键。
Ⅱ语素码全码汉字输入法:
语素码全码汉字输入法是本方案最基本的汉字输入法。除了查字、选字是汉字输入特有的操作之外,其它逐字逐码输入过程与语素码自码写屏基本一致。区别仅在于:用语素码自码写屏时,空格键是用于“分词连写”;而在汉字输入状态,空格键的职能是将被选中成分送至编辑文本的光标处。因此,只要有相应的软件配合,可以将语素码全码汉字输入法变换为[语素码“查字补足”自码写屏法]。
语素码全码输入法的优点是能真正发挥语素码的多种功能,其中尤其是学习功能。它不仅是学习和推广普通话的有效工具,而且它的标意方法与汉字有更多联系,所以也将是学习汉字的有用工具。如果有联想型软件配合,更可以提高写作能力,所以很适合中、小学生和学习语素码者使用;而且语素码最终还能实现盲打的要求,也适合文字工作者和一般人使用;其实,在语素码全码输入法基础上结合汉语叠字格的简化处理,将是最实用的方法。
Ⅲ智慧型语素码汉字快速输入法:
本方法除了用码元补足输入法取代数字法选字之外,与[中文之星]的智慧型新拼音输入法相类似。但对词或词组内的重点字,语素码方法不仅可补足韵母,还可补充如形符等信息,因而可以进一步缩小查找范围。
1、规则:本方法有关新词选定必须全码输入,也只能在此基础上实现汉字语词的快速输入。
2、语素码选择词(词组)内“重点”的一般原则:
(1)一般不选常用的前缀和修饰成分作为重点。如:阿、新、老、大、小、红…等成分;
(2)一般不选常用后缀作为重点。如:们、头、儿、子、过、着、的、了……等成分:
(3)一般不选语素码26个“声母字”为重点,这些字本身已是最形式;
(4)一般组合,可选为首字作为重点,这样比较符合联想规律,并便于顺序搜索;
(5)选以形符编码的汉字作重点,最为方便;
(6)重点字选择大致与构词法相关;但重点选择不当,也不算出错,只是扩大了搜索范围。
3、语素码快速输入方法:
(1)非重点字只输入声母。但若该字之后紧跟有其它字(除儿化外),必须加按键。
具体操作即:声母1,,声母2…(用键,返回主页)
(2)重点字,声母之后补上韵母或更多码元(如形符或全息码元)。
可取:Ja,Jam,Japm…等补足形式。
语素码词与词组快速输入法举例词或词组 语素码码文 码文写屏按键 汉字全码按键 快速输入按键红灯 或 棋子 或 金霉素 或 梦中梦 或
(七)双拼码助记字表编写法
记住和背诵双拼码是学习语素码的关键。双拼码助记字表可以单一韵母或最多三个韵母为一组,分组编写。为编写方便可插入与在编组韵母读音有显著差别的常用字;同音异调字应同组列出。以下是:t、u及u的变读[ü]三个韵母为一编写组的举例(举例中,加下划线的为条件变读成分)。 tu bu fu du 规 (作) 图, 组 处 部, 夫 追 退, 距 有 度; hu 如 数 数, (常) 趋 五, 互 促 会, 普 瑞 路; 2u gu 垂 对 催, 须 努 力, 为 固 目, 水 育 素; ku 虽 最 苦, 亏 为 主。(八)语素码码文举例及其它汉字原文:义勇军进行曲(歌词略)码文样品:
关于语素码的手写输入:
作为字码兼用型汉语元素编码方案,首先考虑的问题是码文可以手写,不仅是一般的手写,而且是通过手写进入电脑和网络;用长短符字母所编制的码文是有规律的和便于机器识别的码文,开发语素码的手写输入软件不仅有实用价值而且有以下具体作用和需要:
(1)手写输入可以体念到“心手同步”书写的乐趣,有利于学好语素码学好普通话;
(2)有利于外国人学汉语;通过语素码“写出”汉字,也会提高外国人学习汉语和汉字的兴趣,有利于汉语真正走向世界;
(3)通过手写语素码输出汉字或正规码文,这对编写汉语助读材料很需要。
关于长短符字母的名称:
为进一步防止语素码与英文之间可能出现的混淆,也会语素码描述单词拼法的需要以及键盘输入的方便,本发明对字母名称作了选定,以下字母名称用汉字标注,一般按普通话发音;带()括号的字按上海地方音;用(″)的全同于英文字母名称,具体如下:
声母名称: A b d f g h J k l (爱) (皮) 此 地 夷;(爱夫)过(爱去)在;几(开)(爱儿)门; 2 t 你 我 (拍儿) 起; 人 思(天) 乌; 羽 是 希 揣 着。
韵母及其它字母名称:
a e g H j k l m
阿 腰 奥 欧 (萼衣) (飞) (骑) 温 (阿汉) 捷; 克因 礼:(″)
n o p q R s t u v w x y z
(″)(″)(″)(″);(″)(″)推;有乌 (″)蛙 央克 (″)(″)
π
昂p 外p 月p 宛p 悠p 安p 望p 应p (翁p) 持p
(骑t) 披t 怀t 夸t (飞t) 依尔
关于借用【汉拼】标调符号方法:
为推广普通话编写初级读物,语素码需要借入[汉拼]方案的“四声符号”;符号加在韵母上方,由:“韵母键”与“符号键”结合Ctrl(右键)复合输出,其中四声符号键可由4个箭头键充任,具体可采用Compose程序。