本发明属于数据处理技术领域,是关于一种对英文词汇进行缩码改变处理位数的数据处理方法和装置。 英文在电脑、电报、电传等的信息处理中,都是采用将每个词汇的全部符号依书写顺序逐个地通过键盘输入的方法,即每一个符号都需要按击一次键,一个英文单词平均有7位长度,则需要平均按击7次键,输入效率不高。
本发明的目的是设计一种不需要把每个词汇的所有符号都全部键入的英文快速输入方法,包括对现有英文词汇编码及对现有英文键盘的改变,克服现有英文词汇输入的缺点。
本发明的设计方案是:根据英文自身的拼写规律(发音和词素),对每个英文词汇的符号个数进行压缩,取其原词中的部分符号作为输入编码,并根据英文字母符号在输入编码中的使用频率对字母键盘进行改进,布置一种新的键盘,每个输入码仍按击一次所在键。
在本发明方案中,对英文的音节,后缀两个概念也进行了新的解释,补充进了新的内容,音节,除了原意义内容外,当辅音音素〔t〕、〔K〕、〔g〕、〔d〕、〔t∫〕、〔d〕、〔Q〕、〔〕、〔S〕、〔z〕、〔〕、〔y〕等单独发音时,则发该音的字母为一个音节,如Word,其中d为一个音节;上述以外的其它辅音音素单独发音时,则发该音地字母属于其前边的音节,如goLden,音节划成gOL-den;单词的第一个字母不和其它字母拼读时,则该字母为一个音节,如fright,f为一个音节;双写字母只发一个音时,则为一个字母,如gOggLe,则看作gOgLe;一个音节中如无辅音字母,则该音节并为前一音节,字母y除在词首时永远是元音字母;与后缀中字母拼读的后缀前的字母为一个音节;单音节、双音节、多音节词,均适合上述对音节的新解释。后缀,除了原意义内容外,凡在一个单词最后有本发明所列的“后缀”内容的,统称为该词的后缀,一律按有后缀处理,如giVe,其中iVe为后缀。
结合词例、附表、附图进一步叙述本发明的缩码法及键盘。
表1是后缀及其编码;
表2是常用词及其编码;
图1是原英文字母键盘的示意图;
图2是本发明英文字母键盘的示意图。
本发明按照设计方案,把英文词汇分为单词(包括无后缀单词,有后缀单词)、常用单词、合成词(包括有连接符、无连接符)、短词(词组)、变体单词、新词汇分别进行编码输入。
一、单词:分为无后缀单词和有后缀单词。
(一)、对无后缀单词的取码规则程序:
1、取单词的第一个字母,如WOrd,先取W;
2、①单音节、双音节词,取第一音节首尾两个字母,如WOrd,先取W,再取r;
②多音节词,取每一个音节的第一个字母;
③、取单词的最后一个字母,如WOrd,第1次取w,第2次取r,第3次取d;CbOOSe,取码COSe;aLphabet,取码为apbt。
前一次取过的,下一次不再重取。
(二)、有后缀单词的取码规则程序:
1、取单词的第一个字母;
2、除后缀外,取每个音节的第一个字母;
第“1”次取过的,在第“2”次中不再重取。
3、①当后缀前边最接近后缀的音节中有元音字母时,取该音节中最接近后缀的元音字母,如agreement,除后缀ment外,取码为agre;
②如当后缀前边最接近后缀的音节中无元音字母时,则取后缀中最前边的元音字母,如COuntLeSS,除后缀LeSS外,取码为Cte;
4、最后取后缀的编码,(后缀的编码见表1)。
二、本发明方案,对常用单词又给了编码。常用单词及编码见表2。
三、本发明方案对合成词(分有连接符和无连接符)的编码规则是:
1、有连接符的合成词,按单词的编码规则,先给前一个单词取码,第二步取连接符“-”,最后给下一个单词取码;
2、无连接符的合成词,按单词的编码规则,先给前一个单词取码,第二步取符号“·”,最后给下一个单词取码。
四、本发明对短语、词组的编码规则是:
1、先取符号“/”,
2、当遇单音节词取第一个字母,当遇双音节、多音节词,取其首尾两个字母。
五、本发明对单词变体的编码规则是:
当单词变体为名词复数时,先按原单词取码加上“,”和“S”,当单词变体为名词所有格时,先按原单词取码加上“,”;当单词变体为动词现在分词时,先按原单词取码加上“,”和“i”;当单词变体为动词过去式时,先按原单词取码加上“,”和“p”;当单词变体为动词的过去分词时,先按原单词取码加上“,”;当单词变体为形容词比较级时,先按原单词取码加上“,”和“e”;当单词变体为形容词最高级时,先按原单词取码加上“,”和“t”。
六、本发明对新增英文词汇的编码规则是,先给基础单词按单词编码规则取码,再取“+”符号,然后再取所增加的字母符号。
本发明对重码的处理,可通过报警信号提示,只需依次补上被压缩掉的第一个字母,第二个字母……,直至没有重码;屏幕上同时给出与该重码相对应的所有词汇,并标示出足以分辨的字母。
第一个字母为大写时,仍按该字母的小写编码,无需转换。
由于本发明对词汇的编码规则中,对单词取每个音节的第一个字母,而每个音节的第一个字母几乎均为辅音字母,所以辅音字母的使用频率相对增大;而元音字母只有在词首、在紧接后缀、或为后缀的编码时,才使用元音字母,其它情况下均被舍弃,所以元音字母在本编码中使用频率相对减少;为了进一步提高键入速度,本发明又把使用频率高的辅音字母对应键放在键盘中指法习惯较易按击的位置,把使用频率低的元音字母对应键放在不易按击的位置,对原英文键盘中的字母键(见图1)的排列位置进行改进,形成一个新的键盘,在改进后的字母键位置(见图2)中,上排键改变为I、W、S、R、T、D、L、C、G、P键,中排键改变为A、E、Y、F、Q、H、B、K、N键,下排键改变为Z、X、U、V、J、O、M键。
本发明由于对英文词汇的符号个数进行压缩编码,输入其中的部分符号,由原来平均按击7次减少到平均按击4次;又考虑到编码后英文字母使用频率发生变化,对现有键盘进行键位调整,适应键盘指法按击习惯,因此本发明可使英文输入速度大大提高。
常用后缀及其编码 表一
后缀 编码
al ial ical a
able ible ble b
ancy ance ency ence ic c
ed d
er ter ise wise ther e
ful fy f
ing ling age g
ship ish h
ion sion tion ation i
kin like k
let l
gram ism ment m
ian an ant en ent n
dom fold or tor some o
graph p
ought ight q
ard crat ward(s) ry ery r
ness es ess less s
ate ist ite t
ous tious ure u
ive sive tive v
ways w
trix x
cy ility ity ty ly ally y
ize z
常用词及其编码表
附表二
常用词 编码 常用词 编码
a a in n
but b on o
can c am p
do d as q
when e for r
of f so s
and g the t
have h which u
I i whom v
not j who w
be k are x
is l by y
may m that z