中文词汇输入方法 本发明涉及一种中文词汇输入方法,尤其涉及一种可增加中文输入速度的中文词汇输入方法。
熟知的中文词汇输入方法中,使用者必须经由键盘来输入词汇中每一个文字的语音拼音,常用的语音拼音则包含注音符号或罗马拼音。例如,当使用注音符号来输入“中华民族”时,使用者必须依序输入“ㄓㄨㄥ”、“ㄇ一ㄅ”、由于相同的语音拼音可对应于不同的文字,如“ㄓㄨㄥ”可对应于“中”、“终”、“钟”等不同的文字,因此使用者还必须选择适当的文字。同样地,当使用罗马拼音来输入“中华民族”时,使用者必须依序输入“zhong”、“hua”、“min”、“zu”。由于相同的语音拼音可对应于不同的文字,如“zhong”可对应于“中”、“终”、“钟”等不同的文字,因此使用者还是必须选择适当的文字。熟知的中文词汇输入方法中,由于使用者必须完整输入每一个文字地语音拼音,并且还要选择适当的文字,因此使用者按键的次数很多而降低了中文输入的速度。
此外,熟知的中文手写输入识别系统中所使用的中文输入方法中,要输入的每个字都要书写,而每个字的书写及识别过程都需要一定时间,而且这样的中文手写输入识别系统要占用相当存储器空间,这不但会增加成本,而且随着词汇表中词汇的增加,识别系统的识别速度及识别率都会跟着下降。
因此,本发明的主要目的在于提供一种中文词汇输入方法,以增加中文输入的速度。
本发明提供了一种词汇输入方法,用来将一词汇输入一计算机,该计算机包含有:一存储器,用来存储程序与数据;一处理器,用来执行该存储器内的程序;一显示器,电连接于该处理器,用来输出显示;以及一输入装置,电连接于该处理器,用来供一使用者输入语音字母;该存储器内存有一词汇表,以及一词汇语音表,该词汇表内存有多个词汇,每一词汇为一由多个文字所组成的文字序列,该词汇语音表内含有该词汇表内每一词汇相对应的拼音序列,每一词汇的拼音序列依序含有该词汇的各个文字的语音拼音的一语音字母,每一文字的语音拼音包含一个或多个依序排列的语音字母,该方法至少包含下列步骤:
(1)利用该输入装置来输入一预定词汇的每一文字的语音拼音的一语音字母;以及
(2)利用该输入的语音字母来搜寻该词汇语音表以找出与该输入的语音字母相对应的拼音序列并形成一拼音序列集;以及
(3)找出与该新的拼音序列集内的各个拼音序列相对应的所有词汇并将其显示于该显示器上以供该使用者选择。
本发明还提供了一种词汇输入方法,用来将一词汇输入一计算机,该计算机包含有:一存储器,用来存储程序与数据;一处理器,用来执行该存储器内的程序;一显示器,电连接于该处理器,用来输出显示;以及一输入装置,电连接于该处理器,用来供一使用者输入语音字母;该存储器内存有一词汇表,以及一词汇语音表,该词汇表内存有多个词汇,每一词汇为一由多个文字所组成的文字序列,该词汇语音表内含有该词汇表内每一词汇相对应的拼音序列,每一词汇的拼音序列依序含有该词汇各个文字的语音拼音的第一个语音字母,每一文字的语音拼音包含一个或多个依序排列的语音字母,该方法至少包含下列步骤:
(1)利用该输入装置来输入一预定词汇的第一文字的语音拼音的第一个语音字母;
(2)利用该输入的语音字母来搜寻该词汇语音表,以找出在该词汇语音表中第一个语音拼音的第一个语音字母与该输入的语音字母相同的拼音序列,从而得到一拼音序列集;
(3)利用该输入装置来输入该预定词汇的下一文字的语音拼音的第一个语音字母;
(4)利用该输入的语音字母来搜寻该所得到的拼音序列集,以找出在该拼音序列中与该下一语音拼音相对应的语音拼音的第一个语音字母与该输入的语音字母相同的拼音序列以形成一新的拼音序列集;
(5)找出与该新的拼音序列集内的各个拼音序列相对应的所有词汇并将其显示于该显示器上以供该使用者选择;
(6)该使用者可重复步骤(3)至(5)以逐次减少该新的拼音序列集内所含的拼音序列,或是利用该输入装置从该显示器上所显示的词汇中选出该预定词汇。
图1为一使用本发明中文词汇输入方法的计算机的功能框图。
图2为本发明中文词汇输入方法的词汇表。
图3为本发明中文词汇输入方法的词汇语音表。
图4为本发明中文词汇输入方法的流程图。
图5与图6是本发明中文词汇输入方法来输入“中华民族”的示意图。
图7为本发明中文词汇输入方法与公知技术的比较图。
图8为本发明中文词汇输入方法与公知中文输入法对照表。
图中符号说明
12计算机 14存储器
16处理器 18显示器
20输入装置 22词汇表
24词汇语音表 26词汇
28拼音序列
请参考图1至图3。图1为一使用本发明中文词汇输入方法的计算机12的功能框图,图2和图3为本发明中文词汇输入方法的词汇表以及词汇语音表。计算机12包含有一存储器14用来存储程序与数据,一处理器16用来执行存储器14内的程序,一显示器18连接于处理器16,用来输出显示,以及一输入装置20连接至处理器16,用来供一使用者输入语音字母。存储器14内存有一词汇表22,以及一词汇语音表24。输入装置20可以是一个计算机键盘或者是可以配合后续进行识别的手写输入板。
如图2所示,词汇表22内存有多个词汇26,每一词汇26是由多个中文文字所组成。如图3所示,词汇语音表24包含有词汇表22内每一词汇26所对应的拼音序列28,每一词汇26的拼音序列28依序含有词汇26的各个文字的语音拼音的第一个语音字母,图3是仅以罗马拼音为例的拼音序列,而以注音符号所形成的拼音序列也可以相似的方式形成。不同的词汇26可对应于同一个拼音序列28。如城市、成事、程序、乘势等不同的词汇具有相同的拼音序列。
每一中文文字的语音拼音包含有一个或多个依序排列的语音字母,而每一中文文字的语音拼音所使用的语音字母可为注音符号字母与罗马拼音字母。当使用者利用罗马拼音字母来输入词汇“中华民族”时,“中华民族”的第一文字的语音拼音为“zhong”,第二文字的语音拼音为“hua”,第三文字的语音拼音为“min”,第四文字的语音拼音为“zu”,而“中华民族”的拼音序列为“zhmz”。
请参考图4。图4为本发明中文词汇输入方法的流程图10。中文词汇输入方法10包含有下列步骤:
步骤30:使用者利用输入装置20,如一键盘,来输入一预定词汇的第一文字的语音拼音的第一个语音字母;
步骤32:计算机12利用输入的语音字母来搜寻词汇语音表24以找出第一个语音拼音的第一个语音字母与使用者所输入的语音字母相同的拼音序列,以形成一拼音序列集;
步骤34:将该拼音序列集的每一个拼音序列所对应的所有词汇显示在显示器18上以供使用者选择;
步骤36:如果使用者利用输入装置20来在显示器18所显示的词汇中选出该预定词汇,则跳至步骤42;
步骤38:使用者利用输入装置20来输入该预定词汇的下一文字的语音拼音的第一个语音字母;
步骤40:计算机12利用使用者所输入的语音字母来搜寻在步骤32所形成的拼音序列集,以找出其下一语音拼音的第一个语音字母与使用者所输入的语音字母相同的所有拼音序列,以形成一新的拼音序列集,跳至步骤34;
步骤42:结束。
依此方法,使用者每次只需输入文字的语音拼音的第一个语音字母,而每次操作所产生的新的拼音序列集所包含的拼音序列将逐渐少于先前的拼音序列集,令使用者更方便选择。
请参考图5与图6。图5与图6是用来说明使用本发明中文词汇输入方法10来输入“中华民族”的过程。首先使用者利用输入装置20输入“中华民族”的第一文字的语音拼音“zhong”的第一个语音字母“z”,而当输入“z”后,显示器18上会显示所有词汇,其第一文字的语音拼音的第一个语音字母均为“z”,如图5所示。然后使用者输入“中华民族”的第二文字的语音拼音“hua”的第一个语音字母“h”,而当输入“h”后,显示器18上会显示所有词汇,其第一文字的语音拼音的第一个语音字母为“z”,并且第二文字的语音拼音的第一个语音字母“h”,如图3所示。此时,使用者就可以直接选择“中华民族”,而无须再输入“m”及“z”。
图7为本发明中文词汇输入方法与习知技术的比较图。利用已知技术输入“中华民族”时,使用者需输入“zhong”“hua”“min”“zu”。当使用者利用本发明中文词汇输入方法来输入中文时,使用者只需要输入每一个文字的语音拼音的第一个语音字母“zhmz”,并且经由显示在显示器18上的词汇来选出所要输入的词汇。有时候使用者不需将该词汇中所有文字的语音拼音的第一个语音字母输入,就可以直接从显示器18所显示的词汇中选出所要的词汇。如图5及图6所示,使用者只输入“zh”,便可以很快地从显示器18选出“中华民族”。因此大幅地减少了使用者按键的次数,而增加中文输入的速度。
请参考图8,图8为本发明中文词汇输入方法与已知中文输入法比较表。本发明中文词汇输入方法用在手写输入识别系统中尤其可以显示出其优点。已知中文输入方法用在手写输入识别系统中,平均输入一个字约需2.5秒,而且这种中文手写输入识别系统要占用相当存储器空间,通常制作15000字左右的已知中文手写输入识别系统约需1M的存储器空间,不但会增加成本,而且随着词汇表中词汇的增加,识别系统的识别速度及识别率都会跟着下降。而本发明中文词汇输入法用在手写输入识别的系统中,平均输入一个字约只需1秒,制作15000字左右的识别系统所占用的存储器空间只要100K,因此本发明在输入速度及占用存储器空间上都较已知技术要改善很多,也让使用者在输入词汇时更加方便。
相对于已知中文词汇输入方法,本发明中文词汇输入方法利用含有拼音序列的词汇语音表24,而拼音序列为词汇各个文字的语音拼音的第一个语音字母所组成。使用者只需要输入词汇每一个文字的语音拼音的第一个语音字母,就可以经由显示在显示器18上的词汇来选出所要输入的词汇。因此本发明大幅地减少了使用者按键的次数,而增加中文输入的速度。
以上所述仅为本发明的较佳实施例,凡在本发明的精神下所进行的修改替换均在本发明的保护范围之内。