标点符号转换方法及装置.pdf

上传人:1** 文档编号:1311664 上传时间:2018-04-14 格式:PDF 页数:11 大小:1.31MB
返回 下载 相关 举报
摘要
申请专利号:

CN201210200998.0

申请日:

2012.06.18

公开号:

CN103514145A

公开日:

2014.01.15

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/22申请日:20120618|||公开

IPC分类号:

G06F17/22

主分类号:

G06F17/22

申请人:

香港城市大学

发明人:

朱纯深; 郝天永

地址:

中国香港九龙

优先权:

专利代理机构:

隆天国际知识产权代理有限公司 72003

代理人:

章侃铱;张浴月

PDF下载: PDF下载
内容摘要

本发明涉及一种标点符号转换方法,应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,所述方法包括以下步骤:S1.查找所述文本中以第一语言和/或第二语言输入的标点符号;S2.判断查找到的所述标点符号是否需要转换;以及S3.根据预设的标点符号映射表,将需要转换的所述标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。本发明能够实现在多语言混合情况下对标点符号的简繁转换,解决了混合文本中标点符号被误转的问题,提高了转换效率,同时方便用户对比转换和结果。

权利要求书

1.  一种标点符号转换方法,应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,其中所述文本为选自中文文本和中文-非中文混合文本中的一种,所述第一语言和所述第三语言分别为选自简体中文和繁体中文中的一种,所述第二语言为选自非中文语言中的一种,所述方法包括以下步骤:
S1.查找所述文本中以第一语言和/或第二语言输入的标点符号;
S2.判断查找到的所述标点符号是否需要转换;以及
S3.根据预设的标点符号映射表,将需要转换的所述标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。

2.
  根据权利要求1所述的标点符号转换方法,其中,所述步骤S2具体包括:
S21.判断所述以第一语言和/或第二语言输入的标点符号是否全部为中文标点符号,如果是则转步骤S3,否则继续步骤S22;
S22.判断所述非中文标点符号间是否包含中文字符或中文-非中文混合字符,如果是则转步骤S3,否则仅转换所述中文标点符号,而保持所述非中文标点符号不变。

3.
  根据权利要求1所述的标点符号转换方法,其中,所述步骤S1之后、所述步骤S2之前还包括:
S11.对查找到的所述标点符号加以突出显示。

4.
  根据权利要求3所述的方法,其中,所述步骤S3之后还包括:
S4.在所述转换过程完成之后,判断是否对所述以第三语言输出的标点符号进行了修改且修改是否正确,如果是则确定是否清除所述突出显示。

5.
  根据权利要求1所述的方法,其中,所述预设的标点符号映射表用于存储所述文本中以第一语言和/或第二语言输入的标点符号与以第三语言输出的标点符号一一对应的映射关系,使所述以第一语言和/或第二语言输入的标点符号与所述以第三语言输出的标点符号相关联;则所述步骤S3根据所述映射关系实现对所述标点符号的转换。

6.
  一种标点符号转换装置,应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,其中所述 文本为选自中文文本和中文-非中文混合文本中的一种,所述第一语言和所述第三语言分别为选自简体中文和繁体中文中的一种,所述第二语言为选自非中文语言中的一种,所述装置包括:
查找模块,用于查找所述文本中以第一语言和/或第二语言输入的标点符号;
判断模块,用于判断查找到的所述标点符号是否需要转换;以及
转换模块,用于根据预设的标点符号映射表,将需要转换的所述标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。

7.
  根据权利要求6所述的标点符号转换装置,其中,所述判断模块包括:
标点判断单元,用于判断所述以第一语言和/或第二语言输入的标点符号是否全部为中文标点符号,如果是则通过所述转换模块进行转换;
字符判断单元,用于判断非中文标点符号间是否包含中文字符或中文-非中文混合字符,如果是则通过所述转换模块进行转换。

8.
  根据权利要求6所述的标点符号转换装置,其中,所述装置还包括:
标识模块,用于对查找到的所述标点符号加以突出显示。

9.
  根据权利要求8所述的标点符号转换装置,其中,所述装置还包括:
清除模块,用于在所述转换过程完成之后,判断是否对所述以第三语言输出的标点符号进行了修改且修改是否正确,如果是则确定是否清除所述突出显示。

10.
  根据权利要求6所述的标点符号转换装置,其中,所述预设的标点符号映射表用于存储所述文本中以第一语言和/或第二语言输入的标点符号与以第三语言输出的标点符号一一对应的映射关系,使所述以第一语言和/或第二语言输入的标点符号与所述以第三语言输出的标点符号相关联;则所述转换模块根据所述映射关系实现对所述标点符号的转换。

说明书

标点符号转换方法及装置
技术领域
本发明涉及标点符号处理技术,尤其涉及一种标点符号转换方法及装置。
背景技术
众所周知,目前使用的中文字体有两种,一种是在中国大陆和新加坡等地区使用的简体中文,另一种是在台湾、香港和澳门等地区使用的繁体中文。然而,由于简体中文和繁体中文之间的差异很大,因此,造成了使用这两种文字的用户在信息交流上的隔阂。为了消除这种隔阂,已经研制开发了一些简繁转换工具。通过这些简繁转换工具,可以很容易地实现简体中文和繁体中文之间的转换。此外,随着计算机技术的发展,在一些网站(例如,Google)或文字编辑软件(例如,微软的Microsoft Word)中都会附有这类的简繁转换工具。
虽然现有的简繁转换工具已经能够较为准确地实现文字间的简繁转换,但目前还没有一款软件能够实现对文本中较复杂的标点符号(例如,双引号)的简繁转换。此外,由于简体中文和繁体中文对标点符号的设置不同,导致了在进行简繁转换时,存在一些标点符号无法被转换或者被转换成乱码的情况,因此,仍需要用户重新对转换后的文本中的标点符号进行查找和判断并做出正确的转换。
另外,现有的简繁转换工具也无法实现对中文-非中文混合文本中的标点符号进行转换。因为在中文-非中文混合文本中,非中文文本(例如,英文文本)通常使用与中文文本(简体中文或繁体中文)不同的标点符号编码,因此,在转换过程中也同样会出现如上所述的无法转换或转换成乱码的情况,因此,为了保证整体的一致性,同样需要用户重新对转换后的文件中的标点符号进行查找和判断并做出正确的转换。
综上所述,由于现有技术还无法实现对标点符号的简繁转换,因此,用户仍需花费大量的时间对转换后的文件中的标点符号进行查找和判断并做出 正确的转换,因此,有必要提出改进的技术手段以解决此问题。
发明内容
鉴于上述现有技术的缺陷,本发明的主要目的在于提供一种标点符号转换方法及装置,以解决现有技术存在的上述问题。
本发明针对现有技术中存在的问题,提供一种标点符号转换方法及装置,能够在中文文本和中文-非中文混合文本中实现对标点符号的简繁转换,从而提高了转换效率。
为实现上述目的,本发明的实施例提供了一种标点符号转换方法,应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,其中所述文本为选自中文文本和中文-非中文混合文本中的一种,所述第一语言和所述第三语言分别为选自简体中文和繁体中文中的一种,所述第二语言为选自非中文语言中的一种,所述方法包括以下步骤:S1.查找所述文本中以第一语言和/或第二语言输入的标点符号;S2.判断查找到的所述标点符号是否需要转换;以及S3.根据预设的标点符号映射表,将需要转换的所述标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。
本发明的实施例还提供了一种标点符号转换装置,应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,其中所述文本为选自中文文本和中文-非中文混合文本中的一种,所述第一语言和所述第三语言分别为选自简体中文和繁体中文中的一种,所述第二语言为选自非中文语言中的一种,所述装置包括:查找模块,用于查找所述文本中以第一语言和/或第二语言输入的标点符号;判断模块,用于判断查找到的所述标点符号是否需要转换;以及转换模块,用于根据预设的标点符号映射表,将需要转换的所述标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。
综上所述,本发明的标点符号转换方法及装置能够实现在多种语言的混合情况下对标点符号的简繁转换,从而解决在混合文本中标点符号被误转的问题,并提高了转换效率;此外,还能够对文本中的标点符号加以突出显示,从而便于用户进行对比转换以及校验转换后的结果。
附图说明
图1为本发明标点符号转换方法的实施例流程图;
图2为本发明标点符号转换装置的实施例结构框图。
具体实施方式
下面将详细描述本发明的实施例。应当注意,这里描述的实施例只用于举例说明,并不用于限制本发明。
图1为本发明标点符号转换方法的实施例流程图。本实施例的标点符号转换方法应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,其中所述文本为选自中文文本和中文-非中文混合文本中的一种,所述第一语言和所述第三语言分别为选自简体中文和繁体中文中的一种,所述第二语言为选自非中文语言中的一种。如图所示,所述方法包括以下步骤S1、S2和S3。
S1.查找文本中以第一语言和/或第二语言输入的标点符号。
在一个实施例中,根据预设的规则,在文本中对以第一语言和/或第二语言输入的标点符号进行查找。这里,预设的规则是指第一语言和第二语言中所有标点符号对应的编码表,文本可以是中文文本(例如,简体中文文本或繁体中文文本),也可以是中文-非中文混合文本(例如,简体中文-英文、简体中文-德文、繁体中文-法文等);第一语言为选自简体中文和繁体中文中的一种,而第二语言为选自非中文语言(例如,英文、德文、法文等)中的一种。
在一个实施例中,在所述步骤S 1之后、所述步骤S2之前还包括步骤S11.对查找到的所述标点符号加以突出显示。具体而言,在一个实施例中,当查找到文本中以第一语言和/或第二语言输入的标点符号时,会通过例如弹出对话框的方式提示用户是否对查找到的标点符号加以突出显示,如果用户选择是,则自动将查找到的标点符号标识出颜色,所述颜色可以是例如红色、黄色、蓝色等。需要注意的是,对所查找到的标点符号加以突出显示的过程不仅限于“颜色”标识,也可以使用类似微软的Microsoft Word中的“批注” 模式来进行。通过上述突出显示,能够很容易地将文本中的标点符号与文字字符进行区分,使得标点符号能够很清楚地被显示,从而便于后续的判断、转换和校对。此外,突出显示不仅限于对查找到的标点符号来进行,参考上述内容,在一个实施例中,也可以在转换后的输出文本中对标点符号加以突出显示。
S2.判断查找到的标点符号是否需要转换。
在一个实施例中,步骤S2具体包括S21.判断以第一语言和/或第二语言输入的标点符号是否全部为中文标点符号,如果是则转步骤S3,否则继续步骤S22;S22.判断非中文标点符号间是否包含中文字符或中文-非中文混合字符,如果是则转步骤S3,否则仅转换中文标点符号,而保持非中文标点符号不变。
参考上述内容,在一个实施例中,可通过以下步骤对所查找到的标点符号进行判断,以确定是否需要进行转换。首先,判断所查找到的标点符号是否全部为中文标点符号(即,简体标点符号或繁体标点符号),如果是,则根据预设的规则将上述以第一语言和/或第二语言输入的中文标点符号转换成以第三语言输出的中文标点符号;如果同时包含中文标点符号和非中文标点符号,则保持其中的非中文标点符号不变,而将中文标点符号转换成以第三语言输出的中文标点符号。这里,第三语言为选自简体中文和繁体中文中的一种。接续,对上述未被转换的非中文标点符号进行判断,如果非中文标点符号中仅包含中文字符(例如,简体或繁体中文的单字、词组或句子等),则将非中文标点符号转换成以第三语言输出的中文标点符号;如果非中文标点符号中仅包含非中文字符(例如,英文单词、词组或句子等),则不需要对其进行转换,即保持非中文标点符号不变;如果非中文标点符号中同时包含有中文字符和非中文字符,则与上述仅包含中文字符的情况一样,将非中文标点符号转换成以第三语言输出的中文标点符号。也就是说,只有当非中文标点符号中仅包含非中文字符时才保持所述非中文标点符号不变,除此之外的其他情况下都需要将非中文标点符号转换成中文标点符号。此外,在一个实施例中,用户也可以直接选择转换所有标点符号。
S3.根据预设的标点符号映射表,将待转换的标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。
在一个实施例中,根据预设的标点符号映射表,对待转换的标点符号进行转换。这里所说的标点符号映射表是一张存储有文本中以第一语言和/或第二语言输入的标点符号与以第三语言输出的标点符号一一对应的映射关系的表,使得以第一语言和/或第二语言输入的标点符号与以第三语言输出的标点符号相关联;从而能够根据所述映射关系实现对所述标点符号的转换。具体而言,在一个实施例中,简体中文和/或非中文与繁体中文标点符号一一对应的映射关系可以如下表1所示(其中包括了简体繁体中文转换中单引号与双引号的互相转换),表1中的内容仅用于举例说明,而并非用于限制本发明。
表1

需要注意的是:简体中文文本的通例为双引号在外层,单引号在内层;而繁体中文文本的通例为单引号在外层,双引号在内层。本系统以此为根据,简体中文文本中凡在外层的无论是单引号还是双引号,一律按繁体通例转为单引号,而在内层的引号一律转为双引号。反之亦然。在表1中,为竖排双引号,在竖排文本中使用;为竖排单引号,在竖排文本中使用。
参考上述内容,在一个实施例中,可根据上述映射关系将标点符号映射表分为以下两种:一种是用于存储以第一语言和/或第二语言输入的“单字符”(例如逗号、句号、冒号等)标点符号与以第三语言输出的标点符号(例如,与,或,与,)一一对应的映射关系的“单字符”标点符号映射表,另一种是用于存储以第一语言和/或第二语言输入的“双字符”(即,成对使用的字符,例如单引号、双引号等)标点符号与以第三语言输出的标点符号(例如“”与『』或‘’与「」)一一对应的映射关系的“双字符”标点符号映射表。
此外,现有技术的一些网站(例如,Google)或文字编辑软件(例如,微软的Microsoft Word)中附带的简繁转换工具已经能够直接利用标点符号 映射表自动地实现“单字符”标点符号从简体到繁体或从繁体到简体的转换,即“静默”转换,该转换的准确率较高,且通常不需要后续的校对。
然而,对“双字符”标点符号而言,由于其本身的复杂性,目前还没有任何软件能够实现对其的繁简转换,而本发明则可以通过步骤S2中对“双字符”标点符号的位置和其包括的内容的判断来实现“双字符”标点符号从简体到繁体或从繁体到简体的转换。具体而言,例如,在将简体中文-英文混合文本转换成繁体中文-英文混合文本的转换过程中,以英文的双引号(″″)为例,当查找到双引号的第一部分时,首先,将其与文本内容相关联以确定其为左引号还是右引号;其次,根据文本内容查找该与双引号同一层最接近的第二部分(即,对应于上述第一部分的右引号或左引号),通过这种方法可以判断双引号的第二部分的位置,从而使左引号和右引号相关联;接续,判断左引号和右引号之间的文本内容是否全部为中文字符或中英混合字符,如果是中英混合字符,则将英文的双引号转换成繁体中文的单引号(「」)或简体中文的双引号(“”),否则保持英文的双引号不变。需要注意的是,当英文以单引号括双引号时,转换成简体中文应变为以双引号括单引号;而当英文以双引号括单引号时,转换成繁体中文应变为以单引号括双引号。
在一个实施例中,步骤S3之后还可以包括:
S4.在所述转换过程完成之后,判断是否对所述以第三语言输出的标点符号进行了修改且修改是否正确,如果是则确定是否清除所述突出显示。
在一个实施例中,当转换过程完成之后,系统可根据预设的规则自动判断转换是否已经完成且是否转换正确,也就是说,判断是否将所有已突出显示的标点符号进行了正确转换,如果是则提醒用户确定是否清除突出显示;或者,用户也可以根据突出显示对转换后的标点符号进行校对或修改,如果确定所有的标点符号都已经被转换,则可以通过点击系统提供的清除按钮(例如,接受对文本的所有格式更改)来清除突出显示,从而使转换后的文本与转换前的文本在格式上(例如,字体、文本颜色等)是一致的;这里所述清除按钮不仅限于一次性清除所有格式更改的方式,还可以通过例如接受并移动到下一条的方式来清除突出显示,这样有助于用户按照一定的顺序进行,不会发生错改或漏改的现象,从而使校对后的文本更加准确、完整。此外,对于突出显示的清除不限于以上的方法,例如,用户也可以手动清除突出显 示,或者也可以直接选择在转换中不突出显示等等。
然而,本发明并不仅限于从简体中文或简体中文-非中文混合文本到繁体中文或繁体中文-非中文混合文本的转换过程,根据上述实例所述的方法,同样可以实现从繁体中文或繁体中文-非中文混合文本到简体中文或简体中文-非中文混合文本的转换过程,故在此不再进行赘述。
图2为本发明标点符号转换装置的实施例结构框图。本实施例的标点符号转换装置同样应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,其中所述文本为选自中文文本和中文-非中文混合文本中的一种,所述第一语言和所述第三语言分别为选自简体中文和繁体中文中的一种,所述第二语言为选自非中文语言中的一种。如图所示,所述装置包括:查找模块11,用于查找文本中以第一语言和/或第二语言输入的标点符号;判断模块12,用于判断查找到的标点符号是否需要转换;以及转换模块13,用于根据预设的标点符号映射表,将待转换的标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。
参考上述内容,在一个实施例中,根据预设的规则,查找模块11在文本中对以第一语言和/或第二语言输入的标点符号进行查找。这里所说的预设规则和文本与上述标点符号转换方法中描述的文本相同,故在此不再进行赘述。在一个实施例中,所述装置还包括标识模块,用于对查找到的标点符号加以突出显示。具体而言,在一个实施例中,当查找模块11查找到文本中以第一语言和/或第二语言输入的标点符号时,会通过例如弹出对话框的方式提示用户是否对查找到的标点符号加以突出显示,如果用户选择是,则自动将查找到的标点符号标识出颜色,所述颜色可以是例如红色、黄色、蓝色等。需要注意的是,对所查找到的标点符号加以突出显示的过程不仅限于“颜色”标识,也可以使用类似微软的Microsoft Word中的“批注”模式来进行。通过上述突出显示,能够很容易地将文本中的标点符号与文字字符进行区分,使得标点符号能够很清楚地被显示,从而便于后续的判断、转换和校对。
接续,在一个实施例中,通过判断模块12来确定是否需要对查找模块11查找到的标点符号进行转换。具体而言,在一个实施例中,判断模块12具体包括:标点判断单元121,用于判断所述以第一语言和/或第二语言输入 的标点符号是否全部为中文标点符号,如果是则通过转换模块13进行转换;字符判断单元123,用于判断非中文标点符号间是否包含中文字符或中文-非中文混合字符,如果是则通过转换模块13进行转换,否则仅通过转换模块13来转换中文标点符号,而保持非中文标点符号不变。
接续,在一个实施例中,转换模块13根据预设的标点符号映射表,对待转换的标点符号进行转换。这里所说的标点符号映射表是一张存储有文本中以第一语言和/或第二语言输入的标点符号与以第三语言输出的标点符号一一对应的映射关系的表,使得以第一语言和/或第二语言输入的标点符号与以第三语言输出的标点符号相关联;从而能够根据所述映射关系实现对所述标点符号的转换。具体而言,在一个实施例中,简体中文和/或非中文与繁体中文标点符号一一对应的映射关系可以如上表1所示,表1中的内容仅用于举例说明,而并非用于限制本发明。
此外,在一个实施例中,本实施例的标点符号转换装置还包括清除模块,用于在所述转换过程完成之后,判断是否对所述以第三语言输出的标点符号进行了修改且修改是否正确,如果是则确定是否清除所述突出显示。
具体而言,在一个实施例中,当转换过程完成之后,判断模块12可根据预设的规则自动判断转换是否已经完成且是否转换正确,也就是说,判断是否将所有已突出显示的标点符号进行了正确转换,如果是则提醒用户确定是否通过清除模块来清除突出显示;或者,用户也可以根据突出显示对转换后的标点符号进行校对或修改,如果确定所有的标点符号都已经被转换,则可以通过点击系统提供的清除按钮(例如,接受对文本的所有格式更改)来清除突出显示,从而使转换后的文本与转换前的文本在格式上(例如,字体、文本颜色等)是一致的;这里所述清除按钮不仅限于一次性清除所有格式更改的方式,还可以通过例如接受并移动到下一条的方式来清除突出显示,这样有助于用户按照一定的顺序进行,不会发生错改或漏改的现象,从而使校对后的文本更加准确、完整。此外,对于突出显示的清除不限于以上的方法,例如,用户也可以手动清除突出显示,或者也可以直接选择在转换中不使用标识模块加以突出显示等等。
综上所述,本发明的标点符号转换方法及装置能够实现对标点符号的简繁转换,特别是对“双字符”标点符号的繁简转换,从而提高了转换效率, 节省了用户对文本通篇查找和修改的时间;此外,还能够对文本中的标点符号加以突出显示,从而便于用户后续的校对。
虽然已参照典型实施例描述了本发明,但应当理解,所用的术语是说明和示例性、而非限制性的术语。由于本发明能够以多种形式具体实施而不脱离发明的精神或实质,所以应当理解,上述实施例不限于任何前述的细节,而应在随附权利要求所限定的精神和范围内广泛地解释,因此落入权利要求或其等效范围内的全部变化和改型都应为随附权利要求所涵盖。

标点符号转换方法及装置.pdf_第1页
第1页 / 共11页
标点符号转换方法及装置.pdf_第2页
第2页 / 共11页
标点符号转换方法及装置.pdf_第3页
第3页 / 共11页
点击查看更多>>
资源描述

《标点符号转换方法及装置.pdf》由会员分享,可在线阅读,更多相关《标点符号转换方法及装置.pdf(11页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN103514145A43申请公布日20140115CN103514145A21申请号201210200998022申请日20120618G06F17/2220060171申请人香港城市大学地址中国香港九龙72发明人朱纯深郝天永74专利代理机构隆天国际知识产权代理有限公司72003代理人章侃铱张浴月54发明名称标点符号转换方法及装置57摘要本发明涉及一种标点符号转换方法,应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,所述方法包括以下步骤S1查找所述文本中以第一语言和/或第二语言输入的标点符号;S2判断查找到的所述标点符号是否需要。

2、转换;以及S3根据预设的标点符号映射表,将需要转换的所述标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。本发明能够实现在多语言混合情况下对标点符号的简繁转换,解决了混合文本中标点符号被误转的问题,提高了转换效率,同时方便用户对比转换和结果。51INTCL权利要求书2页说明书6页附图2页19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书6页附图2页10申请公布号CN103514145ACN103514145A1/2页21一种标点符号转换方法,应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,其中所述文本为选自。

3、中文文本和中文非中文混合文本中的一种,所述第一语言和所述第三语言分别为选自简体中文和繁体中文中的一种,所述第二语言为选自非中文语言中的一种,所述方法包括以下步骤S1查找所述文本中以第一语言和/或第二语言输入的标点符号;S2判断查找到的所述标点符号是否需要转换;以及S3根据预设的标点符号映射表,将需要转换的所述标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。2根据权利要求1所述的标点符号转换方法,其中,所述步骤S2具体包括S21判断所述以第一语言和/或第二语言输入的标点符号是否全部为中文标点符号,如果是则转步骤S3,否则继续步骤S22;S22判断所述非中文标点符号间是否包。

4、含中文字符或中文非中文混合字符,如果是则转步骤S3,否则仅转换所述中文标点符号,而保持所述非中文标点符号不变。3根据权利要求1所述的标点符号转换方法,其中,所述步骤S1之后、所述步骤S2之前还包括S11对查找到的所述标点符号加以突出显示。4根据权利要求3所述的方法,其中,所述步骤S3之后还包括S4在所述转换过程完成之后,判断是否对所述以第三语言输出的标点符号进行了修改且修改是否正确,如果是则确定是否清除所述突出显示。5根据权利要求1所述的方法,其中,所述预设的标点符号映射表用于存储所述文本中以第一语言和/或第二语言输入的标点符号与以第三语言输出的标点符号一一对应的映射关系,使所述以第一语言和/。

5、或第二语言输入的标点符号与所述以第三语言输出的标点符号相关联;则所述步骤S3根据所述映射关系实现对所述标点符号的转换。6一种标点符号转换装置,应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,其中所述文本为选自中文文本和中文非中文混合文本中的一种,所述第一语言和所述第三语言分别为选自简体中文和繁体中文中的一种,所述第二语言为选自非中文语言中的一种,所述装置包括查找模块,用于查找所述文本中以第一语言和/或第二语言输入的标点符号;判断模块,用于判断查找到的所述标点符号是否需要转换;以及转换模块,用于根据预设的标点符号映射表,将需要转换的所述标点符号转换。

6、成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。7根据权利要求6所述的标点符号转换装置,其中,所述判断模块包括标点判断单元,用于判断所述以第一语言和/或第二语言输入的标点符号是否全部为中文标点符号,如果是则通过所述转换模块进行转换;字符判断单元,用于判断非中文标点符号间是否包含中文字符或中文非中文混合字符,如果是则通过所述转换模块进行转换。8根据权利要求6所述的标点符号转换装置,其中,所述装置还包括标识模块,用于对查找到的所述标点符号加以突出显示。9根据权利要求8所述的标点符号转换装置,其中,所述装置还包括权利要求书CN103514145A2/2页3清除模块,用于在所述转换过程完成。

7、之后,判断是否对所述以第三语言输出的标点符号进行了修改且修改是否正确,如果是则确定是否清除所述突出显示。10根据权利要求6所述的标点符号转换装置,其中,所述预设的标点符号映射表用于存储所述文本中以第一语言和/或第二语言输入的标点符号与以第三语言输出的标点符号一一对应的映射关系,使所述以第一语言和/或第二语言输入的标点符号与所述以第三语言输出的标点符号相关联;则所述转换模块根据所述映射关系实现对所述标点符号的转换。权利要求书CN103514145A1/6页4标点符号转换方法及装置技术领域0001本发明涉及标点符号处理技术,尤其涉及一种标点符号转换方法及装置。背景技术0002众所周知,目前使用的中。

8、文字体有两种,一种是在中国大陆和新加坡等地区使用的简体中文,另一种是在台湾、香港和澳门等地区使用的繁体中文。然而,由于简体中文和繁体中文之间的差异很大,因此,造成了使用这两种文字的用户在信息交流上的隔阂。为了消除这种隔阂,已经研制开发了一些简繁转换工具。通过这些简繁转换工具,可以很容易地实现简体中文和繁体中文之间的转换。此外,随着计算机技术的发展,在一些网站(例如,GOOGLE)或文字编辑软件(例如,微软的MICROSOFTWORD)中都会附有这类的简繁转换工具。0003虽然现有的简繁转换工具已经能够较为准确地实现文字间的简繁转换,但目前还没有一款软件能够实现对文本中较复杂的标点符号(例如,双。

9、引号)的简繁转换。此外,由于简体中文和繁体中文对标点符号的设置不同,导致了在进行简繁转换时,存在一些标点符号无法被转换或者被转换成乱码的情况,因此,仍需要用户重新对转换后的文本中的标点符号进行查找和判断并做出正确的转换。0004另外,现有的简繁转换工具也无法实现对中文非中文混合文本中的标点符号进行转换。因为在中文非中文混合文本中,非中文文本(例如,英文文本)通常使用与中文文本(简体中文或繁体中文)不同的标点符号编码,因此,在转换过程中也同样会出现如上所述的无法转换或转换成乱码的情况,因此,为了保证整体的一致性,同样需要用户重新对转换后的文件中的标点符号进行查找和判断并做出正确的转换。0005综。

10、上所述,由于现有技术还无法实现对标点符号的简繁转换,因此,用户仍需花费大量的时间对转换后的文件中的标点符号进行查找和判断并做出正确的转换,因此,有必要提出改进的技术手段以解决此问题。发明内容0006鉴于上述现有技术的缺陷,本发明的主要目的在于提供一种标点符号转换方法及装置,以解决现有技术存在的上述问题。0007本发明针对现有技术中存在的问题,提供一种标点符号转换方法及装置,能够在中文文本和中文非中文混合文本中实现对标点符号的简繁转换,从而提高了转换效率。0008为实现上述目的,本发明的实施例提供了一种标点符号转换方法,应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标。

11、点符号的转换过程中,其中所述文本为选自中文文本和中文非中文混合文本中的一种,所述第一语言和所述第三语言分别为选自简体中文和繁体中文中的一种,所述第二语言为选自非中文语言中的一种,所述方法包括以下步骤S1查找所述文本中以第一语言和/或第二语言输入的标点符号;S2判断查找到的所述标点符号是否需要转换;以及S3根据预设的标点符号映射表,将需要转换的所述标点符号转换成以第三语言输出的标点符号,并保持不需要转说明书CN103514145A2/6页5换的标点符号不变。0009本发明的实施例还提供了一种标点符号转换装置,应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换。

12、过程中,其中所述文本为选自中文文本和中文非中文混合文本中的一种,所述第一语言和所述第三语言分别为选自简体中文和繁体中文中的一种,所述第二语言为选自非中文语言中的一种,所述装置包括查找模块,用于查找所述文本中以第一语言和/或第二语言输入的标点符号;判断模块,用于判断查找到的所述标点符号是否需要转换;以及转换模块,用于根据预设的标点符号映射表,将需要转换的所述标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。0010综上所述,本发明的标点符号转换方法及装置能够实现在多种语言的混合情况下对标点符号的简繁转换,从而解决在混合文本中标点符号被误转的问题,并提高了转换效率;此外,还能。

13、够对文本中的标点符号加以突出显示,从而便于用户进行对比转换以及校验转换后的结果。附图说明0011图1为本发明标点符号转换方法的实施例流程图;0012图2为本发明标点符号转换装置的实施例结构框图。具体实施方式0013下面将详细描述本发明的实施例。应当注意,这里描述的实施例只用于举例说明,并不用于限制本发明。0014图1为本发明标点符号转换方法的实施例流程图。本实施例的标点符号转换方法应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,其中所述文本为选自中文文本和中文非中文混合文本中的一种,所述第一语言和所述第三语言分别为选自简体中文和繁体中文中的一种,。

14、所述第二语言为选自非中文语言中的一种。如图所示,所述方法包括以下步骤S1、S2和S3。0015S1查找文本中以第一语言和/或第二语言输入的标点符号。0016在一个实施例中,根据预设的规则,在文本中对以第一语言和/或第二语言输入的标点符号进行查找。这里,预设的规则是指第一语言和第二语言中所有标点符号对应的编码表,文本可以是中文文本(例如,简体中文文本或繁体中文文本),也可以是中文非中文混合文本(例如,简体中文英文、简体中文德文、繁体中文法文等);第一语言为选自简体中文和繁体中文中的一种,而第二语言为选自非中文语言(例如,英文、德文、法文等)中的一种。0017在一个实施例中,在所述步骤S1之后、所。

15、述步骤S2之前还包括步骤S11对查找到的所述标点符号加以突出显示。具体而言,在一个实施例中,当查找到文本中以第一语言和/或第二语言输入的标点符号时,会通过例如弹出对话框的方式提示用户是否对查找到的标点符号加以突出显示,如果用户选择是,则自动将查找到的标点符号标识出颜色,所述颜色可以是例如红色、黄色、蓝色等。需要注意的是,对所查找到的标点符号加以突出显示的过程不仅限于“颜色”标识,也可以使用类似微软的MICROSOFTWORD中的“批注”模式来说明书CN103514145A3/6页6进行。通过上述突出显示,能够很容易地将文本中的标点符号与文字字符进行区分,使得标点符号能够很清楚地被显示,从而便于。

16、后续的判断、转换和校对。此外,突出显示不仅限于对查找到的标点符号来进行,参考上述内容,在一个实施例中,也可以在转换后的输出文本中对标点符号加以突出显示。0018S2判断查找到的标点符号是否需要转换。0019在一个实施例中,步骤S2具体包括S21判断以第一语言和/或第二语言输入的标点符号是否全部为中文标点符号,如果是则转步骤S3,否则继续步骤S22;S22判断非中文标点符号间是否包含中文字符或中文非中文混合字符,如果是则转步骤S3,否则仅转换中文标点符号,而保持非中文标点符号不变。0020参考上述内容,在一个实施例中,可通过以下步骤对所查找到的标点符号进行判断,以确定是否需要进行转换。首先,判断。

17、所查找到的标点符号是否全部为中文标点符号(即,简体标点符号或繁体标点符号),如果是,则根据预设的规则将上述以第一语言和/或第二语言输入的中文标点符号转换成以第三语言输出的中文标点符号;如果同时包含中文标点符号和非中文标点符号,则保持其中的非中文标点符号不变,而将中文标点符号转换成以第三语言输出的中文标点符号。这里,第三语言为选自简体中文和繁体中文中的一种。接续,对上述未被转换的非中文标点符号进行判断,如果非中文标点符号中仅包含中文字符(例如,简体或繁体中文的单字、词组或句子等),则将非中文标点符号转换成以第三语言输出的中文标点符号;如果非中文标点符号中仅包含非中文字符(例如,英文单词、词组或句。

18、子等),则不需要对其进行转换,即保持非中文标点符号不变;如果非中文标点符号中同时包含有中文字符和非中文字符,则与上述仅包含中文字符的情况一样,将非中文标点符号转换成以第三语言输出的中文标点符号。也就是说,只有当非中文标点符号中仅包含非中文字符时才保持所述非中文标点符号不变,除此之外的其他情况下都需要将非中文标点符号转换成中文标点符号。此外,在一个实施例中,用户也可以直接选择转换所有标点符号。0021S3根据预设的标点符号映射表,将待转换的标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。0022在一个实施例中,根据预设的标点符号映射表,对待转换的标点符号进行转换。这里所说。

19、的标点符号映射表是一张存储有文本中以第一语言和/或第二语言输入的标点符号与以第三语言输出的标点符号一一对应的映射关系的表,使得以第一语言和/或第二语言输入的标点符号与以第三语言输出的标点符号相关联;从而能够根据所述映射关系实现对所述标点符号的转换。具体而言,在一个实施例中,简体中文和/或非中文与繁体中文标点符号一一对应的映射关系可以如下表1所示(其中包括了简体繁体中文转换中单引号与双引号的互相转换),表1中的内容仅用于举例说明,而并非用于限制本发明。0023表1说明书CN103514145A4/6页700240025需要注意的是简体中文文本的通例为双引号在外层,单引号在内层;而繁体中文文本的通。

20、例为单引号在外层,双引号在内层。本系统以此为根据,简体中文文本中凡在外层的无论是单引号还是双引号,一律按繁体通例转为单引号,而在内层的引号一律转为双引号。反之亦然。在表1中,为竖排双引号,在竖排文本中使用;为竖排单引号,在竖排文本中使用。0026参考上述内容,在一个实施例中,可根据上述映射关系将标点符号映射表分为以下两种一种是用于存储以第一语言和/或第二语言输入的“单字符”(例如逗号、句号、冒号等)标点符号与以第三语言输出的标点符号(例如,与,或,与,)一一对应的映射关系的“单字符”标点符号映射表,另一种是用于存储以第一语言和/或第二语言输入的“双字符”(即,成对使用的字符,例如单引号、双引号。

21、等)标点符号与以第三语言输出的标点符号(例如“”与或与)一一对应的映射关系的“双字符”标点符号映射表。0027此外,现有技术的一些网站(例如,GOOGLE)或文字编辑软件(例如,微软的MICROSOFTWORD)中附带的简繁转换工具已经能够直接利用标点符号映射表自动地实现“单字符”标点符号从简体到繁体或从繁体到简体的转换,即“静默”转换,该转换的准确率较高,且通常不需要后续的校对。0028然而,对“双字符”标点符号而言,由于其本身的复杂性,目前还没有任何软件能够实现对其的繁简转换,而本发明则可以通过步骤S2中对“双字符”标点符号的位置和其包括的内容的判断来实现“双字符”标点符号从简体到繁体或从。

22、繁体到简体的转换。具体而言,例如,在将简体中文英文混合文本转换成繁体中文英文混合文本的转换过程中,以英文的双引号()为例,当查找到双引号的第一部分时,首先,将其与文本内容相关联以确定其为左引号还是右引号;其次,根据文本内容查找该与双引号同一层最接近的第二部分(即,对应于上述第一部分的右引号或左引号),通过这种方法可以判断双引号的第二部分的位置,从而使左引号和右引号相关联;接续,判断左引号和右引号之间的文本内容是否全部为中文字符或中英混合字符,如果是中英混合字符,则将英文的双引号转换成繁体中文的单引号()或简体中文的双引号(“”),否则保持英文的双引号不变。需要注意的是,当英文以单引号括双引号时。

23、,转换成简体中文应变为以双引号括单引号;而当英文以双引号括单引号时,转换成繁体中文应变为以单引号括双引号。0029在一个实施例中,步骤S3之后还可以包括0030S4在所述转换过程完成之后,判断是否对所述以第三语言输出的标点符号进行了修改且修改是否正确,如果是则确定是否清除所述突出显示。0031在一个实施例中,当转换过程完成之后,系统可根据预设的规则自动判断转换是说明书CN103514145A5/6页8否已经完成且是否转换正确,也就是说,判断是否将所有已突出显示的标点符号进行了正确转换,如果是则提醒用户确定是否清除突出显示;或者,用户也可以根据突出显示对转换后的标点符号进行校对或修改,如果确定所。

24、有的标点符号都已经被转换,则可以通过点击系统提供的清除按钮(例如,接受对文本的所有格式更改)来清除突出显示,从而使转换后的文本与转换前的文本在格式上(例如,字体、文本颜色等)是一致的;这里所述清除按钮不仅限于一次性清除所有格式更改的方式,还可以通过例如接受并移动到下一条的方式来清除突出显示,这样有助于用户按照一定的顺序进行,不会发生错改或漏改的现象,从而使校对后的文本更加准确、完整。此外,对于突出显示的清除不限于以上的方法,例如,用户也可以手动清除突出显示,或者也可以直接选择在转换中不突出显示等等。0032然而,本发明并不仅限于从简体中文或简体中文非中文混合文本到繁体中文或繁体中文非中文混合文。

25、本的转换过程,根据上述实例所述的方法,同样可以实现从繁体中文或繁体中文非中文混合文本到简体中文或简体中文非中文混合文本的转换过程,故在此不再进行赘述。0033图2为本发明标点符号转换装置的实施例结构框图。本实施例的标点符号转换装置同样应用于将文本中以第一语言和/或第二语言输入的标点符号转换成以第三语言输出的标点符号的转换过程中,其中所述文本为选自中文文本和中文非中文混合文本中的一种,所述第一语言和所述第三语言分别为选自简体中文和繁体中文中的一种,所述第二语言为选自非中文语言中的一种。如图所示,所述装置包括查找模块11,用于查找文本中以第一语言和/或第二语言输入的标点符号;判断模块12,用于判断。

26、查找到的标点符号是否需要转换;以及转换模块13,用于根据预设的标点符号映射表,将待转换的标点符号转换成以第三语言输出的标点符号,并保持不需要转换的标点符号不变。0034参考上述内容,在一个实施例中,根据预设的规则,查找模块11在文本中对以第一语言和/或第二语言输入的标点符号进行查找。这里所说的预设规则和文本与上述标点符号转换方法中描述的文本相同,故在此不再进行赘述。在一个实施例中,所述装置还包括标识模块,用于对查找到的标点符号加以突出显示。具体而言,在一个实施例中,当查找模块11查找到文本中以第一语言和/或第二语言输入的标点符号时,会通过例如弹出对话框的方式提示用户是否对查找到的标点符号加以突。

27、出显示,如果用户选择是,则自动将查找到的标点符号标识出颜色,所述颜色可以是例如红色、黄色、蓝色等。需要注意的是,对所查找到的标点符号加以突出显示的过程不仅限于“颜色”标识,也可以使用类似微软的MICROSOFTWORD中的“批注”模式来进行。通过上述突出显示,能够很容易地将文本中的标点符号与文字字符进行区分,使得标点符号能够很清楚地被显示,从而便于后续的判断、转换和校对。0035接续,在一个实施例中,通过判断模块12来确定是否需要对查找模块11查找到的标点符号进行转换。具体而言,在一个实施例中,判断模块12具体包括标点判断单元121,用于判断所述以第一语言和/或第二语言输入的标点符号是否全部为。

28、中文标点符号,如果是则通过转换模块13进行转换;字符判断单元123,用于判断非中文标点符号间是否包含中文字符或中文非中文混合字符,如果是则通过转换模块13进行转换,否则仅通过转换模块13来转换中文标点符号,而保持非中文标点符号不变。0036接续,在一个实施例中,转换模块13根据预设的标点符号映射表,对待转换的标说明书CN103514145A6/6页9点符号进行转换。这里所说的标点符号映射表是一张存储有文本中以第一语言和/或第二语言输入的标点符号与以第三语言输出的标点符号一一对应的映射关系的表,使得以第一语言和/或第二语言输入的标点符号与以第三语言输出的标点符号相关联;从而能够根据所述映射关系实。

29、现对所述标点符号的转换。具体而言,在一个实施例中,简体中文和/或非中文与繁体中文标点符号一一对应的映射关系可以如上表1所示,表1中的内容仅用于举例说明,而并非用于限制本发明。0037此外,在一个实施例中,本实施例的标点符号转换装置还包括清除模块,用于在所述转换过程完成之后,判断是否对所述以第三语言输出的标点符号进行了修改且修改是否正确,如果是则确定是否清除所述突出显示。0038具体而言,在一个实施例中,当转换过程完成之后,判断模块12可根据预设的规则自动判断转换是否已经完成且是否转换正确,也就是说,判断是否将所有已突出显示的标点符号进行了正确转换,如果是则提醒用户确定是否通过清除模块来清除突出。

30、显示;或者,用户也可以根据突出显示对转换后的标点符号进行校对或修改,如果确定所有的标点符号都已经被转换,则可以通过点击系统提供的清除按钮(例如,接受对文本的所有格式更改)来清除突出显示,从而使转换后的文本与转换前的文本在格式上(例如,字体、文本颜色等)是一致的;这里所述清除按钮不仅限于一次性清除所有格式更改的方式,还可以通过例如接受并移动到下一条的方式来清除突出显示,这样有助于用户按照一定的顺序进行,不会发生错改或漏改的现象,从而使校对后的文本更加准确、完整。此外,对于突出显示的清除不限于以上的方法,例如,用户也可以手动清除突出显示,或者也可以直接选择在转换中不使用标识模块加以突出显示等等。0。

31、039综上所述,本发明的标点符号转换方法及装置能够实现对标点符号的简繁转换,特别是对“双字符”标点符号的繁简转换,从而提高了转换效率,节省了用户对文本通篇查找和修改的时间;此外,还能够对文本中的标点符号加以突出显示,从而便于用户后续的校对。0040虽然已参照典型实施例描述了本发明,但应当理解,所用的术语是说明和示例性、而非限制性的术语。由于本发明能够以多种形式具体实施而不脱离发明的精神或实质,所以应当理解,上述实施例不限于任何前述的细节,而应在随附权利要求所限定的精神和范围内广泛地解释,因此落入权利要求或其等效范围内的全部变化和改型都应为随附权利要求所涵盖。说明书CN103514145A1/2页10图1说明书附图CN103514145A102/2页11图2说明书附图CN103514145A11。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1