一种纸质稿件转换为网络文本页面的方法及系统.pdf

上传人:Y0****01 文档编号:1301944 上传时间:2018-04-14 格式:PDF 页数:8 大小:534.29KB
返回 下载 相关 举报
摘要
申请专利号:

CN201611271081.4

申请日:

2016.12.23

公开号:

CN106844567A

公开日:

2017.06.13

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):G06F 17/30申请日:20161223|||公开

IPC分类号:

G06F17/30; G06K9/34; H04N1/04

主分类号:

G06F17/30

申请人:

《中国医药科学》杂志社有限公司

发明人:

詹洪春

地址:

100012 北京市朝阳区北苑东路19号院铁建广场3号楼612

优先权:

专利代理机构:

济宁宏科利信专利代理事务所 37217

代理人:

樊嵩

PDF下载: PDF下载
内容摘要

本发明提供了一种纸质稿件转换为网络文本页面的方法及系统,首先通过一扫面设备扫描纸质稿件的内容形成位图文件,并通过文字处理软件将位图文件转换为电子文本文件,再通过网页编辑器将电子文本文件读取到的文字数据进行填充到网页中形成初步的网络文本。通过一连接自动筛选设备在电子文本文件中查找筛选出需要建立超链接的字段,通过该字段的属性及像素在初步形成的网络文本中查找到该字段,并通过网页编辑器添加相应的超链接,形成带超链接的网络文本页面。本发明将纸质稿件转换为网络文本页面的效率高并且能够自动生成超链接,标题及文字能够矢量改变,方便实用。

权利要求书

1.一种纸质稿件转换为网络文本页面的方法,其特征在于,包括如下步骤:
步骤一:通过图像扫描设备将纸质稿件扫描生成位图文件;
步骤二:通过文字处理器将位图文件转换为文字处理器文本文件;
步骤三:根据文字处理器文本文件的内容选择网页页面模板,将文字处理器文本文件
中的文本元素插入网页页面模板中,生成初步的网页页面;
步骤四:查找筛选出需要建立超链接的字段,通过该字段的属性及像素在初步形成的
网络文本中查找到该字段,通过网页编辑器添加相应的超链接,形成带超链接的网络文本
页面。
2.根据权利要求1所述的一种纸质稿件转换为网络文本页面的方法,其特征在于,包括
如下步骤:
步骤一:将纸质稿件通过扫描仪转换成tif文件;
步骤二:通过文字处理器的OCR文本识别功能将tif文件转成文字文本网页文本:
步骤三:根据文字文本网页文本的内容选择网页页面模板,将文字文本网页文本中的
文本元素插入网页页面模板中,生成初步的网页页面。
3.根据权利要求1所述的一种纸质稿件转换为网络文本页面的方法,其特征在于,所述
步骤三还包括如下步骤:
预先设置网页页面模板:通过网页编辑器绘制多套模板上传至系统中;
选择网页页面模板:根据文字处理器文本文件中的文本内容选择页面属性接近的网页
页面模板;
插入文本内容:根据文字处理器文本文件中的文本内容插入标题和文本修饰控件,所
述标题根据文字处理器文本文件中的文本标题确定,所述文本修饰控件用于对网页文本文
字进行修饰;
生成初步的网页页面:根据网页页面模板的填充内容,通过文本修饰控件生成初步的
网页页面。
4.根据权利要求3所述的一种纸质稿件转换为网络文本页面的方法,其特征在于,所述
步骤三还包括如下步骤:
优化网页页面元素:根据文本编辑框的大小选择采用input元素或textarea元素控件
进行填充;
填充网页页面属性:根据文字处理器文本文件中的文字的字体,将字体数据信息转换
为像素单位填充到网页页面中;将文字处理器文本文件中的文字转换为命名文本元素的字
段。
5.根据权利要求4所述的一种纸质稿件转换为网络文本页面的方法,其特征在于,所述
命名文本元素的字段为拼音字段或者英文字段。
6.一种采用如权利要求1所述的纸质稿件转换为网络文本页面的方法的系统,其特征
在于,包括:
扫描设备,用于扫描纸质稿件,并生成位图文件;
连接模块,用于连接扫描设备、文字处理器、网页编辑模块和显示模块;
文字处理器,用于将位图文件转换为文字处理器可处理的文字处理器文本文件,并且
读取文字处理器文本文件内每一列的内容;
网页编辑模块,用于在网页编辑过程中生成网页页面,并且根据文字处理器读取到的
内容选择相应的网页页面模板进行填充属性和创建文本编辑框;
显示模块,用于显示文字处理器界面和网页页面界面;
筛选模块,用于在电子文本文件中查找筛选出需要建立超链接的字段;
查找模块,用于根据字段的属性及像素在初步形成的网络文本中查找到该字段;
网页编辑器,用于在查找到的字段中添加相应的超链接。
7.根据权利要求6所述的一种纸质稿件转换为网页页面的系统,其特征在于,所述文字
处理器包括:
文字处理器文本转换单元,用于将扫描设备扫描到的纸质稿件的位图文件转换为文字
处理器可处理的文字处理器文本文件;
读取单元,用于读取文字处理器文本文件内的每一列的内容;
文字处理界面生成模块,用于生成文字处理器文本转换单元和读取单元运行过程中的
用户可操作界面。
8.根据权利要求6所述的一种纸质稿件转换为网页页面的系统,其特征在于,所述网页
编辑模块包括:
文本编辑框创建单元,用于根据文字处理器读取到的文字处理器文本文件中的偶数列
的内容进行创建文本编辑框;
网页页面模板预生成选择单元,用于在生成网页页面之前生成网页页面模板,并且根
据文字处理器读取到的文字处理器文本文件中的内容进行选择合适的网页页面模板;
网页页面界面生成单元,用于生成网页编辑模块运行过程中的用户可操作界面和网页
页面。
9.根据权利要求8所述的一种纸质稿件转换为网页页面的系统,其特征在于,所述网页
编辑模块还包括:
属性填充单元,用于根据文字处理器文本文件中的文字的字体,将字体数据信息转换
为像素单位填充到网页页面中;将文字处理器文本文件中的文字转换为命名文本元素的字
段;
网页页面优化单元,用于根据文本编辑框的大小选择采用input元素或textarea元素
控件进行填充。

说明书

一种纸质稿件转换为网络文本页面的方法及系统

技术领域

本发明涉及计算机通信技术领域,尤其涉及一种纸质稿件转换为网络文本页面的
方法及系统。

背景技术

目前各个无纸化的办公系统,审批系统逐步普及,原来纸质化的word排版的文本。
现有技术中大多采用dreamware等类似的网页编辑软件,手动的将原来的word文本转换为
单纯的文本网页,修饰性差,并且需要插入超链接时比较麻烦需要人工一一添加,耗时费工
效率地。或者通过扫描仪转换成word,再利用word自带的工具转成网络文本,内容复杂,不
符合网页文本的要求,生成的只是静态的网页。

发明内容

为克服现有技术中存在的纸质稿件转变为网页页面过程复杂,效率低下的问题,
本发明提供了一种纸质稿件转换为网络文本页面的方法及系统。

一种纸质稿件转换为网络文本页面的方法,包括如下步骤:

步骤一:通过图像扫描设备将纸质稿件扫描生成位图文件;

步骤二:通过文字处理器将位图文件转换为文字处理器文本文件;

步骤三:根据文字处理器文本文件的内容选择网页页面模板,将文字处理器文本文件
中的文本元素插入网页页面模板中,生成初步的网页页面;

步骤四:查找筛选出需要建立超链接的字段,通过该字段的属性及像素在初步形成的
网络文本中查找到该字段,通过网页编辑器添加相应的超链接,形成带超链接的网络文本
页面。

进一步的,包括如下步骤:

步骤一:将纸质稿件通过扫描仪转换成tif文件;

步骤二:通过文字处理器的OCR文本识别功能将tif文件转成文字文本网页文本;

步骤三:根据文字文本网页文本的内容选择网页页面模板,将文字文本网页文本中的
文本元素插入网页页面模板中,生成初步的网页页面。

进一步的,所述步骤三还包括如下步骤:

预先设置网页页面模板:通过网页编辑器绘制多套模板上传至系统中;

选择网页页面模板:根据文字处理器文本文件中的文本内容选择页面属性接近的网页
页面模板:

插入文本内容:根据文字处理器文本文件中的文本内容插入标题和文本修饰控件,所
述标题根据文字处理器文本文件中的文本标题确定,所述文本修饰控件用于对网页文本文
字进行修饰;

生成初步的网页页面:根据网页页面模板的填充内容,通过文本修饰控件生成初步的
网页页面。

进一步的,所述步骤三还包括如下步骤:

优化网页页面元素:根据文本编辑框的大小选择采用input元素或textarea元素控件
进行填充;

填充网页页面属性:根据文字处理器文本文件中的文字的字体,将字体数据信息转换
为像素单位填充到网页页面中;将文字处理器文本文件中的文字转换为命名文本元素的字
段。

进一步的,所述命名文本元素的字段为拼音字段或者英文字段。

本发明的另一个目的是提供一种采用所述的纸质稿件转换为网络文本页面的方
法的系统,包括:

扫描设备,用于扫描纸质稿件,并生成位图文件;

连接模块,用于连接扫描设备、文字处理器、网页编辑模块和显示模块;

文字处理器,用于将位图文件转换为文字处理器可处理的文字处理器文本文件,并且
读取文字处理器文本文件内每一列的内容;

网页编辑模块,用于在网页编辑过程中生成网页页面,并且根据文字处理器读取到的
内容选择相应的网页页面模板进行填充属性和创建文本编辑框;

显示模块,用于显示文字处理器界面和网页页面界面;

筛选模块,用于在电子文本文件中查找筛选出需要建立超链接的字段;

查找模块,用于根据字段的属性及像素在初步形成的网络文本中查找到该字段;

网页编辑器,用于在查找到的字段中添加相应的超链接。

进一步的,所述文字处理器包括:

文字处理器文本转换单元,用于将扫描设备扫描到的纸质稿件的位图文件转换为文字
处理器可处理的文字处理器文本文件;

读取单元,用于读取文字处理器文本文件内的每一列的内容;

文字处理界面生成模块,用于生成文字处理器文本转换单元和读取单元运行过程中的
用户可操作界面。

进一步的,所述网页编辑模块包括:

文本编辑框创建单元,用于根据文字处理器读取到的文字处理器文本文件中的偶数列
的内容进行创建文本编辑框;

网页页面模板预生成选择单元,用于在生成网页页面之前生成网页页面模板,并且根
据文字处理器读取到的文字处理器文本文件中的内容进行选择合适的网页页面模板;

网页页面界面生成单元,用于生成网页编辑模块运行过程中的用户可操作界面和网页
页面。

进一步的,所述网页编辑模块还包括:

属性填充单元,用于根据文字处理器文本文件中的文字的字体,将字体数据信息转换
为像素单位填充到网页页面中;将文字处理器文本文件中的文字转换为命名文本元素的字
段;

网页页面优化单元,用于根据文本编辑框的大小选择采用input元素或textarea元素
控件进行填充。

与现有技术相比,本发明的有益效果是:

通过一扫面设备扫描纸质稿件的内容形成位图文件,并通过文字处理软件将位图文件
转换为电子文本文件,再通过网页编辑器将电子文本文件读取到的文字数据进行填充到网
页中形成初步的网络文本。通过一连接自动筛选设备在电子文本文件中查找筛选出需要建
立超链接的字段,通过该字段的属性及像素在初步形成的网络文本中查找到该字段,并通
过网页编辑器添加相应的超链接,形成带超链接的网络文本页面,转换效率高,节省人力,
耗费时间少。


具体实施方式

以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实
施例仅用以解释本发明,并不用于限定本发明。

实施例1

本具体实施方式披露了一种纸质稿件转换为网络文本页面的方法,包括如下步骤:

步骤一:通过图像扫描设备将纸质稿件扫描生成位图文件。在本发明的一个可行的具
体实施方式中,可以通过手持式扫描仪或者立式扫描仪进行扫描纸质稿件,并且通过扫描
仪连接计算机处理设备将扫描到的图像以tif位图文件的形式进行保存。扫描过程中避免
可见光照射影响扫描的质量。采用手持式扫描仪进行扫描时,应当在光线较暗的空间内将
纸质稿件平铺在平面上进行扫描。采用立式扫描仪进行扫描时则需要将纸质稿件置于扫面
盖板下方并盖紧盖板,不漏亮光。在本发明的其他具体实施例中,位图文件还可以是其他格
式,例如BMP文件。

优选的,图像扫描设备还可以是数码相机或者手机等图像采集类设备,采用数码
相机或者手机进行获取图像能够有效的避免图像扫描设备在扫描过程中的曝光问题。

步骤二:通过文字处理器将位图文件转换为文字处理器文本文件。在本发明的一
个可行的具体实施例中,可以采用Office Document Imaging软件作为文字处理器,并通过
其自带的OCR文本识别功能将tif文件转成文字文本网页文本。OCR文字识别是指电子设备
(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机
文字的过程。在本发明的其他具体实施例中,还可以通过其他带有图像文字功能的文字处
理器进行,例如汉王软件,WPS等。

步骤三:根据文字处理器文本文件的内容选择网页页面模板,将文字处理器文本
文件中的文本元素插入网页页面模板中,生成初步的网页页面。

优选的,在选择网页页面模板之前预先设置多个网页页面模板,通过网页编辑器
在插入网页页面时,自动生成网页页面模板供选择。可行的,在本发明的一个具体实施方式
中,可以通过一网页页面模板服务器进行提供网页页面模板。

优选的,选择网页页面模板时根据文字处理器文本文件中的文本内容选择页面属
性接近的网页页面模板。具体的,是根据文字文本网页文本中表格的尺寸和样式选择最接
近的网页页面模板。

确定好网页页面模板之后,根据文字处理器文本文件中的文本内容插入标题和文
本修饰控件,所述标题根据文字处理器文本文件中的文本标题确定,所述文本修饰控件用
于对网页文本文字进行修饰。

优选的,初步生成的网页页面的填充内容是按照奇数列与偶数列区分的方式读取
到的文字处理器文本文件中的内容,其中,奇数列的内容作为变量,偶数列的内容作为文本
编辑框,并且变量与文本编辑框一一对应。变量是表格需要填写的内容,其通过空间控制在
网页上可供用户进行填写。

最终上传到网页上的网页页面通过文本修饰控件生成。

此外,为使得网页页面更具有美观性,可以根据文字处理器文本文件中的文字的
字体对网页页面填充内容进行调整。可行的,可以将字体数据信息转换为像素单位填充到
网页页面中,再根据像素单位进行调整网页页面字段的大小属性。而网页页面内填充的文
字信息则是文字处理器文本文件中的文字转换为命名文本元素的字段,优选的,所述命名
文本元素的字段为拼音字段或英文字段,其根据文字处理器文本文件中的文字的拼音或者
英文同义得到。

采用上述方法获得的文本能够直接放到网页上作为form的流程文本,使用方便,
能够有效的提高纸质稿件上传到网页的效率。

步骤四:查找筛选出需要建立超链接的字段,通过该字段的属性及像素在初步形
成的网络文本中查找到该字段,通过网页编辑器添加相应的超链接,形成带超链接的网络
文本页面。可行的,网络文本页面的标题根据电子文本文件的标题建立,其与电子文本文件
的标题之间建立对应的映射关系,当电子文本文件的标题发生改变时候,例如字体和颜色
的变化等,则网络文本页面根据像素及属性进行相应的改变,使之成为最终的网络文本。

实施例2

本具体实施方式披露了一种纸质稿件转换为网页页面的系统,包括:

扫描设备,用于扫描纸质稿件,并生成位图文件。优选的,扫描设备可以采用立式扫描
仪、手持式扫描仪、数码相机或者手机等图像采集设备。扫描得到的图像存储为tif格式、
BMP格式等位图文件格式,采用位图文件进行存储图像,图像失真度小,能够有效的位置纸
质稿件的原状。

连接模块,用于连接扫描设备、文字处理器、网页编辑模块和显示模块。优选的,可
以通过一数据交换机将扫描设备、文字处理器、网页编辑模块和显示设备相连接,扫描设备
将文件传送给文字处理器,文字处理器与网页编辑模块之间相互传送数据,而显示模块则
接收文字处理器和网页编辑模块传送的显示信息数据。

文字处理器,用于将位图文件转换为文字处理器可处理的文字处理器文本文件,
并且读取文字处理器文本文件内每一列的内容。可行的,文字处理器可以是自带的OCR文本
识别功能软件,例如Office Document Imaging软件、汉王和WPS等。

优选的,文字处理器包括文字处理器文本转换单元,用于将扫描设备扫描到的纸
质稿件的位图文件转换为文字处理器可处理的文字处理器文本文件。

读取单元,用于读取文字处理器文本文件内的每一列的内容。

文字处理界面生成模块,用于生成文字处理器文本转换单元和读取单元运行过程
中的用户可操作界面,具体的是将读取文字处理器文本文件内容、选择内容等通过控件菜
单选择的形式呈现给用户供用户选择。

此外,网页编辑模块用于在网页编辑过程中生成网页页面,并且根据文字处理器
读取到的内容选择相应的网页页面模板进行填充属性和创建文本编辑框。

优选的,所述网页编辑模块包括,文本编辑框创建单元,其用于根据文字处理器读
取到的文字处理器文本文件中的偶数列的内容进行创建文本编辑框。

还包括一网页页面模板预生成选择单元,用于在生成网页页面之前生成网页页面
模板,并且根据文字处理器读取到的文字处理器文本文件中的内容进行选择合适的网页页
面模板。在选择合适的网页页面模板之后,通过一表格生成控件进行生成表格,用户通过点
击控件形成需要的表格。优选的,用户在点击控件之后,还会在操作界面弹出一属性选择对
话框,用户可以在对话框内选择表格的属性,包括底纹、颜色、尺寸调节和字体大小等,具体
的各个属性的名称根据文字处理器内的文本的字段来确认。

还包括一网页页面界面生成单元,用于生成网页编辑模块运行过程中的用户可操
作界面和网页页面。用户通过在用户可操作界面内进行选择控制网页编辑模块运行过程。

优选的,网页编辑模块还包括一属性填充单元,用于根据文字处理器文本文件中
的文字的字体,将字体数据信息转换为像素单位填充到网页页面中;将文字处理器文本文
件中的文字转换为命名文本元素的字段。可行的,在本发明的一个具体实施方式中,可以采
用字段的拼音或者英文作为命名文本。

优选的,网页编辑模块还包括一网页页面优化单元,用于根据文本编辑框的大小
选择采用input元素或textarea元素控件进行填充。

显示模块,用于显示文字处理器界面和网页页面界面。可行的,在本发明的一个具
体实施方式中,可以采用一液晶显示器进行显示,其同时作为文字处理器和网页编辑模块
的显示设备。用户能够在该液晶显示器上看到操作的步骤和过程中的网页页面。并且用户
还以通过该液晶显示其看到网页编辑的内容。

筛选模块,用于在电子文本文件中查找筛选出需要建立超链接的字段,其中需要
建立超链接的字段可以通过建立一个流行网络超链接数据库,通过查找筛选将数据库中与
电子文本文件中重合的部分插入超链接。

查找模块,用于根据字段的属性及像素在初步形成的网络文本中查找到该字段。

网页编辑器,用于在查找到的字段中添加相应的超链接。

上述说明示出并描述了本发明的优选实施例,如前所述,应当理解本发明并非局
限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和
环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改
动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附
权利要求的保护范围内。

一种纸质稿件转换为网络文本页面的方法及系统.pdf_第1页
第1页 / 共8页
一种纸质稿件转换为网络文本页面的方法及系统.pdf_第2页
第2页 / 共8页
一种纸质稿件转换为网络文本页面的方法及系统.pdf_第3页
第3页 / 共8页
点击查看更多>>
资源描述

《一种纸质稿件转换为网络文本页面的方法及系统.pdf》由会员分享,可在线阅读,更多相关《一种纸质稿件转换为网络文本页面的方法及系统.pdf(8页珍藏版)》请在专利查询网上搜索。

本发明提供了一种纸质稿件转换为网络文本页面的方法及系统,首先通过一扫面设备扫描纸质稿件的内容形成位图文件,并通过文字处理软件将位图文件转换为电子文本文件,再通过网页编辑器将电子文本文件读取到的文字数据进行填充到网页中形成初步的网络文本。通过一连接自动筛选设备在电子文本文件中查找筛选出需要建立超链接的字段,通过该字段的属性及像素在初步形成的网络文本中查找到该字段,并通过网页编辑器添加相应的超链接,形。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1