文档格式转化系统及方法.pdf

上传人:e1 文档编号:973337 上传时间:2018-03-22 格式:PDF 页数:17 大小:915.41KB
返回 下载 相关 举报
摘要
申请专利号:

CN200910198421.9

申请日:

2009.11.06

公开号:

CN101699426A

公开日:

2010.04.28

当前法律状态:

授权

有效性:

有权

法律详情:

专利权的转移IPC(主分类):G06F 17/21变更事项:专利权人变更前权利人:上海传知信息科技发展有限公司变更后权利人:上海枫享网络科技有限公司变更事项:地址变更前权利人:200435 上海市宝山区共和新路5199号5楼E室变更后权利人:200072 上海市闸北区延长中路625号15幢一层125室登记生效日:20150818|||授权|||实质审查的生效IPC(主分类):G06F 17/21申请日:20091106|||公开

IPC分类号:

G06F17/21; G06F17/22; G06F17/30; G06T11/60

主分类号:

G06F17/21

申请人:

上海传知信息科技发展有限公司

发明人:

陆昀

地址:

200435 上海市宝山区共和新路5199号5楼E室

优先权:

专利代理机构:

上海光华专利事务所 31219

代理人:

余明伟;尹丽云

PDF下载: PDF下载
内容摘要

本发明揭示了一种文档格式转化系统及方法,该文档格式转化系统包括图片转化模块、文字获取模块、文字图像映射模块;图片转化模块用以把文档的每一页转为图片格式的数据;文字获取模块用以获取文档每一页的文字、各文字在图片中的状态信息;文字图像映射模块用以生成各页文字信息与图片所对应的映射表,该表中包含有各文字在图片中的状态信息。本发明可避免出现因未安装网页插件而不能阅读文档的问题。

权利要求书

1: 一种文档格式转化系统,其特征在于,该系统包括: 图片转化模块,用以把文档的每一页转为图片格式的数据; 文字获取模块,用以获取文档每一页的文字、各文字在图片中的状态信息; 文字图像映射模块,用以生成各页文字信息与图片所对应的映射表,该表中包含有各文字在图片中的状态信息; 所述图片转化模块、文字获取模块把每一个文档的每一页转换为一张无损图片文件和一个包含该页所有文字信息的文本文件,图片文件用于在网页上显示,文本文件用于文档的全文搜索;为了能够提取在图片选择区域中的文字,在转换时,所述文字图像映射模块生成一张文字图像映射表,该表中定了所有文字在图片中的状态;所述文字在图片中的状态信息包括文字的位置、旋转状态数据、扭曲状态数据、缩放状态数据; 所述系统进一步包括PPT-FLASH转换模块,用以将PPT格式的数据转换为FLASH格式,其包括: PPT分析器,用以分析PPT文档的结构,把PPT文档中的对象分为PPT对象、资源对象;所述PPT对象包括PPT对象的形状、文本、效果,所述资源对象包括图片、音乐、视频、FLASH文件; FLASH生成器,用以把PPT对象的形状、文本、效果对应生成与FLASH一致的形状、文本、效果,同时把PPT中的图片、音乐、视频、FLASH文件嵌入或载入FLASH文档中; 所述FLASH生成器包括: 形状生成单元,用以根据所述PPT分析器获取的PPT文件中每个形状的大小、几何形状、矩形轮廓框和位置,利用这些信息生成与Flash一致的形状; 文本生成单元,用以根据所述PPT分析器获取的PPT文件中的文本大小、定位、样式、字体和位置,利用这些信息生成与Flash一致的文本; 效果生成单元,用以根据所述PPT分析器获取的PPT文件中的动画效果类别、动画效果参数,利用这些信息生成包含ActionScript脚本的Flash一致的动画效果; 图片生成单元,用以根据所述PPT分析器解析出的图片尺寸、定位、位置,将图片数据进行压缩优化后直接生成与Flash一致的图片; 音乐生成单元,用以根据所述PPT分析器解析出的PPT文件中的音频对象,将音频数据进行压缩优化后直接嵌入到Flash文档; 视频生成单元,用以根据所述PPT分析器解析出的PPT文件中的视频对象,将视频数据转换成flv视频格式,利用Flash课件播放器进行播放视频; FLASH生成单元,用以根据所述PPT分析器解析出的PPT文件中的Flash对象,直接将Flash对象生成单独的Flash文件,利用Flash课件播放器直接载入Flash文档。
2: 一种文档格式转化系统,其特征在于,该系统包括: 图片转化模块,用以把文档的每一页转为图片格式的数据; 文字获取模块,用以获取文档每一页的文字、各文字在图片中的状态信息; 文字图像映射模块,用以生成各页文字信息与图片所对应的映射表,该表中包含有各文字在图片中的状态信息。
3: 根据权利要求2所述的文档格式转化系统,其特征在于: 所述系统进一步包括PPT-FLASH转换模块,用以将PPT格式的数据转换为FLASH格式, 其包括: PPT分析器,用以分析PPT文档的结构,把PPT文档中的对象分为PPT对象、资源对象;所述PPT对象包括PPT对象的形状、文本、效果,所述资源对象包括图片、音乐、视频、FLASH文件; FLASH生成器,用以把PPT对象的形状、文本、效果对应生成与FLASH一致的形状、文本、效果,同时把PPT中的图片、音乐、视频、FLASH文件嵌入或载入FLASH文档中。
4: 根据权利要求3所述的文档格式转化系统,其特征在于: 所述FLASH生成器包括: 形状生成单元,用以根据所述PPT分析器获取的PPT文件中每个形状的大小、几何形状、矩形轮廓框和位置,利用这些信息生成与Flash一致的形状; 文本生成单元,用以根据所述PPT分析器获取的PPT文件中的文本大小、定位、样式、字体和位置,利用这些信息生成与Flash一致的文本; 效果生成单元,用以根据所述PPT分析器获取的PPT文件中的动画效果类别、动画效果参数,利用这些信息生成包含ActionScript脚本的Flash一致的动画效果; 图片生成单元,用以根据所述PPT分析器解析出的图片尺寸、定位、位置,将图片数据进行压缩优化后直接生成与Flash一致的图片; 音乐生成单元,用以根据所述PPT分析器解析出的PPT文件中的音频对象,将音频数据进行压缩优化后直接嵌入到Flash文档; 视频生成单元,用以根据所述PPT分析器解析出的PPT文件中的视频对象,将视频数据转换成flv视频格式,利用Flash课件播放器进行播放视频; FLASH生成单元,用以根据所述PPT分析器解析出的PPT文件中的Flash对象,直接将Flash对象生成单独的Flash文件,利用Flash课件播放器直接载入Flash文档。
5: 根据权利要求2所述的文档格式转化系统,其特征在于: 所述图片转化模块、文字获取模块把每一个文档的每一页转换为一张无损图片文件和一个包含该页所有文字信息的文本文件,图片文件用于在网页上显示,文本文件用于文档的全文搜索; 为了能够提取在图片选择区域中的文字,在转换时,所述文字图像映射模块生成一张文字图像映射表,该表中定了所有文字在图片中的状态; 所述文字在图片中的状态信息包括文字的位置、旋转状态数据、扭曲状态数据、缩放状态数据。
6: 根据权利要求5所述的文档格式转化系统,其特征在于: 通过三维矩阵定义文字在图片中的状态信息,三维矩阵中包括定义如下文字状态的参数: 水平方向缩放参数; 水平方向扭曲参数; 垂直方向扭曲参数; 垂直方向缩放参数; 水平方向位置参数; 垂直方向位置参数。
7: 根据权利要求2所述的文档格式转化系统,其特征在于: 所述图片转化模块使用逐字解析技术确保文档所有信息都被读取,使用32位图像技术生成内存图像,使用字体映射技术和二次立方算法确保图像的质量; 所述图片转化模块包括 逐字解析单元,用以逐字解析出文档的所有信息; 字体映射单元,用以把文字信息显示为点阵图片; 二次立方算法单元,用以根据相邻像素重新计算本像素的颜色值,在视觉上呈现较光滑的效果,消除图像的锯齿; 图片最小化转换单元,使用动态分析色素技术保证生成小尺寸的图像文件,纯文本数据使用无格式文档存储。
8: 一种文档格式转化方法,其特征在于,该方法包括如下步骤: 图片转化步骤,把文档的每一页转为图片格式的数据; 文字获取步骤,获取文档每一页的文字、各文字在图片中的状态信息; 文字图像映射步骤,生成各页文字信息与图片所对应的映射表,该表中包含有各文字在图片中的状态信息。
9: 根据权利要求8所述的文档格式转化方法,其特征在于: 所述方法进一步包括PPT-FLASH转换步骤,将PPT格式的数据转换为FLASH格式,其包括: PPT分析步骤,分析PPT文档的结构,把PPT文档中的对象分为PPT对象、资源对象;所述PPT对象包括PPT对象的形状、文本、效果,所述资源对象包括图片、音乐、视频、FLASH文件; FLASH生成步骤,把PPT对象的形状、文本、效果对应生成与FLASH一致的形状、文本、效果,同时把PPT中的图片、音乐、视频、FLASH文件嵌入或载入FLASH文档中; FLASH生成步骤包括 -形状生成步骤,用以根据所述PPT分析器获取的PPT文件中每个形状的大小、几何形状、矩形轮廓框和位置,利用这些信息生成与Flash一致的形状; -文本生成步骤,用以根据所述PPT分析步骤获取的PPT文件中的文本大小、定位、样式、字体和位置,利用这些信息生成与Flash一致的文本; -效果生成步骤,用以根据所述PPT分析步骤获取的PPT文件中的动画效果类别、动画效果参数,利用这些信息生成包含ActionScript脚本的Flash一致的动画效果; -图片生成步骤,用以根据所述PPT分析步骤解析出的图片尺寸、定位、位置,将图片数据进行压缩优化后直接生成与Flash一致的图片; -音乐生成步骤,用以根据所述PPT分析步骤解析出的PPT文件中的音频对象,将音频数据进行压缩优化后直接嵌入到Flash文档; -视频生成步骤,用以根据所述PPT分析步骤解析出的PPT文件中的视频对象,将视频数据转换成flv视频格式,利用Flash课件播放器进行播放视频; -FLASH生成步骤,用以根据所述PPT分析步骤解析出的PPT文件中的Flash对象,直接将Flash对象生成单独的Flash文件,利用Flash课件播放器直接载入Flash文档。
10: 根据权利要求8所述的文档格式转化方法,其特征在于: 所述图片转化步骤、文字获取步骤把每一个文档的每一页转换为一张无损图片文件和一个包含该页所有文字信息的文本文件,图片文件用于在网页上显示,文本文件用于文档的全文搜索; 为了能够提取在图片选择区域中的文字,在转换时,所述文字图像映射步骤中生成一张文字图像映射表,该表中定了所有文字在图片中的状态; 所述文字在图片中的状态信息包括文字的位置、旋转状态数据、扭曲状态数据、缩放状态数据。

说明书


文档格式转化系统及方法

    【技术领域】

    本发明属于计算机技术领域,涉及一种格式转化系统,尤其涉及一种文档格式转化系统;此外,本发明还涉及上述文档格式转化系统的转化方法。

    背景技术

    如今,计算机用户可通过网络看各类电子书,如WORD、TXT、PDF等格式的文件。现有的通常做法是把文本制作成超文本标记语言HTML的格式。如中国专利CN200510125040.X提供了一种用于将格式化文档转化为网页的系统和方法,用于将文档转换为网页的系统和方法可包括映射模块,它被编程为将文档的文档样式映射到网页的样式。该系统也可包括转化模块,它被编程为基于该映射模块的映射将文档的内容转化为超文本标记语言;以及呈现模块,它被编程为基于该超文本标记语言呈现该网页。该方法可包括将文档中的文档样式映射到网页的样式、基于该映射将文档的内容转化为超文本标记语言、以及根据该超文本标记语言来呈现网页。

    这种实现方案遇到复杂的文本,排版复杂。如,无法编辑文字的字体;再如,遇到既包含有文字又包含有图片格式的信息,需要对文字制作成超文本标记语言HTML的格式,对图片制作成图片格式,排版复杂,难以完美呈现。

    另外,现在大部分读者使用Office PPT软件观看PPT,具有强大的编辑功能。缺点和桌面文档阅读器类似,不能共享、交流。

    当前的在线PPT功能一般采用Flash格式,其功能有限,无动画效果,无交互功能,也不能整合外部的音频/视频资源等等。

    【发明内容】

    本发明所要解决的技术问题是:提供一种文档格式转化系统,可避免出现因未安装网页插件而不能阅读文档的问题。

    此外,本发明还提供一种上述文档格式转化系统的转化方法。

    为解决上述技术问题,本发明采用如下技术方案:

    一种文档格式转化系统,其特征在于,该系统包括:

    图片转化模块,用以把文档的每一页转为图片格式的数据;

    文字获取模块,用以获取文档每一页的文字、各文字在图片中的状态信息;

    文字图像映射模块,用以生成各页文字信息与图片所对应的映射表,该表中包含有各文字在图片中的状态信息。

    作为本发明的一种优选方案,所述系统进一步包括PPT-FLASH转换模块,用以将PPT格式的数据转换为FLASH格式,其包括:

    PPT分析器,用以分析PPT文档的结构,把PPT文档中的对象分为PPT对象、资源对象;所述PPT对象包括PPT对象的形状、文本、效果,所述资源对象包括图片、音乐、视频、FLASH文件;

    FLASH生成器,用以把PPT对象的形状、文本、效果对应生成与FLASH一致的形状、文本、效果,同时把PPT中的图片、音乐、视频、FLASH文件嵌入或载入FLASH文档中。

    作为本发明的一种优选方案,所述FLASH生成器包括:

    形状生成单元,用以根据所述PPT分析器获取的PPT文件中每个形状的大小、几何形状、矩形轮廓框和位置,利用这些信息生成与Flash一致的形状;

    文本生成单元,用以根据所述PPT分析器获取的PPT文件中的文本大小、定位、样式、字体和位置,利用这些信息生成与Flash一致的文本;

    效果生成单元,用以根据所述PPT分析器获取的PPT文件中的动画效果类别、动画效果参数,利用这些信息生成包含ActionScript脚本的Flash一致的动画效果;

    图片生成单元,用以根据所述PPT分析器解析出的图片尺寸、定位、位置,将图片数据进行压缩优化后直接生成与Flash一致的图片;

    音乐生成单元,用以根据所述PPT分析器解析出的PPT文件中的音频对象,将音频数据进行压缩优化后直接嵌入到Flash文档;

    视频生成单元,用以根据所述PPT分析器解析出的PPT文件中的视频对象,将视频数据转换成flv视频格式,利用Flash课件播放器进行播放视频;

    FLASH生成单元,用以根据所述PPT分析器解析出的PPT文件中的Flash对象,直接将Flash对象生成单独的Flash文件,利用Flash课件播放器直接载入Flash文档。

    作为本发明的一种优选方案,所述图片转化模块、文字获取模块把每一个文档的每一页转换为一张无损图片文件和一个包含该页所有文字信息的文本文件,图片文件用于在网页上显示,文本文件用于文档的全文搜索;为了能够提取在图片选择区域中的文字,在转换时,所述文字图像映射模块生成一张文字图像映射表,该表中定了所有文字在图片中的状态;所述文字在图片中的状态信息包括文字的位置、旋转状态数据、扭曲状态数据、缩放状态数据。

    作为本发明的一种优选方案,通过三维矩阵定义文字在图片中的状态信息,三维矩阵中包括定义如下文字状态地参数:水平方向缩放参数;水平方向扭曲参数;垂直方向扭曲参数;垂直方向缩放参数;水平方向位置参数;垂直方向位置参数。

    作为本发明的一种优选方案,所述图片转化模块使用逐字解析技术确保文档所有信息都被读取,使用32位图像技术生成内存图像,使用字体映射技术和二次立方算法确保图像的质量。

    作为本发明的一种优选方案,所述图片转化模块包括

    逐字解析单元,用以逐字解析出文档的所有信息;

    字体映射单元,用以把文字信息显示为点阵图片;

    二次立方算法单元,用以根据相邻像素重新计算本像素的颜色值,在视觉上呈现较光滑的效果,消除图像的锯齿;

    图片最小化转换单元,使用动态分析色素技术保证生成小尺寸的图像文件,纯文本数据使用无格式文档存储。

    一种文档格式转化方法,该方法包括如下步骤:

    图片转化步骤,把文档的每一页转为图片格式的数据;

    文字获取步骤,获取文档每一页的文字、各文字在图片中的状态信息;

    文字图像映射步骤,生成各页文字信息与图片所对应的映射表,该表中包含有各文字在图片中的状态信息。

    作为本发明的一种优选方案,所述方法进一步包括PPT-FLASH转换步骤,将PPT格式的数据转换为FLASH格式,其包括:

    PPT分析步骤,分析PPT文档的结构,把PPT文档中的对象分为PPT对象、资源对象;所述PPT对象包括PPT对象的形状、文本、效果,所述资源对象包括图片、音乐、视频、FLASH文件;

    FLASH生成步骤,把PPT对象的形状、文本、效果对应生成与FLASH一致的形状、文本、效果,同时把PPT中的图片、音乐、视频、FLASH文件嵌入或载入FLASH文档中;

    FLASH生成步骤包括

    -形状生成步骤,用以根据所述PPT分析器获取的PPT文件中每个形状的大小、几何形状、矩形轮廓框和位置,利用这些信息生成与Flash一致的形状;

    -文本生成步骤,用以根据所述PPT分析步骤获取的PPT文件中的文本大小、定位、样式、字体和位置,利用这些信息生成与Flash一致的文本;

    -效果生成步骤,用以根据所述PPT分析步骤获取的PPT文件中的动画效果类别、动画效果参数,利用这些信息生成包含ActionScript脚本的Flash一致的动画效果;

    -图片生成步骤,用以根据所述PPT分析步骤解析出的图片尺寸、定位、位置,将图片数据进行压缩优化后直接生成与Flash一致的图片;

    -音乐生成步骤,用以根据所述PPT分析步骤解析出的PPT文件中的音频对象,将音频数据进行压缩优化后直接嵌入到Flash文档;

    -视频生成步骤,用以根据所述PPT分析步骤解析出的PPT文件中的视频对象,将视频数据转换成flv视频格式,利用Flash课件播放器进行播放视频;

    -FLASH生成步骤,用以根据所述PPT分析步骤解析出的PPT文件中的Flash对象,直接将Flash对象生成单独的Flash文件,利用Flash课件播放器直接载入Flash文档。

    作为本发明的一种优选方案,所述图片转化步骤、文字获取步骤把每一个文档的每一页转换为一张无损图片文件和一个包含该页所有文字信息的文本文件,图片文件用于在网页上显示,文本文件用于文档的全文搜索;为了能够提取在图片选择区域中的文字,在转换时,所述文字图像映射步骤中生成一张文字图像映射表,该表中定了所有文字在图片中的状态;所述文字在图片中的状态信息包括文字的位置、旋转状态数据、扭曲状态数据、缩放状态数据。

    本发明的有益效果在于:本发明提出的文档格式转化系统及方法,把原来复杂的文档转变成为统一的基本的数据,这些数据都是现有Web2.0技术能够支持的数据格式,只需要标准的浏览器就可以查看各种文档资源;避免了因为没有安装软件而不能阅读文档的问题。转换成转有格式,会员不用下载任何插件或软件,即可进行高质量的阅读。

    【附图说明】

    图1为文档格式转化系统的组成示意图。

    图2为FLASH生成器的组成示意图。

    图3为文档格式转化方法的流程图。

    图4为无损图片转换-图片最小化转换示意图。

    图5为文字状态信息的示意图。

    图6为文档转换的示意图。

    【具体实施方式】

    下面结合附图详细说明本发明的优选实施例。

    实施例一

    请参阅图1,本发明揭示了一种文档格式转化系统10,该系统包括图片转化模块11、文字获取模块12、文字图像映射模块13、PPT-FLASH转换模块14。

    图片转化模块11、文字获取模块12、文字图像映射模块13用于把文档转换为图片格式,并获取图片各位置对应的文字。

    图片转化模块11用以把文档的每一页转为图片格式的数据;文字获取模块12用以获取文档每一页的文字、各文字在图片中的状态信息;文字图像映射模块13用以生成各页文字信息与图片所对应的映射表,该表中包含有各文字在图片中的状态信息。

    所述图片转化模块11、文字获取模块12把每一个文档的每一页转换为一张无损图片文件和一个包含该页所有文字信息的文本文件,图片文件用于在网页上显示,文本文件用于文档的全文搜索;为了能够提取在图片选择区域中的文字,在转换时,所述文字图像映射模块生成一张文字图像映射表,该表中定了所有文字在图片中的状态;所述文字在图片中的状态信息包括文字的位置、旋转状态数据、扭曲状态数据、缩放状态数据。

    作为本发明的一种实现方式,文字的位置、旋转状态数据、扭曲状态数据、缩放状态数据通过三维矩阵来定义,三维矩阵中包括定义如下文字状态的参数:水平方向缩放参数;水平方向扭曲参数;垂直方向扭曲参数;垂直方向缩放参数;水平方向位置参数;垂直方向位置参数。

    所述图片转化模块11使用逐字解析技术确保文档所有信息都被读取,使用32位图像技术生成内存图像,使用字体映射技术和二次立方算法确保图像的质量。本实施例中,所述图片转化模块11包括逐字解析单元、字体映射单元、二次立方算法单元、图片最小化转换单元。逐字解析单元用以逐字解析出文档的所有信息;字体映射单元用以把文字信息显示为点阵图片;二次立方算法单元用以根据相邻像素重新计算本像素的颜色值,在视觉上呈现较光滑的效果,消除图像的锯齿;图片最小化转换单元使用动态分析色素技术保证生成小尺寸的图像文件,纯文本数据使用无格式文档存储。

    PPT-FLASH转换模块14用于把PPT格式的文件转换为FLASH格式的文件,其包括PPT分析器141、FLASH生成器142。

    PPT分析器141用以分析PPT文档的结构,把PPT文档中的对象分为PPT对象、资源对象;所述PPT对象包括PPT对象的形状、文本、效果,所述资源对象包括图片、音乐、视频、FLASH文件;

    FLASH生成器142用以把PPT对象的形状、文本、效果对应生成与FLASH一致的形状、文本、效果,同时把PPT中的图片、音乐、视频、FLASH文件嵌入或载入FLASH文档中。

    请参阅图2,具体地,所述FLASH生成器142包括:

    形状生成单元1421用以根据所述PPT分析器141获取的PPT文件中每个形状的大小、几何形状、矩形轮廓框和位置,利用这些信息生成与Flash一致的形状;

    文本生成单元1422用以根据所述PPT分析器141获取的PPT文件中的文本大小、定位、样式、字体和位置,利用这些信息生成与Flash一致的文本;

    效果生成单元1423用以根据所述PPT分析器141获取的PPT文件中的动画效果类别、动画效果参数,利用这些信息生成包含ActionScript脚本的Flash一致的动画效果;

    图片生成单元1424用以根据所述PPT分析器141解析出的图片尺寸、定位、位置,将图片数据进行压缩优化后直接生成与Flash一致的图片;

    音乐生成单元1425用以根据所述PPT分析器141解析出的PPT文件中的音频对象,将音频数据进行压缩优化后直接嵌入到Flash文档;

    视频生成单元1426用以根据所述PPT分析器141解析出的PPT文件中的视频对象,将视频数据转换成flv视频格式,利用Flash课件播放器进行播放视频;

    FLASH生成单元1427用以根据所述PPT分析器141解析出的PPT文件中的Flash对象,直接将Flash对象生成单独的Flash文件,利用Flash课件播放器直接载入Flash文档。

    以上介绍了本发明的文档格式转化系统,本发明在揭示上述文档格式转化系统的同时,还揭示一种文档格式转化方法,该方法包括如下步骤:

    步骤A、图片转化步骤,把文档的每一页转为图片格式的数据;

    步骤B、文字获取步骤,获取文档每一页的文字、各文字在图片中的状态信息;

    步骤C、文字图像映射步骤,生成各页文字信息与图片所对应的映射表,该表中包含有各文字在图片中的状态信息。

    所述图片转化步骤、文字获取步骤把每一个文档的每一页转换为一张无损图片文件和一个包含该页所有文字信息的文本文件,图片文件用于在网页上显示,文本文件用于文档的全文搜索;为了能够提取在图片选择区域中的文字,在转换时,所述文字图像映射步骤中生成一张文字图像映射表,该表中定了所有文字在图片中的状态;所述文字在图片中的状态信息包括文字的位置、旋转状态数据、扭曲状态数据、缩放状态数据。

    此外,所述方法还可以包括步骤D、PPT-FLASH转换步骤,将PPT格式的数据转换为FLASH格式,其包括:

    PPT分析步骤,分析PPT文档的结构,把PPT文档中的对象分为PPT对象、资源对象;所述PPT对象包括PPT对象的形状、文本、效果,所述资源对象包括图片、音乐、视频、FLASH文件;

    FLASH生成步骤,把PPT对象的形状、文本、效果对应生成与FLASH一致的形状、文本、效果,同时把PPT中的图片、音乐、视频、FLASH文件嵌入或载入FLASH文档中;

    FLASH生成步骤包括

    -形状生成步骤,用以根据所述PPT分析器获取的PPT文件中每个形状的大小、几何形状、矩形轮廓框和位置,利用这些信息生成与Flash一致的形状;

    -文本生成步骤,用以根据所述PPT分析步骤获取的PPT文件中的文本大小、定位、样式、字体和位置,利用这些信息生成与Flash一致的文本;

    -效果生成步骤,用以根据所述PPT分析步骤获取的PPT文件中的动画效果类别、动画效果参数,利用这些信息生成包含ActionScript脚本的Flash一致的动画效果;

    -图片生成步骤,用以根据所述PPT分析步骤解析出的图片尺寸、定位、位置,将图片数据进行压缩优化后直接生成与Flash一致的图片;

    -音乐生成步骤,用以根据所述PPT分析步骤解析出的PPT文件中的音频对象,将音频数据进行压缩优化后直接嵌入到Flash文档;

    -视频生成步骤,用以根据所述PPT分析步骤解析出的PPT文件中的视频对象,将视频数据转换成flv视频格式,利用Flash课件播放器进行播放视频;

    -FLASH生成步骤,用以根据所述PPT分析步骤解析出的PPT文件中的Flash对象,直接将Flash对象生成单独的Flash文件,利用Flash课件播放器直接载入Flash文档。

    综上所述,本发明提出的文档格式转化系统及方法,把原来复杂的文档转变成为统一的基本的数据,这些数据都是现有Web2.0技术能够支持的数据格式,只需要标准的浏览器就可以查看各种文档资源;避免了因为没有安装软件而不能阅读文档的问题。转换成转有格式,会员不用下载任何插件或软件,即可进行高质量的阅读。

    本发明与现有的PPT网上播放方式相比具有以下优势:

    (1)实现了大部分PPT的强大功能:

    页内的各种动画效果;

    页之间的切换效果;

    左右手鼠标进行翻页(快捷键支持方向键);

    缩略图查看;

    全屏观看;

    课件全文搜索。

    (2)整合外部资源:

    在线插入外部音频;

    在线插入外部视频。

    (3)整合学习社区功能:

    课件提问,问答共享;

    每页笔记,笔记共享;

    在线书籍相关;

    发表课件评论,评论共享;

    相关文章,文章共享;

    BBS讨论。

    (4)只需Flash播放器插件即可(98%的电脑已安装此通用插件);

    无刷新操作;

    加载缓冲技术,提高加载速度;

    支持大部分主流浏览器;

    跨平台,与操作系统无关。

    实施例二

    本发明的改进之一在于对文档的转化,请参阅图6,本发明的转换规则如下所述:

    文本数据的纯文本信息→纯文本数据(.txt格式);

    字体信息,文本特效和图片数据→图片数据(.png格式);

    文字数据与图片数据的对应关系→XML数据(.xml格式);

    多媒体数据→Adobe Flash(.swf格式);

    脚本数据→抛弃(出于安全角度考虑)。

    请参阅图4,图片转化模块的无损图片转换中,使用逐字解析技术确保文档所有信息都被读取,使用目前色彩最好的32位图像技术生成内存图像,使用字体映射技术和二次立方算法保证图像的质量。

    本实施例的原理及技术如下:

    本发明中计算机成像的原理:计算机图像的最小单位是像素即每英寸72个像素,每个像素上可以使用的颜色有2的24次方种,就是现在通用的RGB规则。RGB规则就是使用红(red),绿(green),蓝(blue)分量合成一种颜色,每种颜色可以有256个分量,所以共有256x256x256中颜色,等价于2的24次方。在RGB规则的基础上再增加一个透明(Alpha)分量,就构成了ARGB规则,其中A表示透明度,透明度是一种颜色叠加算法,就是将一个像素上的两种颜色合成一种颜色使其在视觉效果上实现透明效果。

    字体映射技术:字体是将一种文字显示为点阵图片的程序,分为两种,点阵字体和矢量字体,其中点阵字体主要用与老式的黑白显示器,矢量字体就是通过一种复杂算法生成点阵图,现在通用的TrueType字体就是这种。本实施例使用矢量字体点阵。

    二次立方算法单元中所提到的二次立方算法:这种算法的主要目的是根据相邻像素重新计算本像素的颜色值,在视觉上呈现比较光滑的效果,是图像抗锯齿的一种常用算法。

    图片最小化转换:使用动态分析色素技术保证生成最小尺寸的图像文件。纯文本数据使用无格式文档存储。虽然每个像素可以使用高达2的24次方种颜色,但是对于具体的一个图片,不可能使用这么多像素,所以就将这张图片所使用的颜色值存储为调色板。例如一般文档中都是白底黑字,那么它仅使用了两种颜色,在这种情况下使用RGB颜色方案就显得没有必要了,这时使用简单的位图就足够了,这样生成的图片文件就大大缩小了,而且图像数据没有丢失。

    文字图像映射转换:每一个文档的每一页将被转换为一张无损图片文件和一个包含该页所有文字信息的文本文件,图片文件用于在网页上显示,文本文件用于文档的全文搜索。为了能够提取在图片选择区域中的文字,转换时会生成一张文字图像映射表,该表中定了所有文字在图片中的状态(位置,旋转,扭曲,缩放)。

    由于文字在图像中表现方法非常复杂,使用常规算法很难确定,所以在文字图像映射转换中使用三维矩阵算法来实现。下面描述一下如何使用三维矩阵算法来计算文字在图片中的位置,旋转,扭曲和缩放。

    本实施例通过三维矩阵定义文字在图片中的位置,旋转,扭曲和缩放。各字母的表示如下:

    a:水平方向缩放;

    b:水平方向扭曲;

    c:垂直方向扭曲;

    d:垂直方向缩放;

    e:水平方向位置;

    f:水平方向位置;

    g:三维图像使用,目前不使用,为常量值0;

    h:三维图像使用,目前不使用,为常量值0;

    i:三维图像使用,目前不使用,为常量值1。

    请参阅图5,介绍了本实施例中字符的状态表示方法。

    实施例三

    本实施例在包含有文档转化功能的同时还包括FLASH转化功能,可把PPT文件转化为FLASH文件。

    关键技术应用如下:

    (1)PPT课件解析器

    系统通过Microsoft Office Powerpoint提供的API接口获取PPT课件的文档信息,本发明收集PPT课件中的每一个对象、幻灯片的布局、形状,文本的动画效果和一些嵌入的对象。利用这些信息将它们转换成Flash格式的对象。

    请参阅表1,系统解析出PPT的布局、文档内容,精确的计算出每个对象的位置、大小和几何形状等,并通过获取的动画效果生成相对应的flash格式文档,以下表格描述了系统是如何处理PPT的每个对象。

      对象  描述  Shapes  系统获取PPT中每个Shape的大小、几何形状、矩形轮廓框和位置,利用这  些信息生成与Flash一致的Shape  Texts  系统获取PPT中的文本大小、定位、样式、字体和位置,利用这些信息生成  与Flash一致的Text  Animation  Effects  系统获取PPT中的动画效果类别(例如飞入、淡出等),动画效果参数(例如方  向、速度、旋转、透明等),利用这些信息生成包含ActionScript脚本的Flash  一致的动画效果  Image  系统解析出图片尺寸、定位、位置,将图片数据进行压缩优化后直接生成与  Flash一致的Image  Audio  系统解析出PPT中的音频对象,将音频数据进行压缩优化后直接嵌入到Flash  文档  Video  系统解析出PPT中的视频对象,将视频数据转换成flv视频格式,利用Flash  课件播放器进行播放视频

      对象  描述  Flash  系统解析出PPT中的Flash对象,直接将Flash对象生成单独的Flash文件,  利用Flash课件播放器直接载入Flash文档

    表1

    (2)PPT课件转换成Flash格式文档

    本发明中的Flash文档生成器,完全按照Adobe Flash 8文档格式规范,兼容Adobe Flash Player 8以上的所有插件版本(现在最新的是Adobe FlashPlayer 11),通过标准的xml格式定义生成Flash文档。

    (3)Flash文档播放器

    应该格式转换后,被转换的文件通过FLASH播放器播放。

    本发明的播放器不仅可以完美保留PPT课件的动画效果,同时也支持文档、图片、设计稿件、流程图、工程文件等超多类型的文档资料。就像现有的视频网站的视频播放器一样,本发明播放器也是采用Flash技术实现,并嵌入到网页中展示文件。利用本发明播放器,常见的Word、Excel、TXT、PDF、PSD、JPG、PPT以及更多其他格式的文件资料,都可以直接在线浏览,而无需在电脑上安装这些文件的相应软件。

    这里本发明的描述和应用是说明性的,并非想将本发明的范围限制在上述实施例中。这里所披露的实施例的变形和改变是可能的,对于那些本领域的普通技术人员来说实施例的替换和等效的各种部件是公知的。本领域技术人员应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现。在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。

文档格式转化系统及方法.pdf_第1页
第1页 / 共17页
文档格式转化系统及方法.pdf_第2页
第2页 / 共17页
文档格式转化系统及方法.pdf_第3页
第3页 / 共17页
点击查看更多>>
资源描述

《文档格式转化系统及方法.pdf》由会员分享,可在线阅读,更多相关《文档格式转化系统及方法.pdf(17页珍藏版)》请在专利查询网上搜索。

本发明揭示了一种文档格式转化系统及方法,该文档格式转化系统包括图片转化模块、文字获取模块、文字图像映射模块;图片转化模块用以把文档的每一页转为图片格式的数据;文字获取模块用以获取文档每一页的文字、各文字在图片中的状态信息;文字图像映射模块用以生成各页文字信息与图片所对应的映射表,该表中包含有各文字在图片中的状态信息。本发明可避免出现因未安装网页插件而不能阅读文档的问题。 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1