一种信息的发布方法、 系统及装置 【技术领域】
本发明涉及信息处理技术领域, 尤其涉及一种信息的发布方法、 系统及装置。背景技术 在目前的信息发布领域, 很多信息都是通过纸质媒介的发布方式, 例如, 目前常用 的字典等具有条目内容的图书, 其一般都是通过印刷出版的方式发布。
如图 1 所示, 在字典出版领域, 采用印刷出版方式发布信息, 具体包括如下步骤 :
步骤 101、 出版社进行选题, 确定待出版图书的类型。
步骤 102、 出版社编辑向作者约稿, 约稿方式一般通过电话或邮件, 作者一般通过 纸质媒介交初稿。
步骤 103、 编辑收到初稿后改稿, 改稿经校对人员校对后交给排版人员排出纸质小 样, 将小样交给编辑人员。
步骤 104、 重复步骤 103, 经三审三校后由排版人员排出成稿。
步骤 105、 成稿被总编室审批成功后, 将被提交印刷厂印刷出版。
基于上述步骤, 印刷出版方式发布存在如下缺点 :
(1) 编辑的改稿、 校对都是通过纸质媒介进行, 就导致编辑的劳动被固化在纸质媒 介上无法重复利用 ;
(2) 此种出版方式留下的数字资源仅有数字排版文件, 一般数字排版文件的特点 是图书的内容与排版样式混合在同一个排版文件中, 且该排版文件没有考虑结构化, 相当 于一个简单的字符序列, 因此, 当将数字排版文件应用于网络出版时, 由于针对不同的网络 环境相同的条目内容可能使用不同的显示样式 ; 当将数字排版文件应用于手机出版时, 由 于手机屏幕大小限制, 需要显示每个条目内容中对用户最有意义的部分 ( 如字典中, 显示 释义不显示例句等 ), 因此, 目前的数字排版文件无法直接应用于网络出版以及手机出版等 电子出版领域。
(3) 此种出版方式忽略了条目内容结构化组成的特点, 仅仅将条目的内容连同排 版样式一起混合存入数字排版文件, 无法满足对条目中某些内容的深度加工, 例如, 修改或 扩展等处理。
综上所述, 在字典等采用印刷出版方式发布信息的领域中, 数字资源的再利用率 低, 不便于信息的深度加工, 并且数字资源不能直接应用于手机、 网络等其它出版方式。
发明内容 有鉴于此, 本发明实施例提供一种信息的发布方法、 系统及装置, 用于解决现有采 用印刷出版方式发布信息的数字资源再利用率低, 不便于信息深度加工以及数字资源无法 直接应用于网络、 手机等出版方式的问题。
本发明实施例通过如下技术方案实现 :
根据本发明实施例的一个方面, 提供了一种信息的发布方法。
根据本发明实施例提供的信息的发布方法, 包括 :
确定待发布信息对应的数字排版文件 ;
根据待发布信息对应的提取属性以及提取条件, 从所述数字排版文件中提取与所 述提取属性对应的信息 ;
根据待发布信息不同提取属性对应的层级关系, 将提取的与所述提取属性对应的 信息按照设定格式上传到服务器中存储, 并通过所述服务器发布其存储的信息。
根据本发明实施例的另一个方面, 还提供了一种信息的发布系统。
根据本发明实施例提供的信息的发布系统, 包括 :
信息提取装置, 用于确定待发布信息对应的数字排版文件, 根据待发布信息对应 的提取属性以及提取条件, 从所述数字排版文件中提取与所述提取属性对应的信息 ; 并根 据待发布信息不同提取属性对应的层级关系, 将提取的与所述提取属性对应的信息按照设 定格式上传到服务器 ;
服务器, 用于存储所述信息提取装置上传的信息, 并发布其存储的信息。
根据本发明实施例的另一个方面, 还提供了一种信息的发布装置。
根据本发明实施例提供的信息的发布装置, 包括 :
确定单元, 用于确定待发布信息对应的数字排版文件 ;
信息提取单元, 用于根据待发布信息对应的提取属性以及提取条件, 从所述确定 单元确定的数字排版文件中提取与所述提取属性对应的信息 ;
信息上传单元, 用于根据待发布信息不同提取属性对应的层级关系, 将提取的与 所述提取属性对应的信息按照设定格式上传到服务器中存储, 并通过所述服务器发布其存 储的信息。
通过本发明实施例提供的上述至少一个技术方案, 确定待发布信息对应的数字排 版文件, 根据待发布信息对应的提取属性以及提取条件, 从该数字排版文件中提取与提取 属性对应的信息, 然后根据待发布信息不同提取属性对应的层级关系, 将提取的与提取属 性对应的信息按照设定格式上传到服务器中存储, 并通过服务器发布其存储的信息, 采用 该技术方案, 能够有效地利用数字排版文件, 提高了采用印刷出版方式发布信息的数字资 源再利用率, 并且便于对信息进行深度加工, 可以直接应用于网络、 手机等出版方式。
本发明的其它特征和优点将在随后的说明书中阐述, 并且, 部分地从说明书中变 得显而易见, 或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明 书、 权利要求书、 以及附图中所特别指出的结构来实现和获得。 附图说明
附图用来提供对本发明的进一步理解, 并且构成说明书的一部分, 与本发明实施 例一起用于解释本发明, 并不构成对本发明的限制。在附图中 :
图 1 为本发明背景技术中传统字典发布方式流程图 ;
图 2 为本发明实施例中信息的发布系统第一示意图 ;
图 3 为本发明实施例中信息的发布系统第二示意图 ;
图 4 为本发明实施例中信息的发布方法流程图 ;
图 5 为本发明实施例中字典条目结构凡例示意图 ;图 6 为本发明实施例中信息的发布装置示意图。具体实施方式
为了给出简化信息发布流程、 提供资源再利用率以及便于信息深度加工的实现方 案, 本发明实施例提供了一种信息的发布方法、 系统及装置, 以下结合说明书附图对本发明 的优选实施例进行说明, 应当理解, 此处所描述的优选实施例仅用于说明和解释本发明, 并 不用于限定本发明。并且在不冲突的情况下, 本申请中的实施例及实施例中的特征可以相 互组合。
根据本发明实施例, 首先提供了一种信息的发布系统, 如图 2 所示, 该系统所涉及 的网络包括如下实体 :
信息提取装置 201 以及服务器 202 ; 其中 :
信息提取装置 201, 用于确定待发布信息对应的数字排版文件, 根据待发布信息对 应的提取属性以及提取条件, 从确定的数字排版文件中提取与待发布信息的提取属性对应 的信息 ; 并根据待发布信息不同提取属性对应的层级关系, 将提取的与提取属性对应的信 息按照设定格式上传到服务器 202 ; 服务器 202, 用于存储信息提取装置 201 上传的信息, 并发布其存储的信息。
较佳地, 如图 3 所示, 本发明一个实施例所涉及的系统还可以进一步包括 :
信息获取装置 203, 该装置用于向服务器 202 发送信息获取请求, 并接收服务器 202 提供的信息 ;
相应地, 服务器 202 还用于, 接收信息获取装置 203 的信息获取请求, 在对该信息 获取装置 203 验证通过后, 根据接收的信息获取请求向该信息获取装置 203 提供信息。
进一步地, 本发明一个实施例中, 信息获取装置 203 可以为网络设备、 移动终端或 信息加工设备 ;
当信息获取装置 203 为信息加工设备 ( 例如印刷机 ) 时, 可以执行对信息的加工, 例如根据获取的信息生成数字排版文件, 并根据生成的数字排版文件印刷出版, 为实现此 功能, 上述信息获取装置 203 还用于, 采用设定方式加工获取的信息, 并在加工过程中向服 务器 202 上报加工状态信息 ;
相应地, 服务器 202 还用于, 接收信息获取装置 203 上报的加工状态信息, 以确定 信息获取装置的运行状态以及信息的加工进度。
进一步地, 本发明一个实施例中, 还可以对服务器 202 中存储的信息进行深度加 工, 例如更改、 扩展、 删除等更新操作, 具体地, 该服务器还包括 :
信息更新装置, 用于向服务器 202 发送信息更新请求 ;
相应地, 服务器 202 还用于, 接收信息更新装置的信息更新请求, 在对信息更新装 置验证通过后, 根据接收的信息更新请求更新存储的信息。
实际应用中, 服务器 202 可以提供通过 Internet 可以被访问的接口供信息提取装 置 201、 信息获取装置 203 以及信息更新装置访问, 信息提取装置 201、 信息获取装置 203 以 及信息更新装置也具有相应的 Internet 接口, 在需要访问服务器 202 时, 调用该接口完成 与服务器 202 的交互。
本发明实施例所述系统中各实体所实现的更为详细的功能以及具体实现过程将
在随后的实施例中体现, 此处不再详细描述。
本发明实施例提供的信息的发布方法中, 通过从数字排版文件中提取信息并以设 定格式存储到服务器中进行发布, 具体如图 4 所示, 包括 :
步骤 401、 确定待发布信息对应的数字排版文件 ;
步骤 402、 根据待发布信息对应的提取属性以及提取条件, 从确定的数字排版文件 中提取与待发布信息的提取属性对应的信息 ;
步骤 403、 根据待发布信息不同提取属性对应的层级关系, 将提取的与提取属性对 应的信息按照设定格式上传到服务器中 ;
步骤 404、 服务器接收信息后存储, 并发布其存储的信息。
该步骤中, 服务器发布其存储的信息, 较常用地采用如下方式 :
由服务器主动下发信息, 例如, 定时向指定终端发布其存储的信息 ; 或,
基于信息获取请求下发信息, 即接收信息获取请求, 并根据该信息获取请求向发 送该信息获取请求的设备提供相应信息。较佳地, 服务器在向发送信息获取请求的设备提 供其请求获取的信息之前, 对该发送信息获取请求的设备进行验证, 例如验证该设备是否 有权限使用其请求获取的信息, 并在对该设备验证通过后, 根据信息获取请求向该设备提 供信息。 本发明实施例中, 发送信息获取请求的设备可以为网络设备 ( 如 PC)、 移动终端或 信息加工设备等, 其中, 信息加工设备可以在获取到信息后, 还可以采用设定方式 ( 例如印 刷成册 ) 加工获取的信息, 并在加工过程中向服务器上报加工状态信息, 以方便服务器对 信息的加工流程以及信息加工设备的运行状况进行监控。
进一步地, 本发明实施例中, 还可以对存储在服务器中的信息进行深度加工, 例如 信息更改、 信息删除、 添加等, 具体地, 可以登录到服务器更改信息, 向服务器发送信息更新 请求, 相应地, 服务器接收信息更新请求, 并根据接收的信息更新请求更新存储的信息。较 佳地, 服务器在根据接收的信息更新请求更新存储的信息之前, 首先对发送信息更新请求 的设备进行身份验证, 并在对该设备验证通过后, 根据接收的信息更新请求更新存储的信 息。
为了更好地理解本发明实施例提供的信息的发布方法, 以下结合字典信息的发布 过程对本发明实施例所涉及的更为具体的细节进行详细描述 :
字典的数字排版文件中同时保存了字典条目的内容和条目内容最终印刷时的排 版样式, 一个数字排版文件可能含有多个条目, 其中每一个条目中条目内容和排版样式都 是混排的, 条目之间也没有明显的区分 ( 如换行、 换段等 )。因此, 本发明实施例中, 首先基 于信息提取装置对字典数字排版文件进行信息提取以及格式转换, 保存到服务器中。
首先, 对字典进行分析, 确定字典条目结构凡例, 该字典条目结构凡例中包括的信 息有 : 待发布信息的提取属性、 提取条件以及待发布信息各提取属性之间的层次关系等。
在确定字典条目结构凡例时, 应根据用户的应用要求确定, 例如网络出版或手机 终端出版, 确定的字典条目结构凡例的一个示例如下 :
在确定字典条目结构凡例时, 确定字典条目中不同内容的名称, 如以上内容中 ITEM 节点中 name = “派生词” , 就表示了在该字典中有派生词内容需要提取 ; 并且确定不同 节点 ( 待发布信息的提取属性 ) 的关系, 如以上内容中 “条目” 节点的 level = “1” 而 “派生 词” 节点的 level = “2” , 则说明条目节点是派生词节点的上层 ( 或父节点 ) ; 并且确定每个 节点 ( 待发布信息的提取属性 ) 的提取条件, 由上述内容中的 “CONDITION” 确定, CONDITION 节点指出了对现有数字排版文件提取的通配条件集, PATTERN 节点描述了通配条件集中的 一个条件, 例如该节点在数字排版文件中的排版样式。对应的用户界面如图 5 所示, 其中, 级次表示字典条目中不同提取属性之间的层次关系, 级次最小为 0 逐次增长, 小数字节点
比大数字节点具有更高的级次, 例如, 2 级节点是所有大于 2 级 (3、 4 级等等 ) 节点的祖先, 级次相同的节点为兄弟关系 ; 层级结构指的是该类型的节点在输出时遵循上述级次关系 ; 不输出是指该类型的节点不输出, 用来屏蔽用户不需要的内容。
根据上述过程确定字典条目结构凡例后, 通过信息提取装置装载该字典条目结构 凡例, 选定待发布的字典的数字排版文件, 由信息提取装置自动将字典数字排版文件中的 多个条目区分开, 并且将每个条目按照字典条目结构凡例中的提取属性信息以及提取条件 信息提取出来, 并根据字典条目结构凡例中不同提取属性之间的层次关系将信息转换为设 定格式, 一个具体示例如下 :
以上内容按照设定格式存储不同提取属性对应的信息内容, 各提取属性之间具有 层次关系, 方便信息的查找、 获取以及更新等。
通过上述过程将信息提取并转换为设定格式后, 上传至服务器, 由服务器存储信 息, 具体在存储时, 可采用如表一所示格式 :
表一 :
字段名 SYS_DOCUMENTID WORD_ORDER PAGE CATALOG_ID WORD CONTENT EDIT_STATUS RELATION
类型 NUMBER(12) FLOAT(12) NUMBER(10) NUMBER(12) VARCHAR(2048) CLOB NUMBER(10) VARCHAR(2048)为空值? N描述 主键 ID, 唯一标识 条目顺序 页码 目录 ID 条目名称 条目内容 加工状态 关联条目根据上表所示的存储格式, 服务器在存储字典条目内容时, 为每一个条目动态生 成唯一的 ID, 保存在 SYS_DOCUMENTID 字段, 条目结构化内容保存在 CONTENT 字段, 如果有条 目的加工状态信息, 则将条目的加工状态保存在 EDIT_STATUS 字段。
根据本发明实施例, 还可以同时上传字典对应的图片或音频附件, 图片在服务器 中可采用如表二所示存储格式 :
表二 :
根据上表所示的存储格式, 服务器为每一个图片动态生成唯一的 ID, 保存在 SYS_ DOCUMENTID 字段, 图片内容保存在 IMG_REAL_PATH 字段中, 如果有图片的加工状态信息, 则 图片的加工状态保存在 SYS_CURRENTSTATUS 字段中。
本实施例中, 信息获取装置, 如信息加工设备调用服务器接口获得待加工的所有 条目名称及条目 ID, 确定条目后, 信息加工设备根据表一的 SYS_DOCUMENTID 字段获得服务 器上相应的 CONTENT 字段内容共编辑加工。当加工完成后, 字典加工装置调用服务器的接 口将 CONTENT 字段内容发送至服务器保存。
还可以调用服务器接口对服务器保存的条目进行更新, 例如, 对当前字典结构凡 例的调整, 如原来认为该字典条目结构中的 “拼音” 节点与 “释义” 节点是父子关系, 现在可 以将其定义为兄弟关系 ; 再例如, 对结构凡例的扩展, 如可以将某字典条目结构中 “释义” 节 点中以尖括号 <> 括起来的部分抽取出来单独成为 “条目” 节点。
本实施例中可以通过查询服务器上表一中的 EDIT_STATUS 字段确定条目的加工 状态。
采用本发明实施例上述的字典信息发布方法, 对现有字典的数字排版文件进行再 次利用, 根据字典条目凡例自动提取条目内容, 在提高了工作效率的基础上, 还具有以下效 果:
(1) 增加资源的利用程度 : 通过把固化在字典的数字排版文件内部的编辑的劳动 以结构化的条目形式提取并保存, 使编辑的劳动在纸质图书出版后还能得到利用。
(2) 适应当前新媒体出版要求 : 通过服务器可以根据需要任意抽取信息内容进行 发布、 出版, 适应当前移动终端、 网络设备等多种新媒体出版的要求。
(3) 信息扩展更方便 : 通过对服务器中存储的信息进行信息更新, 可以再次对信 息内容进行深度加工, 例如, 更改、 扩展、 上传图片、 音频等, 适应未来出版需要。
与上述流程对应, 本发明实施例还提供了一种信息提取装置, 如图 6 所示, 该装置 包括 :
确定单元 601、 信息提取单元 602、 以及信息上传单元 603 ; 其中 :
确定单元 601, 用于确定待发布信息对应的数字排版文件 ;
信息提取单元 602, 用于根据待发布信息对应的提取属性以及提取条件, 从确定单 元 601 确定的数字排版文件中提取与该提取属性对应的信息 ;
信息上传单元 603, 用于根据待发布信息不同提取属性对应的层级关系, 将提取的 与提取属性对应的信息按照设定格式上传到服务器中存储, 并通过服务器发布其存储的信 息。
应当理解, 该实施例提供的信息提取装置所实现的功能与上述实施例提供的信息 发布方法流程一一对应, 对于该装置各个功能单元所实现的更为详细的处理流程, 在上述 方法实施例中已做详细描述, 此处不再详细描述。
通过本发明实施例提供的上述至少一个技术方案, 确定待发布信息对应的数字排 版文件, 根据待发布信息对应的提取属性以及提取条件, 从该数字排版文件中提取与提取 属性对应的信息, 然后根据待发布信息不同提取属性对应的层级关系, 将提取的与提取属 性对应的信息按照设定格式上传到服务器中存储, 并通过服务器发布其存储的信息, 采用 该技术方案, 简化了信息发布流程, 并且有效地利用了数字排版文件, 从而提高了资源再利 用率, 并且便于对信息进行深度加工。
显然, 本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精 神和范围。这样, 倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围 之内, 则本发明也意图包含这些改动和变型在内。