《百科内容的发布方法和装置.pdf》由会员分享,可在线阅读,更多相关《百科内容的发布方法和装置.pdf(20页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103177020 A(43)申请公布日 2013.06.26CN103177020A*CN103177020A*(21)申请号 201110437546.X(22)申请日 2011.12.21G06F 17/30(2006.01)(71)申请人北大方正集团有限公司地址 100871 北京市海淀区成府路298号方正大厦5层申请人北京北大方正电子有限公司(72)发明人陈金莲(74)专利代理机构北京英赛嘉华知识产权代理有限责任公司 11204代理人王达佐(54) 发明名称百科内容的发布方法和装置(57) 摘要本发明提供了一种百科内容的发布方法,包括:获取百科类内容资源文件。
2、的多个条目;使用预设的标引规则标引各个条目的属性;根据属性重组多个条目;套用预设的模板发布重组的条目。本发明提供了一种百科内容的发布装置,包括:获取模块,用于获取百科类内容资源文件的多个条目;标引模块,用于使用预设的标引规则标引各个条目的属性;重组模块,用于根据属性重组多个条目;发布模块,用于套用预设的模板发布重组的条目。本发明实现了百科类知识的高效发布。(51)Int.Cl.权利要求书1页 说明书11页 附图7页(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书1页 说明书11页 附图7页(10)申请公布号 CN 103177020 ACN 103177020 A1/1页21。
3、.一种百科内容的发布方法,其特征在于,包括:获取百科类内容资源文件的多个条目;使用预设的标引规则标引各个所述条目的属性;根据所述属性重组所述多个条目;套用预设的模板发布所述重组的条目。2.根据权利要求1所述的方法,其特征在于,根据所述百科类内容资源文件的文本样式,对所述百科类内容资源文件进行结构化,以获得所述多个条目。3.根据权利要求1所述的方法,其特征在于,所述属性包括:来源、适用对象、年龄阶段、关键词和作者。4.根据权利要求3所述的方法,其特征在于,根据所述适用对象、所述年龄阶段和所述关键词中的至少一个重组所述多个条目。5.根据权利要求1所述的方法,其特征在于,套用预设的模板发布所述重组的。
4、条目包括:预先创建Html模板、Epub模板和MMS模板;使用所述Html模板套设所述重组的条目得到Html内容,并通过网站发布所述Html内容;使用所述Epub模板套设所述重组的条目得到Epub内容,并通过移动终端发布所述Epub内容;使用所述MMS模板套设所述重组的条目得到MMS内容,并通过移动终端发布所述Epub内容。6.一种百科内容的发布装置,其特征在于,包括:获取模块,用于获取百科类内容资源文件的多个条目;标引模块,用于使用预设的标引规则标引各个所述条目的属性;重组模块,用于根据所述属性重组所述多个条目;发布模块,用于套用预设的模板发布所述重组的条目。7.根据权利要求6所述的装置,其。
5、特征在于,所述获取模块根据所述百科类内容资源文件的文本样式,对所述百科类内容资源文件进行结构化,以获得所述多个条目。8.根据权利要求6所述的装置,其特征在于,所述属性包括:来源、适用对象、年龄阶段、关键词和作者。9.根据权利要求8所述的装置,其特征在于,所述重组模块根据所述适用对象、所述年龄阶段和所述关键词中的至少一个重组所述多个条目。10.根据权利要求6所述的装置,其特征在于,所述分布模块预先创建Html模板、Epub模板和MMS模板;使用所述Html模板套设所述重组的条目得到Html内容,并通过网站发布所述Html内容;使用所述Epub模板套设所述重组的条目得到Epub内容,并通过移动终端。
6、发布所述Epub内容;使用所述MMS模板套设所述重组的条目得到MMS内容,并通过移动终端发布所述Epub内容。权 利 要 求 书CN 103177020 A1/11页3百科内容的发布方法和装置技术领域0001 本发明涉及数字出版领域,具体而言,涉及一种百科内容的发布方法和装置。背景技术0002 百科类知识涉及到人们生活的方方面面,很多时候读者需要以各种方式来获取所需的内容,而不是通读全书。然而,目前在专业百科类数字出版领域中,例如专业医学类,百科知识内容资源多以纸质出版物介质存在,没有形成可重复利用的内容资源,也没有形成知识体系。专业百科类知识内容数量庞大纷杂,读者很难从中快速找到所需的某一方。
7、面的知识。发明内容0003 本发明旨在提供一种百科内容的发布方法和装置,以解决百科类知识的发布问题。0004 在本发明的实施例中,提供了一种百科内容的发布方法,包括:获取百科类内容资源文件的多个条目;使用预设的标引规则标引各个条目的属性;根据属性重组多个条目;套用预设的模板发布重组的条目。0005 在本发明的实施例中,提供了一种百科内容的发布装置,包括:获取模块,用于获取百科类内容资源文件的多个条目;标引模块,用于使用预设的标引规则标引各个条目的属性;重组模块,用于根据属性重组多个条目;发布模块,用于套用预设的模板发布重组的条目。0006 本发明上述实施例的百科内容的发布方法和装置因为采用数据。
8、结构来处理百科内容,从而实现了百科类知识的高效发布。附图说明0007 此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:0008 图1示出了根据本发明实施例的百科内容的发布方法的流程图;0009 图2示出了根据本发明实施例的条目效果图;0010 图3示出了根据本发明实施例的内容重组的效果图;0011 图4示出了根据本发明实施例的内容重组得到的条目内容的xml文件;0012 图5示出了根据本发明实施例的html内容的效果图;0013 图6示出了根据本发明实施例的Epub内容的效果图;0014 图7示。
9、出了根据本发明实施例的MMS内容的效果图;0015 图8示出了根据本发明实施例的百科内容的发布装置的示意图。具体实施方式说 明 书CN 103177020 A2/11页40016 下面将参考附图并结合实施例,来详细说明本发明。0017 图1示出了根据本发明实施例的百科内容的发布方法的流程图,包括:0018 步骤S10,获取百科类内容资源文件的多个条目;0019 步骤S20,使用预设的标引规则标引各个条目的属性;0020 步骤S30,根据属性重组多个条目;0021 步骤S40,套用预设的模板发布重组的条目。0022 该方法采用数据结构来处理百科内容,从而实现了百科类知识的高效发布。0023 优选。
10、地,根据百科类内容资源文件的文本样式,对百科类内容资源文件进行结构化,以获得多个条目。0024 例如,可以收集百科条目的内容文件,对已有的内容资源进行百科条目结构化拆分,得到的百科条目录入数据库。图2示出了根据本发明实施例的条目效果图。用户选择打开百科内容文档“中草药百科知识.doc”,关于文本样式的规则为“颜色RGB:默认色,字体:(中文)+中文正文,字号:小四,加粗”,释文的规则为“颜色RGB:默认色,字体:(西文)+中文正文,字号:小五”;然后对文档中的百科条目进行自动标引,并对条目内的条头、释文等条目结构通过自动提取规则进行自动提取。用户可以导出百科条目结构化标引体系。然后用户导入结构。
11、化标引体系。0025 对文档“中草药百科知识.doc”设置的自动提取规则.xml可以定义如下:0026 说 明 书CN 103177020 A3/11页50027 说 明 书CN 103177020 A4/11页60028 说 明 书CN 103177020 A5/11页70029 自动提取规则分为两种:word文本样式规则和正则表达式规则。0030 Word文本样式规则可以从word的文本样式中提取,具体提取规则包括word文档编辑的常见样式规则,部分枚举如下:0031 font 字体 underline 下划线size 字体大小color 字体颜色italic 斜体bold 粗体0032 。
12、为了满足更复杂格式的百科条目提取,提取规则可通过正则表达式进行自动匹配。例如提取以“【英文名称】”前缀的内容为条目的英文名称,则正则表达式规则为。0033 优选地,属性包括:来源、适用对象、年龄阶段、关键词和作者。0034 百科条目的存储表结构可以如下表所示,其中以SYS_DOCUMENTID存储条目ID,唯一标识条目,以DOC_EXPLAIN存储条目内容,以SYS_TOPIC存储条目条头。DOC_EXPLAIN为大文本字段,存储结构化的xml条目内容。0035 说 明 书CN 103177020 A6/11页80036 0037 优选地,根据适用对象、年龄阶段和关键词中的至少一个重组多个条目。
13、。图3示出了根据本发明实施例的内容重组的效果图。如图所示,设置条目的筛选条件和发布设置以说 明 书CN 103177020 A7/11页9及排序条件。通过内容分类选择可以指定只发布某个分类下面的百科条目。通过适用对象、年龄阶段、关键词等属性字段对服务器的条目资源进行筛选,只发布符合条件的条目内容;可以设置要发布内容的条目数,可以通过条目的创建日期进行按时间段发布,也可以设置发布的具体周期;可以设置最终条目内容的排序规则,可以按照条目的属性字段进行任意排序,例如按照创建日期升序排序输出。按照模板名称和创建人信息保存该内容模板。按照内容模板输出的条目内容为xml通用格式,如图4所示。下面对条目结构。
14、的一些主要节点进行注释:0038 百科条目的根节点百科条目的系统属性节点百科条目的属性节点百科条目的条头百科条目的正文0039 优选地,套用预设的模板发布重组的条目包括:预先创建Html模板、Epub模板和MMS模板;使用Html模板套设重组的条目得到Html内容,并通过网站发布Html内容;使用Epub模板套设重组的条目得到Epub内容,并通过移动终端发布Epub内容;使用MMS模板套设重组的条目得到MMS内容,并通过移动终端发布Epub内容。0040 在数字出版时代,人们的阅读方式已经不再单一的局限于纸质阅读,手机阅读、网络阅读、电子阅读器、平板电脑阅读等多种形式的阅读方式极大了改变了人们。
15、传统的单一的纸质阅读的习惯,这对内容出版来说也提出了多元发布的新需求。0041 本实施例中提供三种条目发布方式:Html模板用于网站发布;Epub模板用于移动设备发布;MMS(彩信)发布模板用于手机彩信发布。选择输出文件的形式可以为共享目录或ftp形式。如图5所示,为用户选择系统内置的html发布模板对内容模板进行网页发布的效果图。如图6所示,为用户选择内置Epub模板对条目内容进行移动设备发布的效果图。如图7所示,为用户选择系统内置的MMS模板进行手机条目内容发布的效果图。0042 发布模板可以为xslt格式,对内容模板输出的xml内容文件匹配用户选择的xslt发布模板,从而进行内容组装,再转换为不同发布形式的内容资源包。xslt发布模板如下:0043 说 明 书CN 103177020 A8/11页100044 说 明 书CN 103177020 A10。