一种视频源名称处理方法及装置.pdf

上传人:Y948****062 文档编号:6187637 上传时间:2019-05-18 格式:PDF 页数:16 大小:1.67MB
返回 下载 相关 举报
摘要
申请专利号:

CN201310479231.0

申请日:

2013.10.14

公开号:

CN103544252A

公开日:

2014.01.29

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||专利申请权的转移IPC(主分类):G06F 17/30登记生效日:20160427变更事项:申请人变更前权利人:北京暴风科技股份有限公司变更后权利人:成都云朵技术有限公司变更事项:地址变更前权利人:100191 北京市海淀区学院路51号首享科技大厦13层变更后权利人:610000 四川省成都市高新区天府大道北段1480号6幢119室|||实质审查的生效IPC(主分类):G06F 17/30申请日:20131014|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

北京暴风科技股份有限公司

发明人:

冯鑫; 王干; 林赞贤

地址:

100191 北京市海淀区学院路51号首享科技大厦13层

优先权:

专利代理机构:

北京凯特来知识产权代理有限公司 11260

代理人:

郑立明;赵镇勇

PDF下载: PDF下载
内容摘要

本发明公开了一种视频源名称处理方法及装置,包括:提取待处理的视频源的原始片名,将所述原始片名与视频源片名库中的片名进行匹配,若存在与所述原始片名匹配的片名,则将该待处理的视频源加入视频源数据库中,否则,将所述原始片名进行拆分,获得所述待处理的视频源的原子片名,并根据所述待处理的视频源的信息确定该视频源的片名属性分类信息;再将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名。本发明实施例提供的技术方案能够对不同来源影片的原始片名自动地进行合理的拆分及规范化重组,从而实现自动化整理及合并不同来源的视频源,进而减少相应处理过程中的人工成本投入。

权利要求书

权利要求书
1.  一种视频源名称处理方法,其特征在于,包括:
提取待处理的视频源的原始片名,所述原始片名为视频源的当前名称;
将所述原始片名与视频源片名库中的片名进行匹配,若存在与所述原始片名匹配的片名,则将该待处理的视频源加入视频源数据库中,否则,
将所述原始片名进行拆分,获得所述待处理的视频源的原子片名,并根据所述待处理的视频源的信息确定该视频源的片名属性分类信息,所述原子片名是指视频源本身的名称;再将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名;
根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中。

2.  根据权利要求1所述的方法,其特征在于,所述片名属性分类信息包括:片名中缀信息、片名后缀信息和连接词中的一项或多项;所述片名属性分类信息用于记载视频源的具体参数信息,包括视频源的类型信息、视频源的来源信息或视频源的版本信息中的一项或多项。

3.  根据权利要求2所述的方法,其特征在于,根据所述待处理的视频源的信息确定该视频源的片名属性分类信息的步骤包括:
解析所述待处理的视频源的原始片名,从所述原始片名中获取所述片名中缀信息、片名后缀信息和连接词;
所述片名中缀信息、片名后缀信息和连接词按照预定的格式组合作为该视频源的片名属性分类信息。

4.  根据权利要求3所述的方法,其特征在于,将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名的步骤包括:
依次将原子片名、中连接词、片名中缀信息、后连接词和片名后缀信息组合获得所述视频源的组合片名。

5.  根据权利要求1至4任一项所述的方法,其特征在于,根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中的步骤包括:
判断所述原子片名是否存在于原子片名库中,若存在且该原子片名无对应的片名属性分类信息,则直接将原子片名加入到视频源片名库中,还将该视频源加入到所述视频源数据库中;
若原子片名未存在于原子片名库中,则判断所述原子片名对应的组合片名是否存在于组合片名库中,若存在,则将该组合片名加入到视频源片名库中,并将该视频源加入到所述视频源数据库中,若该组合片名未存在于组合片名库中,则将所述原子片名加入原子片名库中,将所述组合片名加入组合片名库中,根据所述组合片名更新视频源片名库中的片名,并将该视频源加入到所述视频源数据库中。

6.  一种视频源名称处理装置,其特征在于,包括:
原始片名获取单元,用于提取待处理的视频源的原始片名,所述原始片名为视频源的当前名称;
原始片名匹配处理单元,用于将所述原始片名获取单元提取到的原始片名与视频源片名库中的片名进行匹配;
视频加入处理单元,用于在所述原始片名匹配处理单元确定视频源片名库中存在与所述原始片名匹配的片名时,将该待处理的视频源加入视频源数据库中;
组合片名重组单元,用于在所述原始片名匹配处理单元确定视频源片名库中未存在与所述原始片名匹配的片名时,将所述原始片名进行拆分,获得所述待处理的视频源的原子片名,并根据所述待处理的视频源的信息确定该视频源的片名属性分类信息,所述原子片名是指视频源本身的名称;再将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名;还用于通知所述视频加入处理单元根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中。

7.  根据权利要求6所述的装置,其特征在于,所述片名属性分类信息包括:片名中缀信息、片名后缀信息或连接词中的一项或多项;所述片名属性分类信息用于记载视频源的具体参数信息,包括视频源的类型信息、视频源的来源信息或视频源的版本信息中的一项或多项。

8.  根据权利要求7所述的装置,其特征在于,所述组合片名重组单元中,根据所述待处理的视频源的信息确定该视频源的片名属性分类信息的步骤由以下单元实现:
原始片名解析子单元,用于解析所述原始片名获取单元提取的待处理的视频源的原始片名,从所述原始片名中获取所述片名中缀信息、片名后缀信息和连接词;
片名属性分类信息确定子单元,用于将所述原始片名解析子单元解析获得的片名中缀信息、片名后缀信息和连接词按照预定的格式组合作为该视频源的片名属性分类信息。

9.  根据权利要求8所述的装置,其特征在于,所述组合片名重组单元中,将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名的步骤由以下单元实现:
重组组合片名子单元,用于获取所述片名属性分类信息确定子单元确定的片名属性分类信息,并依次将所述原子片名、中连接词、片名中缀信息、后连接词和片名后缀信息组合获得所述视频源的组合片名。

10.  根据权利要求6至9任一项所述的装置,其特征在于,该装置还包括:
原子片名判断处理单元,用于判断所述组合片名重组单元获得的原子片名是否存在于原子片名库中,若存在且该原子片名无对应的片名属性分类信息,则直接将原子片名加入到视频源片名库中,还通知所述视频加入处理单将该视频源加入到所述视频源数据库中;
组合片名判断处理单元,用于根据所述原子片名判断处理单元的判断结果,若确定所述原子片名未存在于原子片名库中,则判断所述原子片名对应的组合片名是否存在于组合片名库中,若存在,则将该组合片名加入到视频源片名库中,并通知所述视频加入处理单将该视频源加入到所述视频源数据库中,若该组合片名未存在于组合片名库中,则将所述原子片名加入原子片名库中,将所述组合片名加入组合片名库中,根据所述组合片名更新视频源片名库中的片名,并通知所述视频加入处理单将该视频源加入到所述视频源数据库中。

说明书

说明书一种视频源名称处理方法及装置
技术领域
本发明涉及一种视频处理技术,尤其涉及一种视频源名称处理方法及装置。 
背景技术
随着网络技术的快速发展,通过网络传播的视频源也越来越多。为此,便出现了一些专门提供视频源信息的网站,同时,为保证网站能够为用户更为方便地提供其需要的视频源,则在网站服务器中需要对视频源进行有效的管理,其中包括对视频源的名称的统一管理等。 
目前,由于提供视频的影视聚合产品中数据来源的格式及命名的不同,导致现有影视聚合产品普遍存在数据杂乱及大量重复的问题。针对相应问题,目前,通常采用的针对视频源名称的管理方式为人工简单进行管理。这种人工针对视频名称进行管理的方式一方面无法保证数据整理的有效性,例如,仍然存在片名重复杂乱的问题等,另一方面还将导致较大的人工成本投入。 
发明内容
本发明的目的是提供一种视频源名称处理方法及装置,从而可以有效针对视频源的名称进行管理。 
本发明的目的是通过以下技术方案实现的: 
一种视频源名称处理方法,包括: 
提取待处理的视频源的原始片名,所述原始片名为视频源的当前名称; 
将所述原始片名与视频源片名库中的片名进行匹配,若存在与所述原始片名匹配的片名,则将该待处理的视频源加入视频源数据库中,否则, 
将所述原始片名进行拆分,获得所述待处理的视频源的原子片名,并根据所述待处理的视频源的信息确定该视频源的片名属性分类信息,所述原子片名是指视频源本身的名称;再将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名; 
根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中。 
其中,所述片名属性分类信息包括:片名中缀信息、片名后缀信息和连接词中的一 项或多项;所述片名属性分类信息用于记载视频源的具体参数信息,包括视频源的类型信息、视频源的来源信息或视频源的版本信息中的一项或多项。 
进一步地,根据所述待处理的视频源的信息确定该视频源的片名属性分类信息的步骤包括: 
解析所述待处理的视频源的原始片名,从所述原始片名中获取所述片名中缀信息、片名后缀信息和连接词; 
所述片名中缀信息、片名后缀信息和连接词按照预定的格式组合作为该视频源的片名属性分类信息。 
可选地,将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名的步骤包括: 
依次将原子片名、中连接词、片名中缀信息、后连接词和片名后缀信息组合获得所述视频源的组合片名。 
进一步地,根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中的步骤包括: 
判断所述原子片名是否存在于原子片名库中,若存在且该原子片名无对应的片名属性分类信息,则直接将原子片名加入到视频源片名库中,还将该视频源加入到所述视频源数据库中; 
若原子片名未存在于原子片名库中,则判断所述原子片名对应的组合片名是否存在于组合片名库中,若存在,则将该组合片名加入到视频源片名库中,并将该视频源加入到所述视频源数据库中,若该组合片名未存在于组合片名库中,则将所述原子片名加入原子片名库中,将所述组合片名加入组合片名库中,根据所述组合片名更新视频源片名库中的片名,并将该视频源加入到所述视频源数据库中。 
一种视频源名称处理装置,包括: 
原始片名获取单元,用于提取待处理的视频源的原始片名,所述原始片名为视频源的当前名称; 
原始片名匹配处理单元,用于将所述原始片名获取单元提取到的原始片名与视频源片名库中的片名进行匹配; 
视频加入处理单元,用于在所述原始片名匹配处理单元确定视频源片名库中存在与所述原始片名匹配的片名时,将该待处理的视频源加入视频源数据库中; 
组合片名重组单元,用于在所述原始片名匹配处理单元确定视频源片名库中未存在 与所述原始片名匹配的片名时,将所述原始片名进行拆分,获得所述待处理的视频源的原子片名,并根据所述待处理的视频源的信息确定该视频源的片名属性分类信息,所述原子片名是指视频源本身的名称;再将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名;还用于通知所述视频加入处理单元根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中。 
其中,所述片名属性分类信息包括:片名中缀信息、片名后缀信息或连接词中的一项或多项;所述片名属性分类信息用于记载视频源的具体参数信息,包括视频源的类型信息、视频源的来源信息或视频源的版本信息中的一项或多项。 
进一步地,所述组合片名重组单元中,根据所述待处理的视频源的信息确定该视频源的片名属性分类信息的步骤由以下单元实现: 
原始片名解析子单元,用于解析所述原始片名获取单元提取的待处理的视频源的原始片名,从所述原始片名中获取所述片名中缀信息、片名后缀信息和连接词; 
片名属性分类信息确定子单元,用于将所述原始片名解析子单元解析获得的片名中缀信息、片名后缀信息和连接词按照预定的格式组合作为该视频源的片名属性分类信息。 
可选地,所述组合片名重组单元中,将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名的步骤由以下单元实现: 
重组组合片名子单元,用于获取所述片名属性分类信息确定子单元确定的片名属性分类信息,并依次将所述原子片名、中连接词、片名中缀信息、后连接词和片名后缀信息组合获得所述视频源的组合片名。 
进一步地,该装置还包括: 
原子片名判断处理单元,用于判断所述组合片名重组单元获得的原子片名是否存在于原子片名库中,若存在且该原子片名无对应的片名属性分类信息,则直接将原子片名加入到视频源片名库中,还通知所述视频加入处理单将该视频源加入到所述视频源数据库中; 
组合片名判断处理单元,用于根据所述原子片名判断处理单元的判断结果,若确定所述原子片名未存在于原子片名库中,则判断所述原子片名对应的组合片名是否存在于组合片名库中,若存在,则将该组合片名加入到视频源片名库中,并通知所述视频加入处理单将该视频源加入到所述视频源数据库中,若该组合片名未存在于组合片名库中,则将所述原子片名加入原子片名库中,将所述组合片名加入组合片名库中,根据所述组 合片名更新视频源片名库中的片名,并通知所述视频加入处理单将该视频源加入到所述视频源数据库中。 
由上述本发明提供的技术方案可以看出,本发明实施例提供的技术方案能够对不同来源影片(即视频源)的原始片名自动地进行合理的拆分及规范化重组,从而实现自动化整理及合并不同来源的视频源,进而减少相应处理过程中的人工成本投入。 
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。 
图1为本发明实施例提供的视频源名称处理方法的处理过程示意图; 
图2为本发明实施例提供的视频源名称处理方法的应用实施例的处理过程示意图; 
图3为本发明实施例提供的视频源名称处理装置的结构示意图; 
图4为本发明实施例提供的装置中的组合片名重组单元的结构示意图。 
图5为本发明实施例提供的视频源名称处理装置的结构示意图。 
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。 
下面将结合附图对本发明实施例作进一步地详细描述。 
本发明实施例提供的一种视频源名称处理方法的具体实现过程如图1所示,可以包括以下处理步骤: 
步骤101,当获取到需要处理名称的视频源后,则提取待处理的视频源的原始片名,所述原始片名为视频源的当前名称; 
步骤102,将提取获得的所述原始片名与视频源片名库(即影视片名库)中的片名进行匹配,若存在与所述原始片名匹配的片名,则执行步骤103,否则,执行步骤104至步骤106; 
步骤103,由于视频源片名库中已经存在与该原始片名相同的视频源片名,则表明该 原始片名符合预定的片名格式,即无需对该原始片名进行修改,此时只需要将该待处理的视频源加入视频源数据库中即可。 
步骤104,将所述原始片名进行拆分,获得所述待处理的视频源的原子片名,即从所述视频源的原始片名中提取出视频源的原子片名,相应的原子片名是指视频源本身的名称,比如,若视频源是电影,则该视频源的原子片名就是指该电影的名称,若视频源是电视剧,则该视频源的原子片名就是指该电视剧的名称; 
举例来说,假设视频源的原始片名为“美剧-傲骨贤妻-第4季-第10集”,则通过相应的提取原子片名的过程便可以将作为原子片名的“傲骨贤妻”提取出来; 
步骤105,根据所述待处理的视频源的信息确定该视频源的片名属性分类信息; 
其中,所述片名属性分类信息可以但不限于包括:片名中缀信息、片名后缀信息或连接词中的一项或多项;所述片名属性分类信息用于记载视频源的具体参数信息,相应的参数信息可以但不限于包括视频源的类型信息、视频源的来源信息或视频源的版本信息中的一项或多项。 
具体可以根据视频源的原始片名进行片名属性分类信息的确定,也可以根据获取到的视频源携带的其他信息确定所述片名属性分类信息,或者也可以同时根据原始片名和视频源携带的其他信息确定所述片名属性分类信息;例如,可以解析所述待处理的视频源的原始片名,从所述原始片名中获取所述片名中缀信息、片名后缀信息和连接词; 
步骤106,将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名,该组合片名即为视频源的影视片名; 
若所述片名属性分类信息包含多项信息内容,则可以将多项信息按照预定的顺序(即预定的片名构造规则)与原子片名组合获得所述视频源的组合片名;例如,可以将步骤105中获得的所述片名中缀信息、片名后缀信息、连接词及原子片名按照预定的片名构造规则组合获得该视频源的组合片名; 
相应的预定的片名构造规则可以但不限于:依次将原子片名、中连接词、片名中缀信息、后连接词和片名后缀信息组合获得所述视频源的组合片名;其中,前连接词、中连接词和后连接词可以为相同的连接词,也可以为各不相同的连接词,所述连接词可以为预定的“*”、“—”或“&”等符号,也可以为特定的英文字母等;所述的连接词可以为从原始片名中提取获得,也可以预先设定; 
步骤107,根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中,以便于观看视频源的用户可以通过该视频源的组合片名索引到该视频源。 
通过上述处理过程,可以方便快捷地对待加入到视频源数据库中的视频源的名称进行相应的规范化处理,从而便于针对视频源的管理。例如,若在原始片名中包括片名前缀信息及前连接词等信息,则在通过上述过程拆分原始片名后,相应的片名前缀信息只作为属性对影片进行归类以为后期的推广用而不再出现在视频源的组合片名(即新的影片片名)中,相应的片名前缀信息可以为:“预告片、特辑、片花或晚会”等描述;另外,若原始片名中包括状态词,则由于状态词为各家站点描述影片当前状态的信息,为无意义信息,因而,在重组获得的组合片名中该状态词也需要去除,同时对于多余的连接词也一并去除,使得重组获得的影视片名更加规范合理。 
为便于理解,下面将结合具体应用过程及相应的附图对本发明实施例的实现过程进行详细解释说明。 
参照图2所示,相应的视频源名称处理方法的应用过程可以包括以下步骤: 
步骤201,针对来自于不同站点的数据源(即视频源),获取视频源的原始片名,并将原始片名与本地视频源片名库中的片名进行匹配,另外,还可以将该视频源的原始片名存入mysql数据库(关联数据库)以备后续处理过程中调用; 
具体地,在该步骤中,若获取的视频源的原始片名与本地视频源片名库中的片名匹配,则表明该视频源已经存在,且表明该视频源的原始片名符合命名规范,则可以进行影片、专辑及视频等视频源的合并处理,具体的合并处理过程可以包括:将该视频源作为对应影片的专辑内容,写入专辑列表并关联到影片中去,以及根据该视频源的信息对相应影片的信息进行补充,如影片描述、导演信息、演员信息、分类信息等; 
在该步骤中,若获取的视频源的原始片名与本地视频源片名库中的片名不匹配,则创建一个新的影片,并执行后续的步骤202; 
步骤202,对于原始片名与本地视频源片名库中的片名不匹配的情况,则通过该步骤针对新创建的影片进行名称的处理,相应的处理过程具体可以包括: 
步骤2021,从mysql数据库中取出视频源的原始片名,并根据原始片名(如影片标题等)中的连接词对原始片名进行拆分,以提取出该原始片名中的片名中缀信息、片名后缀信息; 
步骤2022,根据预定的片名构造规则,重新构造(即重组)视频源的组合片名,具体根据原子片名和提取出的片名中缀信息、片名后缀信息按照预定的片名构造规则构造组合片名; 
步骤2023,将原子片名与原子片名库中的原子片名匹配,根据匹配结果: 
若在原子片名库中存在该原子片名,则判断提取出的信息中是否存在片名属性分类信息(如片名中缀信息及片名后缀信息等),若有则执行步骤2024,否则,则直接更新影视片名库(即视频源片名库)中的影片名为新的原子片名,并合并该影片到已入库影片,即将该视频源加入到所述视频源数据库中; 
若原子片名未存在于所述原子片名库中,则执行步骤2024; 
步骤2024,将组合片名与组合片名库中的组合片名匹配,根据匹配结果: 
若存在该组合片名,则判断组合片名是否己加入影视片名库(即视频源片名库,其中保存各个视频源的组合片名及原始片名,作为各个视频源的关联索引信息),若该组合片名存在于影视片名库中,则合并该影片到己入库影片(即将该视频源加入到所述视频源数据库中,进行影片、专辑及视频等视频源的合并处理),具体的合并处理方式在之前的步骤201中已经描述,在此不再赘述;若该组合片名没有存在于影视片名库中,则更新影视片名库中片名为新片名,并合并该影片到已入库影片;若组合片名存在于组合片名库中,但通过步骤2023确定原子片名未存在于原子片名库中,则在该步骤中还将原子片名加入到原子片名库中;其中,相应的新片名可以为组合片名,也可以为根据组合片名按照预定的格式规则确定的片名,例如,将“原子片名+片名中缀信息+片名后缀信息”作为相应的新片名增加到影视片名库中; 
若不存在,则将原子片名写入原子片名库,组合片名写入组合片名库,并创建与原始片名关联关系,创建的关联关系可以写入图2所示的关联片名库中,以便后期进行查询、纠错等处理。除此之外还需要根据该组合片名更新影视片名库中的片名为新片名,并合并该影片到已入库影片。 
在上述执行步骤2021的处理过程中,若无法对原始片名进行拆分,即原始片名不符合预定的规范,则可以将该原始片名存入待定片名库中,并发出人工处理指令,以通知需要由人工参预处理以完成任务后续的处流程。 
完成上述处理后,便可以将新获取的视频源以合乎规范的格式加入到影视片名库中,之后,便可以校验视频源的有效性(如:url、影片信息等),以便根据校验结果进行视频源的上线或下线的处理。通过上述过程,可以方便快捷地将从原始片名中提取的片名前缀信息、状态词及部分连接词等信息,在重组获得的组合片名中去除掉,而仅保留提取出的片名中缀信息和片名后缀信息,从而获得更加规范的影视片名。 
在上述处理过程中,在原始片名中提取出的状态词、片名前缀信息、片名中缀信 息、片名后缀信息及相应的连接词具体可以但不限于包括以下信息: 
片名前缀信息可以包括:预,预告,预告片,片花,花絮,特辑,集合,MV,PV,新PV,集锦,MTV,片段,搞笑片段,精彩片段,剪辑,无版权,特别报道,精选,序,特别节目,宣传,宣传片,片段,主题曲,剧透,片场直击,首映式,幕后特辑,制作特辑,看点,精彩看点,专题,娱乐,新闻,特别报道,特别报导,抢鲜看,抢鲜,体验版,大全,纪录片,演唱会,开幕式,闭幕式,采访,访谈,会议,选集,英文特辑,中文特辑,合集版,合集,晚会,讲述,现场视频,介绍,片头,片头曲,片尾,片尾曲,专场,视频,攻略,串烧,典礼,颁奖,颁奖晚会,颁奖典礼,吐槽版,演唱会,巡演,选播,插曲,精彩分段,分段,欣赏,直击,拍摄日志,盘点,推广曲,展映,打造中,揭秘,搞笑,精选集,高清合集,VIP,付费版,付费,付费片、独家爆料、开播大典、开播盛典、首映礼、真实记录、相关视频、明星会、特典,特摄,中文特辑,首播仪式,首播盛典,首映典礼,视频集锦,视频合集,特别节目,精彩花絮,首映礼看点,特别视频,开播典礼,开播仪式,开播秀,首发仪式,群星见面会,颁奖典礼,春节特辑,开播庆典,庆功盛宴,首播庆典,首映大典,首映特别节目,大剧揭秘,宣传片,开场片段欣赏,明星见面会,伴奏,搞笑视频动画,坑爹解说,节目开头创意短片,特效演示,演出资讯,精彩视频,测试,只用视频集ID查询,搞笑视频、网游视频,真人版视频,游戏视频,视频攻略,攻略,页游视频,过场动画、游戏动画、组装视频、教学视频,通关攻略,三星攻略,三星通关攻略,特技攻略,合辑、片场纪实,公益宣传片,开篇预告,超长独家特辑,采访及活动,幕后制作特辑,最新花絮,首播庆典,全球首演典礼,颁奖典礼,精彩回放,大揭秘,青春剧,纪录专辑,纪录专题,等等。 
片名中缀信息可以包括:0~9,第$季,第$部,第$届,第$章,上,下,中,上集,中集,下集,上下集,一~十,壹~拾,I~IX,系列$,S$,第$期,第$话,第$单元,第$卷,第$幕,第$弹,第$辑,$部曲,第$夜,上部、中部、下部、Ⅰ~Ⅻ、㈠~㈩、⑴~⑽,等等。 
片名后缀信息可以包括:国语,国语版,剧场版,影院,影院版,TV,TV版,高清,高清版,1080,1080P,1080高清,1080P高清,720,720P,720高清,720P高清,480,480P,480版,动画版,英语版,法语版,泰语版,微电影,微电影版,续集,续,DVD版,DVD,BD,BD版,BD高清,BD高清版,搞笑版,重制版,高清重制版,粤语版,粤语,泰语,英语,日语,日语版,韩语,韩语版,德语,印度,印度语,意大利,意大利语,印度 版,印地语,越南,越南版,墨西哥,墨西哥版,德语版,XX卫视版,XX卫视,央视版,央视,3D,3D版,7.1,7.1声道,5.1,5.1声道,原声版,电影版,电视剧版,动漫版,网络版,沙画版,原版,XX年版,真人版,ova,ova版,sp,sp版,特别版,oad,oad版,未删减,未删减版,未删版,未删,加长版,加长,美版,美国版,丹麦,丹麦语,国内版,浙版,番外篇,番外,号外,海外版,歌剧版,蓝光版,蓝光,未剪辑版,剪辑版,中文版,中文,性别逆转版,XX话版,XX语版,XX国版,XX文版,闽南语,大陆版,香港版,港版,台湾版,港台版,北印度语,韩版,特别篇,XXXX年版,内地版,四川方言版,四川话版,东北方言版,东北话版,陕西方言版,陕西话版,粤语配音,广东话版,上海方言版,上海话版,精华版,精简版,电视版,TVB,TVB版,无声电影,土耳其语(耳其语),川话版,XXXX版,序章,特别篇,短片,天津话版,1080P超清,720P高清,480P标清,葡萄牙语,先行版,精编版,最终章,CG电影,CG动画电影,HD重制版,卫视版,迷你特别篇,前章,后章,精编版,无字幕版,总集篇,旧剧场版,新剧场版,超高清版,新OVA,日剧,台湾原版,lite,lite版,夏季特别篇,秋季特别篇,春季特别篇,冬季特别篇,修复版,广告剧,公益广告剧,最终章,复活篇,前篇,后篇,总集篇,延续篇,前篇&后篇,特番,电影版,南斯拉夫版,配音剧,HD、音乐电影、最终章,晚间版,下午版,中午版,动画电影版,方言版,Q版剧场、Q版、微动画、微动漫,卡通版,特别加映,音乐剧,等等。 
状态词可以包括:第X集,连载中,正在更新,更新中,X集全,更新至XX,至XX,待续,未完待续,XXXX(如2013),新番,停播,已停播,XX导演版,XX演员版,XX导演,XX演员,全集,全,XX国家,完结,完,结局,完结篇,X部全,英文字幕,中文字幕,中英字幕,英文中字,日语中字,XXXXX期,XXXXX集,XXXX-XX-XX,百度影音,快播,QVOD,德语中字,中文配音,英文字幕版,英文字幕,流畅版,土豆网,优酷网,tudou,youku,百度视频,乐视出品,优酷出品,CCTV,CCTV-$,CCTV$,BBC,大结局,季播,imax,imax版,经典卡通,等等。 
连接词可以包括:(,),,(,),《,》,:,:,-,—,——,",“,”,·,[,],【,】,/,等等。 
通过上述处理过程,可以方便快捷地对视频源的原始片名进行拆分重组,从而获得拆分重组后的新的影视片名(即组合片名)。在新的影视片名中,可以有效过滤掉原始片名中重复杂乱的状态词、多余的连接词及片名前缀信息等,并以更为合理的方式为影视片植入相应的片名属性分类信息,从而便于视频服务提供商根据原子片名库及组合片 名库合并不同来源的影片,以实现对各视频资源的有效管理。 
总之,本发明实施例提供的技术方案能够使得视频源的名称更加规范化,进而使得视频产品的品质得到有效增强,而且,相应的处理过程还可以有效降低人工运营成本。 
本发明实施例还提供了一种视频源名称处理装置,其具体实现结构如图3所示,可以包括以下处理单元: 
原始片名获取单元301,用于提取待处理的视频源的原始片名,所述原始片名为视频源的当前名称; 
原始片名匹配处理单元302,用于将所述原始片名获取单元301提取到的原始片名与视频源片名库中的片名进行匹配; 
视频加入处理单元303,用于在所述原始片名匹配处理单元302确定视频源片名库中存在与所述原始片名匹配的片名时,将该待处理的视频源加入视频源数据库中; 
组合片名重组单元304,用于在所述原始片名匹配处理单元302确定视频源片名库中未存在与所述原始片名匹配的片名时,将所述原始片名进行拆分,获得所述待处理的视频源的原子片名,并根据所述待处理的视频源的信息确定该视频源的片名属性分类信息,所述原子片名是指视频源本身的名称;再将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名;还用于通知所述视频加入处理单元303根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中。 
在该装置中,所述片名属性分类信息可以但不限于包括:片名中缀信息、片名后缀信息和连接词中的一项或多项;所述片名属性分类信息用于记载视频源的具体参数信息,包括视频源的类型信息、视频源的来源信息或视频源的版本信息中的一项或多项。 
进一步地,如图4所示,在本发明实施例提供的装置的组合片名重组单元304中,根据所述待处理的视频源的信息确定该视频源的片名属性分类信息的步骤具体可以由以下子单元实现: 
原始片名解析子单元3041,用于解析所述原始片名获取单元301提取的待处理的视频源的原始片名,从所述原始片名中获取所述片名中缀信息、片名后缀信息和连接词; 
片名属性分类信息确定子单元3042,用于将所述原始片名解析子单元3041解析获得的片名中缀信息、片名后缀信息和连接词按照预定的格式组合作为该视频源的片名属性分类信息。 
具体地,仍参照图4所示,在本发明实施例提供的装置的组合片名重组单元304中, 将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名的步骤具体可以由重组组合片名子单元3043实现,该重组组合片名子单元3043用于获取所述片名属性分类信息确定子单元3042确定的片名属性分类信息,并依次将所述原子片名、中连接词、片名中缀信息、后连接词和片名后缀信息组合获得所述视频源的组合片名。 
进一步,如图5所示,本发明实施例提供的装置还可以包括以下处理单元: 
原子片名判断处理单元305,用于判断所述组合片名重组单元304获得的原子片名是否存在于原子片名库中,若存在且该原子片名无对应的片名属性分类信息,则直接将原子片名加入到视频源片名库中,还通知所述视频加入处理单元303将该视频源加入到所述视频源数据库中; 
组合片名判断处理单元306,用于根据所述原子片名判断处理单元305的判断结果,若确定所述原子片名未存在于原子片名库中,则判断所述原子片名对应的组合片名是否存在于组合片名库中,若存在,则将该组合片名加入到视频源片名库中,并通知所述视频加入处理单元303将该视频源加入到所述视频源数据库中,若该组合片名未存在于组合片名库中,则将所述原子片名加入原子片名库中,将所述组合片名加入组合片名库中,根据所述组合片名更新视频源片名库中的片名,并通知所述视频加入处理单元303将该视频源加入到所述视频源数据库中。 
利用上述本发明实施例提供的装置,可以方便快捷地对视频源的原始片名进行拆分重组,从而获得拆分重组后的新的影视片名。 
而且,通过本发明实施例提供的装置能够使得视频源的名称更加规范化,进而使得视频产品的品质得到有效增强,而且,相应的处理过程还可以有效降低人工运营成本。从而方便视频服务提供商对视频源的有效管理。 
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。 

一种视频源名称处理方法及装置.pdf_第1页
第1页 / 共16页
一种视频源名称处理方法及装置.pdf_第2页
第2页 / 共16页
一种视频源名称处理方法及装置.pdf_第3页
第3页 / 共16页
点击查看更多>>
资源描述

《一种视频源名称处理方法及装置.pdf》由会员分享,可在线阅读,更多相关《一种视频源名称处理方法及装置.pdf(16页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 103544252 A (43)申请公布日 2014.01.29 CN 103544252 A (21)申请号 201310479231.0 (22)申请日 2013.10.14 G06F 17/30(2006.01) (71)申请人 北京暴风科技股份有限公司 地址 100191 北京市海淀区学院路 51 号首 享科技大厦 13 层 (72)发明人 冯鑫 王干 林赞贤 (74)专利代理机构 北京凯特来知识产权代理有 限公司 11260 代理人 郑立明 赵镇勇 (54) 发明名称 一种视频源名称处理方法及装置 (57) 摘要 本发明公开了一种视频源名称处理方法及装 置,。

2、 包括 : 提取待处理的视频源的原始片名, 将所 述原始片名与视频源片名库中的片名进行匹配, 若存在与所述原始片名匹配的片名, 则将该待处 理的视频源加入视频源数据库中, 否则, 将所述原 始片名进行拆分, 获得所述待处理的视频源的原 子片名, 并根据所述待处理的视频源的信息确定 该视频源的片名属性分类信息 ; 再将所述原子片 名和所述视频源的片名属性分类信息合并为所述 视频源的组合片名。本发明实施例提供的技术方 案能够对不同来源影片的原始片名自动地进行合 理的拆分及规范化重组, 从而实现自动化整理及 合并不同来源的视频源, 进而减少相应处理过程 中的人工成本投入。 (51)Int.Cl. 权。

3、利要求书 2 页 说明书 9 页 附图 4 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书9页 附图4页 (10)申请公布号 CN 103544252 A CN 103544252 A 1/2 页 2 1. 一种视频源名称处理方法, 其特征在于, 包括 : 提取待处理的视频源的原始片名, 所述原始片名为视频源的当前名称 ; 将所述原始片名与视频源片名库中的片名进行匹配, 若存在与所述原始片名匹配的片 名, 则将该待处理的视频源加入视频源数据库中, 否则, 将所述原始片名进行拆分, 获得所述待处理的视频源的原子片名, 并根据所述待处理 的视频源的信息确定该。

4、视频源的片名属性分类信息, 所述原子片名是指视频源本身的名 称 ; 再将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名 ; 根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中。 2. 根据权利要求 1 所述的方法, 其特征在于, 所述片名属性分类信息包括 : 片名中缀信 息、 片名后缀信息和连接词中的一项或多项 ; 所述片名属性分类信息用于记载视频源的具 体参数信息, 包括视频源的类型信息、 视频源的来源信息或视频源的版本信息中的一项或 多项。 3. 根据权利要求 2 所述的方法, 其特征在于, 根据所述待处理的视频源的信息确定该 视频源的片名属性分类信息的步。

5、骤包括 : 解析所述待处理的视频源的原始片名, 从所述原始片名中获取所述片名中缀信息、 片 名后缀信息和连接词 ; 所述片名中缀信息、 片名后缀信息和连接词按照预定的格式组合作为该视频源的片名 属性分类信息。 4. 根据权利要求 3 所述的方法, 其特征在于, 将所述原子片名和所述视频源的片名属 性分类信息合并为所述视频源的组合片名的步骤包括 : 依次将原子片名、 中连接词、 片名中缀信息、 后连接词和片名后缀信息组合获得所述视 频源的组合片名。 5.根据权利要求1至4任一项所述的方法, 其特征在于, 根据所述视频源的组合片名将 所述待处理的视频源加入视频源数据库中的步骤包括 : 判断所述原子。

6、片名是否存在于原子片名库中, 若存在且该原子片名无对应的片名属性 分类信息, 则直接将原子片名加入到视频源片名库中, 还将该视频源加入到所述视频源数 据库中 ; 若原子片名未存在于原子片名库中, 则判断所述原子片名对应的组合片名是否存在于 组合片名库中, 若存在, 则将该组合片名加入到视频源片名库中, 并将该视频源加入到所述 视频源数据库中, 若该组合片名未存在于组合片名库中, 则将所述原子片名加入原子片名 库中, 将所述组合片名加入组合片名库中, 根据所述组合片名更新视频源片名库中的片名, 并将该视频源加入到所述视频源数据库中。 6. 一种视频源名称处理装置, 其特征在于, 包括 : 原始片。

7、名获取单元, 用于提取待处理的视频源的原始片名, 所述原始片名为视频源的 当前名称 ; 原始片名匹配处理单元, 用于将所述原始片名获取单元提取到的原始片名与视频源片 名库中的片名进行匹配 ; 视频加入处理单元, 用于在所述原始片名匹配处理单元确定视频源片名库中存在与所 述原始片名匹配的片名时, 将该待处理的视频源加入视频源数据库中 ; 权 利 要 求 书 CN 103544252 A 2 2/2 页 3 组合片名重组单元, 用于在所述原始片名匹配处理单元确定视频源片名库中未存在与 所述原始片名匹配的片名时, 将所述原始片名进行拆分, 获得所述待处理的视频源的原子 片名, 并根据所述待处理的视频。

8、源的信息确定该视频源的片名属性分类信息, 所述原子片 名是指视频源本身的名称 ; 再将所述原子片名和所述视频源的片名属性分类信息合并为所 述视频源的组合片名 ; 还用于通知所述视频加入处理单元根据所述视频源的组合片名将所 述待处理的视频源加入视频源数据库中。 7. 根据权利要求 6 所述的装置, 其特征在于, 所述片名属性分类信息包括 : 片名中缀信 息、 片名后缀信息或连接词中的一项或多项 ; 所述片名属性分类信息用于记载视频源的具 体参数信息, 包括视频源的类型信息、 视频源的来源信息或视频源的版本信息中的一项或 多项。 8. 根据权利要求 7 所述的装置, 其特征在于, 所述组合片名重组。

9、单元中, 根据所述待处 理的视频源的信息确定该视频源的片名属性分类信息的步骤由以下单元实现 : 原始片名解析子单元, 用于解析所述原始片名获取单元提取的待处理的视频源的原始 片名, 从所述原始片名中获取所述片名中缀信息、 片名后缀信息和连接词 ; 片名属性分类信息确定子单元, 用于将所述原始片名解析子单元解析获得的片名中缀 信息、 片名后缀信息和连接词按照预定的格式组合作为该视频源的片名属性分类信息。 9. 根据权利要求 8 所述的装置, 其特征在于, 所述组合片名重组单元中, 将所述原子片 名和所述视频源的片名属性分类信息合并为所述视频源的组合片名的步骤由以下单元实 现 : 重组组合片名子单。

10、元, 用于获取所述片名属性分类信息确定子单元确定的片名属性分 类信息, 并依次将所述原子片名、 中连接词、 片名中缀信息、 后连接词和片名后缀信息组合 获得所述视频源的组合片名。 10. 根据权利要求 6 至 9 任一项所述的装置, 其特征在于, 该装置还包括 : 原子片名判断处理单元, 用于判断所述组合片名重组单元获得的原子片名是否存在于 原子片名库中, 若存在且该原子片名无对应的片名属性分类信息, 则直接将原子片名加入 到视频源片名库中, 还通知所述视频加入处理单将该视频源加入到所述视频源数据库中 ; 组合片名判断处理单元, 用于根据所述原子片名判断处理单元的判断结果, 若确定所 述原子片。

11、名未存在于原子片名库中, 则判断所述原子片名对应的组合片名是否存在于组合 片名库中, 若存在, 则将该组合片名加入到视频源片名库中, 并通知所述视频加入处理单将 该视频源加入到所述视频源数据库中, 若该组合片名未存在于组合片名库中, 则将所述原 子片名加入原子片名库中, 将所述组合片名加入组合片名库中, 根据所述组合片名更新视 频源片名库中的片名, 并通知所述视频加入处理单将该视频源加入到所述视频源数据库 中。 权 利 要 求 书 CN 103544252 A 3 1/9 页 4 一种视频源名称处理方法及装置 技术领域 0001 本发明涉及一种视频处理技术, 尤其涉及一种视频源名称处理方法及装。

12、置。 背景技术 0002 随着网络技术的快速发展, 通过网络传播的视频源也越来越多。 为此, 便出现了一 些专门提供视频源信息的网站, 同时, 为保证网站能够为用户更为方便地提供其需要的视 频源, 则在网站服务器中需要对视频源进行有效的管理, 其中包括对视频源的名称的统一 管理等。 0003 目前, 由于提供视频的影视聚合产品中数据来源的格式及命名的不同, 导致现有 影视聚合产品普遍存在数据杂乱及大量重复的问题。 针对相应问题, 目前, 通常采用的针对 视频源名称的管理方式为人工简单进行管理。 这种人工针对视频名称进行管理的方式一方 面无法保证数据整理的有效性, 例如, 仍然存在片名重复杂乱的。

13、问题等, 另一方面还将导致 较大的人工成本投入。 发明内容 0004 本发明的目的是提供一种视频源名称处理方法及装置, 从而可以有效针对视频源 的名称进行管理。 0005 本发明的目的是通过以下技术方案实现的 : 0006 一种视频源名称处理方法, 包括 : 0007 提取待处理的视频源的原始片名, 所述原始片名为视频源的当前名称 ; 0008 将所述原始片名与视频源片名库中的片名进行匹配, 若存在与所述原始片名匹配 的片名, 则将该待处理的视频源加入视频源数据库中, 否则, 0009 将所述原始片名进行拆分, 获得所述待处理的视频源的原子片名, 并根据所述待 处理的视频源的信息确定该视频源的。

14、片名属性分类信息, 所述原子片名是指视频源本身的 名称 ; 再将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片 名 ; 0010 根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库中。 0011 其中, 所述片名属性分类信息包括 : 片名中缀信息、 片名后缀信息和连接词中的一 项或多项 ; 所述片名属性分类信息用于记载视频源的具体参数信息, 包括视频源的类型信 息、 视频源的来源信息或视频源的版本信息中的一项或多项。 0012 进一步地, 根据所述待处理的视频源的信息确定该视频源的片名属性分类信息的 步骤包括 : 0013 解析所述待处理的视频源的原始片名, 从所。

15、述原始片名中获取所述片名中缀信 息、 片名后缀信息和连接词 ; 0014 所述片名中缀信息、 片名后缀信息和连接词按照预定的格式组合作为该视频源的 片名属性分类信息。 说 明 书 CN 103544252 A 4 2/9 页 5 0015 可选地, 将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的 组合片名的步骤包括 : 0016 依次将原子片名、 中连接词、 片名中缀信息、 后连接词和片名后缀信息组合获得所 述视频源的组合片名。 0017 进一步地, 根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库 中的步骤包括 : 0018 判断所述原子片名是否存在于原子片名库中。

16、, 若存在且该原子片名无对应的片名 属性分类信息, 则直接将原子片名加入到视频源片名库中, 还将该视频源加入到所述视频 源数据库中 ; 0019 若原子片名未存在于原子片名库中, 则判断所述原子片名对应的组合片名是否存 在于组合片名库中, 若存在, 则将该组合片名加入到视频源片名库中, 并将该视频源加入到 所述视频源数据库中, 若该组合片名未存在于组合片名库中, 则将所述原子片名加入原子 片名库中, 将所述组合片名加入组合片名库中, 根据所述组合片名更新视频源片名库中的 片名, 并将该视频源加入到所述视频源数据库中。 0020 一种视频源名称处理装置, 包括 : 0021 原始片名获取单元, 。

17、用于提取待处理的视频源的原始片名, 所述原始片名为视频 源的当前名称 ; 0022 原始片名匹配处理单元, 用于将所述原始片名获取单元提取到的原始片名与视频 源片名库中的片名进行匹配 ; 0023 视频加入处理单元, 用于在所述原始片名匹配处理单元确定视频源片名库中存在 与所述原始片名匹配的片名时, 将该待处理的视频源加入视频源数据库中 ; 0024 组合片名重组单元, 用于在所述原始片名匹配处理单元确定视频源片名库中未存 在 与所述原始片名匹配的片名时, 将所述原始片名进行拆分, 获得所述待处理的视频源的 原子片名, 并根据所述待处理的视频源的信息确定该视频源的片名属性分类信息, 所述原 子。

18、片名是指视频源本身的名称 ; 再将所述原子片名和所述视频源的片名属性分类信息合并 为所述视频源的组合片名 ; 还用于通知所述视频加入处理单元根据所述视频源的组合片名 将所述待处理的视频源加入视频源数据库中。 0025 其中, 所述片名属性分类信息包括 : 片名中缀信息、 片名后缀信息或连接词中的一 项或多项 ; 所述片名属性分类信息用于记载视频源的具体参数信息, 包括视频源的类型信 息、 视频源的来源信息或视频源的版本信息中的一项或多项。 0026 进一步地, 所述组合片名重组单元中, 根据所述待处理的视频源的信息确定该视 频源的片名属性分类信息的步骤由以下单元实现 : 0027 原始片名解析。

19、子单元, 用于解析所述原始片名获取单元提取的待处理的视频源的 原始片名, 从所述原始片名中获取所述片名中缀信息、 片名后缀信息和连接词 ; 0028 片名属性分类信息确定子单元, 用于将所述原始片名解析子单元解析获得的片名 中缀信息、 片名后缀信息和连接词按照预定的格式组合作为该视频源的片名属性分类信 息。 0029 可选地, 所述组合片名重组单元中, 将所述原子片名和所述视频源的片名属性分 类信息合并为所述视频源的组合片名的步骤由以下单元实现 : 说 明 书 CN 103544252 A 5 3/9 页 6 0030 重组组合片名子单元, 用于获取所述片名属性分类信息确定子单元确定的片名属 。

20、性分类信息, 并依次将所述原子片名、 中连接词、 片名中缀信息、 后连接词和片名后缀信息 组合获得所述视频源的组合片名。 0031 进一步地, 该装置还包括 : 0032 原子片名判断处理单元, 用于判断所述组合片名重组单元获得的原子片名是否存 在于原子片名库中, 若存在且该原子片名无对应的片名属性分类信息, 则直接将原子片名 加入到视频源片名库中, 还通知所述视频加入处理单将该视频源加入到所述视频源数据库 中 ; 0033 组合片名判断处理单元, 用于根据所述原子片名判断处理单元的判断结果, 若确 定所述原子片名未存在于原子片名库中, 则判断所述原子片名对应的组合片名是否存在于 组合片名库中。

21、, 若存在, 则将该组合片名加入到视频源片名库中, 并通知所述视频加入处理 单将该视频源加入到所述视频源数据库中, 若该组合片名未存在于组合片名库中, 则将所 述原子片名加入原子片名库中, 将所述组合片名加入组合片名库中, 根据所述组 合片名更 新视频源片名库中的片名, 并通知所述视频加入处理单将该视频源加入到所述视频源数据 库中。 0034 由上述本发明提供的技术方案可以看出, 本发明实施例提供的技术方案能够对不 同来源影片 (即视频源) 的原始片名自动地进行合理的拆分及规范化重组, 从而实现自动化 整理及合并不同来源的视频源, 进而减少相应处理过程中的人工成本投入。 附图说明 0035 为。

22、了更清楚地说明本发明实施例的技术方案, 下面将对实施例描述中所需要使用 的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本发明的一些实施例, 对于本 领域的普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以根据这些附图获得其他 附图。 0036 图 1 为本发明实施例提供的视频源名称处理方法的处理过程示意图 ; 0037 图 2 为本发明实施例提供的视频源名称处理方法的应用实施例的处理过程示意 图 ; 0038 图 3 为本发明实施例提供的视频源名称处理装置的结构示意图 ; 0039 图 4 为本发明实施例提供的装置中的组合片名重组单元的结构示意图。 图 5 为本发明实施例提供。

23、的视频源名称处理装置的结构示意图。 具体实施方式 0040 下面结合本发明实施例中的附图, 对本发明实施例中的技术方案进行清楚、 完整 地描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而不是全部的实施例。基于本 发明的实施例, 本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施 例, 都属于本发明的保护范围。 0041 下面将结合附图对本发明实施例作进一步地详细描述。 0042 本发明实施例提供的一种视频源名称处理方法的具体实现过程如图 1 所示, 可以 包括以下处理步骤 : 说 明 书 CN 103544252 A 6 4/9 页 7 0043 步骤 101, 当获。

24、取到需要处理名称的视频源后, 则提取待处理的视频源的原始片 名, 所述原始片名为视频源的当前名称 ; 0044 步骤 102, 将提取获得的所述原始片名与视频源片名库 (即影视片名库) 中的片名 进行匹配, 若存在与所述原始片名匹配的片名, 则执行步骤 103, 否则, 执行步骤 104 至步骤 106 ; 0045 步骤 103, 由于视频源片名库中已经存在与该原始片名相同的视频源片名, 则表明 该 原始片名符合预定的片名格式, 即无需对该原始片名进行修改, 此时只需要将该待处理 的视频源加入视频源数据库中即可。 0046 步骤 104, 将所述原始片名进行拆分, 获得所述待处理的视频源的原。

25、子片名, 即从 所述视频源的原始片名中提取出视频源的原子片名, 相应的原子片名是指视频源本身的名 称, 比如, 若视频源是电影, 则该视频源的原子片名就是指该电影的名称, 若视频源是电视 剧, 则该视频源的原子片名就是指该电视剧的名称 ; 0047 举例来说, 假设视频源的原始片名为 “美剧 - 傲骨贤妻 - 第 4 季 - 第 10 集” , 则通 过相应的提取原子片名的过程便可以将作为原子片名的 “傲骨贤妻” 提取出来 ; 0048 步骤 105, 根据所述待处理的视频源的信息确定该视频源的片名属性分类信息 ; 0049 其中, 所述片名属性分类信息可以但不限于包括 : 片名中缀信息、 片。

26、名后缀信息或 连接词中的一项或多项 ; 所述片名属性分类信息用于记载视频源的具体参数信息, 相应的 参数信息可以但不限于包括视频源的类型信息、 视频源的来源信息或视频源的版本信息中 的一项或多项。 0050 具体可以根据视频源的原始片名进行片名属性分类信息的确定, 也可以根据获取 到的视频源携带的其他信息确定所述片名属性分类信息, 或者也可以同时根据原始片名和 视频源携带的其他信息确定所述片名属性分类信息 ; 例如, 可以解析所述待处理的视频源 的原始片名, 从所述原始片名中获取所述片名中缀信息、 片名后缀信息和连接词 ; 0051 步骤 106, 将所述原子片名和所述视频源的片名属性分类信息。

27、合并为所述视频源 的组合片名, 该组合片名即为视频源的影视片名 ; 0052 若所述片名属性分类信息包含多项信息内容, 则可以将多项信息按照预定的顺序 (即预定的片名构造规则) 与原子片名组合获得所述视频源的组合片名 ; 例如, 可以将步骤 105 中获得的所述片名中缀信息、 片名后缀信息、 连接词及原子片名按照预定的片名构造规 则组合获得该视频源的组合片名 ; 0053 相应的预定的片名构造规则可以但不限于 : 依次将原子片名、 中连接词、 片名中缀 信息、 后连接词和片名后缀信息组合获得所述视频源的组合片名 ; 其中, 前连接词、 中连接 词和后连接词可以为相同的连接词, 也可以为各不相同。

28、的连接词, 所述连接词可以为预定 的 “*” 、“” 或 “&” 等符号, 也可以为特定的英文字母等 ; 所述的连接词可以为从原始片名 中提取获得, 也可以预先设定 ; 0054 步骤 107, 根据所述视频源的组合片名将所述待处理的视频源加入视频源数据库 中, 以便于观看视频源的用户可以通过该视频源的组合片名索引到该视频源。 0055 通过上述处理过程, 可以方便快捷地对待加入到视频源数据库中的视频源的名称 进行相应的规范化处理, 从而便于针对视频源的管理。例如, 若在原始片名中包括片名前 缀信息及前连接词等信息, 则在通过上述过程拆分原始片名后, 相应的片名前缀信息只作 说 明 书 CN 。

29、103544252 A 7 5/9 页 8 为属性对影片进行归类以为后期的推广用而不再出现在视频源的组合片名 (即新的影片片 名) 中, 相应的片名前缀信息可以为 :“预告片、 特辑、 片花或晚会” 等描述 ; 另外, 若原始片名 中包括状态词, 则由于状态词为各家站点描述影片当前状态的信息, 为无意义信息, 因而, 在重组获得的组合片名中该状态词也需要去除, 同时对于多余的连接词也一并去除, 使得 重组获得的影视片名更加规范合理。 0056 为便于理解, 下面将结合具体应用过程及相应的附图对本发明实施例的实现过程 进行详细解释说明。 0057 参照图 2 所示, 相应的视频源名称处理方法的应。

30、用过程可以包括以下步骤 : 0058 步骤 201, 针对来自于不同站点的数据源 (即视频源) , 获取视频源的原始片名, 并 将原始片名与本地视频源片名库中的片名进行匹配, 另外, 还可以将该视频源的原始片名 存入 mysql 数据库 (关联数据库) 以备后续处理过程中调用 ; 0059 具体地, 在该步骤中, 若获取的视频源的原始片名与本地视频源片名库中的片名 匹配, 则表明该视频源已经存在, 且表明该视频源的原始片名符合命名规范, 则可以进行影 片、 专辑及视频等视频源的合并处理, 具体的合并处理过程可以包括 : 将该视频源作为对应 影片的专辑内容, 写入专辑列表并关联到影片中去, 以及。

31、根据该视频源的信息对相应影片 的信息进行补充, 如影片描述、 导演信息、 演员信息、 分类信息等 ; 0060 在该步骤中, 若获取的视频源的原始片名与本地视频源片名库中的片名不匹配, 则创建一个新的影片, 并执行后续的步骤 202 ; 0061 步骤 202, 对于原始片名与本地视频源片名库中的片名不匹配的情况, 则通过该步 骤针对新创建的影片进行名称的处理, 相应的处理过程具体可以包括 : 0062 步骤 2021, 从 mysql 数据库中取出视频源的原始片名, 并根据原始片名 (如影片标 题等) 中的连接词对原始片名进行拆分, 以提取出该原始片名中的片名中缀信息、 片名后缀 信息 ; 。

32、0063 步骤 2022, 根据预定的片名构造规则, 重新构造 (即重组) 视频源的组合片名, 具体 根据原子片名和提取出的片名中缀信息、 片名后缀信息按照预定的片名构造规则构造组合 片名 ; 0064 步骤 2023, 将原子片名与原子片名库中的原子片名匹配, 根据匹配结果 : 0065 若在原子片名库中存在该原子片名, 则判断提取出的信息中是否存在片名属性分 类信息 (如片名中缀信息及片名后缀信息等) , 若有则执行步骤 2024, 否则, 则直接更新影视 片名库 (即视频源片名库) 中的影片名为新的原子片名, 并合并该影片到已入库影片, 即将 该视频源加入到所述视频源数据库中 ; 006。

33、6 若原子片名未存在于所述原子片名库中, 则执行步骤 2024 ; 0067 步骤 2024, 将组合片名与组合片名库中的组合片名匹配, 根据匹配结果 : 0068 若存在该组合片名, 则判断组合片名是否己加入影视片名库 (即视频源片名库, 其 中保存各个视频源的组合片名及原始片名, 作为各个视频源的关联索引信息) , 若该组合片 名存在于影视片名库中, 则合并该影片到己入库影片 (即将该视频源加入到所述视频源数 据库中, 进行影片、 专辑及视频等视频源的合并处理) , 具体的合并处理方式在之前的步骤 201 中已经描述, 在此不再赘述 ; 若该组合片名没有存在于影视片名库中, 则更新影视片名。

34、 库中片名为新片名, 并合并该影片到已入库影片 ; 若组合片名存在于组合片名库中, 但通过 说 明 书 CN 103544252 A 8 6/9 页 9 步骤 2023 确定原子片名未存在于原子片名库中, 则在该步骤中还将原子片名加入到原子 片名库中 ; 其中, 相应的新片名可以为组合片名, 也可以为根据组合片名按照预定的格式规 则确定的片名, 例如, 将 “原子片名 + 片名中缀信息 + 片名后缀信息” 作为相应的新片名增 加到影视片名库中 ; 0069 若不存在, 则将原子片名写入原子片名库, 组合片名写入组合片名库, 并创建与原 始片名关联关系, 创建的关联关系可以写入图 2 所示的关联。

35、片名库中, 以便后期进行查询、 纠错等处理。除此之外还需要根据该组合片名更新影视片名库中的片名为新片名, 并合并 该影片到已入库影片。 0070 在上述执行步骤 2021 的处理过程中, 若无法对原始片名进行拆分, 即原始片名不 符合预定的规范, 则可以将该原始片名存入待定片名库中, 并发出人工处理指令, 以通知需 要由人工参预处理以完成任务后续的处流程。 0071 完成上述处理后, 便可以将新获取的视频源以合乎规范的格式加入到影视片名库 中, 之后, 便可以校验视频源的有效性 (如 : url、 影片信息等) , 以便根据校验结果进行视频 源的上线或下线的处理。通过上述过程, 可以方便快捷地。

36、将从原始片名中提取的片名前缀 信息、 状态词及部分连接词等信息, 在重组获得的组合片名中去除掉, 而仅保留提取出的片 名中缀信息和片名后缀信息, 从而获得更加规范的影视片名。 0072 在上述处理过程中, 在原始片名中提取出的状态词、 片名前缀信息、 片名中缀信 息、 片名后缀信息及相应的连接词具体可以但不限于包括以下信息 : 0073 片名前缀信息可以包括 : 预, 预告, 预告片, 片花, 花絮, 特辑, 集合, MV, PV, 新 PV, 集锦, MTV, 片段, 搞笑片段, 精彩片段, 剪辑, 无版权, 特别报道, 精选, 序, 特别节目, 宣传, 宣传片, 片段, 主题曲, 剧透, 。

37、片场直击, 首映式, 幕后特辑, 制作特辑, 看点, 精彩看点, 专题, 娱乐, 新闻, 特别报道, 特别报导, 抢鲜看, 抢鲜, 体验版, 大全, 纪录片, 演唱会, 开幕式, 闭幕 式, 采访, 访谈, 会议, 选集, 英文特辑, 中文特辑, 合集版, 合集, 晚会, 讲述, 现场视频, 介绍, 片头, 片头曲, 片尾, 片尾曲, 专场, 视频, 攻略, 串烧, 典礼, 颁奖, 颁奖晚会, 颁奖典礼, 吐槽 版, 演唱会, 巡演, 选播, 插曲, 精彩分段, 分段, 欣赏, 直击, 拍摄日志, 盘点, 推广曲, 展映, 打 造中, 揭秘, 搞笑, 精选集, 高清合集, VIP, 付费版, 。

38、付费, 付费片、 独家爆料、 开播大典、 开播 盛典、 首映礼、 真实记录、 相关视频、 明星会、 特典, 特摄, 中文特辑, 首播仪式, 首播盛典, 首 映典礼, 视频集锦, 视频合集, 特别节目, 精彩花絮, 首映礼看点, 特别视频, 开播典礼, 开播 仪式, 开播秀, 首发仪式, 群星见面会, 颁奖典礼, 春节特辑, 开播庆典, 庆功盛宴, 首播庆典, 首映大典, 首映特别节目, 大剧揭秘, 宣传片, 开场片段欣赏, 明星见面会, 伴奏, 搞笑视频动 画, 坑爹解说, 节目开头创意短片, 特效演示, 演出资讯, 精彩视频, 测试, 只用视频集 ID 查 询, 搞笑视频、 网游视频, 真人。

39、版视频, 游戏视频, 视频攻略, 攻略, 页游视频, 过场动画、 游戏 动画、 组装视频、 教学视频, 通关攻略, 三星攻略, 三星通关攻略, 特技攻略, 合辑、 片场纪实, 公益宣传片, 开篇预告, 超长独家特辑, 采访及活动, 幕后制作特辑, 最新花絮, 首播庆典, 全 球首演典礼, 颁奖典礼, 精彩回放, 大揭秘, 青春剧, 纪录专辑, 纪录专题, 等等。 0074 片名中缀信息可以包括 : 0 9, 第 $ 季, 第 $ 部, 第 $ 届, 第 $ 章, 上, 下, 中, 上集, 中集, 下集, 上下集, 一十, 壹拾, I IX, 系列 $, S$, 第 $ 期, 第 $ 话, 第 。

40、$ 单元, 第 $ 卷, 第 $ 幕, 第 $ 弹, 第 $ 辑, $ 部曲, 第 $ 夜, 上部、 中部、 下部、 、 、 , 等等。 0075 片名后缀信息可以包括 : 国语,国语版,剧场版,影院,影院版,TV,TV版,高清, 说 明 书 CN 103544252 A 9 7/9 页 10 高清版,1080,1080P,1080高清,1080P高清,720,720P,720高清,720P高清,480,480P,480 版 , 动画版, 英语版, 法语版, 泰语版, 微电影, 微电影版, 续集, 续, DVD 版, DVD, BD, BD 版, BD 高清, BD 高清版, 搞笑版, 重制版。

41、, 高清重制版, 粤语版, 粤语, 泰语, 英语, 日语, 日语版, 韩 语, 韩语版, 德语, 印度, 印度语, 意大利, 意大利语, 印度 版, 印地语, 越南, 越南版, 墨西哥, 墨西哥版, 德语版, XX卫视版, XX卫视, 央视版, 央视, 3D, 3D版, 7.1, 7.1声道, 5.1, 5.1声道, 原声版, 电影版, 电视剧版, 动漫版, 网络版, 沙画版, 原版, XX 年版, 真人版, ova, ova 版, sp, sp 版, 特别版, oad, oad 版, 未删减, 未删减版, 未删版, 未删, 加长版, 加长, 美版, 美国版, 丹 麦, 丹麦语, 国内版, 浙。

42、版, 番外篇, 番外, 号外, 海外版, 歌剧版, 蓝光版, 蓝光, 未剪辑版, 剪 辑版, 中文版, 中文, 性别逆转版, XX 话版, XX 语版, XX 国版, XX 文版, 闽南语, 大陆版, 香港 版, 港版, 台湾版, 港台版, 北印度语, 韩版, 特别篇, XXXX 年版, 内地版, 四川方言版, 四川话 版, 东北方言版, 东北话版, 陕西方言版, 陕西话版, 粤语配音, 广东话版, 上海方言版, 上海 话版, 精华版, 精简版, 电视版 ,TVB,TVB 版, 无声电影, 土耳其语 (耳其语) , 川话版, XXXX 版 , 序章, 特别篇, 短片 , 天津话版, 1080P。

43、 超清, 720P 高清, 480P 标清, 葡萄牙语, 先行版, 精编 版, 最终章, CG 电影, CG 动画电影, HD 重制版, 卫视版, 迷你特别篇, 前章, 后章, 精编版, 无字 幕版, 总集篇, 旧剧场版, 新剧场版, 超高清版, 新 OVA, 日剧, 台湾原版, lite, lite 版, 夏季 特别篇, 秋季特别篇, 春季特别篇, 冬季特别篇, 修复版, 广告剧, 公益广告剧, 最终章, 复活 篇, 前篇, 后篇, 总集篇, 延续篇, 前篇 & 后篇, 特番, 电影版, 南斯拉夫版, 配音剧, HD、 音乐电 影、 最终章, 晚间版, 下午版, 中午版, 动画电影版, 方言。

44、版, Q 版剧场、 Q 版、 微动画、 微动漫, 卡通版, 特别加映, 音乐剧, 等等。 0076 状态词可以包括 : 第 X 集, 连载中, 正在更新, 更新中, X 集全, 更新至 XX, 至 XX, 待 续, 未完待续, XXXX(如 2013) , 新番, 停播, 已停播, XX 导演版, XX 演员版, XX 导演, XX 演员, 全集, 全, XX 国家, 完结, 完, 结局, 完结篇, X 部全, 英文字幕, 中文字幕, 中英字幕, 英文中 字, 日语中字, XXXXX 期, XXXXX 集, XXXX-XX-XX, 百度影音, 快播, QVOD, 德语中字, 中文配音, 英文字。

45、幕版, 英文字幕, 流畅版, 土豆网, 优酷网, tudou, youku, 百度视频, 乐视出品, 优酷出 品, CCTV, CCTV-$, CCTV$, BBC, 大结局, 季播, imax, imax 版, 经典卡通, 等等。 0077 连接词可以包括 : (,),,(,) ,, , :, : , -, “,“, ” , , ,,【,】 , /, 等 等。 0078 通过上述处理过程, 可以方便快捷地对视频源的原始片名进行拆分重组, 从而获 得拆分重组后的新的影视片名 (即组合片名) 。在新的影视片名中, 可以有效过滤掉原始片 名中重复杂乱的状态词、 多余的连接词及片名前缀信息等, 并以。

46、更为合理的方式为影视片 植入相应的片名属性分类信息, 从而便于视频服务提供商根据原子片名库及组合片 名库 合并不同来源的影片, 以实现对各视频资源的有效管理。 0079 总之, 本发明实施例提供的技术方案能够使得视频源的名称更加规范化, 进而使 得视频产品的品质得到有效增强, 而且, 相应的处理过程还可以有效降低人工运营成本。 0080 本发明实施例还提供了一种视频源名称处理装置, 其具体实现结构如图 3 所示, 可以包括以下处理单元 : 0081 原始片名获取单元 301, 用于提取待处理的视频源的原始片名, 所述原始片名为视 频源的当前名称 ; 0082 原始片名匹配处理单元 302, 用。

47、于将所述原始片名获取单元 301 提取到的原始片 说 明 书 CN 103544252 A 10 8/9 页 11 名与视频源片名库中的片名进行匹配 ; 0083 视频加入处理单元 303, 用于在所述原始片名匹配处理单元 302 确定视频源片名 库中存在与所述原始片名匹配的片名时, 将该待处理的视频源加入视频源数据库中 ; 0084 组合片名重组单元 304, 用于在所述原始片名匹配处理单元 302 确定视频源片名 库中未存在与所述原始片名匹配的片名时, 将所述原始片名进行拆分, 获得所述待处理的 视频源的原子片名, 并根据所述待处理的视频源的信息确定该视频源的片名属性分类信 息, 所述原子。

48、片名是指视频源本身的名称 ; 再将所述原子片名和所述视频源的片名属性分 类信息合并为所述视频源的组合片名 ; 还用于通知所述视频加入处理单元 303 根据所述视 频源的组合片名将所述待处理的视频源加入视频源数据库中。 0085 在该装置中, 所述片名属性分类信息可以但不限于包括 : 片名中缀信息、 片名后缀 信息和连接词中的一项或多项 ; 所述片名属性分类信息用于记载视频源的具体参数信息, 包括视频源的类型信息、 视频源的来源信息或视频源的版本信息中的一项或多项。 0086 进一步地, 如图 4 所示, 在本发明实施例提供的装置的组合片名重组单元 304 中, 根据所述待处理的视频源的信息确定。

49、该视频源的片名属性分类信息的步骤具体可以由以 下子单元实现 : 0087 原始片名解析子单元 3041, 用于解析所述原始片名获取单元 301 提取的待处理的 视频源的原始片名, 从所述原始片名中获取所述片名中缀信息、 片名后缀信息和连接词 ; 0088 片名属性分类信息确定子单元 3042, 用于将所述原始片名解析子单元 3041 解析 获得的片名中缀信息、 片名后缀信息和连接词按照预定的格式组合作为该视频源的片名属 性分类信息。 0089 具体地, 仍参照图 4 所示, 在本发明实施例提供的装置的组合片名重组单元 304 中, 将所述原子片名和所述视频源的片名属性分类信息合并为所述视频源的组合片名的 步骤具体可以由重组组合片名子单元 3043 实现, 该重组组合片名子单元 30。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1