《一种基于视频特征的互联网视频字幕索引方法.pdf》由会员分享,可在线阅读,更多相关《一种基于视频特征的互联网视频字幕索引方法.pdf(4页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104156479A43申请公布日20141119CN104156479A21申请号201410423598522申请日20140826G06F17/3020060171申请人中译语通科技(北京)有限公司地址100040北京市石景山区八大处高科技园区西井路3号3号楼7473房间72发明人程国艮袁翔宇王宇晨74专利代理机构北京知本村知识产权代理事务所11039代理人周自清54发明名称一种基于视频特征的互联网视频字幕索引方法57摘要本发明是一种基于视频特征的互联网视频字幕索引方法,包括以下步骤针对已有文本字幕的视频文件,构建索引,确定特征值CIRIGIBI/10取整;所选择的固定。
2、区域不包含通常的视频区、台标和广告区;由此得到视频的特征值,即一个颜色特征值序列C1C2C3C4CN,CN代表视频第01N101N秒的特征值,而每个字幕对应一个特征值子序列,CK1,CK2,CKN;通过上述特征值进一步进行视频字幕的检索,实现字幕匹配。本发明通过对视频特征值序列的构建、字幕特征值子序列的构建,所形成的检索方法,可以针对格式不同视频进行字幕的索引,高效而且准确。51INTCL权利要求书1页说明书2页19中华人民共和国国家知识产权局12发明专利申请权利要求书1页说明书2页10申请公布号CN104156479ACN104156479A1/1页21一种基于视频特征的互联网视频字幕索引方。
3、法,其特征在于,包括以下步骤步骤一针对已有文本字幕的视频文件,构建索引(1)将视频的每N秒作为一个窗口,选定视频的固定区域来计算该窗口内该视频固定区域范围内的平均颜色值RGB值,如果该窗口范围内有多帧,则对多帧累计进行计算平均值,每个窗口的特征值为一个颜色平均值向量值的总值的加和除以10,也即特征值CIRIGIBI/10取整;(2)所选择的固定区域不包含通常的视频区、台标和广告区;(3)由此得到视频的特征值,即一个颜色特征值序列C1C2C3C4CN,CN代表视频第01N101N秒的特征值,而每个字幕对应一个特征值子序列,CK1,CK2,CKN;步骤二视频字幕的检索(1)对于互联网上的视频I,在。
4、首尾各取一段1秒的视频片段,计算视频片段的特征值;(2)在视频索引库里对于每一个视频特征值序列,从头到尾以1秒的窗口进行扫描,计算扫描窗口与视频片段的欧式距离的最小值;(3)查找得到最相似的视频V,即视频与片段距离最小;(4)对于视频I,取得全部的颜色特征值序列S;(5)对V中的每个字幕所对应的字幕的特征值,查找特征值在V的特征序列里最匹配的部分,实现字幕匹配。2根据权利要求1所述的基于视频特征的互联网视频字幕索引方法,其特征在于,N一般选取02。3根据权利要求1所述的基于视频特征的互联网视频字幕索引方法,其特征在于,RGB值的R、G、B三通道的取值范围为0255。权利要求书CN1041564。
5、79A1/2页3一种基于视频特征的互联网视频字幕索引方法技术领域0001本发明涉及计算机软件技术领域,尤指一种基于视频特征的互联网视频字幕索引方法。背景技术0002互联网上的视频多种多样,相同内容的视频,可能编码格式不一样,可能码率不一样,可能分辨率不一样,可能一个视频是另一个视频的片段。在这种情况下,很难高效并且准备的进行视频字幕的索引,实现字幕的匹配。发明内容0003为解决上述问题,本发明提供可以针对格式不同视频的一种基于视频特征的互联网视频字幕索引方法。0004本发明是一种基于视频特征的互联网视频字幕索引方法,包括以下步骤步骤一针对已有文本字幕的视频文件,构建索引(1)将视频的每N秒作为。
6、一个窗口,选定视频的固定区域来计算该窗口内该视频固定区域范围内的平均颜色值RGB值,如果该窗口范围内有多帧,则对多帧累计进行计算平均值,每个窗口的特征值为一个颜色平均值向量值的总值的加和除以10,也即特征值CIRIGIBI/10取整;(2)所选择的固定区域不包含通常的视频区、台标和广告区;(3)由此得到视频的特征值,即一个颜色特征值序列C1C2C3C4CN,CN代表视频第01N101N秒的特征值,而每个字幕对应一个特征值子序列,CK1,CK2,CKN;步骤二视频字幕的检索(1)对于互联网上的视频I,在首尾各取一段1秒的视频片段,计算视频片段的特征值;(2)在视频索引库里对于每一个视频特征值序列。
7、,从头到尾以1秒的窗口进行扫描,计算扫描窗口与视频片段的欧式距离的最小值;(3)查找得到最相似的视频V,即视频与片段距离最小;(4)对于视频I,取得全部的颜色特征值序列S;(5)对V中的每个字幕所对应的字幕的特征值,查找特征值在V的特征序列里最匹配的部分,实现字幕匹配。0005N一般选取02。0006RGB值的R、G、B三通道的取值范围为0255。0007本发明的有益技术效果在于通过对视频特征值序列的构建、字幕特征值子序列的构建,所形成的检索方法,可以针对格式不同视频进行字幕的索引,高效而且准确。具体实施方式0008下面结合实施例,对本发明的具体实施方式作进一步详细描述。说明书CN104156。
8、479A2/2页40009互联网上的视频多种多样,相同内容的视频,可能编码格式不一样,可能码率不一样,可能分辨率不一样,可能一个视频是另一个视频的片段。本专利提供一个针对格式不同视频的一种字幕索引机制及字幕检测方法。0010本发明是一种基于视频特征的互联网视频字幕索引方法,包括以下步骤步骤一针对已有文本字幕的视频文件,构建索引(1)将视频的每N秒作为一个窗口,N一般选取02。选定视频的固定区域来计算该窗口内该视频固定区域范围内的平均颜色值RGB值,RGB值的R、G、B三通道的取值范围为0255。RGB色彩模式是工业界的一种颜色标准,是通过对红R、绿G、蓝B三个颜色通道的变化以及它们相互之间的叠。
9、加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色。如果该窗口范围内有多帧,则对多帧累计进行计算平均值,每个窗口的特征值为一个颜色平均值向量值的总值的加和除以10,也即特征值CIRIGIBI/10取整;(2)所选择的固定区域不包含通常的视频区、台标和广告区;(3)由此得到视频的特征值,即一个颜色特征值序列C1C2C3C4CN,CN代表视频第01N101N秒的特征值,而每个字幕对应一个特征值子序列,CK1,CK2,CKN;步骤二视频字幕的检索(1)对于互联网上的视频I,在首尾各取一段1秒的视频片段,计算视频片段的特征值;(2)在视频索引库里对于每一个视频特征值序列,从头到尾以1秒的窗口进行扫描,计算扫描窗口与视频片段的欧式距离的最小值;(3)查找得到最相似的视频V,即视频与片段距离最小;(4)对于视频I,取得全部的颜色特征值序列S;(5)对V中的每个字幕所对应的字幕的特征值,查找特征值在V的特征序列里最匹配的部分,实现字幕匹配。说明书CN104156479A。