一种基于视频特征的互联网视频字幕索引方法.pdf

上传人:54 文档编号:629999 上传时间:2018-02-28 格式:PDF 页数:4 大小:279.63KB
返回 下载 相关 举报
摘要
申请专利号:

CN201410423598.5

申请日:

2014.08.26

公开号:

CN104156479A

公开日:

2014.11.19

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20140826|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

中译语通科技(北京)有限公司

发明人:

程国艮; 袁翔宇; 王宇晨

地址:

100040 北京市石景山区八大处高科技园区西井路3号3号楼7473房间

优先权:

专利代理机构:

北京知本村知识产权代理事务所 11039

代理人:

周自清

PDF下载: PDF下载
内容摘要

本发明是一种基于视频特征的互联网视频字幕索引方法,包括以下步骤:针对已有文本字幕的视频文件,构建索引,确定特征值Ci=((Ri+Gi+Bi)/10)取整;所选择的固定区域不包含通常的视频区、台标和广告区;由此得到视频的特征值,即一个颜色特征值序列C1C2C3C4……Cn,Cn代表视频第0.1*(n-1)-0.1*n秒的特征值,而每个字幕对应一个特征值子序列,Ck1,Ck2,...Ckn;通过上述特征值进一步进行视频字幕的检索,实现字幕匹配。本发明通过对视频特征值序列的构建、字幕特征值子序列的构建,所形成的检索方法,可以针对格式不同视频进行字幕的索引,高效而且准确。

权利要求书

1.  一种基于视频特征的互联网视频字幕索引方法,其特征在于,包括以下步骤:
步骤一:针对已有文本字幕的视频文件,构建索引
(1)将视频的每N秒作为一个窗口,选定视频的固定区域来计算该窗口内该视频固定区域范围内的平均颜色值RGB值,如果该窗口范围内有多帧,则对多帧累计进行计算平均值,每个窗口的特征值为一个颜色平均值向量值的总值的加和除以10,也即特征值Ci= ((Ri+Gi+Bi)/10)取整;
(2)所选择的固定区域不包含通常的视频区、台标和广告区;
(3)由此得到视频的特征值,即一个颜色特征值序列C1C2C3C4……Cn,Cn代表视频第0.1*(n-1)-0.1*n 秒的特征值,而每个字幕对应一个特征值子序列,Ck1,Ck2,...Ckn
步骤二:视频字幕的检索
(1)对于互联网上的视频I,在首尾各取一段1秒的视频片段,计算视频片段的特征值;
(2)在视频索引库里对于每一个视频特征值序列,从头到尾以1秒的窗口进行扫描,计算扫描窗口与视频片段的欧式距离的最小值;
(3)查找得到最相似的视频V,即视频与片段距离最小;
(4)对于视频I,取得全部的颜色特征值序列S;
(5)对V中的每个字幕所对应的字幕的特征值,查找特征值在V的特征序列里最匹配的部分,实现字幕匹配。

2.
  根据权利要求1所述的基于视频特征的互联网视频字幕索引方法,其特征在于,N一般选取 0.2。

3.
  根据权利要求1所述的基于视频特征的互联网视频字幕索引方法,其特征在于,RGB值的R、G、B三通道的取值范围为 0–255。

说明书

一种基于视频特征的互联网视频字幕索引方法
技术领域
本发明涉及计算机软件技术领域,尤指一种基于视频特征的互联网视频字幕索引方法。
背景技术
互联网上的视频多种多样,相同内容的视频,可能编码格式不一样,可能码率不一样,可能分辨率不一样,可能一个视频是另一个视频的片段。在这种情况下,很难高效并且准备的进行视频字幕的索引,实现字幕的匹配。
发明内容
为解决上述问题,本发明提供可以针对格式不同视频的一种基于视频特征的互联网视频字幕索引方法。
本发明是一种基于视频特征的互联网视频字幕索引方法, 包括以下步骤:
步骤一:针对已有文本字幕的视频文件,构建索引
(1)将视频的每N秒作为一个窗口,选定视频的固定区域来计算该窗口内该视频固定区域范围内的平均颜色值RGB值,如果该窗口范围内有多帧,则对多帧累计进行计算平均值,每个窗口的特征值为一个颜色平均值向量值的总值的加和除以10,也即特征值Ci= ((Ri+Gi+Bi)/10)取整;
(2)所选择的固定区域不包含通常的视频区、台标和广告区;
(3)由此得到视频的特征值,即一个颜色特征值序列C1C2C3C4……Cn,Cn代表视频第0.1*(n-1)-0.1*n 秒的特征值,而每个字幕对应一个特征值子序列,Ck1,Ck2,...Ckn
步骤二:视频字幕的检索
(1)对于互联网上的视频I,在首尾各取一段1秒的视频片段,计算视频片段的特征值;
(2)在视频索引库里对于每一个视频特征值序列,从头到尾以1秒的窗口进行扫描,计算扫描窗口与视频片段的欧式距离的最小值;
(3)查找得到最相似的视频V,即视频与片段距离最小;
(4)对于视频I,取得全部的颜色特征值序列S;
(5)对V中的每个字幕所对应的字幕的特征值,查找特征值在V的特征序列里最匹配的部分,实现字幕匹配。
N一般选取 0.2。
RGB值的R、G、B三通道的取值范围为 0 – 255。
本发明的有益技术效果在于:通过对视频特征值序列的构建、字幕特征值子序列的构建,所形成的检索方法,可以针对格式不同视频进行字幕的索引,高效而且准确。
具体实施方式
下面结合实施例,对本发明的具体实施方式作进一步详细描述。
互联网上的视频多种多样,相同内容的视频,可能编码格式不一样,可能码率不一样,可能分辨率不一样,可能一个视频是另一个视频的片段。本专利提供一个针对格式不同视频的一种字幕索引机制及字幕检测方法。
本发明是一种基于视频特征的互联网视频字幕索引方法, 包括以下步骤:
步骤一:针对已有文本字幕的视频文件,构建索引
(1)将视频的每N秒作为一个窗口,N一般选取 0.2。选定视频的固定区域来计算该窗口内该视频固定区域范围内的平均颜色值RGB值,RGB值的R、G、B三通道的取值范围为 0–255。RGB色彩模式是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色。如果该窗口范围内有多帧,则对多帧累计进行计算平均值,每个窗口的特征值为一个颜色平均值向量值的总值的加和除以10,也即特征值Ci= ((Ri+Gi+Bi)/10)取整;
(2)所选择的固定区域不包含通常的视频区、台标和广告区;
(3)由此得到视频的特征值,即一个颜色特征值序列C1C2C3C4……Cn,Cn代表视频第0.1*(n-1)-0.1*n 秒的特征值,而每个字幕对应一个特征值子序列,Ck1,Ck2,...Ckn
步骤二:视频字幕的检索
(1)对于互联网上的视频I,在首尾各取一段1秒的视频片段,计算视频片段的特征值;
(2)在视频索引库里对于每一个视频特征值序列,从头到尾以1秒的窗口进行扫描,计算扫描窗口与视频片段的欧式距离的最小值;
(3)查找得到最相似的视频V,即视频与片段距离最小;
(4)对于视频I,取得全部的颜色特征值序列S;
(5)对V中的每个字幕所对应的字幕的特征值,查找特征值在V的特征序列里最匹配的部分,实现字幕匹配。 

一种基于视频特征的互联网视频字幕索引方法.pdf_第1页
第1页 / 共4页
一种基于视频特征的互联网视频字幕索引方法.pdf_第2页
第2页 / 共4页
一种基于视频特征的互联网视频字幕索引方法.pdf_第3页
第3页 / 共4页
点击查看更多>>
资源描述

《一种基于视频特征的互联网视频字幕索引方法.pdf》由会员分享,可在线阅读,更多相关《一种基于视频特征的互联网视频字幕索引方法.pdf(4页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104156479A43申请公布日20141119CN104156479A21申请号201410423598522申请日20140826G06F17/3020060171申请人中译语通科技(北京)有限公司地址100040北京市石景山区八大处高科技园区西井路3号3号楼7473房间72发明人程国艮袁翔宇王宇晨74专利代理机构北京知本村知识产权代理事务所11039代理人周自清54发明名称一种基于视频特征的互联网视频字幕索引方法57摘要本发明是一种基于视频特征的互联网视频字幕索引方法,包括以下步骤针对已有文本字幕的视频文件,构建索引,确定特征值CIRIGIBI/10取整;所选择的固定。

2、区域不包含通常的视频区、台标和广告区;由此得到视频的特征值,即一个颜色特征值序列C1C2C3C4CN,CN代表视频第01N101N秒的特征值,而每个字幕对应一个特征值子序列,CK1,CK2,CKN;通过上述特征值进一步进行视频字幕的检索,实现字幕匹配。本发明通过对视频特征值序列的构建、字幕特征值子序列的构建,所形成的检索方法,可以针对格式不同视频进行字幕的索引,高效而且准确。51INTCL权利要求书1页说明书2页19中华人民共和国国家知识产权局12发明专利申请权利要求书1页说明书2页10申请公布号CN104156479ACN104156479A1/1页21一种基于视频特征的互联网视频字幕索引方。

3、法,其特征在于,包括以下步骤步骤一针对已有文本字幕的视频文件,构建索引(1)将视频的每N秒作为一个窗口,选定视频的固定区域来计算该窗口内该视频固定区域范围内的平均颜色值RGB值,如果该窗口范围内有多帧,则对多帧累计进行计算平均值,每个窗口的特征值为一个颜色平均值向量值的总值的加和除以10,也即特征值CIRIGIBI/10取整;(2)所选择的固定区域不包含通常的视频区、台标和广告区;(3)由此得到视频的特征值,即一个颜色特征值序列C1C2C3C4CN,CN代表视频第01N101N秒的特征值,而每个字幕对应一个特征值子序列,CK1,CK2,CKN;步骤二视频字幕的检索(1)对于互联网上的视频I,在。

4、首尾各取一段1秒的视频片段,计算视频片段的特征值;(2)在视频索引库里对于每一个视频特征值序列,从头到尾以1秒的窗口进行扫描,计算扫描窗口与视频片段的欧式距离的最小值;(3)查找得到最相似的视频V,即视频与片段距离最小;(4)对于视频I,取得全部的颜色特征值序列S;(5)对V中的每个字幕所对应的字幕的特征值,查找特征值在V的特征序列里最匹配的部分,实现字幕匹配。2根据权利要求1所述的基于视频特征的互联网视频字幕索引方法,其特征在于,N一般选取02。3根据权利要求1所述的基于视频特征的互联网视频字幕索引方法,其特征在于,RGB值的R、G、B三通道的取值范围为0255。权利要求书CN1041564。

5、79A1/2页3一种基于视频特征的互联网视频字幕索引方法技术领域0001本发明涉及计算机软件技术领域,尤指一种基于视频特征的互联网视频字幕索引方法。背景技术0002互联网上的视频多种多样,相同内容的视频,可能编码格式不一样,可能码率不一样,可能分辨率不一样,可能一个视频是另一个视频的片段。在这种情况下,很难高效并且准备的进行视频字幕的索引,实现字幕的匹配。发明内容0003为解决上述问题,本发明提供可以针对格式不同视频的一种基于视频特征的互联网视频字幕索引方法。0004本发明是一种基于视频特征的互联网视频字幕索引方法,包括以下步骤步骤一针对已有文本字幕的视频文件,构建索引(1)将视频的每N秒作为。

6、一个窗口,选定视频的固定区域来计算该窗口内该视频固定区域范围内的平均颜色值RGB值,如果该窗口范围内有多帧,则对多帧累计进行计算平均值,每个窗口的特征值为一个颜色平均值向量值的总值的加和除以10,也即特征值CIRIGIBI/10取整;(2)所选择的固定区域不包含通常的视频区、台标和广告区;(3)由此得到视频的特征值,即一个颜色特征值序列C1C2C3C4CN,CN代表视频第01N101N秒的特征值,而每个字幕对应一个特征值子序列,CK1,CK2,CKN;步骤二视频字幕的检索(1)对于互联网上的视频I,在首尾各取一段1秒的视频片段,计算视频片段的特征值;(2)在视频索引库里对于每一个视频特征值序列。

7、,从头到尾以1秒的窗口进行扫描,计算扫描窗口与视频片段的欧式距离的最小值;(3)查找得到最相似的视频V,即视频与片段距离最小;(4)对于视频I,取得全部的颜色特征值序列S;(5)对V中的每个字幕所对应的字幕的特征值,查找特征值在V的特征序列里最匹配的部分,实现字幕匹配。0005N一般选取02。0006RGB值的R、G、B三通道的取值范围为0255。0007本发明的有益技术效果在于通过对视频特征值序列的构建、字幕特征值子序列的构建,所形成的检索方法,可以针对格式不同视频进行字幕的索引,高效而且准确。具体实施方式0008下面结合实施例,对本发明的具体实施方式作进一步详细描述。说明书CN104156。

8、479A2/2页40009互联网上的视频多种多样,相同内容的视频,可能编码格式不一样,可能码率不一样,可能分辨率不一样,可能一个视频是另一个视频的片段。本专利提供一个针对格式不同视频的一种字幕索引机制及字幕检测方法。0010本发明是一种基于视频特征的互联网视频字幕索引方法,包括以下步骤步骤一针对已有文本字幕的视频文件,构建索引(1)将视频的每N秒作为一个窗口,N一般选取02。选定视频的固定区域来计算该窗口内该视频固定区域范围内的平均颜色值RGB值,RGB值的R、G、B三通道的取值范围为0255。RGB色彩模式是工业界的一种颜色标准,是通过对红R、绿G、蓝B三个颜色通道的变化以及它们相互之间的叠。

9、加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色。如果该窗口范围内有多帧,则对多帧累计进行计算平均值,每个窗口的特征值为一个颜色平均值向量值的总值的加和除以10,也即特征值CIRIGIBI/10取整;(2)所选择的固定区域不包含通常的视频区、台标和广告区;(3)由此得到视频的特征值,即一个颜色特征值序列C1C2C3C4CN,CN代表视频第01N101N秒的特征值,而每个字幕对应一个特征值子序列,CK1,CK2,CKN;步骤二视频字幕的检索(1)对于互联网上的视频I,在首尾各取一段1秒的视频片段,计算视频片段的特征值;(2)在视频索引库里对于每一个视频特征值序列,从头到尾以1秒的窗口进行扫描,计算扫描窗口与视频片段的欧式距离的最小值;(3)查找得到最相似的视频V,即视频与片段距离最小;(4)对于视频I,取得全部的颜色特征值序列S;(5)对V中的每个字幕所对应的字幕的特征值,查找特征值在V的特征序列里最匹配的部分,实现字幕匹配。说明书CN104156479A。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1