一种发现广告视频的方法及装置.pdf

上传人:1520****312 文档编号:973321 上传时间:2018-03-22 格式:PDF 页数:16 大小:523.61KB
返回 下载 相关 举报
摘要
申请专利号:

CN201110279361.0

申请日:

2011.09.20

公开号:

CN102346768A

公开日:

2012.02.08

当前法律状态:

授权

有效性:

有权

法律详情:

专利权人的姓名或者名称、地址的变更IPC(主分类):G06F 17/30变更事项:专利权人变更前:北京鹏润鸿途科技有限公司变更后:北京鹏润鸿途科技股份有限公司变更事项:地址变更前:100085 北京市海淀区学清路38号金码大厦B座顶1-2322变更后:100085 北京市海淀区学清路38号金码大厦B座顶1-2322|||授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20110920|||公开

IPC分类号:

G06F17/30

主分类号:

G06F17/30

申请人:

北京鹏润鸿途科技有限公司

发明人:

何长龙; 刘向宇; 李勋

地址:

100085 北京市海淀区学清路38号金码大厦B座顶1-2322

优先权:

专利代理机构:

深圳市威世博知识产权代理事务所(普通合伙) 44280

代理人:

何青瓦;李庆波

PDF下载: PDF下载
内容摘要

本发明提供了一种发现广告视频的方法及装置,其中发现广告的方法包括:A.利用预先建立的广告视频样本库中的各广告视频样本确定电视视频中的广告时段;B.将所述广告时段内的电视视频与各广告视频样本进行比对,并在与各广告视频样本不匹配的电视视频片段里去除重复视频片段,从去除重复视频片段后的不匹配的电视视频片段中确定目标广告视频。通过上述方式,可以提高广告监管的效率。

权利要求书

1: 一种发现广告的方法, 其特征在于, 所述方法包括 : A. 利用预先建立的广告视频样本库中的各广告视频样本确定电视视频中的广告时 段; B. 将所述广告时段内的电视视频与各广告视频样本进行比对, 并在与各广告视频样本 不匹配的电视视频片段里去除重复视频片段, 从去除重复视频片段后的不匹配的电视视频 片段中确定目标广告视频。
2: 根据权利要求 1 所述的方法, 其特征在于, 所述方法在步骤 B 后进一步包括 : 将确定 的目标广告视频放入所述广告视频样本库。
3: 根据权利要求 1 所述的方法, 其特征在于, 所述步骤 A 包括 : 在电视视频中采集电视视频样本 ; 将所述电视视频样本与各广告视频样本逐一比对, 将所述电视视频样本中与各广告视 频样本比对上的视频片段确定为各匹配视频片段 ; 将各匹配视频片段按照在所述电视视频样本中的时间顺序排列, 从中确定连续视频片 段集与独立视频片段, 其中所述连续视频片段集为相邻两个匹配视频片段之间的时间间隔 不超过预定值的匹配视频片段集合, 所述独立视频片段为所有匹配视频片段中除所述连续 视频片段集之外的匹配视频片段 ; 将所述连续视频片段集在所述电视视频样本中开始时刻之前设定时长的第一冗余时 刻与结束时刻之后设定时长的第二冗余时刻之间的时间区间, 以及所述独立视频片段在所 述电视视频样本中开始时刻之前设定时长的第三冗余时刻与结束时刻之后设定时长的第 四冗余时刻之间的时间区间确定为所述广告时段。
4: 根据权利要求 1 所述的方法, 其特征在于, 所述步骤 A 包括 : 在电视视频中采集多个电视视频样本 ; 将所述多个电视视频样本与各广告视频样本逐一比对, 确定在所述多个电视视频样本 的相同时间段内均与同一广告视频样本比对上的视频片段为匹配视频片段 ; 将所述匹配视频片段在所述电视视频样本中开始时刻之前设定时长的第五冗余时刻 与结束时刻之后设定时长的第六冗余时刻之间的时间区间确定为所述广告时段。
5: 根据权利要求 1 所述的方法, 其特征在于, 在所述步骤 B 之后还包括 : 将与各广告视 频样本匹配的电视视频片段和所述目标广告视频作为所述电视视频包含的广告。
6: 根据权利要求 1 至 5 中任一权项所述的方法, 其特征在于, 从去除重复视频片段后的 不匹配的电视视频片段中确定目标广告视频包括 : 利用对所述去除重复视频片段后的不匹配的电视视频片段的人工审核结果, 确定目标 广告视频 ; 或者, 通过大量广告视频数据训练得到的分类器, 对所述去除重复视频片段后的不匹配的电 视视频片段进行分类判断, 确定目标广告视频。
7: 一种发现广告的装置, 其特征在于, 所述装置包括 : 广告时段确定单元, 用于利用预先建立的广告视频样本库中的各广告视频样本确定电 视视频中的广告时段 ; 去重单元, 用于将所述广告时段内的电视视频与各广告视频样本进行比对, 并在与各 广告视频样本不匹配的电视视频片段里去除重复视频片段 ; 2 目标广告确定单元, 用于从去除重复视频片段后的不匹配的电视视频片段中确定目标 广告视频。
8: 根据权利要求 7 所述的装置, 其特征在于, 所述装置进一步包括插入单元, 用于将确 定的目标广告视频放入所述广告视频样本库。
9: 根据权利要求 7 所述的装置, 其特征在于, 所述广告时段确定单元包括 : 第一采集子单元, 用于在电视视频中采集电视视频样本 ; 第一比对子单元, 用于将所述电视视频样本与各广告视频样本逐一比对, 将所述电视 视频样本中与各广告视频样本比对上的视频片段确定为各匹配视频片段 ; 匹配集确定子单元, 将各匹配视频片段按照的时间顺序排列, 从中确定连续视频片段 集与独立视频片段, 其中所述连续视频片段集为相邻两个匹配视频片段之间的时间间隔不 超过预定值的匹配视频片段集合, 所述独立视频片段为所有匹配视频片段中除所述连续视 频片段集之外的匹配视频片段 ; 第一广告时段确定子单元, 用于将所述连续视频片段集在所述电视视频样本中开始时 刻之前设定时长的第一冗余时刻与结束时刻之后设定时长的第二冗余时刻之间的时间区 间, 以及所述独立视频片段在所述电视视频样本中开始时刻之前设定时长的第三冗余时刻 与结束时刻之后设定时长的第四冗余时刻之间的时间区间确定为所述广告时段。
10: 根据权利要求 7 所述的装置, 其特征在于, 所述广告时段确定单元包括 : 第二采集子单元, 用于在电视视频中采集多个电视视频样本 ; 第二比对子单元, 用于将所述多个电视视频样本与各广告视频样本逐一比对, 确定在 所述多个电视视频样本的相同时间段内均与同一广告视频样本比对上的视频片段为匹配 视频片段 ; 第二广告时段确定子单元, 用于将所述匹配视频片段在所述电视视频样本中开始时刻 之前设定时长的第五冗余时刻与结束时刻之后设定时长的第六冗余时刻之间的时间区间 确定为所述广告时段。
11: 根据权利要求 7 所述的装置, 其特征在于, 所述装置进一步包括广告提取单元, 用 于将与各广告视频样本匹配的电视视频片段和所述目标广告视频作为所述电视视频包含 的广告。
12: 根据权利要求 7 至 11 中任一权项所述的装置, 其特征在于, 所述目标广告确定单元 利用对所述去除重复视频片段后的不匹配的电视视频片段的人工审核结果, 确定目标广告 视频 ; 或者, 所述目标广告确定单元通过大量广告视频数据训练得到的分类器, 对所述去除 重复视频片段后的不匹配的电视视频片段进行分类判断, 确定目标广告视频。

说明书


一种发现广告视频的方法及装置

    【技术领域】
     本发明涉及数据处理技术, 特别涉及一种发现广告视频的方法及装置。 【背景技术】
     在电视视频中对广告进行监管是一项很重要的工作。在现有技术中, 从电视视频 中发现广告视频的方法比较简单, 通常采用对全天的电视视频进行重复度比对, 找出电视 视频中重复出现次数较高的视频片段, 确定为疑似广告, 然后再通过人工审核, 确定为广告 样本。 在这种方法下, 存在两个问题 : 首先, 这样做很难发现全天只播放了一次的广告视频, 即发现的广告视频不够全面 ; 其次, 全天播放的其他重复视频也会被确定为疑似广告, 例如 全天多次播放的歌曲、 电视剧的片头和片尾等等, 这些本不属于广告的视频也需要通过人 工审核, 大大增加了审核的工作量。 【发明内容】 本发明所要解决的技术问题是提供一种发现广告视频的方法及装置, 以解决现有 技术对广告监管时, 发现的广告视频不全面、 增加人工审核工作量的缺陷。
     本发明为解决技术问题而采用的技术方案是提供一种发现广告所述方法包括 : A. 利用预先建立的广告视频样本库中的各广告视频样本确定电视视频中的广告时段 ; B. 将所述广告时段内的电视视频与各广告视频样本进行比对, 并在与各广告视频样本不匹 配的电视视频片段里去除重复视频片段, 从去除重复视频片段后的不匹配的电视视频片段 中确定目标广告视频。
     根据本发明之一优选实施例, 所述方法在步骤 B 后进一步包括 : 将确定的目标广 告视频放入所述广告视频样本库。
     根据本发明之一优选实施例, 所述步骤 A 包括 : 在电视视频中采集电视视频样本 ; 将所述电视视频样本与各广告视频样本逐一比对, 将所述电视视频样本中与各广告视频样 本比对上的视频片段确定为各匹配视频片段 ; 将各匹配视频片段按照在所述电视视频样本 中的时间顺序排列, 从中确定连续视频片段集与独立视频片段, 其中所述连续视频片段集 为相邻两个匹配视频片段之间的时间间隔不超过预定值的匹配视频片段集合, 所述独立视 频片段为所有匹配视频片段中除所述连续视频片段集之外的匹配视频片段 ; 将所述连续视 频片段集在所述电视视频样本中开始时刻之前设定时长的第一冗余时刻与结束时刻之后 设定时长的第二冗余时刻之间的时间区间, 以及所述独立视频片段在所述电视视频样本中 开始时刻之前设定时长的第三冗余时刻与结束时刻之后设定时长的第四冗余时刻之间的 时间区间确定为所述广告时段。
     根据本发明之一优选实施例, 所述步骤 A 包括 : 在电视视频中采集多个电视视频 样本 ; 将所述多个电视视频样本与各广告视频样本逐一比对, 确定在所述多个电视视频样 本的相同时间段内均与同一广告视频样本比对上的视频片段为匹配视频片段 ; 将所述匹配 视频片段在所述电视视频样本中开始时刻之前设定时长的第五冗余时刻与结束时刻之后
     设定时长的第六冗余时刻之间的时间区间确定为所述广告时段。
     根据本发明之一优选实施例, 在所述步骤 B 之后还包括 : 将与各广告视频样本匹 配的电视视频片段和所述目标广告视频作为所述电视视频包含的广告。
     根据本发明之一优选实施例, 从去除重复视频片段后的不匹配的电视视频片段中 确定目标广告视频包括 : 利用对所述去除重复视频片段后的不匹配的电视视频片段的人工 审核结果, 确定目标广告视频 ; 或者, 通过大量广告视频数据训练得到的分类器, 对所述去 除重复视频片段后的不匹配的电视视频片段进行分类判断, 确定目标广告视频。
     本发明还提供了一种发现广告的装置, 包括 : 广告时段确定单元, 用于利用预先建 立的广告视频样本库中的各广告视频样本确定电视视频中的广告时段 ; 去重单元, 用于将 所述广告时段内的电视视频与各广告视频样本进行比对, 并在与各广告视频样本不匹配的 电视视频片段里去除重复视频片段 ; 目标广告确定单元, 用于从去除重复视频片段后的不 匹配的电视视频片段中确定目标广告视频。
     根据本发明之一优选实施例, 所述装置进一步包括插入单元, 用于将确定的目标 广告视频放入所述广告视频样本库。
     根据本发明之一优选实施例, 所述广告时段确定单元包括 : 第一采集子单元, 用于 在电视视频中采集电视视频样本 ; 第一比对子单元, 用于将所述电视视频样本与各广告视 频样本逐一比对, 将所述电视视频样本中与各广告视频样本比对上的视频片段确定为各匹 配视频片段 ; 匹配集确定子单元, 将各匹配视频片段按照的时间顺序排列, 从中确定连续视 频片段集与独立视频片段, 其中所述连续视频片段集为相邻两个匹配视频片段之间的时间 间隔不超过预定值的匹配视频片段集合, 所述独立视频片段为所有匹配视频片段中除所述 连续视频片段集之外的匹配视频片段 ; 第一广告时段确定子单元, 用于将所述连续视频片 段集在所述电视视频样本中开始时刻之前设定时长的第一冗余时刻与结束时刻之后设定 时长的第二冗余时刻之间的时间区间, 以及所述独立视频片段在所述电视视频样本中开始 时刻之前设定时长的第三冗余时刻与结束时刻之后设定时长的第四冗余时刻之间的时间 区间确定为所述广告时段。
     根据本发明之一优选实施例, 所述广告时段确定单元包括 : 第二采集子单元, 用于 在电视视频中采集多个电视视频样本 ; 第二比对子单元, 用于将所述多个电视视频样本与 各广告视频样本逐一比对, 确定在所述多个电视视频样本的相同时间段内均与同一广告视 频样本比对上的视频片段为匹配视频片段 ; 第二广告时段确定子单元, 用于将所述匹配视 频片段在所述电视视频样本中开始时刻之前设定时长的第五冗余时刻与结束时刻之后设 定时长的第六冗余时刻之间的时间区间确定为所述广告时段。
     根据本发明之一优选实施例, 所述装置进一步包括广告提取单元, 用于将与各广 告视频样本匹配的电视视频片段和所述目标广告视频作为所述电视视频包含的广告。
     根据本发明之一优选实施例, 所述目标广告确定单元利用对所述去除重复视频片 段后的不匹配的电视视频片段的人工审核结果, 确定目标广告视频 ; 或者, 所述目标广告确 定单元通过大量广告视频数据训练得到的分类器, 对所述去除重复视频片段后的不匹配的 电视视频片段进行分类判断, 确定目标广告视频。
     由以上技术方案可以看出, 通过利用广告视频样本确定电视视频中的广告时段, 再通过将广告时段内的电视视频与广告视频样本进行比对, 可以很好地提高从电视视频中发现的广告视频数量, 将电视视频中只播一次的广告视频提取出来, 同时可以过滤电视视 频中重复播放的非广告视频, 提高广告监管的效率。 【附图说明】
     图 1 为本发明中发现广告视频的方法的实施例的流程示意图 ;
     图 2 为确定广告时段的方法的实施例一的流程示意图 ;
     图 3 为视频比对的方法的流程示意图 ;
     图 4 为广告时段的示意图 ;
     图 5 是确定广告时段的方法的实施例二的流程示意图
     图 6 为本发明中发现广告视频的装置的实施例一的结构示意框图 ;
     图 7 为本发明中发现广告视频的装置的实施例二的结构示意框图。 【具体实施方式】
     为了使本发明的目的、 技术方案和优点更加清楚, 下面结合附图和具体实施例对 本发明进行详细描述。 请参考图 1, 图 1 为本发明中发现广告视频的方法实施例的流程示意图。 如图 1 所 示, 所述方法包括 :
     步骤 S101 : 利用预先建立的广告视频样本库中的各广告视频样本确定电视视频 中的广告时段。
     步骤 S102 : 将广告时段内的电视视频与各广告视频样本进行比对, 并在与各广告 视频样本不匹配的电视视频片段里去除重复视频片段, 从去除重复视频片段后的不匹配的 电视视频片段中确定目标广告视频。
     下面对上述步骤进行具体说明。
     广告视频样本, 是指单个广告的视频, 广告视频样本库, 就是包含多个广告视频的 数据库。广告视频样本库中的广告视频样本, 首先可通过收集既有广告视频得到, 其次, 从 本发明的方法中发现的目标广告视频, 最终也可以加入到广告视频样本库中作为广告视频 样本。
     利用广告视频样本库中的各广告视频样本确定电视视频在播放中的广告时段, 可 采用以下两种方式进行。
     实施方式一 :
     请参考图 2, 图 2 为确定广告时段的方法的实施例一的流程示意图。如图 2 所示, 确定广告时段的方法包括 :
     步骤 S1011 : 在电视视频中采集电视视频样本。在本实施例中, 可采集一天的电视 视频作为电视视频样本。
     步骤 S1012 : 将电视视频样本与各广告视频样本逐一比对, 从电视视频样本中确 定与广告视频样本匹配的各视频片段。
     视频比对采用的方法可参考图 3, 图 3 为视频比对的方法的流程示意图。 电视视频 样本即为图中的源视频, 广告视频样本即为图中的目标视频。将源视频与目标视频进行解 码后, 就可按照图 3 中所示的方法, 将两者进行比对。
     从图 3 可以看出, 在将源视频与目标视频进行比对时, 实际上是先取目标视频的 第一帧, 与源视频的每一帧比对, 如果没有比对上, 则取目标视频的下一帧与源视频的每一 帧比对, 直到找到源视频中与目标视频中能比对上的帧, 这时, 记录下该帧在源视频中的位 置, 再循环执行从源视频中取下一帧与目标视频中取的下一帧进行比对, 直到比对失败, 记 录下最后一个比对成功的帧在源视频中的位置, 此时, 在源视频的两个记录的帧的位置之 间的视频片段, 即为匹配视频片段。 在寻找源视频与目标视频中第一个相同帧时, 也可以先 取源视频的第一帧, 与目标视频的每一帧比对, 如果没有比对上, 再取源视频的下一帧与目 标视频的每一帧比对, 以此类推。 如果源视频与目标视频中没有一帧能比对成功, 则说明源 视频与该目标视频比对失败, 源视频中没有该目标视频的匹配视频片段。
     将各个广告视频样本分别作为目标视频执行上述比对过程, 就可以找到电视视频 样本中的各个匹配视频片段了。
     请继续参考图 2。
     步骤 S1013 : 将各匹配视频片段按照在电视视频样本中的时间顺序排列, 从中确 定连续视频片段集与独立视频片段。
     通常来说, 在电视视频中播放的广告是有一定连续性的, 这些广告都是在一段时 间内集中播放, 每个广告之间间隔的时间比较短, 利用这个特点, 可以找出连续视频片段 集, 该连续视频片段集是指相邻两个匹配视频片段之间的播放时间间隔不超过预定值的匹 配视频片段集合。例如, 有五个匹配视频片段, 这五个匹配视频片段中两两相邻的匹配视 频片段之间的播放时间间隔为 5 秒, 则可以将这五个匹配视频片段作为一个连续视频片段 集。所有匹配视频片段中除连续视频片段集之外的匹配视频片段就称之为独立视频片段。 步骤 S1014 : 将连续视频片段集在电视视频样本中的时间区间与独立视频片段在 电视视频样本中的时间区间确定为广告时段。
     连续视频片段集在电视视频样本中的时间区间为第一冗余时刻至第二冗余时刻 之间的时间区间, 其中第一冗余时刻位于连续视频片段集中首个匹配视频片段在电视视频 样本中的开始时刻之前, 且该第一冗余时刻到连续视频片段集中首个匹配视频片段在电视 视频样本中的开始时刻之间的时间长度不超过设定的第一阈值, 第二冗余时刻位于连续视 频片段集中最后一个匹配视频片段在电视视频样本中的结束时刻之后, 且连续视频片段集 中最后一个匹配视频片段在电视视频样本中的结束时刻到该第二冗余时刻之间的时间长 度不超过设定的第二阈值。同理, 独立视频片段在电视视频样本中的时间区间为第三冗余 时刻至第四冗余时刻之间的时间区间, 其中第三冗余时刻位于独立视频片段在电视视频样 本中的开始时刻之前, 且该第三冗余时刻到独立视频片段在电视视频样本中的开始时刻之 间的时间长度不超过设定的第三阈值, 第四冗余时刻位于独立视频片段在电视视频样本中 的结束时刻 之后, 且独立视频片段在电视视频样本中的结束时刻到该第四冗余时刻之间的 时间长度不超过设定的第四阈值。
     请参考图 4, 图 4 为广告时段的示意图。 从图上可以看出, 在电视视频样本中, 包含 了连续视频片段集与独立视频片段, 在确定广告时段时, 广告时段是包含连续视频片段集 的一段时间区间和包含独立视频片段的一段时间区间。广告时段中有一段可调节时间, 由 图中的第一阈值、 第二阈值、 第三阈值与第四阈值体现。 第一阈值、 第二阈值、 第三阈值与第 四阈值可以设置为相同, 也可以设置为不同。例如连续视频片段集所处时间为第 10 分钟至
     第 20 分钟, 广告时段可以是第 7 分钟至第 23 分钟, 其中第一阈值与第二阈值相同, 均为三 分钟。
     利用广告视频样本库中的各广告视频样本确定电视视频在播放中的广告时段, 还 可以采用下面的方式实施。 请参考图 5, 图 5 是确定广告时段的方法的实施例二的流程示意 图。
     实施方式二 :
     步骤 S101A : 在电视视频中采集多个电视视频样本。在本实施例中, 可采集一天的 电视视频作为其中的一个电视视频样本。
     步骤 S101B : 将多个电视视频样本与各广告视频样本逐一比对, 确定在多个电视 视频样本的相同时间段内均与同一广告视频样本比对上的视频片段为匹配视频片段。
     步骤 S101C : 将匹配视频片段在电视视频样本中的时间区间确定为广告时段。
     匹配视频片段在电视视频样本中的时间区间为第五冗余时刻至第六冗余时刻之 间的时间区间, 所述第五冗余时刻位于匹配视频片段在电视视频样本中的开始时刻之前, 且该第五冗余时刻到匹配视频片段在电视视频样本中的开始时刻之间的时间长度不超过 设定的第五阈值, 第六冗余时刻位于匹配视频片段在电视视频样本中的结束时刻之后, 且 匹配视频片段在电视视频样本中的结束时刻到该第六冗余时刻之间的时间长度不超过设 定的第六阈值。 这里的第五阈值与第六阈值可以与实施例一中的第一阈值、 第二阈值、 第三 阈值或第四阈值相同或不同, 这里不再做具体说明。 在确定广告时段的实施方式二中, 通过电视视频的多个样本来确定匹配视频片 段, 从而找到广告时段, 符合电视视频中广告出现的规律。可以理解, 通常在电视视频中出 现的广告具有时段重复性, 即在电视视频中, 很可能出现连续多天在同一时间段内播放的 都是相同的广告, 因此, 采用实施方式二的方法, 也能够很好地提取到广告时段。
     请继续参考图 1。 在确定了广告时段后, 就可以利用广告时段来确定电视视频中的 目标广告视频。
     在步骤 S102 中, 首先将广告时段内的电视视频与各广告视频样本进行比对, 这 时, 广告时段内的电视视频就包括了与广告视频样本匹配的视频片段和与广告视频样本不 匹配的视频片段, 与广告视频样本匹配的视频片段就是广告视频样本库中的广告视频, 而 与广告视频样本不匹配的视频片段则需要进行进一步的处理, 从中去除重复的视频片段。
     去除重复的视频片段就是将多个相同的视频片段进行归一化, 保留其中的一个, 其实施方法为 : 将与广告视频样本不匹配的视频片段进行两两比对, 如果比对上则保留其 中一个, 将保留的这个视频片段与下一个未比对的视频片段进行比对。
     从去重处理后得到的不匹配视频片段中也可能确定出目标广告视频, 也就是说, 有些广告视频可能尚未被纳入广告视频样本库中。具体可采用的方法包括人工审核, 审核 人员从不匹配视频片段中选择出广告视频, 根据审核人员的选择确定出目标广告视频。由 于通过上述处理流程, 只有这部分不匹配视频片段需要进行人工审核, 大大降低了需要审 核的可疑视频, 因此极大地缩减了人力。此外, 也可以采用机器学习算法, 通过大量广告视 频数据训练得到的分类器, 对去重处理后得到的不匹配视频片段进行分类判断, 以确定该 不匹配视频片段是否为目标广告视频。
     经过上述处理流程得到的目标广告视频, 可以进一步添加到广告视频样本库, 也
     就是说, 本发明的方法, 既利用了广告视频样本来实现发现电视视频中仅出现一次的广告 视频以及排除全天多次播放的非广告视频的目的, 同时还可以利用最终的输出结果来扩充 广告视频样本的数量, 重复这个过程, 最终可以大大提高在电视视频管理上的效率。
     此外, 采用本发明的方法, 还可以进一步地将步骤 102 中与各广告视频样本匹配 的电视视频片段及目标广告视频作为电视视频中的广告。 也就是说本发明的方法还可以用 于从电视视频中提取广告。
     请参考图 6, 图 6 为本发明中发现广告视频的装置的实施例一的结构示意框图。 所 述装置包括 : 广告时段确定单元 201、 去重单元 202 及目标广告确定单元 203。
     广告时段确定单元 201, 用于利用预先建立的广告视频样本库中的各广告视频样 本确定电视视频中的广告时段。
     广告视频样本, 是指单个广告的视频, 广告视频样本库, 就是包含多个广告视频的 数据库。广告视频样本库中的广告视频样本, 首先可通过收集既有广告视频得到, 其次, 利 用本发明得到的目标广告视频, 最终也可以加入到广告视频样本库中作为广告视频样本。
     广告时段确定单元 201 包括第一采集子单元 2011、 第一比对子单元 2012、 匹配集 确定子单元 2013 以及第一广告时段确定子单元 2014。
     其中采集子单元 2011, 用于在电视视频中采集电视视频样本。 在本实施例中, 可采 集一天的电视视频作为电视视频样本。
     第一比对子单元 2012, 用于将电视视频样本与各广告视频样本逐一比对, 从电视 视频样本中确定与广告视频样本匹配的各视频片段。
     视频比对采用的方法可参考图 3, 图 3 为视频比对的方法的流程示意图。 电视视频 样本即为图中的源视频, 广告视频样本即为图中的目标视频。将源视频与目标视频进行解 码后, 就可按照图 3 中所示的方法, 将两者进行比对。
     从图 3 可以看出, 在将源视频与目标视频进行比对时, 实际上是先取目标视频的 第一帧, 与源视频的每一帧比对, 如果没有比对上, 则取目标视频的下一帧与源视频的每一 帧比对, 直到找到源视频中与目标视频中能比对上的帧, 这时, 记录下该帧在源视频中的位 置, 再从源视频中取下一帧, 与目标视频中取的下一帧进行比对, 直到比对失败, 记录下最 后一个比对成功的帧在源视频中的位置, 此时, 在源视频的两个记录的帧的位置之间的视 频片段, 即为匹配视频片段。 在寻找源视频与目标视频中第一个相同帧时, 也可以先取源视 频的第一帧, 与目标视频的每一帧比对, 如果没有比对上, 再取源视频的下一帧与目标视频 的每一帧比对, 以此类推。 如果源视频与目标视频中没有一帧能比对成功, 则说明源视频与 该目标视频比对失败, 源视频中没有该目标视频的匹配视频片段。
     将各个广告视频样本分别作为目标视频执行上述比对过程, 就可以找到电视视频 样本中的各个匹配视频片段了。
     请继续参考图 6。
     匹配集确定子单元 2013, 用于将各匹配视频片段按照在电视视频样本中的时间顺 序排列, 从中确定连续视频片段集与独立视频片段。
     通常来说, 在电视视频中播放的广告是有一定连续性的, 这些广告都是在一段时 间内集中播放, 每个广告之间间隔的时间比较短, 利用这个特点, 可以找出连续视频片段 集, 该连续视频片段集是指相邻两个匹配视频片段之间的播放时间间隔不超过预定值的匹配视频片段集合。例如, 有五个匹配视频片段, 这五个匹配视频片段中两两相邻的匹配视 频片段之间的播放时间间隔为 5 秒, 则可以将这五个匹配视频片段作为一个连续视频片段 集。所有匹配视频片段中除连续视频片段集之外的匹配视频片段就称之为独立视频片段。
     第一广告时段确定子单元 2014, 用于将连续视频片段集在电视视频样本中的时间 区间与独立视频片段在电视视频样本中的时间区间确定为广告时段。
     连续视频片段集在电视视频样本中的时间区间为第一冗余时刻至第二冗余时刻 之间的时间区间, 其中第一冗余时刻位于连续视频片段集中首个匹配视频片段在电视视频 样本中的开始时刻之前, 且该第一冗余时刻到连续视频片段集中首个匹配视频片段在电视 视频样本中的开始时刻之间的时间长度不超过设定的第一阈值, 第二冗余时刻位于连续视 频片段集中最后一个匹配视频片段在电视视频样本中的结束时刻之后, 且连续视频片段集 中最后一个匹配视频片段在电视视频样本中的结束时刻到该第二冗余时刻之间的时间长 度不超过设定的第二阈值。同理, 独立视频片段在电视视频样本中的时间区间为第三冗余 时刻至第四冗余时刻之间的时间区间, 其中第三冗余时刻位于独立视频片段在电视视频样 本中的开始时刻之前, 且该第三冗余时刻到独立视频片段在电视视频样本中的开始时刻之 间的时间长度不超过设定的第三阈值, 第四冗余时刻位于独立视频片段在电视视频样本中 的结束时刻之后, 且独立视频片段在电视视频样本中的结束时刻到该第四冗余时刻之间的 时间长度不超过设定的第四阈值。 请参考图 4, 图 4 为广告时段的示意图。 从图上可以看出, 在电视视频样本中, 包含 了连续视频片段集与独立视频片段, 在确定广告时段时, 广告时段是包含连续视频片段集 的一段时间区间和包含独立视频片段的一段时间区间。广告时段中有一段可调节时间, 由 图中的第一阈值、 第二阈值、 第三阈值与第四阈值体现。 第一阈值、 第二阈值、 第三阈值与第 四阈值可以设置为相同, 也可以设置为不同。例如连续视频片段集所处时间为第 10 分钟至 第 20 分钟, 则广告时段可以是第 7 分钟至第 23 分钟, 其中第一阈值与第二阈值相同, 均为 三分钟。
     去重单元 202, 用于将广告时段内播放的电视视频与各广告视频样本进行比对, 并 在与各广告视频样本不匹配的电视视频片段里去除重复视频片段。
     去除重复的视频片段就是将多个相同的视频片段进行归一化, 保留其中的一个, 其实施方法为 : 将与广告视频样本不匹配的视频片段进行两两比对, 如果比对上则保留其 中一个, 将保留的这个视频片段与下一个未比对的视频片段进行比对。
     目标广告确定单元 203, 用于从去除重复视频片段后的不匹配的电视视频片段中 确定目标广告视频。
     目标广告确定单元 203 从去重处理后得到的不匹配视频片段中可以确定目标广 告视频, 包括两种方式 : 一种是利用对去除重复视频片段后的不匹配的电视视频片段的人 工审核结果, 确定目标广告视频。 由于通过上述处理流程, 只有这部分不匹配视频片段需要 进行人工审核, 大大降低了需要审核的可疑视频, 因此极大地缩减了人力。 第二种方式是目 标广告确定单元 203 通过大量广告视频数据训练得到的分类器, 对所述去除重复视频片段 后的不匹配的电视视频片段进行分类判断, 确定目标广告视频。
     请参考图 7, 图 7 为本发明中发现广告视频的装置的实施例二的结构示意框图。 如 图 7 所示, 所述装置包括 : 广告时段确定单元 301、 去重单元 302、 目标广告确定单元 303、 插
     入单元 304 及广告提取单元 305。
     其中广告时段确定单元 301, 用于利用预先建立的广告视频样本库中的各广告视 频样本确定电视视频中的广告时段。广告时段确定单元 301, 包括第二采集子单元 3011、 第 二比对子单元 3012 及第二广告时段确定子单元 3013。
     其中第二采集子单元 3011, 用于在电视视频中采集多个电视视频样本。在本实施 例中, 可采集一天的电视视频作为其中的一个电视视频样本。
     第二比对子单元 3012, 用于将多个电视视频样本与各广告视频样本逐一比对, 确 定在多个电视视频样本的相同时间段内均与同一广告视频样本比对上的视频片段为匹配 视频片段。
     第二广告时段确定子单元 3013, 用于将匹配视频片段在电视视频样本中的时间区 间确定为广告时段。
     匹配视频片段在电视视频样本中的时间区间为第五冗余时刻至第六冗余时刻之 间的时间区间, 所述第五冗余时刻位于匹配视频片段在电视视频样本中的开始时刻之前, 且该第五冗余时刻到匹配视频片段在电视视频样本中的开始时刻之间的时间长度不超过 设定的第五阈值, 第六冗余时刻位于匹配视频片段在电视视频样本中的结束时刻之后, 且 匹配视频片段在电视视频样本中的结束时刻到该第六冗余时刻之间的时间长度不超过设 定的第六阈值。 去重单元 302, 用于将广告时段内的电视视频与各广告视频样本进行比对, 并在与 各广告视频样本不匹配的电视视频片段里去除重复视频片段。
     目标广告确定单元 303, 用于从去除重复视频片段后的不匹配的电视视频片段中 确定目标广告视频。
     插入单元 304, 用于将确定的目标广告视频放入广告视频样本库。本发明的装置, 既利用了广告视频样本来实现发现电视视频中仅出现一次的广告视频以及排除全天多次 播放的非广告视频的目的, 同时还可以利用最终的输出结果来扩充广告视频样本的数量, 重复这个过程, 最终可以大大提高在电视视频管理上的效率。
     广告提取单元 305, 用于将与各广告视频样本匹配的电视视频片段及目标广告视 频作为电视视频中的广告。也就是说本发明的装置还可以用于从电视视频中提取广告。
     以上所述仅为本发明的较佳实施例而已, 并不用以限制本发明, 凡在本发明的精 神和原则之内, 所做的任何修改、 等同替换、 改进等, 均应包含在本发明保护的范围之内。
    

一种发现广告视频的方法及装置.pdf_第1页
第1页 / 共16页
一种发现广告视频的方法及装置.pdf_第2页
第2页 / 共16页
一种发现广告视频的方法及装置.pdf_第3页
第3页 / 共16页
点击查看更多>>
资源描述

《一种发现广告视频的方法及装置.pdf》由会员分享,可在线阅读,更多相关《一种发现广告视频的方法及装置.pdf(16页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN102346768A43申请公布日20120208CN102346768ACN102346768A21申请号201110279361022申请日20110920G06F17/3020060171申请人北京鹏润鸿途科技有限公司地址100085北京市海淀区学清路38号金码大厦B座顶1232272发明人何长龙刘向宇李勋74专利代理机构深圳市威世博知识产权代理事务所普通合伙44280代理人何青瓦李庆波54发明名称一种发现广告视频的方法及装置57摘要本发明提供了一种发现广告视频的方法及装置,其中发现广告的方法包括A利用预先建立的广告视频样本库中的各广告视频样本确定电视视频中的广告时段;。

2、B将所述广告时段内的电视视频与各广告视频样本进行比对,并在与各广告视频样本不匹配的电视视频片段里去除重复视频片段,从去除重复视频片段后的不匹配的电视视频片段中确定目标广告视频。通过上述方式,可以提高广告监管的效率。51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书8页附图5页CN102346788A1/2页21一种发现广告的方法,其特征在于,所述方法包括A利用预先建立的广告视频样本库中的各广告视频样本确定电视视频中的广告时段;B将所述广告时段内的电视视频与各广告视频样本进行比对,并在与各广告视频样本不匹配的电视视频片段里去除重复视频片段,从去除重复视频片段后的不。

3、匹配的电视视频片段中确定目标广告视频。2根据权利要求1所述的方法,其特征在于,所述方法在步骤B后进一步包括将确定的目标广告视频放入所述广告视频样本库。3根据权利要求1所述的方法,其特征在于,所述步骤A包括在电视视频中采集电视视频样本;将所述电视视频样本与各广告视频样本逐一比对,将所述电视视频样本中与各广告视频样本比对上的视频片段确定为各匹配视频片段;将各匹配视频片段按照在所述电视视频样本中的时间顺序排列,从中确定连续视频片段集与独立视频片段,其中所述连续视频片段集为相邻两个匹配视频片段之间的时间间隔不超过预定值的匹配视频片段集合,所述独立视频片段为所有匹配视频片段中除所述连续视频片段集之外的匹。

4、配视频片段;将所述连续视频片段集在所述电视视频样本中开始时刻之前设定时长的第一冗余时刻与结束时刻之后设定时长的第二冗余时刻之间的时间区间,以及所述独立视频片段在所述电视视频样本中开始时刻之前设定时长的第三冗余时刻与结束时刻之后设定时长的第四冗余时刻之间的时间区间确定为所述广告时段。4根据权利要求1所述的方法,其特征在于,所述步骤A包括在电视视频中采集多个电视视频样本;将所述多个电视视频样本与各广告视频样本逐一比对,确定在所述多个电视视频样本的相同时间段内均与同一广告视频样本比对上的视频片段为匹配视频片段;将所述匹配视频片段在所述电视视频样本中开始时刻之前设定时长的第五冗余时刻与结束时刻之后设定。

5、时长的第六冗余时刻之间的时间区间确定为所述广告时段。5根据权利要求1所述的方法,其特征在于,在所述步骤B之后还包括将与各广告视频样本匹配的电视视频片段和所述目标广告视频作为所述电视视频包含的广告。6根据权利要求1至5中任一权项所述的方法,其特征在于,从去除重复视频片段后的不匹配的电视视频片段中确定目标广告视频包括利用对所述去除重复视频片段后的不匹配的电视视频片段的人工审核结果,确定目标广告视频;或者,通过大量广告视频数据训练得到的分类器,对所述去除重复视频片段后的不匹配的电视视频片段进行分类判断,确定目标广告视频。7一种发现广告的装置,其特征在于,所述装置包括广告时段确定单元,用于利用预先建立。

6、的广告视频样本库中的各广告视频样本确定电视视频中的广告时段;去重单元,用于将所述广告时段内的电视视频与各广告视频样本进行比对,并在与各广告视频样本不匹配的电视视频片段里去除重复视频片段;权利要求书CN102346768ACN102346788A2/2页3目标广告确定单元,用于从去除重复视频片段后的不匹配的电视视频片段中确定目标广告视频。8根据权利要求7所述的装置,其特征在于,所述装置进一步包括插入单元,用于将确定的目标广告视频放入所述广告视频样本库。9根据权利要求7所述的装置,其特征在于,所述广告时段确定单元包括第一采集子单元,用于在电视视频中采集电视视频样本;第一比对子单元,用于将所述电视视。

7、频样本与各广告视频样本逐一比对,将所述电视视频样本中与各广告视频样本比对上的视频片段确定为各匹配视频片段;匹配集确定子单元,将各匹配视频片段按照的时间顺序排列,从中确定连续视频片段集与独立视频片段,其中所述连续视频片段集为相邻两个匹配视频片段之间的时间间隔不超过预定值的匹配视频片段集合,所述独立视频片段为所有匹配视频片段中除所述连续视频片段集之外的匹配视频片段;第一广告时段确定子单元,用于将所述连续视频片段集在所述电视视频样本中开始时刻之前设定时长的第一冗余时刻与结束时刻之后设定时长的第二冗余时刻之间的时间区间,以及所述独立视频片段在所述电视视频样本中开始时刻之前设定时长的第三冗余时刻与结束时。

8、刻之后设定时长的第四冗余时刻之间的时间区间确定为所述广告时段。10根据权利要求7所述的装置,其特征在于,所述广告时段确定单元包括第二采集子单元,用于在电视视频中采集多个电视视频样本;第二比对子单元,用于将所述多个电视视频样本与各广告视频样本逐一比对,确定在所述多个电视视频样本的相同时间段内均与同一广告视频样本比对上的视频片段为匹配视频片段;第二广告时段确定子单元,用于将所述匹配视频片段在所述电视视频样本中开始时刻之前设定时长的第五冗余时刻与结束时刻之后设定时长的第六冗余时刻之间的时间区间确定为所述广告时段。11根据权利要求7所述的装置,其特征在于,所述装置进一步包括广告提取单元,用于将与各广告。

9、视频样本匹配的电视视频片段和所述目标广告视频作为所述电视视频包含的广告。12根据权利要求7至11中任一权项所述的装置,其特征在于,所述目标广告确定单元利用对所述去除重复视频片段后的不匹配的电视视频片段的人工审核结果,确定目标广告视频;或者,所述目标广告确定单元通过大量广告视频数据训练得到的分类器,对所述去除重复视频片段后的不匹配的电视视频片段进行分类判断,确定目标广告视频。权利要求书CN102346768ACN102346788A1/8页4一种发现广告视频的方法及装置【技术领域】0001本发明涉及数据处理技术,特别涉及一种发现广告视频的方法及装置。【背景技术】0002在电视视频中对广告进行监管。

10、是一项很重要的工作。在现有技术中,从电视视频中发现广告视频的方法比较简单,通常采用对全天的电视视频进行重复度比对,找出电视视频中重复出现次数较高的视频片段,确定为疑似广告,然后再通过人工审核,确定为广告样本。在这种方法下,存在两个问题首先,这样做很难发现全天只播放了一次的广告视频,即发现的广告视频不够全面;其次,全天播放的其他重复视频也会被确定为疑似广告,例如全天多次播放的歌曲、电视剧的片头和片尾等等,这些本不属于广告的视频也需要通过人工审核,大大增加了审核的工作量。【发明内容】0003本发明所要解决的技术问题是提供一种发现广告视频的方法及装置,以解决现有技术对广告监管时,发现的广告视频不全面。

11、、增加人工审核工作量的缺陷。0004本发明为解决技术问题而采用的技术方案是提供一种发现广告所述方法包括A利用预先建立的广告视频样本库中的各广告视频样本确定电视视频中的广告时段;B将所述广告时段内的电视视频与各广告视频样本进行比对,并在与各广告视频样本不匹配的电视视频片段里去除重复视频片段,从去除重复视频片段后的不匹配的电视视频片段中确定目标广告视频。0005根据本发明之一优选实施例,所述方法在步骤B后进一步包括将确定的目标广告视频放入所述广告视频样本库。0006根据本发明之一优选实施例,所述步骤A包括在电视视频中采集电视视频样本;将所述电视视频样本与各广告视频样本逐一比对,将所述电视视频样本中。

12、与各广告视频样本比对上的视频片段确定为各匹配视频片段;将各匹配视频片段按照在所述电视视频样本中的时间顺序排列,从中确定连续视频片段集与独立视频片段,其中所述连续视频片段集为相邻两个匹配视频片段之间的时间间隔不超过预定值的匹配视频片段集合,所述独立视频片段为所有匹配视频片段中除所述连续视频片段集之外的匹配视频片段;将所述连续视频片段集在所述电视视频样本中开始时刻之前设定时长的第一冗余时刻与结束时刻之后设定时长的第二冗余时刻之间的时间区间,以及所述独立视频片段在所述电视视频样本中开始时刻之前设定时长的第三冗余时刻与结束时刻之后设定时长的第四冗余时刻之间的时间区间确定为所述广告时段。0007根据本发。

13、明之一优选实施例,所述步骤A包括在电视视频中采集多个电视视频样本;将所述多个电视视频样本与各广告视频样本逐一比对,确定在所述多个电视视频样本的相同时间段内均与同一广告视频样本比对上的视频片段为匹配视频片段;将所述匹配视频片段在所述电视视频样本中开始时刻之前设定时长的第五冗余时刻与结束时刻之后说明书CN102346768ACN102346788A2/8页5设定时长的第六冗余时刻之间的时间区间确定为所述广告时段。0008根据本发明之一优选实施例,在所述步骤B之后还包括将与各广告视频样本匹配的电视视频片段和所述目标广告视频作为所述电视视频包含的广告。0009根据本发明之一优选实施例,从去除重复视频片。

14、段后的不匹配的电视视频片段中确定目标广告视频包括利用对所述去除重复视频片段后的不匹配的电视视频片段的人工审核结果,确定目标广告视频;或者,通过大量广告视频数据训练得到的分类器,对所述去除重复视频片段后的不匹配的电视视频片段进行分类判断,确定目标广告视频。0010本发明还提供了一种发现广告的装置,包括广告时段确定单元,用于利用预先建立的广告视频样本库中的各广告视频样本确定电视视频中的广告时段;去重单元,用于将所述广告时段内的电视视频与各广告视频样本进行比对,并在与各广告视频样本不匹配的电视视频片段里去除重复视频片段;目标广告确定单元,用于从去除重复视频片段后的不匹配的电视视频片段中确定目标广告视。

15、频。0011根据本发明之一优选实施例,所述装置进一步包括插入单元,用于将确定的目标广告视频放入所述广告视频样本库。0012根据本发明之一优选实施例,所述广告时段确定单元包括第一采集子单元,用于在电视视频中采集电视视频样本;第一比对子单元,用于将所述电视视频样本与各广告视频样本逐一比对,将所述电视视频样本中与各广告视频样本比对上的视频片段确定为各匹配视频片段;匹配集确定子单元,将各匹配视频片段按照的时间顺序排列,从中确定连续视频片段集与独立视频片段,其中所述连续视频片段集为相邻两个匹配视频片段之间的时间间隔不超过预定值的匹配视频片段集合,所述独立视频片段为所有匹配视频片段中除所述连续视频片段集之。

16、外的匹配视频片段;第一广告时段确定子单元,用于将所述连续视频片段集在所述电视视频样本中开始时刻之前设定时长的第一冗余时刻与结束时刻之后设定时长的第二冗余时刻之间的时间区间,以及所述独立视频片段在所述电视视频样本中开始时刻之前设定时长的第三冗余时刻与结束时刻之后设定时长的第四冗余时刻之间的时间区间确定为所述广告时段。0013根据本发明之一优选实施例,所述广告时段确定单元包括第二采集子单元,用于在电视视频中采集多个电视视频样本;第二比对子单元,用于将所述多个电视视频样本与各广告视频样本逐一比对,确定在所述多个电视视频样本的相同时间段内均与同一广告视频样本比对上的视频片段为匹配视频片段;第二广告时段。

17、确定子单元,用于将所述匹配视频片段在所述电视视频样本中开始时刻之前设定时长的第五冗余时刻与结束时刻之后设定时长的第六冗余时刻之间的时间区间确定为所述广告时段。0014根据本发明之一优选实施例,所述装置进一步包括广告提取单元,用于将与各广告视频样本匹配的电视视频片段和所述目标广告视频作为所述电视视频包含的广告。0015根据本发明之一优选实施例,所述目标广告确定单元利用对所述去除重复视频片段后的不匹配的电视视频片段的人工审核结果,确定目标广告视频;或者,所述目标广告确定单元通过大量广告视频数据训练得到的分类器,对所述去除重复视频片段后的不匹配的电视视频片段进行分类判断,确定目标广告视频。0016由。

18、以上技术方案可以看出,通过利用广告视频样本确定电视视频中的广告时段,再通过将广告时段内的电视视频与广告视频样本进行比对,可以很好地提高从电视视频中说明书CN102346768ACN102346788A3/8页6发现的广告视频数量,将电视视频中只播一次的广告视频提取出来,同时可以过滤电视视频中重复播放的非广告视频,提高广告监管的效率。【附图说明】0017图1为本发明中发现广告视频的方法的实施例的流程示意图;0018图2为确定广告时段的方法的实施例一的流程示意图;0019图3为视频比对的方法的流程示意图;0020图4为广告时段的示意图;0021图5是确定广告时段的方法的实施例二的流程示意图0022。

19、图6为本发明中发现广告视频的装置的实施例一的结构示意框图;0023图7为本发明中发现广告视频的装置的实施例二的结构示意框图。【具体实施方式】0024为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。0025请参考图1,图1为本发明中发现广告视频的方法实施例的流程示意图。如图1所示,所述方法包括0026步骤S101利用预先建立的广告视频样本库中的各广告视频样本确定电视视频中的广告时段。0027步骤S102将广告时段内的电视视频与各广告视频样本进行比对,并在与各广告视频样本不匹配的电视视频片段里去除重复视频片段,从去除重复视频片段后的不匹配的电视视频片段中确。

20、定目标广告视频。0028下面对上述步骤进行具体说明。0029广告视频样本,是指单个广告的视频,广告视频样本库,就是包含多个广告视频的数据库。广告视频样本库中的广告视频样本,首先可通过收集既有广告视频得到,其次,从本发明的方法中发现的目标广告视频,最终也可以加入到广告视频样本库中作为广告视频样本。0030利用广告视频样本库中的各广告视频样本确定电视视频在播放中的广告时段,可采用以下两种方式进行。0031实施方式一0032请参考图2,图2为确定广告时段的方法的实施例一的流程示意图。如图2所示,确定广告时段的方法包括0033步骤S1011在电视视频中采集电视视频样本。在本实施例中,可采集一天的电视视。

21、频作为电视视频样本。0034步骤S1012将电视视频样本与各广告视频样本逐一比对,从电视视频样本中确定与广告视频样本匹配的各视频片段。0035视频比对采用的方法可参考图3,图3为视频比对的方法的流程示意图。电视视频样本即为图中的源视频,广告视频样本即为图中的目标视频。将源视频与目标视频进行解码后,就可按照图3中所示的方法,将两者进行比对。说明书CN102346768ACN102346788A4/8页70036从图3可以看出,在将源视频与目标视频进行比对时,实际上是先取目标视频的第一帧,与源视频的每一帧比对,如果没有比对上,则取目标视频的下一帧与源视频的每一帧比对,直到找到源视频中与目标视频中能。

22、比对上的帧,这时,记录下该帧在源视频中的位置,再循环执行从源视频中取下一帧与目标视频中取的下一帧进行比对,直到比对失败,记录下最后一个比对成功的帧在源视频中的位置,此时,在源视频的两个记录的帧的位置之间的视频片段,即为匹配视频片段。在寻找源视频与目标视频中第一个相同帧时,也可以先取源视频的第一帧,与目标视频的每一帧比对,如果没有比对上,再取源视频的下一帧与目标视频的每一帧比对,以此类推。如果源视频与目标视频中没有一帧能比对成功,则说明源视频与该目标视频比对失败,源视频中没有该目标视频的匹配视频片段。0037将各个广告视频样本分别作为目标视频执行上述比对过程,就可以找到电视视频样本中的各个匹配视。

23、频片段了。0038请继续参考图2。0039步骤S1013将各匹配视频片段按照在电视视频样本中的时间顺序排列,从中确定连续视频片段集与独立视频片段。0040通常来说,在电视视频中播放的广告是有一定连续性的,这些广告都是在一段时间内集中播放,每个广告之间间隔的时间比较短,利用这个特点,可以找出连续视频片段集,该连续视频片段集是指相邻两个匹配视频片段之间的播放时间间隔不超过预定值的匹配视频片段集合。例如,有五个匹配视频片段,这五个匹配视频片段中两两相邻的匹配视频片段之间的播放时间间隔为5秒,则可以将这五个匹配视频片段作为一个连续视频片段集。所有匹配视频片段中除连续视频片段集之外的匹配视频片段就称之为。

24、独立视频片段。0041步骤S1014将连续视频片段集在电视视频样本中的时间区间与独立视频片段在电视视频样本中的时间区间确定为广告时段。0042连续视频片段集在电视视频样本中的时间区间为第一冗余时刻至第二冗余时刻之间的时间区间,其中第一冗余时刻位于连续视频片段集中首个匹配视频片段在电视视频样本中的开始时刻之前,且该第一冗余时刻到连续视频片段集中首个匹配视频片段在电视视频样本中的开始时刻之间的时间长度不超过设定的第一阈值,第二冗余时刻位于连续视频片段集中最后一个匹配视频片段在电视视频样本中的结束时刻之后,且连续视频片段集中最后一个匹配视频片段在电视视频样本中的结束时刻到该第二冗余时刻之间的时间长度。

25、不超过设定的第二阈值。同理,独立视频片段在电视视频样本中的时间区间为第三冗余时刻至第四冗余时刻之间的时间区间,其中第三冗余时刻位于独立视频片段在电视视频样本中的开始时刻之前,且该第三冗余时刻到独立视频片段在电视视频样本中的开始时刻之间的时间长度不超过设定的第三阈值,第四冗余时刻位于独立视频片段在电视视频样本中的结束时刻之后,且独立视频片段在电视视频样本中的结束时刻到该第四冗余时刻之间的时间长度不超过设定的第四阈值。0043请参考图4,图4为广告时段的示意图。从图上可以看出,在电视视频样本中,包含了连续视频片段集与独立视频片段,在确定广告时段时,广告时段是包含连续视频片段集的一段时间区间和包含独。

26、立视频片段的一段时间区间。广告时段中有一段可调节时间,由图中的第一阈值、第二阈值、第三阈值与第四阈值体现。第一阈值、第二阈值、第三阈值与第四阈值可以设置为相同,也可以设置为不同。例如连续视频片段集所处时间为第10分钟至说明书CN102346768ACN102346788A5/8页8第20分钟,广告时段可以是第7分钟至第23分钟,其中第一阈值与第二阈值相同,均为三分钟。0044利用广告视频样本库中的各广告视频样本确定电视视频在播放中的广告时段,还可以采用下面的方式实施。请参考图5,图5是确定广告时段的方法的实施例二的流程示意图。0045实施方式二0046步骤S101A在电视视频中采集多个电视视频。

27、样本。在本实施例中,可采集一天的电视视频作为其中的一个电视视频样本。0047步骤S101B将多个电视视频样本与各广告视频样本逐一比对,确定在多个电视视频样本的相同时间段内均与同一广告视频样本比对上的视频片段为匹配视频片段。0048步骤S101C将匹配视频片段在电视视频样本中的时间区间确定为广告时段。0049匹配视频片段在电视视频样本中的时间区间为第五冗余时刻至第六冗余时刻之间的时间区间,所述第五冗余时刻位于匹配视频片段在电视视频样本中的开始时刻之前,且该第五冗余时刻到匹配视频片段在电视视频样本中的开始时刻之间的时间长度不超过设定的第五阈值,第六冗余时刻位于匹配视频片段在电视视频样本中的结束时刻。

28、之后,且匹配视频片段在电视视频样本中的结束时刻到该第六冗余时刻之间的时间长度不超过设定的第六阈值。这里的第五阈值与第六阈值可以与实施例一中的第一阈值、第二阈值、第三阈值或第四阈值相同或不同,这里不再做具体说明。0050在确定广告时段的实施方式二中,通过电视视频的多个样本来确定匹配视频片段,从而找到广告时段,符合电视视频中广告出现的规律。可以理解,通常在电视视频中出现的广告具有时段重复性,即在电视视频中,很可能出现连续多天在同一时间段内播放的都是相同的广告,因此,采用实施方式二的方法,也能够很好地提取到广告时段。0051请继续参考图1。在确定了广告时段后,就可以利用广告时段来确定电视视频中的目标。

29、广告视频。0052在步骤S102中,首先将广告时段内的电视视频与各广告视频样本进行比对,这时,广告时段内的电视视频就包括了与广告视频样本匹配的视频片段和与广告视频样本不匹配的视频片段,与广告视频样本匹配的视频片段就是广告视频样本库中的广告视频,而与广告视频样本不匹配的视频片段则需要进行进一步的处理,从中去除重复的视频片段。0053去除重复的视频片段就是将多个相同的视频片段进行归一化,保留其中的一个,其实施方法为将与广告视频样本不匹配的视频片段进行两两比对,如果比对上则保留其中一个,将保留的这个视频片段与下一个未比对的视频片段进行比对。0054从去重处理后得到的不匹配视频片段中也可能确定出目标广。

30、告视频,也就是说,有些广告视频可能尚未被纳入广告视频样本库中。具体可采用的方法包括人工审核,审核人员从不匹配视频片段中选择出广告视频,根据审核人员的选择确定出目标广告视频。由于通过上述处理流程,只有这部分不匹配视频片段需要进行人工审核,大大降低了需要审核的可疑视频,因此极大地缩减了人力。此外,也可以采用机器学习算法,通过大量广告视频数据训练得到的分类器,对去重处理后得到的不匹配视频片段进行分类判断,以确定该不匹配视频片段是否为目标广告视频。0055经过上述处理流程得到的目标广告视频,可以进一步添加到广告视频样本库,也说明书CN102346768ACN102346788A6/8页9就是说,本发明。

31、的方法,既利用了广告视频样本来实现发现电视视频中仅出现一次的广告视频以及排除全天多次播放的非广告视频的目的,同时还可以利用最终的输出结果来扩充广告视频样本的数量,重复这个过程,最终可以大大提高在电视视频管理上的效率。0056此外,采用本发明的方法,还可以进一步地将步骤102中与各广告视频样本匹配的电视视频片段及目标广告视频作为电视视频中的广告。也就是说本发明的方法还可以用于从电视视频中提取广告。0057请参考图6,图6为本发明中发现广告视频的装置的实施例一的结构示意框图。所述装置包括广告时段确定单元201、去重单元202及目标广告确定单元203。0058广告时段确定单元201,用于利用预先建立。

32、的广告视频样本库中的各广告视频样本确定电视视频中的广告时段。0059广告视频样本,是指单个广告的视频,广告视频样本库,就是包含多个广告视频的数据库。广告视频样本库中的广告视频样本,首先可通过收集既有广告视频得到,其次,利用本发明得到的目标广告视频,最终也可以加入到广告视频样本库中作为广告视频样本。0060广告时段确定单元201包括第一采集子单元2011、第一比对子单元2012、匹配集确定子单元2013以及第一广告时段确定子单元2014。0061其中采集子单元2011,用于在电视视频中采集电视视频样本。在本实施例中,可采集一天的电视视频作为电视视频样本。0062第一比对子单元2012,用于将电视。

33、视频样本与各广告视频样本逐一比对,从电视视频样本中确定与广告视频样本匹配的各视频片段。0063视频比对采用的方法可参考图3,图3为视频比对的方法的流程示意图。电视视频样本即为图中的源视频,广告视频样本即为图中的目标视频。将源视频与目标视频进行解码后,就可按照图3中所示的方法,将两者进行比对。0064从图3可以看出,在将源视频与目标视频进行比对时,实际上是先取目标视频的第一帧,与源视频的每一帧比对,如果没有比对上,则取目标视频的下一帧与源视频的每一帧比对,直到找到源视频中与目标视频中能比对上的帧,这时,记录下该帧在源视频中的位置,再从源视频中取下一帧,与目标视频中取的下一帧进行比对,直到比对失败。

34、,记录下最后一个比对成功的帧在源视频中的位置,此时,在源视频的两个记录的帧的位置之间的视频片段,即为匹配视频片段。在寻找源视频与目标视频中第一个相同帧时,也可以先取源视频的第一帧,与目标视频的每一帧比对,如果没有比对上,再取源视频的下一帧与目标视频的每一帧比对,以此类推。如果源视频与目标视频中没有一帧能比对成功,则说明源视频与该目标视频比对失败,源视频中没有该目标视频的匹配视频片段。0065将各个广告视频样本分别作为目标视频执行上述比对过程,就可以找到电视视频样本中的各个匹配视频片段了。0066请继续参考图6。0067匹配集确定子单元2013,用于将各匹配视频片段按照在电视视频样本中的时间顺序。

35、排列,从中确定连续视频片段集与独立视频片段。0068通常来说,在电视视频中播放的广告是有一定连续性的,这些广告都是在一段时间内集中播放,每个广告之间间隔的时间比较短,利用这个特点,可以找出连续视频片段集,该连续视频片段集是指相邻两个匹配视频片段之间的播放时间间隔不超过预定值的匹说明书CN102346768ACN102346788A7/8页10配视频片段集合。例如,有五个匹配视频片段,这五个匹配视频片段中两两相邻的匹配视频片段之间的播放时间间隔为5秒,则可以将这五个匹配视频片段作为一个连续视频片段集。所有匹配视频片段中除连续视频片段集之外的匹配视频片段就称之为独立视频片段。0069第一广告时段确。

36、定子单元2014,用于将连续视频片段集在电视视频样本中的时间区间与独立视频片段在电视视频样本中的时间区间确定为广告时段。0070连续视频片段集在电视视频样本中的时间区间为第一冗余时刻至第二冗余时刻之间的时间区间,其中第一冗余时刻位于连续视频片段集中首个匹配视频片段在电视视频样本中的开始时刻之前,且该第一冗余时刻到连续视频片段集中首个匹配视频片段在电视视频样本中的开始时刻之间的时间长度不超过设定的第一阈值,第二冗余时刻位于连续视频片段集中最后一个匹配视频片段在电视视频样本中的结束时刻之后,且连续视频片段集中最后一个匹配视频片段在电视视频样本中的结束时刻到该第二冗余时刻之间的时间长度不超过设定的第。

37、二阈值。同理,独立视频片段在电视视频样本中的时间区间为第三冗余时刻至第四冗余时刻之间的时间区间,其中第三冗余时刻位于独立视频片段在电视视频样本中的开始时刻之前,且该第三冗余时刻到独立视频片段在电视视频样本中的开始时刻之间的时间长度不超过设定的第三阈值,第四冗余时刻位于独立视频片段在电视视频样本中的结束时刻之后,且独立视频片段在电视视频样本中的结束时刻到该第四冗余时刻之间的时间长度不超过设定的第四阈值。0071请参考图4,图4为广告时段的示意图。从图上可以看出,在电视视频样本中,包含了连续视频片段集与独立视频片段,在确定广告时段时,广告时段是包含连续视频片段集的一段时间区间和包含独立视频片段的一。

38、段时间区间。广告时段中有一段可调节时间,由图中的第一阈值、第二阈值、第三阈值与第四阈值体现。第一阈值、第二阈值、第三阈值与第四阈值可以设置为相同,也可以设置为不同。例如连续视频片段集所处时间为第10分钟至第20分钟,则广告时段可以是第7分钟至第23分钟,其中第一阈值与第二阈值相同,均为三分钟。0072去重单元202,用于将广告时段内播放的电视视频与各广告视频样本进行比对,并在与各广告视频样本不匹配的电视视频片段里去除重复视频片段。0073去除重复的视频片段就是将多个相同的视频片段进行归一化,保留其中的一个,其实施方法为将与广告视频样本不匹配的视频片段进行两两比对,如果比对上则保留其中一个,将保。

39、留的这个视频片段与下一个未比对的视频片段进行比对。0074目标广告确定单元203,用于从去除重复视频片段后的不匹配的电视视频片段中确定目标广告视频。0075目标广告确定单元203从去重处理后得到的不匹配视频片段中可以确定目标广告视频,包括两种方式一种是利用对去除重复视频片段后的不匹配的电视视频片段的人工审核结果,确定目标广告视频。由于通过上述处理流程,只有这部分不匹配视频片段需要进行人工审核,大大降低了需要审核的可疑视频,因此极大地缩减了人力。第二种方式是目标广告确定单元203通过大量广告视频数据训练得到的分类器,对所述去除重复视频片段后的不匹配的电视视频片段进行分类判断,确定目标广告视频。0。

40、076请参考图7,图7为本发明中发现广告视频的装置的实施例二的结构示意框图。如图7所示,所述装置包括广告时段确定单元301、去重单元302、目标广告确定单元303、插说明书CN102346768ACN102346788A8/8页11入单元304及广告提取单元305。0077其中广告时段确定单元301,用于利用预先建立的广告视频样本库中的各广告视频样本确定电视视频中的广告时段。广告时段确定单元301,包括第二采集子单元3011、第二比对子单元3012及第二广告时段确定子单元3013。0078其中第二采集子单元3011,用于在电视视频中采集多个电视视频样本。在本实施例中,可采集一天的电视视频作为其。

41、中的一个电视视频样本。0079第二比对子单元3012,用于将多个电视视频样本与各广告视频样本逐一比对,确定在多个电视视频样本的相同时间段内均与同一广告视频样本比对上的视频片段为匹配视频片段。0080第二广告时段确定子单元3013,用于将匹配视频片段在电视视频样本中的时间区间确定为广告时段。0081匹配视频片段在电视视频样本中的时间区间为第五冗余时刻至第六冗余时刻之间的时间区间,所述第五冗余时刻位于匹配视频片段在电视视频样本中的开始时刻之前,且该第五冗余时刻到匹配视频片段在电视视频样本中的开始时刻之间的时间长度不超过设定的第五阈值,第六冗余时刻位于匹配视频片段在电视视频样本中的结束时刻之后,且匹。

42、配视频片段在电视视频样本中的结束时刻到该第六冗余时刻之间的时间长度不超过设定的第六阈值。0082去重单元302,用于将广告时段内的电视视频与各广告视频样本进行比对,并在与各广告视频样本不匹配的电视视频片段里去除重复视频片段。0083目标广告确定单元303,用于从去除重复视频片段后的不匹配的电视视频片段中确定目标广告视频。0084插入单元304,用于将确定的目标广告视频放入广告视频样本库。本发明的装置,既利用了广告视频样本来实现发现电视视频中仅出现一次的广告视频以及排除全天多次播放的非广告视频的目的,同时还可以利用最终的输出结果来扩充广告视频样本的数量,重复这个过程,最终可以大大提高在电视视频管。

43、理上的效率。0085广告提取单元305,用于将与各广告视频样本匹配的电视视频片段及目标广告视频作为电视视频中的广告。也就是说本发明的装置还可以用于从电视视频中提取广告。0086以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。说明书CN102346768ACN102346788A1/5页12图1图2说明书附图CN102346768ACN102346788A2/5页13图3说明书附图CN102346768ACN102346788A3/5页14图4图5说明书附图CN102346768ACN102346788A4/5页15图6说明书附图CN102346768ACN102346788A5/5页16图7说明书附图CN102346768A。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1