一种基于SIFT特征算法的视频内容安全监管方法技术领域
本发明属于视频处理技术领域,具体涉及一种基于SIFT特征算法的视频内
容安全监管方法。
背景技术
随着计算机技术、通信技术和多媒体技术的不断发展和融合,各种多媒体
应用迅速在社会各个领域发展壮大。越来越多的人在享受视频信息带来的便利
时,同时也受到了多种形式的非法信息的侵害。目前的互联网中有大量基于明
文和透明的协议,在视频传输中很容易受到攻击,容易被替换和篡改,鲁棒性
不强。特别是在边远地区和未受监管的平台上,一些不法分子这些利用技术漏
洞,传播了大量恐怖,发动信息,干扰了正常的国家秩序。
传统技术中比如水印技术和哈希转换技术在视频传输领域存在较大难度。
水印是可见或者不可见的图案,能够被嵌入到影音内容中,就比如一个防伪标
签被贴在产品之上进行正品验证。但是加水印会改变影音内容,可能影响影音
内容质量,也可能被破解。另外存在多种水印技术,互相之间不兼容,如同不
同类型的防伪标签不能被同一设备验证。最重要的是存在大量的影音内容,比
如电视节目、以DVD和VHS录相带等形式发行的电影和娱乐音视频,以及互
联网视听节目是没有水印的。因此不能通过水印技术进行传输。哈希转换技术
是一种二进制文件验证技术。它对影音内容的编辑,剪切,压缩等操作都非常
敏感。微小的文件变化都会导致哈希值的变化,因此虽然密码哈希值在数据鉴
定和完整性校验中非常有用,但它并不适合传输影音内容。
发明内容
本发明的目的在于:针对上述现有技术领域中存在的问题,提供一种基于
SIFT特征算法的视频内容安全监管方法,解决在互联网中,视频传输鲁棒性低,
视频内容监管不到位的问题。
为了实现上述目的,本发明采用的技术方案为:
一种基于SIFT特征算法的视频内容安全监管方法,视频源发送端在接收到
视频源接收端的视频请求时,对视频进行解码处理,同时发送原始视频流到视
频源接收端;具体地,
视频源发送端首先对视频抽取关键帧,然后对关键帧进行指纹信息的提取,
再将提取的指纹信息进行非对称加密,加密后的指纹信息和块信息形成二进制
序列,将视频和加密后指纹打包通过网络传输通道发送至视频源接收端;
视频接收端接收到视频和加密的指纹信息后,然后对接收到的视频抽取关
键帧,并对关键帧进行指纹信息提取;同时将接收到的加密的指纹信息进行解
密,得到视频块内容特征;将视频中提取的指纹信息与解密得到视频块内容特
征进行视频指纹对比,对比失败,则说明视频在传输过程中被篡改,对比成功,
视频在传输过程中安全。
优选地,视频源发送端在接收到视频接收端的视频传输请求时,服务器以T
秒为单位,并将抽取后的整个视频中关键帧,针对每一关键帧分割成N*N个块,
形成所述的块信息,视频源发送端服务器使用sift特征算法按顺序对每个关键帧
中N*N块进行视频内容特征提取。
优选地,所述的视频内容特征提取,具体包括尺度空间极值检测、关键点
定位、方向确定和关键点描述;
采用尺度空间极值检测,搜索所有尺度上的图像位置,通过高斯微分函数
来识别潜在的对于尺度和旋转不变的兴趣点;
采用关键点定位,在每个候选的位置上,通过一个拟合精细的模型来确定
位置和尺度。关键点的选择依据于它们的稳定程度;
采用方向确定,基于图像局部的梯度方向,分配给每个关键点位置一个或
多个方向。所有后面的对图像数据的操作都相对于关键点的方向、尺度和位置
进行变换,从而提供对于这些变换的不变性;
采用关键点描述,在每个关键点周围的邻域内,在选定的尺度上测量图像
局部的梯度。这些梯度被变换成一种表示,这种表示允许比较大的局部形状的
变形和光照变化。
优选地,将采用sift特征算法得到的视频内容特征用非对称加密算法进行处
理。
优选地,将加密后的指纹信息和块信息进行量化处理,并用二进制序列来
表示。
优选地,视频接收终端将接收到视频流解码并缓存起来,然后等待接收带
有加密视频指纹信息的二进制序列文件。
优选地,当视频接收终端收到带有加密视频指纹信息的二进制文件之后,
首先对文件进行解密处理,然后提取二进制文件中的指纹信息,并将对视频进
行抽帧及抽取指纹,对比两者的指纹信息是否一致。
由于采用了上述技术方案,本发明的有益效果是:
本发明的一种基于SIFT特征算法的视频内容安全监管方法,采用SIFT特
征点指纹,视频在传输前,先通过SIFT算法提取视频中的关键帧的特征点,并
生成一个特征点的矢量集合,然后对比前后N个帧的特征点集合,去除特征点
相似的集合。然后对剩余的I帧图片进行分块,再提取每一块的特征点矢量集合,
按先后顺序保存成二进制形式,即为传输视频的指纹信息。服务器首先传输指
纹信息,然后再传输视频到终端,终端根据指纹信息对视频进行鉴定。相对于
水印技术和哈希转换技术,不会改变影音内容,对历史内容有效,内容处理后
保持稳定,能识别部分内容。该方法可以大大提高视频传输的安全性,对于视
频质量有非常好的鲁棒性。
附图说明
图1是本发明的视频内容安全监管方法流程图。
图2是本发明的SIFT特征点图。
图3是本发明的DOG空间极值检测图。
图4是本发明的关键点图。
图5是本发明的指纹匹配示意图。
具体实施方式
如图1-5所示,本发明是基于sift特征算法的视频内容安全监管方法,
一种基于SIFT特征算法的视频内容安全监管方法,视频源发送端在接收到
视频源接收端的视频请求时,对视频进行解码处理,同时发送原始视频流到视
频源接收端。视频源发送端首先对视频抽取关键帧,然后对关键帧进行指纹信
息的提取,再将提取的指纹信息进行非对称加密,加密后的指纹信息和块信息
形成二进制序列,将视频和加密后指纹打包通过网络传输通道发送至视频源接
收端。视频接收端接收到视频和加密的指纹信息后,然后对接收到的视频抽取
关键帧,并对关键帧进行指纹信息提取;同时将接收到的加密的指纹信息进行
解密,得到视频块内容特征;将视频中提取的指纹信息与解密得到视频块内容
特征进行视频指纹对比,对比失败,则说明视频在传输过程中被篡改,对比成
功,视频在传输过程中安全。
视频源发送端在接收到视频接收端的视频传输请求时,服务器以T秒为单
位,并将抽取后的整个视频中关键帧,针对每一关键帧分割成N*N个块,形成
所述的块信息,视频源发送端服务器使用sift特征算法按顺序对每个关键帧中
N*N块进行视频内容特征提取。
视频内容特征提取,具体包括尺度空间极值检测、关键点定位、方向确定
和关键点描述。采用尺度空间极值检测,搜索所有尺度上的图像位置,通过高
斯微分函数来识别潜在的对于尺度和旋转不变的兴趣点;采用关键点定位,在
每个候选的位置上,通过一个拟合精细的模型来确定位置和尺度。关键点的选
择依据于它们的稳定程度;采用方向确定,基于图像局部的梯度方向,分配给
每个关键点位置一个或多个方向。所有后面的对图像数据的操作都相对于关键
点的方向、尺度和位置进行变换,从而提供对于这些变换的不变性;采用关键
点描述,在每个关键点周围的邻域内,在选定的尺度上测量图像局部的梯度。
这些梯度被变换成一种表示,这种表示允许比较大的局部形状的变形和光照变
化。
作为优选地技术方案,将采用sift特征算法得到的视频内容特征用非对称加
密算法进行处理。将加密后的指纹信息和块信息进行量化处理,并用二进制序
列来表示。
视频接收终端将接收到视频流解码并缓存起来,然后等待接收带有加密视
频指纹信息的二进制序列文件。
当视频接收终端收到带有加密视频指纹信息的二进制文件之后,首先对文
件进行解密处理,然后提取二进制文件中的指纹信息,并将对视频进行抽帧及
抽取指纹,对比两者的指纹信息是否一致。
视频内容安全监管方法具体包括以下步骤:
视频源发送端接收到终端的视频传输请求,在对视频进行解码处理的同时,
发送原始视频流到终端。发送端服务器以T秒为单位,抽取关键帧,并且逐一
关键帧分割成N*N个块,同时选取每个块中的关键帧(本发明中,T为10秒,
视频长度为2分钟,分为12个块,每隔1秒提取关键帧)。服务器使用sift算法
按顺序对每个块进行视频内容特征提取,包括尺度空间极值检测、关键点定位、
关键点描述、方向确定等。其中:
1)尺度空间极值检测:搜索所有尺度上的图像位置。通过高斯微分函数来识
别潜在的对于尺度和旋转不变的兴趣点。在图像信息处理模型中引入一个被视
为尺度的参数,通过连续变化尺度参数获得多尺度下的尺度空间表示序列,对
这些序列进行尺度空间主轮廓的提取,并以该主轮廓作为一种特征向量,实现
边缘、角点检测和不同分辨率上的特征提取等。尺度空间方法将传统的单尺度
图像信息处理技术纳入尺度不断变化的动态分析框架中,更容易获取图像的本
质特征。尺度空间中各尺度图像的模糊程度逐渐变大,能够模拟人在距离目标
由近到远时目标在视网膜上的形成过程。尺度空间满足视觉不变性。该不变性
的视觉解释如下:当我们用眼睛观察物体时,一方面当物体所处背景的光照条
件变化时,视网膜感知图像的亮度水平和对比度是不同的,因此要求尺度空间
算子对图像的分析不受图像的灰度水平和对比度变化的影响,即满足灰度不变
性和对比度不变性。另一方面,相对于某一固定坐标系,当观察者和物体之间
的相对位置变化时,视网膜所感知的图像的位置、大小、角度和形状是不同的,
因此要求尺度空间算子对图像的分析和图像的位置、大小、角度以及仿射变换
无关,即满足平移不变性、尺度不变性、欧几里德不变性以及仿射不变性。
2)关键点定位:在每个候选的位置上,通过一个拟合精细的模型来确定位置
和尺度。关键点的选择依据于它们的稳定程度。通过拟合三维二次函数来精确
确定关键点的位置和尺度,同时去除低对比度的关键点和不稳定的边缘响应点
(因为DoG算子会产生较强的边缘响应),以增强匹配稳定性、提高抗噪声能力。
3)方向确定:基于图像局部的梯度方向,分配给每个关键点位置一个或多个
方向。所有后面的对图像数据的操作都相对于关键点的方向、尺度和位置进行
变换,从而提供对于这些变换的不变性。为了使描述符具有旋转不变性,需要
利用图像的局部特征为给每一个关键点分配一个基准方向。使用图像梯度的方
法求取局部结构的稳定方向。对于在DOG金字塔中检测出的关键点点,采集其
所在高斯金字塔图像3σ窗口内像素的梯度和方向分布特征。
4)关键点描述:在每个关键点周围的邻域内,在选定的尺度上测量图像局部
的梯度。这些梯度被变换成一种表示,这种表示允许比较大的局部形状的变形
和光照变化。对于每一个关键点,拥有三个信息:位置、尺度以及方向。所示
首先将坐标轴旋转作为关键点的方向,以确保旋转不变性。以特征点为中心取
8*8的领域作为采样窗口,将采样点与特征点的相对方向通过高斯加权后归入包
含8个方向直方图,最后获得2*2*8的32维特征描述。接下来就是为每个关键
点建立一个描述符,用一组向量将这个关键点描述出来,使其不随各种变化而
改变,比如光照变化、视角变化等等。这个描述子不但包括关键点,也包含关
键点周围对其有贡献的像素点,并且描述符应该有较高的独特性,以便于提高
特征点正确匹配的概率。
通过sift算法可有快速的形成视频指纹信息,将指纹信息采用非对称加密算
法进行加密,加密后的视频指纹信息形成二进制序列文件并通过网络进行传输。
终端将接收到视频流解码并缓存起来,然后等待接收带有加密视频指纹的二进
制文件。当收到带有视频指纹的二进制文件之后,首先对接收到的加密视频指
纹进行解密处理,然后对视频进行指纹提取,通过对比块信息还原的视频指纹
与解密得到的指纹信息,判断视频在传输过程中是否受到恶意篡改。