《一种云平台资源审核的方法.pdf》由会员分享,可在线阅读,更多相关《一种云平台资源审核的方法.pdf(9页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103312770 A (43)申请公布日 2013.09.18 CN 103312770 A *CN103312770A* (21)申请号 201310139000.5 (22)申请日 2013.04.19 H04L 29/08(2006.01) H04L 29/06(2006.01) G06F 21/10(2013.01) (71)申请人 无锡成电科大科技发展有限公司 地址 214135 江苏省无锡市无锡新区太科园 中国传感网大学科技园立业楼A区402 室 (72)发明人 戴元顺 (74)专利代理机构 北京品源专利代理有限公司 11332 代理人 马晓亚 (54)。
2、 发明名称 一种云平台资源审核的方法 (57) 摘要 本发明公开一种云平台资源审核的方法, 该 方法包括 : 抓取待审核资源包含的关键数据, 所 述关键数据包括内容 ; 利用签名匹配算法、 识别 匹配算法和动态特性分析法并行对所述内容进行 非法内容检测, 如检测全部通过, 则允许所述资源 共享 ; 否则, 禁止所述资源共享。通过对各个终端 提供的资源 / 内容进行多方面的安全性和合法性 审核, 并且终身监控该服务的升级更新, 确保云平 台中资源的安全性和合法性, 为所有用户提供绝 对正版、 合法、 安全的资源及一个良好的云平台环 境。 (51)Int.Cl. 权利要求书 2 页 说明书 5 页。
3、 附图 1 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书5页 附图1页 (10)申请公布号 CN 103312770 A CN 103312770 A *CN103312770A* 1/2 页 2 1. 一种云平台资源审核的方法, 其特征在于, 包括 : 抓取待审核资源包含的关键数据, 所述关键数据包括内容 ; 利用签名匹配算法、 识别匹配算法和动态特性分析法并行对所述内容进行非法内容检 测, 如检测全部通过, 则允许所述资源共享 ; 否则, 禁止所述资源共享。 2. 根据权利要求 1 所述的云平台资源审核的方法, 其特征在于, 所述抓取待审核资源 包。
4、含的关键数据是采用文档对象模型 (DOM) 的方法完成的。 3. 根据权利要求 1 所述的云平台资源审核的方法, 其特征在于, 利用所述签名匹配算 法对盗版视频进行检测, 该算法包括, 在时间域上对视频进行分割得到视频镜头片断 ; 提取所述视频镜头片断的简介特征作为签名, 并对视频进行分类, 所述视频镜头片段 的简介特征包括视频镜头片断的语义信息及视频内容提示符 ; 根据查询视频的类型选择相同类型的原始视频, 将所述视频的签名同特征索引库中预 先注册的原始视频签名进行匹配, 如匹配成功, 则为正版视频, 否则, 为盗版视频。 4. 根据权利要求 3 所述的云平台资源审核的方法, 其特征在于, 。
5、所述对视频进行分类 包括, 根据常见事物在视频中出现的时间和空间特征, 把视频划分为不同的类型 ; 所述常见事物包括人物、 建筑物、 树木、 车辆和街道。 5. 根据权利要求 3 所述的云平台资源审核的方法, 其特征在于, 所述盗版视频的编辑 手段包括几何变换、 额外信息插入、 视频顺序改变、 多画面插入和视频质量改变。 6. 根据权利要求 1 所述的云平台资源审核的方法, 其特征在于, 利用所述识别匹配算 法对色情图像进行检测, 该算法包括, 识别图像中人体部分的敏感区域 ; 根据所述敏感区域在数字图像中的亮度、 色调、 形状、 轮廓、 边缘、 粗糙度的特征, 对皮 肤区域进行检测 ; 根据。
6、皮肤区域在数字图像中的皮肤像素比例、 色调、 边缘的特征, 在皮肤区域中对人体 生殖器官进行检测, 根据生殖器官模版或内建的规则进行组建, 如果组建成功, 则该图像为色情图像, 否 则, 为非色情图像。 7. 根据权利要求 1 所述的云平台资源审核的方法, 其特征在于, 利用所述识别匹配算 法对色情图像进行检测, 该算法包括, 提取图像中的各个肤色区域 ; 统计各个肤色区域的皮肤纹理方向直方图、 粗糙度、 纹理密度特征组成特征向量 ; 根据所述特征向量来区分色情图像和非色情图像。 8. 根据权利要求 1 所述的云平台资源审核的方法, 其特征在于, 利用所述动态特性分 析法对色情视频进行检测, 。
7、所述动态特性分析法包括, 利用色情图像的识别方法去识别色情帧 ; 获取视频动态特性 ; 根据视频动态特性检测人体活动, 从而判断色情视频和非色情视频。 9. 根据权利要求 8 所述的云平台资源审核的方法, 其特征在于, 所述运动特性获取的 权 利 要 求 书 CN 103312770 A 2 2/2 页 3 方法包括, 提取运动矢量特征 ; 或者, 提取光流特征 ; 或者, 提取敏感信息点 ; 或者, 利用照 相机的运动模型。 权 利 要 求 书 CN 103312770 A 3 1/5 页 4 一种云平台资源审核的方法 技术领域 0001 本发明涉及云计算领域, 尤其涉及一种云平台资源审核的。
8、方法。 背景技术 0002 目前, 网络上存在各种非法或者不安全的资源, 威胁着广大用户。针对这种情况, 目前主要采取网络警察维护网络的安全, 封闭不良的网页。 但是, 由于每天上传网络上的资 源极多, 而且分布范围极广, 没有统一的解决办法或者不可能全部进行审核。 发明内容 0003 有鉴于此, 本发明要解决的技术问题是提供一种云平台资源审核的方法, 通过对 云平台中提交的资源进行安全性和合法性审核, 并且通过监控管理系统使资源终身安全合 法的为终端服务, 确保云平台中资源的安全性和合法性。 0004 为达到上述目的, 本发明是通过以下技术方案来实现的 : 0005 一种云平台资源审核的方法。
9、, 包括 : 0006 抓取待审核资源包含的关键数据, 所述关键数据包括内容 ; 0007 利用签名匹配算法、 识别匹配算法和动态特性分析法并行对所述内容进行非法内 容检测, 如检测全部通过, 则允许所述资源共享 ; 否则, 禁止所述资源共享。 0008 进一步地, 所述抓取待审核资源包含的关键数据是采用文档对象模型 (DOM) 的方 法完成的。 0009 进一步地, 利用所述签名匹配算法对盗版视频进行检测, 该算法包括, 0010 在时间域上对视频进行分割得到视频镜头片断 ; 0011 提取所述视频镜头片断的简介特征作为签名, 并对视频进行分类, 所述视频镜头 片段的简介特征包括视频镜头片断。
10、的语义信息及视频内容提示符 ; 0012 根据查询视频的类型选择相同类型的原始视频, 将所述视频的签名同特征索引库 中预先注册的原始视频签名进行匹配, 如匹配成功, 则为正版视频, 否则, 为盗版视频。 0013 进一步地, 所述对视频进行分类包括, 0014 根据常见事物在视频中出现的时间和空间特征, 把视频划分为不同的类型 ; 0015 所述常见事物包括人物、 建筑物、 树木、 车辆和街道。 0016 进一步地, 所述盗版视频的编辑手段包括几何变换、 额外信息插入、 视频顺序改 变、 多画面插入和视频质量改变。 0017 进一步地, 利用所述识别匹配算法对色情图像进行检测, 该算法包括, 。
11、0018 识别图像中人体部分的敏感区域 ; 0019 根据所述敏感区域在数字图像中的亮度、 色调、 形状、 轮廓、 边缘、 粗糙度的特征, 对皮肤区域进行检测 ; 0020 根据皮肤区域在数字图像中的皮肤像素比例、 色调、 边缘的特征, 在皮肤区域中对 人体生殖器官进行检测, 说 明 书 CN 103312770 A 4 2/5 页 5 0021 根据生殖器官模版或内建的规则进行组建, 如果组建成功, 则该图像为色情图像, 否则, 为非色情图像 ; 0022 进一步地, 利用所述识别匹配算法对色情图像进行检测, 该算法包括, 0023 提取图像中的各个肤色区域 ; 0024 统计各个肤色区域的。
12、皮肤纹理方向直方图、 粗糙度、 纹理密度特征组成特征向 量 ; 0025 根据所述特征向量来区分色情图像和非色情图像。 0026 进一步地, 利用所述动态特性分析法对色情视频进行检测, 所述动态特性分析法 包括, 0027 利用色情图像的识别方法去识别色情帧 ; 0028 获取视频动态特性 ; 0029 根据视频动态特性检测人体活动, 从而判断色情视频和非色情视频。 0030 进一步地, 所述运动特性获取的方法包括, 提取运动矢量特征 ; 或者, 提取光流特 征 ; 或者, 提取敏感信息点 ; 或者, 利用照相机的运动模型。 0031 本发明的技术方案, 通过对各个终端提供的资源 / 内容进行。
13、全方面的安全性和合 法性审核, 并且终身监控该服务的升级更新, 确保云平台中资源的安全性和合法性, 为所有 用户提供绝对正版、 合法、 安全的资源及一个良好的云平台环境。 附图说明 0032 图 1 为本发明实施例的云平台资源审核的方法的流程图。 具体实施方式 0033 下面结合附图和实施例对本发明作进一步说明。 0034 图 1 为本发明实施例的云平台资源审核的方法流程图。如图 1 所示, 该方法包括 如下步骤 : 0035 步骤 101 : 抓取待审核资源包含的关键数据, 所述关键数据包括内容。 0036 在云平台中, 内容提供者将资源上传到云平台的服务器后等待审核。服务器首先 分析出该资。
14、源包含的关键数据, 如分析出数据主题, 发布时间, 内容等关键信息。由于云传 输中的数据格式大不相同, 可以采用文档对象模型 (DOM) 的方法, 预先建立各种不同的文档 模型, 将这些文档模型与上传的资源的文档类型进行对比, 使用最接近的文档模型来快速 分析待审核资源的关键数据。这种资源处理的方式增加了数据处理的效率。 0037 步骤 102 : 利用签名匹配算法、 识别匹配算法和动态特性分析法并行对所述内容 进行非法内容检测。 0038 其中, 所述非法内容检测包括色情内容检测和盗版内容检测。 0039 色情内容检测技术包括色情图像的检测和色情视频的检测。基于抓取到的内容, 色情图像通常有。
15、两种识别方法, 0040 第一种方法 : 识别色情图像中人体部分的敏感区域 ; 在所述敏感区域检测皮肤区 域 ; 在皮肤区域检测敏感器官 ; 根据敏感器官模版或内建的规则进行组建, 如果组建成功, 则该图像为色情图像, 否则, 为非色情图像。 说 明 书 CN 103312770 A 5 3/5 页 6 0041 其中, 根据人体部分的敏感区域在数字图像中的亮度、 色调、 形状、 轮廓、 边缘、 粗 糙度的特征, 在皮肤区域中对女性乳房等进行检测。根据敏感区域在数字图像中的皮肤像 素比例、 色调、 边缘的特征, 在皮肤区域中对人体生殖器官进行检测, 根据生殖器官模版或 内建的规则进行组建, 如。
16、果组建成功, 则该图像为色情图像, 否则, 为非色情图像 ; 0042 所述识别色情图像中人体部分的具体内容是通过算法来试图理解色情图像中人 体部分的具体内容实现的。 0043 第二种方法 : 提取图像中的各个肤色区域 ; 统计各个肤色区域的皮肤纹理方向直 方图、 粗糙度、 纹理密度特征组成特征向量 ; 根据所述特征向量来区分色情图像和非色情图 像。 。 0044 色情图像的最主要特征是含有大量人体皮肤区域。标记出图像的各个肤色区域, 既可以过滤多余信息, 又可以减小特征提取和机器学习时的资源开销。 因此, 在图像中分割 出肤色区域是进行特征提取的重要前提。色情图像中的肤色区域占整幅图像的比例。
17、较大, 而正常图像中肤色区域占整幅图像的比例则相应较小, 将肤色区域的大小作为一个特征 值 ; 色情图像的另一个主要特征是含有大量光滑、 无明显周期性和方向性的肤色区域, 表现 在 “纹理方向直方图” 上即无纹理的像素比较多。通过 “纹理方向直方图” 特征值的加入, 可以减小对具有大量肤色像素、 但没有皮肤纹理的图像的误判。色情图像的肤色区域内的 “粗糙度” 值比较大, 表明肤色区内颜色变化缓慢, 在较大范围内保持颜色的一致。正常图像 的颜色一般在空域内有所波动, 在较小的范围之内就有明显的变化, 所以 “粗糙度” 的值一 般都比较小。皮肤纹理作为一种特殊的纹理, 它的 “纹理密度” 比一般的。
18、非肤色图像要小得 多。 统计分析方法对于纹理分类与纹理分割有明显的优势, 且具有处理速度快的特点, 因而 使用基于统计的 “纹理方向直方图” 、“粗糙度” 、“纹理密度” 作为另一个特征值。 0045 色情视频的检测可以利用色情图像的识别方法去识别色情帧, 然后利用视频的动 态特性来检测人体的色情活动, 从而判断色情视频和非色情视频。所述视频运动特征的提 取包括如下几种方案 : 0046 方案 1 : 提取运动矢量特征, 对运动矢量的大小和方向进行分析和统计。 0047 如相邻帧差法就是提取运动矢量的一种算法, 基本原理相邻两帧图像对应像素相 对应像素值相减, 在环境亮度变化不大的情况下, 如。
19、果对应像素值相差很小, 则认为此处是 静止的, 如果图像区域某处的像素值变化很大, 认为是由图像中运动问题引起的, 将这些区 域标记出来, 进行运动矢量特征提取。 0048 方案 2 : 提取光流特征, 评判运动的大小和方向。 0049 光流法检测运动物体的基本原理是 : 给图像中的每一个像素点赋予一个速度矢 量, 这就形成了一个图像运动场, 在运动的一个特定时刻, 图像上的点与三维物体上的点 一一对应, 这种对应关系可由投影关系得到, 根据各个像素点的速度矢量特征, 可以对图像 进行动态分析。如果图像中没有运动物体, 则光流矢量在整个图像区域是连续变化的。当 图像中有运动物体时, 目标和图像。
20、背景存在相对运动, 运动物体所形成的速度矢量必然和 邻域背景速度矢量不同, 从而检测出运动物体及位置。光流法的优点在于光流不仅携带了 运动物体的运动信息, 而且还携带了有关景物三维结构的丰富信息, 它能够在不知道场景 的任何信息的情况下, 检测出运动对象。 0050 方案 3 : 提取敏感信息点, 对敏感信息点进行跟踪和轨迹分析。 说 明 书 CN 103312770 A 6 4/5 页 7 0051 方案 4 : 利用照相机的运动模型, 判断照相机的推、 拉、 摇、 移运动类型。 0052 盗版内容检测技术通过分析视频盗版的特点, 在查询视频中, 针对每类盗版编辑 手段进行检测 ; 根据盗版。
21、编辑手段对视频原始内容的遮挡和改变程度, 选择性的提取视屏 帧的简介特征作为签名 ; 然后将查询视频的签名同特征索引库中预先注册的原始视频签名 进行匹配, 如匹配成功, 则为正版视频, 否则, 为盗版视频。整个签名搜索过程, 使用云计算 进行合理的计算任务协调分配, 实现高效的并行计算, 从而提高检索的效率。 0053 本实施例中, 利用所述签名匹配算法对盗版视频进行检测, 采用视频镜头边界检 测算法, 在时间域上对视频进行分割得到视频镜头片断 ; 提取所述视频镜头片断的简介特 征作为签名, 并对视频进行分类, 所述视频镜头片段的简介特征包括视频镜头片断的语义 信息及视频内容提示符 ; 根据查。
22、询视频的类型选择相同类型的原始视频, 将所述视频的签 名同特征索引库中预先注册的原始视频签名进行匹配, 如匹配成功, 则为正版视频, 否则, 为盗版视频。 0054 所述对视频进行分类包括, 根据常见事物在视频中出现的时间和空间特征, 把视 频划分为不同的类型 ; 所述常见事物包括人物、 建筑物、 树木、 车辆和街道。 0055 所述视频镜头边界算法时视频检索的关键技术。 通过镜头分割或镜头切换进行视 频检测。本实施例中, 在时间域上对视频进行分割, 分割得到的视频镜头片断, 作为源视频 的子集, 提取分割得到的视频的语义信息, 从而可以根据视频的内容将视频进行分类, 根据 视频内容的指示符,。
23、 有选择性的进行视频的匹配, 减小了视频匹配的次数, 根据人物、 建筑 物、 树木、 车辆、 街道等常见事物在视频中出现的时间和空间特征, 把视频划分为不同的类 型。然后, 根据查询视频的类型, 选择相同类型的原始视频进行匹配, 极大的提高了匹配的 效率。 0056 盗版视频的编辑手段主要为 5 大类 : 几何变换 (如视屏帧显示比例的改变) 、 额外 信息的插入 (如字幕和电视台台标) 、 画中画 (如一大一小两个视频同时播放) 、 视频质量的 下降 (如噪声) 和视频顺序的改变 (如掉帧和插入帧) 。在查询视频时, 针对每类盗版编辑手 段进行检测。 0057 步骤 103 : 判断内容检测。
24、是否全部通过, 如全部通过, 执行步骤 105, 否则执行步骤 104。 0058 步骤 104 : 禁止所述资源共享, 降低资源上传者的信用等级, 并根据违规内容报送 相关部门处理。 0059 步骤 105 : 允许该资源共享 ; 0060 步骤 106 : 判断该资源是否有更新或者升级, 如有, 执行步骤 101 ; 否则, 对资源其 他方面进行监管。 0061 通过上述多方面并行对云平台资源进行审核, 保证了内容的合法性和安全性。 0062 此外, 本发明的内容审核机制能够对云平台进行监控管理, 即对正在服务的资源 进行使用的监控, 看其是否存在违法或则违反安全的操作, 并且对其升级更新。
25、也进行审核, 保证资源的终身安全性和合法性。 0063 Pass(platform as a service) 模式下提供的程序开发架构应确保其安全性, 该 模式下开发的程序应确保其不会做坏事, 对开发的程序应有一定的功能监控, 杜绝 pass 下 的云平台被恶意软件利用的可能。 说 明 书 CN 103312770 A 7 5/5 页 8 0064 为了解决安装防火墙后外部网络不能访问内部网络服务器的问题, 而设立的一个 非安全系统与安全系统之间的缓冲区, DMZ(demilitarized zone) 使用的网络应用程序, 通过这样一个 DMZ 区域, 更加有效地保护了内部网络。这种网络部。
26、署, 比起一般的防火墙方 案, 对攻击者来说又多了一道关卡, 能够过滤基于协议漏洞发起的攻击, 更精确地控制用户 的访问, 减少因无用命令开放暴露出的命令滥用风险。 0065 在 DMZ 方案中, 包括两个防火墙, 外部防火墙抵挡外部网络的攻击, 并管理所有外 部网络对 DMZ 的访问。内部防火墙管理 DMZ 对于内部网络的访问。内部防火墙是内部网络 的第三道安全防线 ( 前面包括外部防火墙和堡垒主机 ), 当外部防火墙失效的时候, 它还可 以起到保护内部网络的功能。而局域网内部, 对于 Internet 的访问由内部防火墙和位于 DMZ 的堡垒主机控制。在这样的结构里, 一个黑客必须通过三个。
27、独立的区域 ( 外部防火墙、 内部防火墙和堡垒主机 ) 才能够到达局域网。攻击难度大大加强, 相应内部网络的安全性 也就大大加强。 资源上传者把资源上传, 然后由云平台内容审核系统对其进行审核, 如果该 资源有毒, 由于云平台 DMZ 安全架构的设计, 该病毒也不能对云端的最终资源构成威胁, 并 且会将该资源立即毁灭。 0066 本发明的技术方案, 通过对各个终端提供的资源 / 内容进行全方面的安全性和合 法性审核, 并且终身监控该服务的升级更新, 确保云平台中资源的安全性和合法性, 为所有 用户提供绝对正版、 合法、 安全的资源及一个良好的云平台环境。 0067 以上实施例提供的技术方案中的全部或部分内容可以通过程序来指令相关的硬 件来完成, 所述的程序可以存储于一计算机可读取存储介质中, 该程序按照上述内容介绍 的步骤执行, 所述的存储介质, 如 : ROM/RAM、 磁碟、 光盘等。 0068 上述仅为本发明的较佳实施例及所运用技术原理, 任何熟悉本技术领域的技术人 员在本发明披露的技术范围内, 可轻易想到的变化或替换, 都应涵盖在本发明的保护范围 内。 说 明 书 CN 103312770 A 8 1/1 页 9 图 1 说 明 书 附 图 CN 103312770 A 9 。