《一种基于音频分析触发报警和录像的监控方法.pdf》由会员分享,可在线阅读,更多相关《一种基于音频分析触发报警和录像的监控方法.pdf(8页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 104113730 A (43)申请公布日 2014.10.22 CN 104113730 A (21)申请号 201410331930.5 (22)申请日 2014.07.14 H04N 7/18(2006.01) H04N 5/781(2006.01) (71)申请人 苏州科威视数字技术有限公司 地址 215500 江苏省苏州市常熟市东南开发 区东南大道 68 号 (72)发明人 孙世伟 易步强 陈龙 (74)专利代理机构 南京理工大学专利中心 32203 代理人 朱显国 (54) 发明名称 一种基于音频分析触发报警和录像的监控方 法 (57) 摘要 本发明提供一。
2、种基于音频分析触发报警和录 像的监控方法, 包括以下步骤 : 接收一音频数据, 该音频数据拾取于被监控现场 ; 网络摄像机对音 频数据进行音频分析获取其频率值, 并基于该音 频频率值与频率阈值的比较结果设定一标志信 息, 该标志信息包括无声状态、 人声状态及高频状 态 ; 将前述标志信息发送至一网络硬盘录像机, 同时将网络摄像机采集之音频数据和视频数据分 别编码后传输至网络硬盘录像机 ; 以及网络硬盘 录像机对传输的视频和音频数据进行录像数据存 储, 并基于标志信息执行预定规则的报警及视频 显示与录像。 利用本发明的监控方法, 可增强报警 的准确性, 通过增加基于音频分析后的标识信息, 可实现。
3、快速录像检索回放, 缩短录像检索时间。 (51)Int.Cl. 权利要求书 1 页 说明书 4 页 附图 2 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书1页 说明书4页 附图2页 (10)申请公布号 CN 104113730 A CN 104113730 A 1/1 页 2 1. 一种基于音频分析触发报警和录像的监控方法, 其特征在于, 包括以下步骤 : 接收一音频数据, 该音频数据拾取于被监控现场 ; 网络摄像机对音频数据进行音频分析获取其频率值, 并基于该音频频率值与频率阈值 的比较结果设定一标志信息, 该标志信息包括无声状态、 人声状态及高频状态 ; 将前。
4、述标志信息发送至一网络硬盘录像机, 同时将网络摄像机采集之音频数据和视频 数据分别编码后传输至该网络硬盘录像机 ; 以及 网络硬盘录像机对前述传输的视频和音频数据进行录像数据存储, 并基于前述标志信 息执行预定规则的报警及视频显示与录像。 2. 根据权利要求 1 所述的基于音频分析触发报警和录像的监控方法, 其特征在于, 前 述监控方法还包括以下步骤 : 设定第一频率阈值和第二频率阈值, 其中, 所述第一频率阈值小于第二频率阈值。 3. 根据权利要求 1 所述的基于音频分析触发报警和录像的监控方法, 其特征在于, 前 述监控方法的基于音频频率值设定标识信息包括 : 如果拾取于被监控现场音频数据。
5、之音频频率值小于一第一频率阈值, 则设定所述标志 信息为无声状态 ; 如果所述音频频率值大于或等于第一频率阈值, 且小于一第二频率阈值, 则设定所述 标志信息为人声状态 ; 以及 如果所述音频频率值大于或等于第二频率阈值, 则设定所述标志信息为高频状态。 4. 根据权利要求 1 所述的基于音频分析触发报警和录像的监控方法, 其特征在于, 所 述网络硬盘录像机基于无声状态的标识信息, 执行下述操作 : 停止录像。 5. 根据权利要求 1 所述的基于音频分析触发报警和录像的监控方法, 其特征在于, 所 述网络硬盘录像机基于无声状态的标识信息, 执行下述操作 : 全天候录像。 6. 根据权利要求 1。
6、 所述的基于音频分析触发报警和录像的监控方法, 其特征在于, 所 述网络硬盘录像机基于人声状态的标识信息, 执行下述操作 : 发出报警提示音, 并进行视频 显示与录像。 7. 根据权利要求 1 所述的基于音频分析触发报警和录像的监控方法, 其特征在于, 所 述网络硬盘录像机基于高频状态的标识信息, 执行下述操作 : 发出报警提示音, 并进行视频 显示与录像。 8. 根据权利要求 1 所述的基于音频分析触发报警和录像的监控方法, 其特征在于, 所 述编码方式包括 : 对于音频数据, 采用 G711 音频编码算法进行编码 ; 以及 对于视频数据, 采用 H264 视频编码算法进行编码。 权 利 要。
7、 求 书 CN 104113730 A 2 1/4 页 3 一种基于音频分析触发报警和录像的监控方法 技术领域 0001 本发明涉及安防监控技术领域, 具体而言涉及一种基于音频分析触发报警和录像 的监控方法。 背景技术 0002 安防视频监控系统的应用越来越普及, 在安装大量的视频监控系统以后, 用户面 临着大量的音视频数据要实时观看和录像回放查看, 尤其是在视频高清化和网络化以后, 音视频录像的数据量成千上百倍地增加, 从而带来大数据的音视频数据存储、 预览、 检索、 回放等问题, 如何做到实时有效的报警、 节省有效的录像存储空间、 快速的检索历史录像是 目前需要解决的问题。 0003 随着。
8、高清网络摄像机的应用普及, 应用集中在对视频图像的智能分析算法, 但图 像分析算法复杂, 受光线等因素影响比较大, 出现漏报率高、 误报率高的特点, 很多图像智 能分析算法无法在视频监控行业实际应用。 而音频分析算法比较成熟, 具有无漏报率、 误报 率低的特点, 可以根据应用特点使用到安防视频监控系统中, 并且可以和其他成熟的图像 智能分析算法组合一起提升视频监控的智能化水平。 发明内容 0004 本发明目的在于提供一种基于音频分析触发报警和录像的监控方法, 以解决现有 技术中存在的不足, 提升视频监控的智能化需求。 0005 本发明的上述目的通过独立权利要求的技术特征实现, 从属权利要求以另。
9、选或有 利的方式发展独立权利要求的技术特征。 0006 为达成上述目的, 本发明所采用的技术方案如下 : 0007 一种基于音频分析触发报警和录像的监控方法, 包括以下步骤 : 0008 接收一音频数据, 该音频数据拾取于被监控现场 ; 0009 网络摄像机对音频数据进行音频分析获取其频率值, 并基于该音频频率值与频率 阈值的比较结果设定一标志信息, 该标志信息包括无声状态、 人声状态及高频状态 ; 0010 将前述标志信息发送至一网络硬盘录像机, 同时将网络摄像机采集之音频数据和 视频数据分别编码后传输至该网络硬盘录像机 ; 以及 0011 网络硬盘录像机对前述传输的视频和音频数据进行录像数。
10、据存储, 并基于前述标 志信息执行预定规则的报警及视频显示与录像。 0012 进一步的实施例中, 前述监控方法还包括以下步骤 : 0013 设定第一频率阈值和第二频率阈值, 其中, 所述第一频率阈值小于第二频率阈值。 0014 进一步的实施例中, 前述监控方法的基于音频频率值设定标识信息包括 : 0015 如果拾取于被监控现场音频数据之音频频率值小于一第一频率阈值, 则设定所述 标志信息为无声状态 ; 0016 如果所述音频频率值大于或等于第一频率阈值, 且小于一第二频率阈值, 则设定 说 明 书 CN 104113730 A 3 2/4 页 4 所述标志信息为人声状态 ; 以及 0017 如。
11、果所述音频频率值大于或等于第二频率阈值, 则设定所述标志信息为高频状 态。 0018 进一步的实施例中, 所述网络硬盘录像机基于无声状态的标识信息, 执行下述操 作 : 停止录像。 0019 进一步的实施例中, 所述网络硬盘录像机基于无声状态的标识信息, 执行下述操 作 : 全天候录像。 0020 进一步的实施例中, 所述网络硬盘录像机基于人声状态的标识信息, 执行下述操 作 : 发出报警提示音, 并进行视频显示与录像。 0021 进一步的实施例中, 所述网络硬盘录像机基于高频状态的标识信息, 执行下述操 作 : 发出报警提示音, 并进行视频显示与录像。 0022 进一步的实施例中, 所述编码。
12、方式包括 : 0023 对于音频数据, 采用 G711 音频编码算法进行编码 ; 以及 0024 对于视频数据, 采用 H264 视频编码算法进行编码。 0025 由以上本发明的技术方案可知, 本发明所提出的基于音频分析触发报警和录像 的监控方法, 采用基于音频分析而触发的预定规则的录像和报警, 有效减少录像数据的存 储空间, 增强报警的准确性, 通过增加基于音频分析后的标识信息, 可实现快速录像检索回 放, 缩短录像检索时间, 而且适应性强, 后期的维护成本低。 附图说明 0026 图 1 为本发明一实施方式基于音频分析触发报警和录像的监控方法的实现流程 图。 0027 图 2 为图 1 实。
13、施例一具体实现方式的音频 / 视频数据传输过程示意图。 具体实施方式 0028 为了更了解本发明的技术内容, 特举具体实施例并配合所附图式说明如下。 0029 如图 1 所示, 根据本发明的较优实施例, 一种基于音频分析触发报警和录像的监 控方法, 包括以下步骤 : 0030 接收一音频数据 ( 例如直接录音方式 ), 该音频数据拾取于被监控现场 ; 0031 网络摄像机对音频数据进行音频分析获取其频率值, 并基于该音频频率值与频率 阈值的比较结果设定一标志信息, 该标志信息包括无声状态、 人声状态及高频状态 ; 0032 将前述标志信息发送至一网络硬盘录像机, 同时将网络摄像机采集之音频数据。
14、和 视频数据分别编码后传输至该网络硬盘录像机 ; 以及 0033 网络硬盘录像机对前述传输的视频和音频数据进行录像数据存储, 并基于前述标 志信息执行预定规则的报警及视频显示与录像。 0034 由于人声, 例如尖叫声等, 其频率值一般在一定的上下限范围内, 因此在本实施例 中, 采用此方式来进行人声状态的监测, 并基于频率值的分析比较结果实现实时触发, 使得 网络硬盘录像机根据此结果来执行预定规则的报警及视频显示与录像。作为优选的方式, 如果在人声状态下, 则进行报警并在网络硬盘摄像机上进行视频显示与录像。而在较低的 说 明 书 CN 104113730 A 4 3/4 页 5 频率范围下, 。
15、被设定为无声状态, 此时网络硬盘录像机根据此结果来执行特定的操作, 例如 停止录像, 如此可有效减少录像数据的存储空间, 增强报警的准确性。 0035 本实施例中, 采用基于频率分析的标志信息实时触发的方式, 可实现快速录像检 索回放 ( 基于标志信息进行检索 ), 缩短录像检索时间, 适应性强。 0036 本实施例中, 采用基于频率比较结果的直接方式, 相对于采用语音识别或者关键 词匹配等方式的比较结果, 可显著提高报警的准确性, 防止出现误匹配和识别误差, 相对 于语音识别或者关键词匹配的高误判率来说, 本实施例提出的方案更具现实推广性和适应 性, 准确性好。 0037 拾音器连续接受被监。
16、控现场的声音数据, 拾音器通过金属传导线 ( 未示出 ) 与网 络摄像机数据连接, 一旦拾音器接入网路摄像机, 网路摄像机的音频处理工作启动。 0038 作为可选的实施方式, 本实施例的监控方法中, 可参考被监控现场的历史监控情 况和实际环境状况, 或者其他参考条件, 设定第一频率阈值 X1 和第二频率阈值 X2, 其中, 所 述第一频率阈值 X1 小于第二频率阈值 X2。显然, 这里的第一频率阈值 X1 和第二频率阈值 X2 可看做是某一关键或特征人声的音频频率值上下限范围。 0039 网络摄像机可采用常规的网络摄像机, 由带有编码器的处理器 CPU、 SENSOR 模块、 音频处理模块、 。
17、网络模块、 电源模块等组成。结合图 1 和图 2 所示, 在接收到拾音器的音频 信号后, 网络摄像机进行数字采样处理, 网路摄像机的处理器根据音频频率值与前述频率 阈值 (X1、 X2) 的比较结果而进行进行不同处理。 0040 如图 2 所示的图 1 实施例一具体实现方式的音频 / 视频数据传输过程示意图, 其 中基于音频频率值设定标识信息包括 : 0041 如果拾取于被监控现场音频数据之音频频率值小于一第一频率阈值 X1, 则设定所 述标志信息为无声状态 ; 0042 如果所述音频频率值大于或等于第一频率阈值 X1, 且小于一第二频率阈值 X2, 则 设定所述标志信息为人声状态 ; 以及 。
18、0043 如果所述音频频率值大于或等于第二频率阈值 X2, 则设定所述标志信息为高频状 态。 0044 如前所述, 在优选的实施例中, 网络硬盘录像机基于无声状态的标识信息, 执行下 述操作 : 停止录像。 0045 在另选的一些实施例中, 网络硬盘录像机还可基于无声状态的标识信息, 执行下 述操作 : 全天候录像。 0046 在优选的实施例中, 网络硬盘录像机基于人声状态的标识信息, 执行下述操作 : 发 出报警提示音, 并进行视频显示与录像。 0047 在优选的实施例中, 网络硬盘录像机基于高频状态的标识信息, 执行下述操作 : 发 出报警提示音, 并进行视频显示与录像。 0048 作为可。
19、选的实施方式, 前述步骤中的编码方式包括 : 0049 对于音频数据, 采用 G711 音频编码算法进行编码 ; 以及 0050 对于视频数据, 采用 H264 视频编码算法进行编码。 0051 优选地, 前述标识信息、 视频数据和音频数据通过交换机和以太网发送至网络硬 盘录像机。 说 明 书 CN 104113730 A 5 4/4 页 6 0052 虽然本发明已以较佳实施例揭露如上, 然其并非用以限定本发明。本发明所属技 术领域中具有通常知识者, 在不脱离本发明的精神和范围内, 当可作各种的更动与润饰。 因 此, 本发明的保护范围当视权利要求书所界定者为准。 说 明 书 CN 104113730 A 6 1/2 页 7 图 1 说 明 书 附 图 CN 104113730 A 7 2/2 页 8 图 2 说 明 书 附 图 CN 104113730 A 8 。