基于大数据的视频结构化车牌识别系统及方法
技术领域
本发明关于一种车牌识别系统及方法,特别是涉及一种基于大数据的视频结构化车牌识别系统及方法。
背景技术
智能交通系统是未来交通系统的发展方向,它是将先进的信息技术、数据通讯传输技术、电子传感技术、控制技术及计算机技术等有效地集成运用于整个地面交通管理系统而建立的一种在大范围内、全方位发挥作用的,实时、准确、高效的综合交通运输管理系统。
目前,在智能交通中具有大量已安装或将要安装的摄像机、保存有大量的历史数据和提供大规模的实时视频流,因为视频是非结构化数据造成索引和查询各种事件都非常困难。如果我们提取视频特征作为结构化数据存储在分布式数据库中索引和查询都非常方便。在智能交通系统中,车辆监控是最重要的任务,车牌具有唯一性,其作为索引数据具有现实意义。如果能够利用大数据平台管理大规模视频输入、根据各节点内存与CPU负载情况调度视频解码与分析、并将视频分析后的车牌信息存入分布式数据库,用户通过分布式数据库来查询所需要的结果,将能有效地解决目前对视频的非结构化数据索引和查询不便的问题。
发明内容
为克服上述现有技术存在的不足,本发明之目的在于提供一种基于大数据的视频结构化车牌识别系统及方法,通过获取视频特征如车牌信息作为结构化数据存入分布式数据库中作为索引可以快速查询到用户需要的数据,获得更高的用户体验性能,有效解决现有技术对视频的非结构化数据索引和查询不便的问题。
为达上述及其它目的,本发明提出一种基于大数据的视频结构化车牌识别系统,至少包括:
网络摄像机模组,包括多个接入网络的网络摄像机,各网络摄像机将拍摄的图像编码成视频流,并将视频流通过网络传输至向大数据处理平台;
大数据处理平台,利用分布式资源调度对视频流进行视频解码和分析,并将处理好的车牌信息写入到分布式数据库;
分布式数据库,接收大数据处理平台存入的车牌信息,利用分布式数据库存储视频结构化后的车牌信息。
进一步地,所述网络摄像机将拍摄图像编码成H264视频流,将视频流通过RTSP协议传输至向所述大数据处理平台。
进一步地,所述大数据处理平台根据各计算节点负载情况调度到合适的计算节点对视频流进行解码,通过视频分析提取其特征作为结构化数据,并进行车牌定位、车牌识别,最后将分析出的车牌号码写入到分布式数据库。
进一步地,所述大数据处理平台利用大数据处理平台的内存计算特性进行多次迭代,提取视频的多种特征作为结构化数据。
进一步地,所述大数据处理平台利用移动侦测与车辆特征识别出交通工具,利用车牌矩形特征和长宽比进行车牌定位,利用数字、字母、汉字纹理特征,精确识别出车牌信息。
进一步地,所述大数据处理平台分布式接收视频流。
为达到上述目的,本发明还提供一种基于大数据的视频结构化车牌识别方法,包括如下步骤:
步骤一,利用大规模网络摄像机获取视频流,并将其通过网络传输至大数据处理平台;
步骤二,大数据平台根据各计算节点负载情况调度到合适的计算节点对视频流解码;
步骤三,提取视频的多种特征作为结构化数据,并利用车牌定位技术、车牌识别技术进行车牌定位、识别;
步骤四,利用分布式数据库存储视频结构化后的车牌信息。
进一步地,于步骤三中,利用大数据处理平台的内存计算特性进行多次迭代,提取视频的多种特征作为结构化数据,车牌定位与识别利用移动侦测与车辆特征识别出交通工具。
进一步地,于步骤三中,利用车牌矩形特征和长宽比进行车牌定位,利用数字、字母、汉字纹理特征精确识别出车牌信息。
进一步地,所述网络摄像机利用RTSP协议传输视频流, 所述大数据处理平台分布式接收视频流。
与现有技术相比,本发明一种基于大数据的视频结构化车牌识别系统及方法通过获取视频特征如车牌信息作为结构化数据存入分布式数据库中作为索引可以快速查询到用户需要的数据,获得更高的用户体验性能,有效解决了现有技术对视频的非结构化数据的索引和查询不便的问题。
附图说明
图1为本发明一种基于大数据的视频结构化车牌识别系统的系统结构图;
图2为本发明一种基于大数据的视频结构化车牌识别系统之较佳实施例的结构框图;
图3为本发明一种基于大数据的视频结构化车牌识别方法的步骤流程图;
图4为本发明较佳实施例的车牌识别技术的流程示意图;
图5为本发明基于大数据的视频结构化车牌识别方法的又一实例流程图。
图6为本发明基于大数据的视频结构化车牌识别方法的又一实例流程图。
具体实施方式
以下通过特定的具体实例并结合附图说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用,本说明书中的各项细节亦可基于不同观点与应用,在不背离本发明的精神下进行各种修饰与变更。
图1为本发明一种基于大数据的视频结构化车牌识别系统的系统结构图。如图1所示,本发明一种基于大数据的视频结构化车牌识别系统,包括:网络摄像机模组11、大数据处理平台12以及分布式数据库13。
其中,网路摄像机模组11包括多个接入网络的网络摄像机,各网络摄像机将拍摄的图像编码成视频流,并将视频流通过RTSP协议传输至向大数据处理平台102,在本发明中,网络摄像机将图像编码成H264视频流,并且支持RTSP协议来传输视频;大数据处理平台12利用分布式资源调度进行视频解码和分析,并将处理好的视频分析数据写入到分布式数据库13,具体地说,大数据平台12根据各计算节点负载情况调度到合适的计算节点对视频流进行解码,通过视频分析提取其特征作为结构化数据,并进行车牌定位、车牌识别,最后将分析出的车牌号码写入到分布式数据库13,在本发明较佳实施例中,大数据处理平台12分布式接收视频流,其利用大数据处理平台的内存计算特性进行多次迭代,提取视频的多种特征作为结构化数据,车牌定位技术可利用车牌矩形特征和长宽比进行车牌定位,尤其的,在本发明较佳实施例中,车牌定位利用先进的移动侦测技术,构造先进的背景模型对光线变化、雨雪天气具有鲁棒性,对前景图像的后期处理能够有效的解决阴影和空洞等问题,车牌识别技术可利用数字、字母、汉字纹理特征精确识别出车牌,在本发明较佳实施例中,车牌识别对车牌上30个左右的有限汉字、26个英文大写、10个数字进行纹理分析,具有超高的精确性;分布式数据库13,接收大数据处理平台12存入的视频分析数据,利用分布式数据库存储视频结构化后的车牌信息,方便用户索引与查询。
具体地说,在车牌定位过程中,大数据平台通过网络摄像机获得了许多可能是车牌的图块,将这些图块进行分类(例如可手工分类),聚集一定数量后,放入SVM(Support Vector Machine,支持向量机)模型中训练,得到SVM的一个判断模型,在实际的车牌定位过程中,再把所有可能是车牌的图块输入SVM判断模型,通过SVM判断模型自动的选择出实际上真正是车牌的图块。在车牌识别过程中,一副车牌图块首先会进行灰度化,二值化,然后使用相应地算法获取到车牌的每个字符的分割图块,获得海量的这些字符图块后,进行手工分类,然后输入神经网络的MLP(MultiLayer Perceptron,多层感知器)模型中,进行训练,在实际的车牌识别过程中,将得到7个字符图块放入训练好的神经网络模型,通过模型来预测每个图块所表示的具体字符。
本发明中大数据处理平台12采用的负载均衡技术是指系统的稳定运行和计算能力的扩容。正如我们所知,智能视频分析是密集型计算工作,因此在面对大规模的监控视频流分析任务时,必然会面临计算能力的匹配问题。而在此讨论的可扩展技术就是为应对计算能力不足时,需要怎样去满足这样的计算需求。
在针对大规模视频分析的场景,系统并不需要“保证每一个数据至少能得到一次完整的计算”。原因在于监控视频流的价值密度低;例如一小时的监控视频内容,可能只有仅仅一两秒有效的数据。为保证系统的长期稳定运行,我们需要针对大规模监控视频分析场景给出合适的可伸缩性的机制:
1,当出现计算能力不足时,分析系统需要丢弃不重要的摄像流的数据。因此我们需要一个摄像头权重表,当出现计算能力不足时,我们可以依据这个权重表来决定舍去哪些视频流中数据,以保证来自重要摄像头中的数据得到处理。
2,计算能力足够时,但出现任务计算失败,我们需要重启计算任务,完成分析任务。我们通过采用血统机制,从原始输入数据块开始,追踪后面对数据的每一步操作,当处理某一块数据的计算任务失败,我们就可以依据血统机制再次对原始数据进行重新计算。
具体地说,大数据平台的主节点和计算节点之间通过心跳检测(规定时间内向对象发送信息)来判断计算节点是否有空闲线程。每个计算节点有自己的线程池,当有任务分配到计算节点时,计算节点再把任务分成若干个子任务去执行。子任务会向主节点注册自己,用来和主节点之间的通信。每个子任务占用一个线程,然后子任务持续向主节点发送心跳信息,直到任务结束。如果有子任务失败,那么主节点在规定的时间里接收不到该子任务的心跳信息,就认为任务失败,再重启一个子任务来进行该子任务的任务。所以主节点是根据每个计算节点的子任务的心跳数,对各个计算节点的资源消耗情况进行统计和调度的。当有新的数据需要解码或者计算的时候,主任务首先遍历计算节点的子任务的心跳数,然后根据计算节点的子任务的心跳数来把任务分配到相应的计算节点去进行计算。
图2为本发明一种基于大数据的视频结构化车牌识别系统之较佳实施例的结构框图。其中,数据通道101是大规模网络摄像机通过RTSP协议向大数据处理平台传输视频流的数据通道,在本发明较佳实施例中,网络摄像机将图像编码成H264视频流,并且支持RTSP协议来传输视频;数据通道102是大数据处理平台将处理好的视频分析数据写入到分布式数据库的数据通道,其中,大数据平台根据各计算节点负载情况调度到合适的计算节点解码,并进行分析,实现车牌定位、识别,并将处理结果通过数据通道102写入到分布式数据库;用户查询数据通道103是用户查询分布式数据库的数据通道。
图3为本发明一种基于大数据的视频结构化车牌识别方法的步骤流程图。图4为本发明较佳实施例的流程示意图。如图3及图4所示,本发明一种基于大数据的视频结构化车牌识别方法,包括如下步骤:
步骤301,利用大规模网络摄像机获取视频流,并将其通过网络传输至大数据处理平台。在本发明中,网络摄像机将图像编码成H264视频流,并且支持RTSP协议来传输视频,并将视频流通过因特网传输到大数据处理平台。
步骤302,大数据平台根据各计算节点负载情况调度到合适的计算节点对视频流解码。
步骤303,提取视频的多种特征作为结构化数据,并利用车牌定位技术、车牌识别技术进行车牌定位、识别。
本发明中,利用大数据处理平台的内存计算特性进行多次迭代,提取视频的多种特征作为结构化数据;车牌定位技术利用先进的移动侦测技术,构造先进的背景模型对光线变化、雨雪天气具有鲁棒性,对前景图像的后期处理能够有效的解决阴影和空洞等问题;车牌识别技术,对车牌上30个左右的有限汉字、26个英文大写、10个数字进行纹理分析,具有超高的精确性。
步骤304,利用分布式数据库存储视频结构化后的车牌信息,方便用户索引与查询。
图4为本发明较佳实施例的车牌识别技术的流程示意图,包括:
S410摄像机视频流:在本发明中,网络摄像机将图像编码成H264视频流,并且支持RTSP协议来传输视频。
S420视频流传输:本发明中,视频流是通过网络传输到大数据处理平台。
S430视频解码:本发明中,大数据平台根据各计算节点负载情况调度到合适的计算节点解码。
S440车牌定位、车牌识别:本发明中,利用大数据处理平台的内存计算特性进行多次迭代,提取视频的多种特征作为结构化数据;车牌定位技术利用先进的移动侦测技术,构造先进的背景模型对光线变化、雨雪天气具有鲁棒性,对前景图像的后期处理能够有效的解决阴影和空洞等问题;车牌识别技术,对车牌上30个左右的有限汉字、26个英文大写、10个数字进行纹理分析,具有超高的精确性。
S450分布式数据库:本发明中,利用大数据平台的分布式调度处理系统进行视频流接收、视频解码、视频分析;最后将分析出的车牌号码输入到分布式数据库。
S460用户查询接口:本发明中,用户可以查询分布式数据库中存储的车牌信息。
图5为本发明基于大数据的视频结构化车牌识别方法的一实例流程图。其包含以下部分:
1. S510网络摄像机, 1/3″130万像素逐行扫描CMOS感光器件,有效像素1280(H)*1024(V),分辨率达到900TVL帧输出,彩色:0.5Lux 黑白:0.01Lux / F1.2 30IRE,基于ICR双滤光片切换的日夜转换,数字降噪,定焦F=4mm,支持BNC视频输出,256Kb-8M的码流可调,DC12V电源输入,功率<5W。
2. S520机架式服务器, 华为 Tecal RH5885 V2, 硬件1)2颗10核20线程X86 series-FCLGA1567-2400MHz-0.9V-64bit-130000mW-Westmere Xeon E7-4870-10kernel-商用计算机专用;4)内存 16G*8:N00DDR317,通用内存-DDR3 RDIMM-16GB-240PIN-1.5ns-1333000KHz-1.35V-ECC-all-2 Rank(1G*4bit)-Height 30mm ; 4) Raid卡:CH9100RAID00,8端口 raid 卡-6Gb/s PCI Express SATA and SAS RAID Controller-PCIE 2.0 X8 ;5)4*1000M网卡;6)8块1T 2.5”,BC1MSRSCR804,通用硬盘-1000GB-SATA-7200rpm-2.5"-64M-热插拔-内置式;7)2个冗余电源;8)导轨 一副。利用大数据平台Spark作为内存计算,FFMPEG软件解码,基于Opencv视频分析出车牌导入到MongoDB分布式数据库。用户通过查询MongoDB来得到车牌信息。
图6为本发明基于大数据的视频结构化车牌识别方法的又一实例流程图。其包含以下部分:
1. S610网络摄像机, 1/3″130万像素逐行扫描CMOS感光器件,有效像素1280(H)*1024(V),分辨率达到900TVL帧输出,彩色:0.5Lux 黑白:0.01Lux / F1.2 30IRE,基于ICR双滤光片切换的日夜转换,数字降噪,定焦F=4mm,支持BNC视频输出,256Kb-8M的码流可调,DC12V电源输入,功率<5W。
2. S620机架式服务器, 华为 Tecal RH5885 V2, 硬件1)2颗10核20线程X86 series-FCLGA1567-2400MHz-0.9V-64bit-130000mW-Westmere Xeon E7-4870-10kernel-商用计算机专用;4)内存 16G*8:N00DDR317,通用内存-DDR3 RDIMM-16GB-240 PIN-1.5ns-1333000KHz-1.35V-ECC-all-2 Rank(1G*4bit)-Height 30mm ; 4) Raid卡:CH9100RAID00,8端口 raid 卡-6Gb/s PCI Express SATA and SAS RAID Controller-PCIE 2.0 X8 ;5)4*1000M网卡;6)8块1T 2.5”,BC1MSRSCR804,通用硬盘-1000GB-SATA-7200rpm-2.5"-64M-热插拔-内置式;7)2个冗余电源;8)导轨 一副。根据各计算节点负载情况调度到合适的计算节点解码。
3.S630机架式服务器, 华为 Tecal RH5885 V2, 硬件1)2颗10核20线程X86 series-FCLGA1567-2400MHz-0.9V-64bit-130000mW-Westmere Xeon E7-4870-10kernel-商用计算机专用;4)内存 16G*8:N00DDR317,通用内存-DDR3 RDIMM-16GB-240 PIN-1.5ns-1333000KHz-1.35V-ECC-all-2 Rank(1G*4bit)-Height 30mm ; 4) Raid卡:CH9100RAID00,8端口 raid 卡-6Gb/s PCI Express SATA and SAS RAID Controller-PCIE 2.0 X8 ;5)4*1000M网卡;6)8块1T 2.5”,BC1MSRSCR804,通用硬盘-1000GB-SATA-7200rpm-2.5"-64M-热插拔-内置式;7)2个冗余电源;8)导轨 一副。完成主节点调度的视频解码和分析,并将车牌信息和时间导入到MongoDB数据库中。
4、S640视频专用网络,用来传递视频数据与数据库数据。
5、S650分布式数据库,用来存储车牌信息和时间并提供客户查询接口。
可见,本发明一种基于大数据的视频结构化车牌识别系统及方法通过获取视频特征如车牌信息作为结构化数据存入分布式数据库中作为索引可以快速查询到用户需要的数据,获得更高的用户体验性能,有效解决了现有技术对视频的非结构化数据的索引和查询不便的问题。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何本领域技术人员均可在不违背本发明的精神及范畴下,对上述实施例进行修饰与改变。因此,本发明的权利保护范围,应如权利要求书所列。