《一种基于GPU多核并行加速的车辆检测方法.pdf》由会员分享,可在线阅读,更多相关《一种基于GPU多核并行加速的车辆检测方法.pdf(12页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN103336959A43申请公布日20131002CN103336959ACN103336959A21申请号201310306471022申请日20130719G06K9/00200601G06F9/38200601G08G1/0120060171申请人西安电子科技大学地址710071陕西省西安市太白南路2号西安电子科技大学72发明人袁通刘志镜王韦桦刘慧邱龙滨曹文涛赵纬龙赵宏伟李雨楠熊静张小骏王梓曹志高74专利代理机构北京科亿知识产权代理事务所普通合伙11350代理人汤东凤54发明名称一种基于GPU多核并行加速的车辆检测方法57摘要本发明公开了一种基于GPU多核并行加速的车辆。
2、检测方法,其步骤包括计算机视觉、特征提取、目标相似度检测以及MAPREDUCE并行计算框架。本发明有益效果在于,通过MAPREDUCE的GPU并行计算提高了HOG特征提取算法效率,显著缩短了车辆检测所需时间,可用于自动化的智能交通和城市管理领域。51INTCL权利要求书2页说明书7页附图2页19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书7页附图2页10申请公布号CN103336959ACN103336959A1/2页21一种基于GPU多核并行加速的车辆检测方法,其特征在于,所述方法包括以下步骤(1)由CPU获得待检测的图像并复制到GPU内存,其中,将分配的内存设置为不可换。
3、页可提高传输速度;(2)利用硬件纹理单元对所述图像进行降采样,然后对所述降采样后的图像进行伽马校验;(3)计算梯度值,其中,将一个检测窗口划分为若干个区块,在每个区块内,使用GPU并行计算技术,利用水平梯度卷积算子1,0,1与垂直梯度卷积算分别计算水平方向梯度与和垂直方向梯度,进而计算幅值与相位,根据得到的幅值与相位,按照相位值最近的两个BIN之间的相位差为权值分解幅值,并记录;(4)计算方向梯度直方图,其中,根据步骤(3)中得到的结果,使用基于MAPREDUCE模型,在MAP函数阶段对检测窗口进行子胞元划分,并使用二次线性插值求子胞元内的方向梯度直方图,在REDUCE函数阶段对相同区块内的子。
4、胞元方向梯度直方图进行合并,得出区块内的方向梯度直方图;(5)归一化方向梯度直方图,其中,在MAP函数阶段检测窗口进行区块划分,对区块内方向直方图数组求一个归一化系数,并该数组每个元素乘以这个系数,具体是归一化系数通过求数组内加权平方和的开平方的倒数得到;(6)线性SVM计算,其中,将归一化的结果交由CPU进行合并,并与实现训练好的SVM系数向量进行内积运算;(7)判断是否遍历完全,如果遍历完,退出GPU运算模式,如果没有遍历完,转到步骤(2);(8)根据步骤(6)计算出的SVM值与预设的阈值对比,如果超过所述预设阈值,则说明当前检测窗口存在目标车辆,将坐标与尺度信息输出。2根据权利1所述的车。
5、辆检测方法,其特征在于,所述步骤(4)中计算子胞元的方向梯度直方图的步骤为(1)调度程序将显卡内存中的输入数据INPUT数组分为N块,每块大小为(2)每个线程执行MAPCOUNT函数,其中MAPCOUNT函数输出三个值MAP函数产生的中间键的个数I、MAP函数产生的MKEYS数组的大小J字节、MAP函数产生的MVALUES数组的大小K字节。(3)通过J、K计算出每个线程中MKEYS数组和MVALUES数组的大小和其起始位置;(4)每个线程并行执行用户自定义的MAP函数,将产生的结果写入该线程对应MKEYS数组、MVALUES数组和MDIRECTORYINDEX数组中,MDIRECTORYIND。
6、EX数组中的每条记录表示一条中间键记录;(5)对中间键按照KEY值进行排序;(6)按照KEY值将中间键进行分块,把相同KEY值的中间键数据交给一个GPU线程进行处理;(7)每个线程执行REDUCECOUNT函数,其中REDUCECOUNT函数输出三个值REDUCE函数权利要求书CN103336959A2/2页3产生的结果记录的个数I、REDUCE函数产生的RKEYS数组的大小J字节、REDUCE函数产生的RVALUES数组的大小K字节;(8)通过J、K计算出每个线程中RKEYS数组和RVALUES数组的大小和其起始位置;通过I计算出每个线程中RDIRECTORYINDEX数组的大小和其起始位置。
7、;(9)每个线程并行执行REDUCE函数,其中输入MKEYS数组、MVALUES数组、经过排序的MDIRECTORYINDEX数组输出RESULTS数组;操作MDIRECTORYINDEX数组可以表示为,MID为区块的编号;RES表示该区块对应的直方图数组。将相同MID的RES数组中对应的相同位置上元素求和,得到RDATA数组;将产生的结果写入该线程对应RKEYS数组、RVALUES数组和RDIRECTORYINDEX数组中。这样就可以得到每个区块对应的总直方图RESULTS数组,其中ID表示区块的编号,RDATA表示对应区块的总直方图数组。3根据权利1所述的车辆检测方法,其特征在于,所述步骤。
8、5区块的方向梯度直方图的归一化步骤为(1)调度程序将显卡内存中的输入数据INPUT数组分为N块,每块大小为(2)每个线程执行MAPCOUNT函数,其中MAPCOUNT函数输出三个值MAP函数产生的中间键的个数I、MAP函数产生的MKEYS数组的大小J字节、MAP函数产生的MVALUES数组的大小K字节;(3)通过J、K计算出每个线程中MKEYS数组和MVALUES数组的大小和其起始位置;(4)每个线程并行执行用户自定义的MAP函数,计算每个区块的方向梯度直方图,将产生的结果写入该线程对应MKEYS数组、MVALUES数组和MDIRECTORYINDEX数组中。得到RESULTS数组,ID表示区。
9、块的编号,RDATA表示该区块的方向梯度直方图。权利要求书CN103336959A1/7页4一种基于GPU多核并行加速的车辆检测方法技术领域0001本发明涉及计算机视觉领域,具体涉及一种基于MAPREDUCE的GPU并行计算应用于车辆检测的方法。背景技术0002随着智能交通系统在现代社会中重要性的不断提升,车辆监控技术得到了越来越广泛的应用。现有智能交通系统的问题主要是大量的监控信息难以得到有效的及时的处理。而如何通过计算机智能地实时地分析和提取有效的信息,以提升车辆监控与跟踪准确率,已经成为计算机视觉领域的一个热点研究问题。0003基于视觉监控的智能分析技术是计算机视觉和智能交通领域的热点和。
10、难点问题,涉及到图像处理、机器学习、模式识别等课题。近年来学术界上进行了较多的相关研究。0004国内外学者在基于视频序列的复杂场景下车辆检测技术上做了很多的工作。我国的道路交通情况比较复杂,存在车辆、行人公用一条道路的情况,行车道路上车辆的颜色、形状、速度都存在较大差异,因此基于像素级的目标检测方法,如帧间差法、背景差分法不能满足我国实际道路需要。现在基于视频序列的目标检测系统主要采用特征级的检测与机器学习算法相结合的方法对运动目标进行检测。目前,通常采用纹理信息作为特征点,常用的纹理特征有HOG(梯度方向直方图),小波滤波器,类HAAR特征滤波器等。现在运用比较广泛的车辆检测的方法有类HAR。
11、R特征和自适应决策树结合算法,HOG描述子与SVM结合算法,HOG描述子与随机森林结合算法等。类HARR特征的检测算法在实际应用中,还存在一定数量的误检和漏检,因此HOG是现阶段比较好的特征描述子。0005然而这些研究和应用还存在一定的问题虽然基于HOG特征的检测和跟踪算法能够达到比较理想的效果,但是在传统的计算架构下,对HOG特征的提取、SVM训练的计算以及特征匹配的计算都比较费时,远不能满足实时性的要求。0006MAPREDUCE是由谷歌公司提出的并行算法,旨在帮助程序员轻松的编写分布式程序。程序员只需编写两个函数MAP函数和REDUCE函数,其他有关并行的功能,包括任务调度、容错、实时同。
12、步等都由运行时负责。MAP函数负责处理输入数据并产生中间键KEY/VALUE。REDUCE函数根据KEY值将中间键进行合并,并产生最终的结果。目前MAPREDUCE的实现包括基于机群的HADOOP系统、基于CPU的PHOENIX系统和基于GPU的MARS系统等。0007GPU英文全称为GRAPHICPROCESSINGUNIT,中文翻译为“图形处理单元”,是一种专门处理在个人电脑、工作站或游戏机上图像运算工作的微处理器。GPU与CPU相比有更多的处理器和更大的内存带宽,所以GPU有较好的计算能力,可以进行大量计算,如图3所述,为显卡的内部结构示意图。但GPU也有相应的缺点,主要包括(1)GPU。
13、最初的目的是加速图像处理,采用了SIMD(单指令多数据流)模式,这种模式不支持复杂的控制流;(2)GPU的线程是由硬件管理的;(3)GPU不支持直接存取主机内存,需要进行主机内存和显卡内存的调度;(4)GPU没有统一的标准,往往由各厂家决定。为了解决上述问题,NVIDIA公司和AMD公司分别提供了CUDA和BROOK类库,旨在让程序员更好的操作GPU,完成通用计算功能。说明书CN103336959A2/7页50008BINGSHENGHE、WENBINFANG等人在MARSACCELERATINGMAPREDUCEWITHGRAPHICSPROCESSORS一文中提出一种基于MAPREDUCE。
14、的显卡多处理器并行计算模型。发明内容0009鉴于现有技术的不足,本发明旨在于提供一种用基于MAPREDUCE的GPU多核并行加速的车辆检测方法,具体用以分析和理解复杂场景下车辆行为,有效的降低了原有相应方法的时间复杂度,为用户提供了较高的实时性,同时在省时的基础上保障对车辆较高的识别准确率,能有效去除视频采集图像的复杂背景和噪声,本发明的应用有助于改善公共场所的安全监控水平。0010为了实现上述目的,本发明采用的技术方案如下0011一种基于GPU多核并行加速的车辆检测方法,所述方法包括以下步骤0012(1)由CPU获得待检测的图像并复制到GPU内存,其中,将分配的内存设置为不可换页可提高传输速。
15、度;0013(2)利用硬件纹理单元对所述图像进行降采样,然后对所述降采样后的图像进行伽马校验;0014(3)计算梯度值,其中,将一个检测窗口划分为若干个区块,在每个区块内,使用GPU并行计算技术,利用水平梯度卷积算子1,0,1与垂直梯度卷积算子分别计算水平方向梯度与和垂直方向梯度,进而计算幅值与相位,根据得到的幅值与相位,按照相位值最近的两个BIN之间的相位差为权值分解幅值,并记录;0015(4)计算方向梯度直方图,其中,根据步骤(3)中得到的结果,使用基于MAPREDUCE模型,在映射函数阶段对检测窗口进行子胞元划分,并使用二次线性插值求子胞元内的方向梯度直方图,具体是在化简函数阶段对相同区。
16、块内的子胞元方向梯度直方图进行合并,得出区块内的方向梯度直方图;0016(5)归一化方向梯度直方图,其中,在MAP函数阶段检测窗口进行区块划分,对区块内方向直方图数组求一个归一化系数,并该数组每个元素乘以这个系数,具体是归一化系数通过求数组内加权平方和的开平方的倒数得到;0017(6)线性SVM计算,其中,将归一化的结果交由CPU进行合并,并与实现训练好的SVM系数向量进行内积运算;0018(7)判断是否遍历完全,如果遍历完,退出GPU运算模式,如果没有遍历完,转到步骤(2);0019(8)根据步骤(6)计算出的SVM值与预设的阈值对比,如果超过所述预设阈值,则说明当前检测窗口存在目标车辆,将。
17、坐标与尺度信息输出。0020需要说明的是,所述步骤(4)中计算子胞元的方向梯度直方图的步骤为0021(1)调度程序将显卡内存中的输入数据INPUT数组分为N块,每块大小为;0022(2)每个线程执行MAPCOUNT函数,其中MAPCOUNT函数输出三个值MAP函数产生的中间键的个数I、MAP函数产生的MKEYS数组的大小J字节、MAP函数产生的MVALUES数组的大小K字节。说明书CN103336959A3/7页60023(3)通过J、K计算出每个线程中MKEYS数组和MVALUES数组的大小和其起始位置;0024(4)每个线程并行执行用户自定义的MAP函数,将产生的结果写入该线程对应MKEY。
18、S数组、MVALUES数组和MDIRECTORYINDEX数组中,MDIRECTORYINDEX数组中的每条记录表示一条中间键记录;0025(5)对中间键按照KEY值进行排序;0026(6)按照KEY值将中间键进行分块,把相同KEY值的中间键数据交给一个GPU线程进行处理;0027(7)每个线程执行REDUCECOUNT函数,其中REDUCECOUNT函数输出三个值REDUCE函数产生的结果记录的个数I、REDUCE函数产生的RKEYS数组的大小J字节、REDUCE函数产生的RVALUES数组的大小K字节;0028(8)通过J、K计算出每个线程中RKEYS数组和RVALUES数组的大小和其起始。
19、位置;通过I计算出每个线程中RDIRECTORYINDEX数组的大小和其起始位置;0029(9)每个线程并行执行REDUCE函数,其中0030输入MKEYS数组、MVALUES数组、经过排序的MDIRECTORYINDEX数组输出RESULTS数组;0031操作MDIRECTORYINDEX数组可以表示为,MID为区块的编号;RES表示该区块对应的直方图数组。将相同MID的RES数组中对应的相同位置上元素求和,得到RDATA数组;0032将产生的结果写入该线程对应RKEYS数组、RVALUES数组和RDIRECTORYINDEX数组中。这样就可以得到每个区块对应的总直方图RESULTS数组,其。
20、中ID表示区块的编号,RDATA表示对应区块的总直方图数组。0033需要说明的是,所述步骤5区块的方向梯度直方图的归一化步骤为0034(1)调度程序将显卡内存中的输入数据INPUT数组分为N块,每块大小为;0035(2)每个线程执行MAPCOUNT函数,其中MAPCOUNT函数输出三个值MAP函数产生的中间键的个数I、MAP函数产生的MKEYS数组的大小J字节、MAP函数产生的MVALUES数组的大小K字节;0036(3)通过J、K计算出每个线程中MKEYS数组和MVALUES数组的大小和其起始位置;0037(4)每个线程并行执行用户自定义的MAP函数,计算每个区块的方向梯度直方图,将产生的结。
21、果写入该线程对应MKEYS数组、MVALUES数组和MDIRECTORYINDEX数组中。得到RESULTS数组,ID表示区块的编号,RDATA表示该区块的方向梯度直方图。0038本发明有益效果在于,本发明将基于HOG特征的车辆检测算法较之传统架构的计算方法效率上提高30至50倍,将基于HOG特征的车辆检测算法应用于实时的交通视频处理中,将现有的实时车辆检测命中率大大提高。附图说明0039图1为本发明流程示意图;0040图2为本发明中GPU多核并行计算流程图;说明书CN103336959A4/7页70041图3为显卡内部结构图。具体实施方式0042下面将结合附图对本发明作进一步的描述。0043。
22、如图1、图2所示,本发明为一种基于GPU多核并行加速的车辆检测方法,所述方法包括以下步骤0044(1)由CPU获得待检测的图像并复制到GPU内存,其中,将分配的内存设置为不可换页的可提高传输速度;0045(2)利用硬件纹理单元对所述图像进行降采样,然后对降采样后的图像进行伽马校验;0046(3)计算梯度值将一个检测窗口划分为若干个区块,在每个区块内,使用GPU并行计算技术,利用水平梯度卷积算子1,0,1与垂直梯度卷积算子分别计算水平方向梯度与和垂直方向梯度,进而计算幅值与相位,根据得到的幅值与相位,按照相位值最近的两个BIN之间的相位差为权值分解幅值,并记录;0047(4)计算方向梯度直方图,。
23、其中,每个区块有22个胞元,每个胞元有88个像素,每个区块有一个方向梯度直方图,每个直方图有9个BIN,每个像素点的角度范围是0,180,每个BIN占20,对一个胞元的方向梯度直方图的表示按照其BIN所占角度从大到小排列成一个大小为9的数组,对一个区块内4个胞元的方向梯度直方图需要二次线性插值,并最后进行归一化,那么一个区块内4个方向直方图按照胞元从左向右从上至下的方式排列成一个大小为36的数组,最后一个检测窗口的方向直方图按照区块从左向右从上至下的方式排列成一个大小为36N的数组(N为检测窗口中的区块数目)。0048进一步地说,具体计算时,一个区块内的4个胞元再分成22个子胞元,然后对一个检。
24、测窗口中所有的子胞元进行编号,一个区块内的子胞元按照从左向右从上至下的方式编号,不同区块内的子胞元也按照从左向右从上至下的方式编号,因此假设子胞元的编号值是I,那么该子胞元所在的区块号为对检测窗口进行划分,产生INPUT数组,一个INPUT数组是组成,其中ID是对应子胞元的编号,DATA是子胞元内存储的是每个像素点对应的两个BIN编号H0和H1以及分解到相对应BIN的幅值A0和A1,然后将INPUT数组交给GPU并行计算出区块直方图。0049需要说明的是,GPU并行计算的MAP函数0050输入INPUT数组中的键值对,可以表示为;0051输出MDIRECTORYINDEX数组中的键值对,可以表。
25、示为,其中,MID为区块的编号;RES表示该区块对应的直方图数组;0052操作根据事先建好的二维高斯表作为权值,用数组0,1,2表示,分别代表对1个、2个和4个胞元方向直方图贡献的权值,输出的是的键值对,SUBID16得到子胞元在所在区块中的编号。,RES的元素是4个胞元的说明书CN103336959A5/7页8方向直方图数组按照胞元从左往右从上往下排列而成,其中0053如果SUB为0,则RESH0为0A0,RESH1为0A1;0054如果SUB为1或2,则RESH0为1A0,RESH1为1A1,RES9H0为1A0,RES9H1为1A1;0055如果SUB为3,则RES9H0为0A0,RES。
26、9H1为0A1;0056如果SUB是4或8,则RESH0为1A0,RESH1为1A1,RES18H0为1A0,RES18H1为1A1;0057如果SUB是5或6或9或10,则RESH0为2A0,RESH1为2A1,RES9H0为2A0,RES9H1为2A1,RES18H0为2A0,RES18H1为2A1,RES27H0为2A0,RES27H1为2A1;0058如果SUB是7或11,则RES9H0为1A0,RES9H1为1A1,RES27H0为1A0,RES27H1为1A1;0059如果SUB是12,则RES18H0为0A0,RES18H1为0A1;0060如果SUB是13或14,则RES18H。
27、0为1A0,RES18H1为1A1,RES27H0为1A0,RES27H1为1A1;0061如果SUB是15,则RES27H0为0A0,RES27H1为0A1;0062需要进一步说明的是,计算子胞元的方向梯度直方图为00631)调度程序将显卡内存中的输入数据INPUT数组分为N块,每块大小为0064其中,M表示整个输入数据的大小,N表示GPU中进行计算的线程个数,INPUT数组由组成,ID表示子胞元的编号,DATA表示子胞元的像素数组;00652)每个线程执行MAPCOUNT函数。其中MAPCOUNT函数输出三个值MAP函数产生的中间键的个数I、MAP函数产生的MKEYS数组的大小J字节、MA。
28、P函数产生的MVALUES数组的大小K字节;0066其中,MKEYS数组由MID组成,MID表示子胞元组成的区块编号;MVALUES数组存放该区块对应的直方图数组;00673)通过J、K计算出每个线程中MKEYS数组和MVALUES数组的大小和其起始位置;通过I计算出每个线程中MDIRECTORYINDEX数组的大小和其起始位置;0068其中,MKEYS数组由MID组成,MID表示子胞元组成的区块编号;0069需要说明的是,MVALUES数组存放该区块对应的直方图数组RES,MDIRECTORYINDEX数组由键值对组成,KEYOFFSET表示MKEYS数组中每个KEY值的偏移量,KEYSIZ。
29、E表示MKEYS数组中每个KEY值的大小,VALUEOFFSET表示MVALUES数组中每个VALUE值的偏移量,VALUESIZE表示MVALUES数组中每个VALUE值的大小。通过DIRECTORYINDEX数组可以从MKEYS数组和MVALUES数组中取得相应的KEY值和VALUE值。00704)每个线程并行执行用户自定义的MAP函数,将产生的结果写入该线程对应MKEYS数组、MVALUES数组和MDIRECTORYINDEX数组中,MDIRECTORYINDEX数组中的每条记录表示一条中间键记录;00715)对中间键按照KEY值进行排序;说明书CN103336959A6/7页90072。
30、6)按照KEY值将中间键进行分块,把相同KEY值的中间键数据交给一个GPU线程进行处理;00737)每个线程执行REDUCECOUNT函数,其中REDUCECOUNT函数输出三个值REDUCE函数产生的结果记录的个数I、REDUCE函数产生的RKEYS数组的大小J字节、REDUCE函数产生的RVALUES数组的大小K字节;0074其中,RKEYS数组存放每个区块编号,RVALUES数组存放区块直方图的总和;00758)通过J、K计算出每个线程中RKEYS数组和RVALUES数组的大小和其起始位置;0076通过I计算出每个线程中RDIRECTORYINDEX数组的大小和其起始位置。0077其中R。
31、KEYS数组存放每个区块编号,RVALUES数组存放区块直方图的总和;0078需要说明的是,RDIRECTORYINDEX数组由键值对组成,KEYOFFSET表示RKEYS数组中每个KEY值的偏移量,KEYSIZE表示RKEYS数组中每个KEY值的大小,VALUEOFFSET表示RVALUES数组中每个VALUE值的偏移量,VALUESIZE表示RVALUES数组中每个VALUE值的大小。通过RDIRECTORYINDEX数组可以从RKEYS数组和RVALUES数组中取得相应的KEY值和VALUE值。00799)每个线程并行执行REDUCE函数,其中0080REDUCE函数0081输入MKEY。
32、S数组、MVALUES数组、经过排序的MDIRECTORYINDEX数组;0082输出RESULTS数组;0083操作MDIRECTORYINDEX数组可以表示为,MID为区块的编号,RES表示该区块对应的直方图数组;0084进一步地说,将相同MID的RES数组中对应的相同位置上元素求和,得到RDATA数组;将产生的结果写入该线程对应RKEYS数组、RVALUES数组和RDIRECTORYINDEX数组中。这样就可以得到每个区块对应的总直方图RESULTS数组,其中ID表示区块的编号,RDATA表示对应区块的总直方图数组。0085(5)归一化方向梯度直方图,将一个区块中方向直方图数组内所有元素。
33、乘以一个归一化系数,假设一个区块中方向直方图数组为O|0|35|,则交由GPU并行计算。0086需要说明的是,GPU并行计算的MAP函数0087输入INPUT数组中的键值对,可以表示为,ID为区块号,DATA为区块内方向直方图数组;0088输出RESULT数组中的键值对,可以表示为,ID为区块号,RDATA为区块内方向直方图数组;0089操作RDATAIDATAI,10350090需要进一步说明的是,区块的方向梯度直方图的归一化步骤为00911)调度程序将显卡内存中的输入数据INPUT数组分为N块,每块大小为说明书CN103336959A7/7页100092其中,M表示整个输入数据的大小,N表。
34、示GPU中进行计算的线程个数;INPUT数组由组成,ID表示区块的编号,DATA对应区块的总直方图数组;00932)每个线程执行MAPCOUNT函数,其中MAPCOUNT函数输出三个值MAP函数产生的中间键的个数I、MAP函数产生的MKEYS数组的大小J字节、MAP函数产生的MVALUES数组的大小K字节。0094其中,MKEYS数组由ID组成,ID表示区块的编号;MVALUES数组存放该区块对应的方向梯度直方图数组;00953)通过J、K计算出每个线程中MKEYS数组和MVALUES数组的大小和其起始位置;0096通过I计算出每个线程中MDIRECTORYINDEX数组的大小和其起始位置,其。
35、中MKEYS数组由ID组成,ID表示区块编号,MVALUES数组存放该区块对应的方向梯度直方图数组RES;0097需要说明的是,MDIRECTORYINDEX数组由键值对组成,KEYOFFSET表示MKEYS数组中每个KEY值的偏移量,KEYSIZE表示MKEYS数组中每个KEY值的大小,VALUEOFFSET表示MVALUES数组中每个VALUE值的偏移量,VALUESIZE表示MVALUES数组中每个VALUE值的大小。通过DIRECTORYINDEX数组可以从MKEYS数组和MVALUES数组中取得相应的KEY值和VALUE值。00984)每个线程并行执行用户自定义的MAP函数,计算每个。
36、区块的方向梯度直方图。将产生的结果写入该线程对应MKEYS数组、MVALUES数组和MDIRECTORYINDEX数组中。得到RESULTS数组,ID表示区块的编号,RDATA表示该区块的归一化的方向梯度直方图。0099(6)线性SVM计算,将步骤(5)中得到的RESULT数组返回给CPU,由CPU将RESULT数组中键值对合并成数组,并与事先训练好的支持向量作内积运算,计算出SVM权值,计算SVM权值的公式为其中SCORE为SVM权值,O1N为合并后的RESULT数组,X|1|N|为事先训练好的支持向量数组;0100(7)是否已经遍历完整,如果遍历完,退出GPU运算模式,如果没有遍历完,转到步骤(2);0101(8)根据步骤(6)计算出的SVM值SCORE与事先设定好的阈值T对比,如果SCORET,则说明当前检测窗口存在目标车辆,将坐标与尺度信息输出。0102对于本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及变形,而所有的这些改变以及变形都应该属于本发明权利要求的保护范围之内。说明书CN103336959A101/2页11图1说明书附图CN103336959A112/2页12图2图3说明书附图CN103336959A12。