实现GPU运算提高DR图像处理速度的方法.pdf

上传人:54 文档编号:4569884 上传时间:2018-10-20 格式:PDF 页数:7 大小:403.29KB
返回 下载 相关 举报
摘要
申请专利号:

CN201010107317.7

申请日:

2010.02.02

公开号:

CN101783021A

公开日:

2010.07.21

当前法律状态:

授权

有效性:

有权

法律详情:

专利权人的姓名或者名称、地址的变更IPC(主分类):G06T 11/00变更事项:专利权人变更前:深圳市安健科技有限公司变更后:深圳市安健科技股份有限公司变更事项:地址变更前:518057 广东省深圳市高新技术产业园北区朗山路16号华瀚创新园A座3A变更后:518057 广东省深圳市高新技术产业园北区朗山路16号华瀚创新园A座3A|||授权|||实质审查的生效IPC(主分类):G06T 11/00申请日:20100202|||公开

IPC分类号:

G06T11/00; G06T3/00; G06T1/00

主分类号:

G06T11/00

申请人:

深圳市安健科技有限公司

发明人:

杜静; 杜碧; 万洪晓; 陈永洒

地址:

518057 广东省深圳市高新技术产业园北区朗山路16号华瀚创新园A座3A

优先权:

专利代理机构:

深圳市博锐专利事务所 44275

代理人:

张明

PDF下载: PDF下载
内容摘要

本发明公开了一种实现GPU运算提高DR图像处理速度的方法,包括:读取原始医学图像数据,用图像边缘像素对所述原始医学图像进行扩展和补齐;采用CUDA编写的快速傅里叶变换FFT程序直接调用GPU的计算资源,对所述扩展和补齐后的原始医学图像数据以及卷积核分别进行FFT运算,相应得到第一FFT结果和第二FFT结果;采用CUDA编写的卷积程序,直接调用GPU的计算资源对所述第一FFT结果和第二FFT结果在频域求乘法,得到相乘结果;采用CUDA编写的逆FFT程序,直接调用GPU的计算资源对所述相乘结果进行逆FFT运算。本发明能够简易、低成本地在普通消费级别大众PC上实现利用GPU进行医学影像处理的目的。

权利要求书

1: 一种实现GPU运算提高DR图像处理速度的方法,其特征在于,包括: 读取原始医学图像数据,用图像边缘像素对所述原始医学图像进行扩展和补齐,其中设所述原始图像尺寸为imageW×imageH,卷积核尺寸为kernelW×kernelH,补齐后图像尺寸为fftW×fftH,其中fftW=imageW+kernelW-1,fftH=imageH+kernelH-1; 采用计算统一设备架构编程模型CUDA编写的快速傅里叶变换FFT程序直接调用GPU的计算资源,对所述扩展和补齐后的原始医学图像数据以及卷积核分别进行FFT运算,相应得到第一FFT结果和第二FFT结果; 采用计算统一设备架构编程模型CUDA编写的卷积程序,直接调用GPU的计算资源对所述第一FFT结果和第二FFT结果在频域求乘法,得到相乘结果; 采用计算统一设备架构编程模型CUDA编写的逆FFT程序,直接调用GPU的计算资源对所述相乘结果进行逆FFT运算。
2: 根据权利要求1所述的方法,其特征在于:所述用图像边缘像素对所述原始医学图像进行扩展和补齐的步骤中,将补齐后图像尺寸设定为小于或等于1024的2 n 数或最近的512的倍数。
3: 根据权利要求2所述的方法,其特征在于:所述FFT运算包括一次imageW×imageH尺寸二维FFT运算、一次fftW×fffH尺寸二维FFT运算,所述求乘法包括一次imageW×imageH尺寸和fftW×fftH尺寸的频域相乘运算,所述逆FFT运算包括一次fftW×fftH尺寸二维逆FFT运算。
4: 根据权利要求3所述的方法,其特征在于:所述对所述扩展和补齐后的原始医学图像数据以及卷积核分别进行FFT运算的步骤中,选用nVidia开发的CUFFT库进行所述FFT运算。

说明书


实现GPU运算提高DR图像处理速度的方法

    【技术领域】

    本发明涉及医学影像处理技术领域,尤其涉及一种实现GPU运算提高DR图像处理速度的方法。

    背景技术

    在医学图像处理领域,目前利用Console软件进行DR(DigitalRadiography,直接数字化X射线摄影)医学图像处理的技术主要有:Gain校正、腰椎均衡校正、usm锐化、轻度平滑、中度平滑处理等。

    上述DR医学图像处理一般采用微机的CPU来处理,CPU中运行的Console软件,其大多数图像处理技术都使用了卷积算子处理,卷积算子小的有3*3、5*5、39*39、101*101等等,另外这些空域卷积算子都可以通过FFT(快速傅立叶变换)在频率域滤波实现。通过优化算法流程、优化程序代码、将二维卷积算子用一维卷积算子替代,可减少处理时间,但由于console后处理较多,整体处理速度仍太慢。从Pentium4时代开始,CPU时钟频率的提升遭遇瓶颈,一直停留在2GHz至3GHz左右。因此,利用GPU(Graphic Processing Unit,图形处理电路)代替或配合CPU进行医学图像处理的技术也逐渐出现,如:

    2006年5月24日公开的中国发明专利申请第200510110665.9号所揭露的一种医学图像中基于GPU硬件加速的体绘制方法,包括以下步骤:(1)对体数据进行预处理后存储为纹理;(2)为GPU计算生成和提供参数:①基准切面的生成;②在光线投射过程中,纹理的增长量和总共光线需要前进的步数;③在GPU处理中将冗余点对应的冗余部门去掉;(3)GPU计算,生成图像:像素渲染是光线投射计算部分,包括:确定光线两端和颜色混合。该专利申请技术是结合传统CPU实现的光线投射算法、传统的纹理体绘制算法为一体,使用GPU来完成光线投射过程,使用颜色混合方法生成图像,然后发送到颜色缓冲区中。其基本思路是用图形卡硬件对图形绘制进行加速计算,保持图像质量的同时获得实时的绘制速度,满足数字医疗系统的需要。

    为克服上述第200510110665.9号专利申请未记载具体措施实现利用GPU加速的技术问题,2009年9月2日公开了第200910131429.3号中国发明专利申请,该申请揭露一种利用GPU加速CR/DR/CT图像显示及图像处理的方法及专用设备,其包括PC电脑一台,CR/DR工作站或者PACS服务器。其中PC电脑链接着CR/DR工作站或者PACS服务器,利用新型GPU的通用计算能力,实现CR/DR/CT图像的快速显示,图像的显示和图像处理功能均利用GPU完成,提出将图像分割拼合的处理方法,对以往PACS使用的GDI二维加速不同,本方法基本思路是利用GPU的通用计算能力,将CPU从图像处理的繁重计算中解放出来,专心于数据通讯及数据安全的处理,以提高系统效率。

    为克服上述第200910131429.3号专利申请必须使用图形工作站进行GPU加速而导致结构复杂成本高的技术问题,2009年12月2日公开的中国发明专利申请第200910059864.X号所揭露的一种基于GPU加速的三维医学图像显示方法,该方法是将医学DICOM图像序列文件以体数据的方式保存到系统内存;然后利用OPENGL或者DIRECTX的三维图形库编程扩展接口函数API,将体数据加载入GPU显存;再计算生成代理几何体,并对代理几何体中的多边形切片逐像素进行光照计算和颜色计算;最后通过ALPHA混合将代理几何体中所有的多边形切片合成三维医学图像。该方法基本思路是利用特定编程接口,在普通消费级别大众PC上实现实时交互式显示而无须使用图形工作站,以降低成本。

    但是,上述第200910059864.X号专利申请技术利用OPENGL或者DIRECTX的三维图形库编程扩展接口函数API,将医学DICOM图像序列文件的体数据加载入GPU显存的方法仅适合于三维图像处理。该方法需要定制的程序或电路,过程较为复杂,而且要求非常熟悉计算机软件技术、硬件技术的研发人员进行设计和研发,研发成本较高、效率较低、稳定性难以保证、且出现故障时不方便维护。

    【发明内容】

    本发明主要解决的技术问题是提供一种实现GPU运算提高DR图像处理速度的方法,能够简易、低成本地在普通消费级别大众PC上实现直接调用GPU进行医学影像处理的功能。

    为解决上述技术问题,本发明采用的一个技术方案是:提供一种实现GPU运算提高DR图像处理速度的方法,包括:读取原始医学图像数据,用图像边缘像素对所述原始医学图像进行扩展和补齐,其中设所述原始图像尺寸为imageW×imageH,卷积核尺寸为kernelW×kernelH,补齐后图像尺寸为fftW×fftH,其中fftW=imageW+kernelW-1,fftH=imageH+kernelH-1;采用计算统一设备架构编程模型CUDA编写的快速傅里叶变换FFT程序直接调用GPU的计算资源,对所述扩展和补齐后的原始医学图像数据以及卷积核分别进行FFT运算,相应得到第一FFT结果和第二FFT结果;采用计算统一设备架构编程模型CUDA编写的卷积程序,直接调用GPU的计算资源对所述第一FFT结果和第二FFT结果在频域求乘法,得到相乘结果;采用计算统一设备架构编程模型CUDA编写的逆FFT程序,直接调用GPU的计算资源对所述相乘结果进行逆FFT运算。

    其中,所述用图像边缘像素对所述原始医学图像进行扩展和补齐的步骤中,将补齐后图像尺寸设定为小于或等于1024的2n数或最近的512的倍数。

    其中,所述FFT运算包括一次imageW×imageH尺寸二维FFT运算、一次fftW×fftH尺寸二维FFT运算,所述求乘法包括一次imageW×imageH尺寸和fftW×fftH尺寸的频域相乘运算,所述逆FFT运算包括一次fftW×fftH尺寸二维逆FFT运算。

    其中,所述对所述扩展和补齐后的原始医学图像数据以及卷积核分别进行FFT运算的步骤中,选用nVidia开发的CUFFT库进行所述FFT运算。

    本发明的有益效果是:区别于现有技术需要定制的程序或电路进行GPU图像处理而使得设计过程较为复杂、要求较高、成本较高等情况,本发明采用计算统一设备架构编程模型CUDA来编写进行医学图像处理地各种程序,这些CUDA开发的程序在处理图像时可以直接调用GPU的计算资源进行图像处理,关键是能够在廉价的个人计算机上编写和运行医学处理相关的并行运算程序,不需要搭建复杂的平台,不需要专门的硬件设备或软件,使得实现起来非常简单和低成本;同时,CUDA是一种并行编程模型和软件环境,通过CUDA,用户可以利用GPU进行通用计算,其采用扩展的C语言开发,除可以直接调用GPU的计算资源外,运算效率更高;本发明针对医学图像需要进行图像边缘像素处理的特点,用图像边缘像素对所述原始医学图像进行扩展和补齐,与前述采用CUDA技术一起实施,共同的作用是使得不需要较高水平的计算机研发操作人员、不需要专门的平台和设备,就可以进行所述医学图像处理,因此,本发明能够简易、低成本地在普通消费级别大众PC上实现直接调用GPU进行医学影像处理的功能。

    【附图说明】

    图1是本发明实现GPU运算提高DR图像处理速度的方法实施例的流程图。

    【具体实施方式】

    为详细说明本发明的技术内容、构造特征、所实现目的及效果,以下结合实施方式并配合附图详予说明。

    请参阅图1,本发明实现GPU运算提高DR图像处理速度的方法实施例主要包括步骤:

    步骤101:读取原始医学图像数据,用图像边缘像素对所述原始医学图像进行扩展和补齐,其中设所述原始图像尺寸为imageW×imageH,卷积核尺寸为kernelW×kernelH,补齐后图像尺寸为fftW×fftH,其中fftW=imageW+kernelW-1,fftH=imageH+kernelH-1;

    步骤102:采用计算统一设备架构编程模型CUDA编写的快速傅里叶变换FFT程序直接调用GPU的计算资源,对所述扩展和补齐后的原始医学图像数据以及卷积核分别进行FFT运算,相应得到第一FFT结果和第二FFT结果;

    步骤103:采用计算统一设备架构编程模型CUDA编写的卷积程序,直接调用GPU的计算资源对所述第一FFT结果和第二FFT结果在频域求乘法,得到相乘结果;

    步骤104:采用计算统一设备架构编程模型CUDA编写的逆FFT程序,直接调用GPU的计算资源对所述相乘结果进行逆FFT运算。

    以上可以看出,本发明采用计算统一设备架构编程模型CUDA来编写进行医学图像处理的各种程序,这些CUDA开发的程序在处理图像时可以直接调用GPU的计算资源进行图像处理,关键是能够在廉价的个人计算机上编写和运行医学处理相关的并行运算程序,不需要搭建复杂的平台,不需要专门的硬件设备或软件,使得实现起来非常简单和低成本;同时,CUDA是一种并行编程模型和软件环境,通过CUDA,用户可以利用GPU进行通用计算,其采用扩展的C语言开发,除可以直接调用GPU的计算资源外,运算效率更高;本发明针对医学图像需要进行图像边缘像素处理的特点,用图像边缘像素对所述原始医学图像进行扩展和补齐,与前述采用CUDA技术一起实施,共同的作用是使得不需要较高水平的计算机研发操作人员、不需要专门的平台和设备,就可以进行所述医学图像处理,因此,本发明能够简易、低成本地在普通消费级别大众PC上实现直接调用GPU进行医学影像处理的功能。

    此外,本发明还可以实现以下技术效果:

    1)本发明可以充分利用GPU的强大计算能力,如GT200能达到接近1Tflops/s甚至更高;

    2)GPU具有高存储器带宽,图像计算效率更高;

    3)同等计算能力下,GPU比CPU更为廉价;

    4)基于CUDA技术,能够在廉价的个人计算机上编写和运行并行程序。相对于MPI技术的基于工作站网络和集群的并行计算环境,本发明具有显著的成本优势。

    为便于GPU运算和节约带宽,所述用图像边缘像素对所述原始医学图像进行扩展和补齐的步骤中,将补齐后图像尺寸设定为小于或等于1024的2n数或最近的512的倍数。比如,原图像尺寸为1220×120,卷积核尺寸为7×7,算得fftW和fffH分别为1226和126,则最终参与运算的图像尺寸fftW×fftH需补足为1536×128。

    本发明实施例中的图像运算,如所述FFT运算包括一次imageW×imageH尺寸二维FFT运算、一次fftW×fftH尺寸二维FFT运算,所述求乘法包括一次imageW×imageH尺寸和fftW×fftH尺寸的频域相乘运算,所述逆FFT运算包括一次fftW×fftH尺寸二维逆FFT运算。

    其中,所述对所述扩展和补齐后的原始医学图像数据以及卷积核分别进行FFT运算的步骤中,选用nVidia开发的CUFFT库进行所述FFT运算。

    以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

实现GPU运算提高DR图像处理速度的方法.pdf_第1页
第1页 / 共7页
实现GPU运算提高DR图像处理速度的方法.pdf_第2页
第2页 / 共7页
实现GPU运算提高DR图像处理速度的方法.pdf_第3页
第3页 / 共7页
点击查看更多>>
资源描述

《实现GPU运算提高DR图像处理速度的方法.pdf》由会员分享,可在线阅读,更多相关《实现GPU运算提高DR图像处理速度的方法.pdf(7页珍藏版)》请在专利查询网上搜索。

本发明公开了一种实现GPU运算提高DR图像处理速度的方法,包括:读取原始医学图像数据,用图像边缘像素对所述原始医学图像进行扩展和补齐;采用CUDA编写的快速傅里叶变换FFT程序直接调用GPU的计算资源,对所述扩展和补齐后的原始医学图像数据以及卷积核分别进行FFT运算,相应得到第一FFT结果和第二FFT结果;采用CUDA编写的卷积程序,直接调用GPU的计算资源对所述第一FFT结果和第二FFT结果在频。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 计算;推算;计数


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1