1、(10)申请公布号 CN 104360708 A (43)申请公布日 2015.02.18 CN 104360708 A (21)申请号 201410360970.2 (22)申请日 2014.07.24 G06F 1/035(2006.01) (71)申请人 中国人民解放军装甲兵工程学院 地址 100072 北京市丰台区杜家坎 21 号院 信息系侦情室 (72)发明人 蒋晓瑜 丛彬 裴闯 闫兴鹏 赵锴 严志强 赵哲 (54) 发明名称 一种基于三角函数查找表的快速计算全息算 法 (57) 摘要 本发明属于计算全息领域, 具体涉及一种基 于三角函数查找表的快速计算全息算法, 其特征 在于 :
2、该查找表是在点源法计算全息的基础上, 通过对原始公式的推导, 将其中涉及到冗余计算 的相位部分通过数学近似变换及三角函数恒等变 换化简, 生成两张均含有深度信息的相位查找表。 生成过程采用并行计算, 生成速度快, 精度高, 含 有物体 ( 包括三维物体和二维物体 ) 的全部相位 信息, 且占用内存小, 重复利用率高, 应用范围广 泛。 同时算法本身进行了并行优化, 在查表寻址以 及计算过程均采用并行计算, 有效提升了计算全 息的速度。 (51)Int.Cl. 权利要求书 1 页 说明书 4 页 附图 2 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书1页 说明书4页
3、 附图2页 (10)申请公布号 CN 104360708 A CN 104360708 A 1/1 页 2 1. 一种基于三角函数查找表的快速计算全息算法, 其特征在于 : 该查找表算法是在点 源法计算全息的基础上, 对原始公式的相位部分进行提取, 再经过二项式近似以及多次三 角函数恒等变化等数学变换, 将公式中涉及的物空间同全息面的相对位置关系变量进行拆 分, 大大减小了查找表的内存, 再经过 CUDA 并行编程, 生成一组 ( 两张 ) 纯相位查找表。最 终, 利用该查找表将点源法原始公式简化, 通过 CUDA 并行编程, 实现算法。 2. 根据权利要求 1 所述的一种基于三角函数查找表的
4、快速计算全息算法, 其特征在 于 : 该查找表为纯相位查找表。 3. 根据权利要求 1 所述的一种快速计算三维物体全息的查找表算法, 其特征在于 : 该 查找表采用 CUDA 编程生成, 生成过程采用双精度并行计算。 4. 根据权利要求 1 所述的一种基于三角函数查找表的快速计算全息算法, 其特征在 于 : 该查找表包含计算全息图所需的全部相位信息, 表格所占的内存很小。 5. 根据权利要求 1 所述的一种基于三角函数查找表的快速计算全息算法, 其特征在 于 : 该查找表既适用于二维物体计算全息也适用于三维物体计算全息。 6. 根据权利要求 1 所述的一种基于三角函数查找表的快速计算全息算法,
5、 其特征在 于 : 该查找表不需要重复计算, 在查找表允许范围内大小的全息图, 以及不超过查找表计算 范围的物点采样数的计算全息都可直接使用。 7. 根据权利要求 1 所述的一种基于三角函数查找表的快速计算全息算法, 其特征在 于 : 该查找表算法在显卡上生成的全息图, 其光学再现像相比于应用原始点源法, 在 CPU 端 生成全息图的再现像, 质量没有降低。 权 利 要 求 书 CN 104360708 A 2 1/4 页 3 一种基于三角函数查找表的快速计算全息算法 技术领域 0001 本发明属于计算全息领域, 具体涉及一种基于三角函数查找表的快速计算全息算 法。 背景技术 0002 计算全
6、息虽然能够综合应用计算机技术和全息技术, 可以得到良好的三维显示 效果, 但是全息图的空间带宽积很大, 这给计算机的计算速度、 储存容量等带来了巨大的 压力, 制约着计算全息图的实时计算传输和显示。点源法是经典的计算全息算法, 应用 点源法计算三维物体全息图时计算速度慢这一问题就异常突出。点源法计算全息算法 (Ray-tracing) 完全模拟光学全息的物理过程, 把三维物体看作空间上的点光源集合, 赋予 点光源随机的初相位, 每个点光源分别与参考光在全息面相干, 再全部叠加起来即可生成 三维物体的全息图。点源法计算全息能够提供物体完整的三维信息, 但是逐个物点计算全 息图带来了巨大的运算量,
7、 使其计算速度极低。针对这一问题, Mark Lucent 等人提出了著 名的查表法 (Look-up Table, LUT)(M.Lucente, Interactive computation of holograms using a look-up table, J.Electronic Imaging2(1), 28-35(1993), 将三维物空间各物 点的全息图事先计算并存储起来, 当计算一个三维物体的全息图时, 只需从存储的数据中 获取三维物体各物点相应的 PFP, 然后线性叠加即可得到三维物体的全息图。但这种最初 的查表法弊端明显, 首先三维物体每个亮度和位置不同物点都对应一个
8、全息图, 查找表所 占内存将达到 TB 级别。因此, 这种查表法无法满足实际的实验要求。为了在实验中能够 满足实际应用, 一系列基于点源法的查找表优化算法相继被提出。2009 年, 韩国科学家 Kim 等人实现了一种新的查找表 (Novel-Look-up Table, N-LUT) 方法, 以减少内存使用量, 但减少之后的查找表仍然是 GB 级别的, 近期又对 N-LUT 方法进行了改进, 改进后命名为 RLE-basedN-LUT 法, 该方法可以将查找表的内存再次降低一个数量级。新加坡的 Yuechao Pan等人提出的Split Look-up Tables(S-LUT)查找表法将三维
9、查找表的内存降低了很多。 0003 本发明提出的新查表算法命名为三角函数查表法 (Trigonometric look-up table, T-LUT)。通过将原始点源法的公式进行一系列数学恒等变化, 其中多数为三角函数 恒等变换, 将查找表的内存降低到与 S-LUT 查找表相当的程度。但在查找表生成的速度上, 会更加快速, 在生成的数据上也会更加准确。结合 CUDA 架构编程, 将并行思想加入 T-LUT 算法, 即对点源法进行了并行优化。通过一系列对比实验表明, T-LUT 查表法中查找表所占 内存是众多查找表法中最小的, 采用 T-LUT 查表法的计算全息的计算速度有很大提升。 发明内容
10、 0004 本发明的目的是提供一种快速的计算三维物体全息的查找表算法三角函数 查找表法, 该方法能够在不牺牲全息图再现图像质量的前提下, 通过对点源法原始公式进 行一系列数学近似、 数学恒等变化, 最终将查找表寻址的三维变量拆分成为二维变量, 生成 查找表的内存大大减少, 同时计算公式的复杂度有很大程度的简化。 说 明 书 CN 104360708 A 3 2/4 页 4 0005 本发明与现有的方法相比, 具有如下特点 : 0006 1 具备了其他查找表算法减少计算重复数据的优点的同时有效的解决了其他查找 表占用内存超大的问题。本发明查找表内存明显降低。 0007 2、 三维查找表生成速度快
11、, 精度高。 0008 3、 算法的实现是在 GPU 上采用 CUDA 并行计算, 生成全息图速度较快。 附图说明 0009 本发明 “一种快速计算三维物体全息的新查表算法” 的附图有 5 个。 0010 图 1 为本发明提供的 T-LUT 算法推导流程图。 0011 图 2 为本发明提供的 T-LUT 算法计算全息实验优化过程示意图。 0012 图 3 为本发明提供的 T-LUT 算法最终并行优化流程图。 0013 图 4 为本发明提供的 T-LUT 算法 GPU 并行生成全息图再现像同点源法 CPU 生成全 息图再现像对比图。 0014 图 5 为本发明提供的 T-LUT 算法的 GPU
12、并行计算全息速度同点源法 CPU 计算全息 速度对比。 具体实施方式 0015 下面结合附图和附表对本发明 “一种快速计算三维物体全息的新查表算法” 做进 一步描述。 0016 图 1 为本发明提供的 T-LUT 算法推导流程图。 0017 点源法初步数学表达式为 : 0018 0019 物空间采样存在物理上的采样间隔, 设定为 5-20 倍的全息面采样间隔, 则公式 (1) 中的 x2 (pxj-qxh)2, y2 (pyj-qyh)2, 这里的 q 为加载全息图的采样间隔, 即 q 8m, p 为物空间采样间隔是 q 的 5-20 倍。在再现图像系统中, 存在重建距离 zj x, zj y
13、, 由二项式近似可得 :则公式 (1) 的可 以化简为 : 0020 0021 将公式 (2) 中计算全息相位部分提取, 即这部分对于 全息面上的每个像素点计算来讲, 是不断进行重复计算的。本发明提供的是一种纯相位查 找表, 将这重复计算的相位部分预先计算存入表格。 说 明 书 CN 104360708 A 4 3/4 页 5 0022 0023 在光学再现图像系统中, 参考光波长 是固定的, 重建距离 zj是可以人为选取 的。为了简化计算, 这里将 zj取为 的整数倍, 所以是 2 的整数倍。则根据三角函 数性质, 公式 (3) 可简化为 : 0024 Table cosc1(x2+y2)
14、(4) 0025 其中( 对于二维计算全息查找表来讲, zj为常数 ), 这里将 x2+y2进 行归一化, 以后公式中出现的 x、 y 均分别为, axj-xh及 ayj-yh, 其中 a 是本文选取的 p/ q 的最大值, 即 a 20。( 即物空间采样间隔最多为全息面的 20 倍 )。继续将公式 (4) 化 简 0026 Table cos(c1x2)cos(c1y2)-sin(c1x2)sin(c1y2) (5) 0027 显然从公式 (5) 中, 我们得到需要计算的二维查找表即为 : 0028 0029 当物空间采样点为三维点集时, 则中的深度信息 zj不能够将其再看做常 量, 此时令
15、则公式 (6) 可化为 : 0030 0031 这就是最终确定下来的三维 T-LUT 三角函数查找表。 0032 图 2 为本发明提供的 T-LUT 算法计算全息实验优化过程示意图。 0033 实验中, 主要对 T-LUT 算法进行了 GPU 端的 CUDA 编程及优化, 根据光学再现像实 验结果以及生成全息速度, 对 T-LUT 算法进行了多次优化。 0034 图 3 为本发明提供的 T-LUT 算法最终并行优化流程图。 0035 图 3 中, 最终的并行优化采取数据缓存占用内存量与数据计算的并行程度之间进 行权衡的方式进行。本次优化申请的计算空间能够让 GPU 保持峰值计算速度, 线程配比
16、根 据物点采样数不同配比不同, 在以往实验的基础上再次取得了一定的速度优化。本次优化 在取得了速度上的提升的同时, 不会对物点采样产生限制。 0036 图 4 为本发明提供的 T-LUT 算法 GPU 并行生成全息图再现像同点源法 CPU 生成全 息图再现像对比图。 说 明 书 CN 104360708 A 5 4/4 页 6 0037 图 4 中可以看出 T-LUT 算法 GPU 并行生成全息图再现像质量没有降低。 0038 图 5 为本发明提供的 T-LUT 算法的 GPU 并行计算全息速度同点源法 CPU 计算全息 速度对比。 0039 图 5 中可以看出 T-LUT 算法最终并行优化生成全息图的速度得到明显提升, 根据 采样点数量不同, 速度相对于点源法 CPU 运算提升 30-100 倍不等。 说 明 书 CN 104360708 A 6 1/2 页 7 图 1 图 2 图 3 说 明 书 附 图 CN 104360708 A 7 2/2 页 8 图 4 图 5 说 明 书 附 图 CN 104360708 A 8
copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1