单宝彦 1,2,3朱振才 1,*张永合 1,3邱成波 1,2,3
作者单位
摘要
1 中国科学院微小卫星创新研究院, 上海 201203
2 中国科学院大学, 北京 100049
3 中国科学院微小卫星重点实验室, 上海 201203
在行星探测任务中,针对尺度不变特征变换(SIFT)算法计算量大,无法同时满足对导航算法准确性和实时性要求的问题,提出了一种基于快速高斯模糊的并行化SIFT算法,即FG-SIFT算法。首先,将算法中构建高斯金字塔的二维高斯核函数分离成两个一维高斯函数,降低算法的计算复杂度。然后,对于每一维高斯函数,使用两个无限脉冲响应滤波器串联进行逼近,进一步减少计算量。最后,利用并行化处理的优势,设计算法各部分的并行化计算方案。仿真结果表明,FG-SIFT算法的计算效率相较于原SIFT算法平均提高了15倍,相较于没有使用快速高斯模糊的SIFT算法,在图形处理器上的运行效率也有近2倍的提高,很大程度上减少了特征点提取的计算时长,提高了算法的实时性。
图像处理 尺度不变特征变换算法 快速高斯模糊 CUDA 实时性 
激光与光电子学进展
2021, 58(2): 0210020
作者单位
摘要
1 中国洛阳电子装备试验中心,河南 洛阳 471003
2 哈尔滨工业大学 工信部空天热物理重点实验室,黑龙江 哈尔滨 150001
建立了一种包含蒙皮和尾焰的空中目标红外辐射成像GPU并行计算方法。采用SLG模型计算尾焰辐射气体的红外特性,采用LOS方法求解尾焰红外辐射传输方程,根据本体与三维尾焰的成像几何关系,采用正向光线追迹方法计算蒙皮辐射成像,采用反向光线追迹方法计算尾焰辐射成像,建立了目标投影算法,并在蒙皮投影计算模块和尾焰辐射计算模块采用CUDA并行提高计算速度,实现了探测器入瞳处目标红外光谱图像的快速计算。结果表明:投影成像算法可准确生成设定条件下的目标图像,目标红外图像辐射分布与温度分布一致,尾焰辐射强度计算结果与实验结果符合较好,CUDA并行算法可有效提高程序的计算效率,当计算量较大时,蒙皮投影模块的计算加速可达百倍以上。
红外辐射 空中目标 图像仿真 CUDA并行计算 infrared radiation aerial target image simulation CUDA parallel compute 
红外与激光工程
2020, 49(4): 0404003
宣经纬 1,2,3,*饶长辉 1,2钟立波 1,2田雨 1,2
作者单位
摘要
1 中国科学院自适应光学重点实验室, 四川 成都 610209
2 中国科学院光电技术研究所, 四川 成都 610209
3 中国科学院大学, 北京 100049
在地基太阳观测中,光线在穿越大气层时会受到大气湍流的影响而导致图像扭曲、变形以致质量下降。为了消除或降 低大气湍流的影响,事后图像处理技术被用来获得高分辨力的太阳图像。基于斑点干涉法和斑点掩模的事后重建算 法可以获得高分辨力的图像,但由于计算复杂度高,难以满足实时性的要求。在讨论了算法原理的基础上, 使用CUDA并行计算架构实现了太阳斑点重建算法并行化。实验结果表明,在GPU环境下,一张TiO通 道2304 pixel×1984 pixel像素大小的图像,可以在70 s内完成重建,相比运行在CPU上的串行程序,加速比可达7以上。
图像重建 斑点干涉法 斑点掩模法 并行计算 GPU GPU CUDA CUDA image reconstruction speckle interferometry speckle masking parallel computing 
大气与环境光学学报
2020, 15(2): 90
作者单位
摘要
1 杭州电子科技大学电子信息学院,浙江杭州 310000
2 中国电子科技集团公司第五十研究所,上海 200331
定位型振动光纤探测主机输出的是一个巨大的传感器阵列信号,数据量大且实时性处理要求高,对数据处理提出了很高的要求。本文立足于定位型光纤周界安防系统,基于英伟达公司(NVIDIA)的统一计算设备架构( CUDA)平台对预处理算法进行图像处理器( GPU)加速。结果表明预处理算法运行在 GPU上可以达到很好的加速效果,对系统的实时性能有明显提升。
光纤周界 信号处理 图像处理器加速 统一计算设备架构并行计算 optical fiber perimeter signal processing GPU acceleration CUDA parallel computation 
太赫兹科学与电子信息学报
2019, 17(5): 898
作者单位
摘要
1 上海大学 精密机械工程系,上海 200444
2 教育部先进显示与系统应用集成重点实验室,上海 200444
随着计算空间光调制器的分辨率的尺寸逐渐变大,全息图三维动态显示的计算量也越来越大,使得对全息计算速度提出了新的要求。利用GPU并行计算处理的方式实现全息图的快速层析法计算,该方法利用GPU并行多线程和层析法中的图像二维傅里叶变换的优势对菲涅尔衍射变换算法加速计算;同时通过对GPU底层资源的调用和对CUDA中程序的流处理过程,有效减少中间的延时等待。通过对计算速度对比分析表明:与在CPU上运算相比,计算速度大幅提升,基于GPU并行计算的方法比基于CPU计算的方法速度快10倍左右。
计算全息 层析法 优化 computational hologram GPU GPU CUDA CUDA slice-based method optimization 
应用光学
2019, 40(4): 620
作者单位
摘要
1 贵州财经大学 信息学院, 贵州 贵阳 550025
2 贵州财经大学 贵州省经济系统仿真重点实验室, 贵州 贵阳 550025
本文提出一种基于GPU+CPU的快速实现Canny算子的方法。首先将算子分为串行和并行两部分, 高斯滤波、梯度幅值和方向计算、非极大值抑制和双阈值处理在GPU中完成, 将二维高斯滤波分解为水平方向上和垂直方向上的两次一维滤波从而降低计算的复杂度; 然后使用CUDA编程完成多线程并行计算以加快计算速度; 最后使用共享存储器隐藏线程访问全局存储的延迟; 在CPU中则使用队列FIFO完成边缘连接。仿真测试结果表明: 对分辨率为1 024×1 024的8位图像的处理时间为122 ms, 相对应单独使用CPU而言, 加速比最高可达5.39倍, 因此本文方法充分利用了GPU的并行性的特征和CPU的串行处理能力。
加速 Canny CANNY CUDA CUDA GPU GPU acceleration 
液晶与显示
2016, 31(7): 714
作者单位
摘要
西南石油大学计算机科学学院,成都 610500
高精度的位移估计方法对提高超声弹性成像的质量非常重要。在本研究中,通过英伟达公司的 CUDA架构实现了一种新颖的可以同时提高轴向和横向运动估计精确度的位移估计方法在 GPU上的高效并行计算。对比于原始方法在 C Mex编译条件下的实现, GPU实现的方法显示最多可实现 76X的加速,同时保持了较高的位移估计精度。
超声弹性成像 运动追踪 子采样位移估计 图形处理器 ultrasound elastography motion tracking sub-sample displacement estimation GPU CUDA CUDA 
光电工程
2016, 43(6): 83
作者单位
摘要
1 火箭军工程大学 控制工程系, 陕西 西安 710025
2 中国人民解放军96111部队, 陕西 韩城 715400
烟幕、灰尘、云、火焰等不规则物体的实时红外仿真技术是战场环境红外图像实时生成的关键技术和难点之一。以烟幕红外仿真为例, 首先基于Navier-Stokes方程对烟幕的外形进行了建模, 给出了其初始化和边界处理方法; 然后基于灰体辐射模型和光线投射算法考虑了烟幕自身辐射和太阳光照射两种因素对烟幕的红外辐射特性进行了建模; 最后, 利用CUDA并行计算工具对基于物理模型的烟幕红外仿真进行了实现, 成功地将红外烟幕嵌入到基于Vega的红外场景中, 并对利用Vega粒子系统产生的红外烟幕和基于物理模型的红外烟幕的效果进行了对比。仿真结果表明, 基于物理模型的烟幕红外仿真满足实时性需求, 且具有真实感强, 可控性好的优点。
烟幕 红外图像 实时生成 Navier-Stokes方程 smoke IR image real-time generation Navier-Stokes equation CUDA CUDA Vega Vega 
红外与激光工程
2016, 45(4): 0404004
张全 1,2,3,4鲍华 1,3饶长辉 1,3彭真明 2
作者单位
摘要
1 中国科学院自适应光学重点实验室,成都 610209
2 电子科技大学 光电信息学院,成都 610054
3 中国科学院光电技术研究所,成都 610209
4 中国科学院大学,北京 100049
NVIDIA 在其GPU 平台上开发的FFT 库CUFFT 经过几次升级,但在二维FFT 实现上效率还有提升空间,而且对于特定不能与上下文的计算融合,导致多次对Global memory 的访问。本文分析合并内存访问事务大小与占用率之间的关系,优化使用GPU 存储器资源,对小数据量2 次幂二维复数FFT 在GPU 上的实现进行改进,加速比最高达到CUFFT 6.5 的1.27 倍。利用实数FFT 结果的共轭对称性,算法的效率比复数FFT 算法运算量降低了40%。最后将FFT 的改进应用到光学传递函数(OTF)的计算中,采用Kernel 融合的方法,使得OTF 的计算效率比CUFFT 计算方法提高了1.5 倍。
快速傅里叶变换 光学传递函数 图形处理器 FFT CUDA CUDA optical transfer function (OTF) graphic processing unit (GPU) 
光电工程
2016, 43(2): 69
作者单位
摘要
西安电子科技大学 物理与光电工程学院,陕西 西安 710071
红外弱小目标的探测与跟踪对运算硬件和算法的性能提出较高的要求。针对传统背景预测算法串行运算耗时较长的问题,以及经典的通用GPU(Graphic Processing Unit)体积与功耗过大难于整合到红外设备中的问题,提出在嵌入式GPU平台NVIDIA Jetson TK1中实现并行分离卷积的方法,利用CUDA(Compute Unified Device Architecture)实时执行背景预测算法,实现了在嵌入式GPU平台上高效的红外背景预测算法。实验结果表明,在保证正确预测背景的前提下,利用小体积、低功耗的嵌入式GPU平台可以将运算性能提高到串行运算的15倍以上。
红外探测 快速运算 背景预测 infrared detection high performance computation background prediction Jetson TK1 Jetson TK1 CUDA CUDA 
红外与激光工程
2015, 44(9): 2615

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!