白澜 1,2魏仁乐 2,3,*郭拯危 2,4,5赵建辉 2,4,5李宁 2,4,5
作者单位
摘要
1 郑州科技学院 信息工程学院,河南 郑州 450064
2 河南大学 计算机与信息工程学院
3 中共开封市委党校,河南 开封 475001
4 河南大学 河南省大数据分析与处理重点实验室
5 河南大学 河南省智能技术与应用工程技术研究中心,河南 开封 475004
针对多模式合成孔径雷达(SAR)成像处理中存在的计算效率不足问题,提出了一种基于GPU的多模式SAR统一成像并行加速方法。为充分利用GPU 的显存资源,提高算法的运算效率,利用共享内存对矩阵转置、矩阵相乘等部分进行大规模数据并行计算。实验结果表明,该算法大幅度提升了多模式SAR 成像的计算效率,最高加速比达到55.62,解决了GPU 显存空间利用率较低的问题。
合成孔径雷达 图形处理器 多模式 并行加速 Synthetic Aperture Radar Graphic Processing Unit multi-mode parallel acceleration 
太赫兹科学与电子信息学报
2023, 21(8): 1037
作者单位
摘要
中国科学院 长春光学精密机械与物理研究所,吉林长春130033
为了满足4 m级地基大口径光学望远镜千单元自适应光学系统的波前处理规模、速度以及控制带宽要求,研究了基于GPU的千单元级自适应光学系统高速波前处理器。介绍了自适应光学系统波前处理方法,并详细论述了基于GPU的波前处理架构的实现与优化方法。最后,通过湍流模拟器进行桌面模拟实验,得到961单元自适应光学系统的动态性能。实验结果表明:基于GPU的961单元自适应光学系统在采样频率为1 500 Hz时,系统0 dB残余误差抑制带宽能够达到100 Hz,满足4 m级地基大口径光学望远镜自适应光学系统的应用需求。
自适应光学 波前处理 961单元变形镜 图形处理器 adaptive optics wavefront processing 961-element deformable mirror graphics process unit 
光学 精密工程
2022, 30(23): 3004
作者单位
摘要
中国航空工业集团公司洛阳电光设备研究所,河南 洛阳 471000
随着机载显示系统复杂度的提升,越来越多地采用图形处理器来生成显示画面,但由于图形处理器的高复杂性,也给适航审定带来挑战。首先,分析了图形处理器在机载显示领域的使用场景以及带来的风险,研究了当前适航需求; 然后,从使用FPGA和使用COTS器件两条技术路线给出了图形处理器适航应用中关注问题的解决方法,并对两个技术路线进行总结。研究成果有助于解决图形处理器在民机显示领域应用的适航难题,为现有显示设备制造商图形处理硬件设计方法提供参考。
图形处理器 机载显示系统 适航 COTS器件 graphics processor airborne display system airworthiness COTS device 
电光与控制
2022, 29(3): 101
作者单位
摘要
1 武汉大学电子信息学院,湖北 武汉 430072
2 武汉大学深圳研究院,广东 深圳 518000
3 中国民航飞行学院 洛阳分院,河南 洛阳 471001
增加相参积累时间是一种提高雷达探测能力的有效方法,但当目标速度较高时,长时间相参积累会导致目标出现距离徙动效应,从而降低了信噪比,影响雷达的探测威力。针对距离徙动问题,本文给出了Keystone变换(KT)校正算法,仿真评估了三种实现KT方法的性能,进而提出并实现了基于图形处理器(GPU)的线性调频Z变换(CZT)并行算法,结合外辐射源雷达实验证实了该方法的实时性和有效性。
外辐射源雷达 距离徙动 Keystone变换 线性调频Z变换 图形处理器 passive radar range migration Keystone Transform Chirp Z Transform(CZT) Graphics Processing Unit(GPU) 
太赫兹科学与电子信息学报
2021, 19(5): 851
作者单位
摘要
1 中国科学院空天信息创新研究院, 国家环境保护卫星遥感重点实验室, 北京 100101
2 中国科学院大学, 北京 100049
3 宁夏大学资源环境学院, 宁夏 银川 750021
高分四号 (GF-4) 是我国第一颗高分辨率对地静止卫星, 地表反射率产品对于评估生态环境与减灾防灾具有重要价值。GF-4 大气校正算法对地表反射率进行估计, 迭代计算观测与计算表观反射率残差最小值得到气溶胶光学厚度, 并构建 6SV 查找表对地表反射率结果进行计算。在精度验证基础上, 考虑产品生产的高效率需求, 对计算复杂度高的步骤基于图形处理器 (GPU) 进行内核设计, 实现线程、寄存器等性能优化。研究结果表明, 基于 GPU 加速的大气校正算法在性能与能耗上具有较大优势, 一景 GF-4 PMS 的 10240×10240 像元数的影像数据, 相比顺序执行取得 57.3 的总体加速比, 而总体能耗仅为顺序执行的 15.5%。
高分四号 图形处理器 大气校正 地表反射率 气溶胶光学厚度 GF-4 graphics processing unit atmospheric correction surface reflectance aerosol optical depth 
大气与环境光学学报
2021, 16(3): 269
孙敏远 1,2,3袁园 3毕勇 3,*朱建英 2,3[ ... ]张文平 3
作者单位
摘要
1 中国科学院空天信息创新研究院光学工程研究部, 北京 100094
2 中国科学院大学, 北京 100049
3 中国科学院理化技术研究所应用激光研究中心, 北京 100190
为了实现全息图的快速计算,提出了一种基于OptiX光线跟踪引擎和NVIDIA图形处理器(GPU)的光线跟踪全息图生成算法。该算法充分利用了GPU中的硬件光线跟踪核心,可有效提高全息图的计算速度。当组成三维模型的多边形数量为1.6万个,物点数量为4万个时,该光线跟踪全息图生成算法的计算速度约为基于GPU的点源全息图生成算法的11.5倍。
全息 计算全息 光线跟踪 图形处理器 光线跟踪引擎 
激光与光电子学进展
2020, 57(24): 240901
作者单位
摘要
1 上海海洋大学信息学院, 201306
2 上海电力大学电子与信息工程学院, 上海 200090
高光谱图像分类是遥感领域的研究热点之一,是对地观测的重要手段,在地物的精细识别等领域具有重要的应用。使用卷积神经网络(CNN)可以有效地从原始图像中提取高级特征,具有较高的分类精度。但CNN计算量巨大,对硬件要求较高。为了提高模型计算效率,可以在图形处理器(GPU)上进行CNN模型的训练。现有的并行算法,比如GCN(GPU based Cube-CNN),无法充分利用GPU的并行能力,算法加速效果并不理想。为了进一步提升算法效率,提出基于通用矩阵乘法(GEMM)算法的GGCN(GPU based Cube-CNN improved by GEMM)并行加速算法,通过G-PNPE(GEMM based Parallel Neighbor Pixels Extraction)对输入数据和卷积核进行重新组织排列,实现卷积的并行计算,有效地提高了GPU的利用率并进一步提升了算法的训练效率。通过分析在三个数据集上的实验结果发现,改进算法的分类精度与原算法保持一致,而且模型的训练时间缩短了30%左右,表明算法的有效性和优越性。
成像系统 高光谱图像 图形处理器 通用矩阵乘法 并行计算 
激光与光电子学进展
2020, 57(20): 201101
肖文 1,2吴天琦 1,2李仁剑 1,2唐黎 1,2,*陈玲玲 1,2
作者单位
摘要
1 深圳大学物理与光电工程学院,光电子器件与系统广东省/教育部重点实验室, 广东 深圳 518060
2 深圳技术大学健康与环境工程学院, 广东 深圳 518118
随机光学重建显微镜(STORM)关键技术包括大量随机闪烁图像的数据定位与重建算法,而现有的常用开源算法在大数据量情况下存在用时过长或内存受限等限制,影响了STORM技术的进一步推广应用。基于MATLAB和并行计算的方法构建了WindSTORM PLUS开源算法,采用该算法进行单分子定位数据处理。在模拟数据集下,对比WindSTORM和ThunderSTORM,WindSTORM PLUS算法的处理速度提高了1000%,且对比WindSTORM,内存需求降低了60%。此外,搭建了easySTORM系统,在实验数据的处理耗时对比中,WindSTORM PLUS只有WindSTORM和Gauss-WLS的9%,验证了其在超大数据集下处理速度的优越性。WindSTORM PLUS开源算法为超分辨图像处理提供了一个新的高速处理方案。
显微 随机光学重建显微镜 并行计算 超分辨成像 图形处理器 
中国激光
2020, 47(6): 0607001
作者单位
摘要
山西大学物理电子工程学院, 山西 太原 030006
针对当前连续变量量子密钥分发系统数据协调运算速率低的问题,采用中央处理器/图形处理器(CPU/GPU)异构平台实现了多维数据协调算法的并行加速运算,提出了对于异构计算要求的大规模校验矩阵静态双向十字链表及多维并行协调算法。在该平台上对码长为2.048×10 5的情况进行了仿真计算。通过仿真可获取收敛信噪比和协调计算时间,并计算得出协调速率、密钥传输距离和协调效率。结果表明:当码长为2.048×10 5时,在保证协调效率的前提下,采用CPU/GPU异构平台并行加速的协调速率为CPU平台的5倍。
量子光学 量子密钥分发 中央处理器/图形处理器异构平台 多维数据协调 低密度奇偶校验码 稀疏矩阵 
激光与光电子学进展
2019, 56(15): 152702
作者单位
摘要
西安理工大学自动化与信息工程学院, 陕西 西安 710048
基于随机并行梯度下降(SPGD)算法的无波前传感自适应波前校正系统的收敛速度较慢,很难满足无线光相干通信系统对实时性的要求。介绍了SPGD算法的并行化处理,利用图形处理器(GPU)并行计算提高校正系统的收敛速度。选用CCD相机采集的实时光斑形心的周围400个像素平均灰度值作为系统性能指标;利用GPU多线程运算,对性能指标求解过程和变形镜控制电压向量更新过程进行加速处理。室内实验和外场相干光实验结果表明,斯特列尔比达到了0.8以上,时间加速比最大达到了8.6,GPU加速的波前校正系统在提升收敛速度的同时保证了校正效果。
大气光学 波前校正加速 并行计算 随机并行梯度下降算法 图形处理器 
激光与光电子学进展
2019, 56(7): 070101

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!