相同关键词【图形处理器】论文列表 -- 中国光学期刊网

信号与信息处理、计算机与控制

基于GPU的多模式SAR成像加速研究

白澜 ^1,2魏仁乐 ^2,3,*郭拯危 ^2,4,5赵建辉 ^2,4,5李宁 ^2,4,5

作者单位

摘要

¹ 郑州科技学院信息工程学院，河南郑州 450064

² 河南大学计算机与信息工程学院

³ 中共开封市委党校，河南开封 475001

⁴ 河南大学河南省大数据分析与处理重点实验室

⁵ 河南大学河南省智能技术与应用工程技术研究中心，河南开封 475004

针对多模式合成孔径雷达(SAR)成像处理中存在的计算效率不足问题，提出了一种基于GPU的多模式SAR统一成像并行加速方法。为充分利用GPU 的显存资源，提高算法的运算效率，利用共享内存对矩阵转置、矩阵相乘等部分进行大规模数据并行计算。实验结果表明，该算法大幅度提升了多模式SAR 成像的计算效率，最高加速比达到55.62，解决了GPU 显存空间利用率较低的问题。

合成孔径雷达图形处理器多模式并行加速 Synthetic Aperture Radar Graphic Processing Unit multi-mode parallel acceleration

PDF全文 Full Text

太赫兹科学与电子信息学报

2023, 21(8): 1037

基于GPU的961单元自适应光学系统波前处理器设计及其动态性能

杨乐强王建立姚凯男李宏壮 [ ... ]邵蒙 ^*

作者单位

摘要

中国科学院长春光学精密机械与物理研究所，吉林长春130033

为了满足4 m级地基大口径光学望远镜千单元自适应光学系统的波前处理规模、速度以及控制带宽要求，研究了基于GPU的千单元级自适应光学系统高速波前处理器。介绍了自适应光学系统波前处理方法，并详细论述了基于GPU的波前处理架构的实现与优化方法。最后，通过湍流模拟器进行桌面模拟实验，得到961单元自适应光学系统的动态性能。实验结果表明：基于GPU的961单元自适应光学系统在采样频率为1 500 Hz时，系统0 dB残余误差抑制带宽能够达到100 Hz，满足4 m级地基大口径光学望远镜自适应光学系统的应用需求。

自适应光学波前处理 961单元变形镜图形处理器 adaptive optics wavefront processing 961-element deformable mirror graphics process unit

PDF全文 Full Text

光学精密工程

2022, 30(23): 3004

学术研究

图形处理器适航符合性技术研究

张川李文强刘俊锋

作者单位

摘要

中国航空工业集团公司洛阳电光设备研究所,河南洛阳 471000

随着机载显示系统复杂度的提升,越来越多地采用图形处理器来生成显示画面,但由于图形处理器的高复杂性,也给适航审定带来挑战。首先,分析了图形处理器在机载显示领域的使用场景以及带来的风险,研究了当前适航需求; 然后,从使用FPGA和使用COTS器件两条技术路线给出了图形处理器适航应用中关注问题的解决方法,并对两个技术路线进行总结。研究成果有助于解决图形处理器在民机显示领域应用的适航难题,为现有显示设备制造商图形处理硬件设计方法提供参考。

图形处理器机载显示系统适航 COTS器件 graphics processor airborne display system airworthiness COTS device

PDF全文 Full Text

电光与控制

2022, 29(3): 101

探测制导、测控通信与电子对抗

外辐射源雷达距离徙动校正并行实现与实验研究

张汉五 ¹万显荣 ^1,*谢德强 ¹程丰 ¹[ ... ]熊良建 ³

作者单位

摘要

¹ 武汉大学电子信息学院，湖北武汉 430072

² 武汉大学深圳研究院，广东深圳 518000

³ 中国民航飞行学院洛阳分院，河南洛阳 471001

增加相参积累时间是一种提高雷达探测能力的有效方法，但当目标速度较高时，长时间相参积累会导致目标出现距离徙动效应，从而降低了信噪比，影响雷达的探测威力。针对距离徙动问题，本文给出了Keystone变换(KT)校正算法，仿真评估了三种实现KT方法的性能，进而提出并实现了基于图形处理器(GPU)的线性调频Z变换(CZT)并行算法，结合外辐射源雷达实验证实了该方法的实时性和有效性。

外辐射源雷达距离徙动 Keystone变换线性调频Z变换图形处理器 passive radar range migration Keystone Transform Chirp Z Transform(CZT) Graphics Processing Unit(GPU)

PDF全文 Full Text

太赫兹科学与电子信息学报

2021, 19(5): 851

《高分五号卫星大气数据反演》专辑

GF-4大气校正并行算法研究

王子翔 ^1,2,*李正强 ^1,2光洁 ¹佘璐 ³

作者单位

摘要

¹ 中国科学院空天信息创新研究院, 国家环境保护卫星遥感重点实验室, 北京 100101

² 中国科学院大学, 北京 100049

³ 宁夏大学资源环境学院, 宁夏银川 750021

高分四号 (GF-4) 是我国第一颗高分辨率对地静止卫星, 地表反射率产品对于评估生态环境与减灾防灾具有重要价值。GF-4 大气校正算法对地表反射率进行估计, 迭代计算观测与计算表观反射率残差最小值得到气溶胶光学厚度, 并构建 6SV 查找表对地表反射率结果进行计算。在精度验证基础上, 考虑产品生产的高效率需求, 对计算复杂度高的步骤基于图形处理器 (GPU) 进行内核设计, 实现线程、寄存器等性能优化。研究结果表明, 基于 GPU 加速的大气校正算法在性能与能耗上具有较大优势, 一景 GF-4 PMS 的 10240×10240 像元数的影像数据, 相比顺序执行取得 57.3 的总体加速比, 而总体能耗仅为顺序执行的 15.5%。

高分四号图形处理器大气校正地表反射率气溶胶光学厚度 GF-4 graphics processing unit atmospheric correction surface reflectance aerosol optical depth

PDF全文 Full Text

大气与环境光学学报

2021, 16(3): 269

全息

基于OptiX光线跟踪引擎的光线跟踪全息图生成算法

下载：1092次

孙敏远 ^1,2,3袁园 ³毕勇 ^3,*朱建英 ^2,3[ ... ]张文平 ³

作者单位

摘要

¹ 中国科学院空天信息创新研究院光学工程研究部, 北京 100094

² 中国科学院大学, 北京 100049

³ 中国科学院理化技术研究所应用激光研究中心, 北京 100190

为了实现全息图的快速计算,提出了一种基于OptiX光线跟踪引擎和NVIDIA图形处理器(GPU)的光线跟踪全息图生成算法。该算法充分利用了GPU中的硬件光线跟踪核心,可有效提高全息图的计算速度。当组成三维模型的多边形数量为1.6万个,物点数量为4万个时,该光线跟踪全息图生成算法的计算速度约为基于GPU的点源全息图生成算法的11.5倍。

全息计算全息光线跟踪图形处理器光线跟踪引擎

PDF全文 Full Text

激光与光电子学进展

2020, 57(24): 240901

成像系统

GGCN:基于GPU的高光谱图像分类算法

下载：1046次

张明华 ¹邹亚晴 ¹宋巍 ¹黄冬梅 ^1,2,*刘智翔 ¹

作者单位

摘要

¹ 上海海洋大学信息学院, 201306

² 上海电力大学电子与信息工程学院, 上海 200090

高光谱图像分类是遥感领域的研究热点之一,是对地观测的重要手段,在地物的精细识别等领域具有重要的应用。使用卷积神经网络(CNN)可以有效地从原始图像中提取高级特征,具有较高的分类精度。但CNN计算量巨大,对硬件要求较高。为了提高模型计算效率,可以在图形处理器(GPU)上进行CNN模型的训练。现有的并行算法,比如GCN(GPU based Cube-CNN),无法充分利用GPU的并行能力,算法加速效果并不理想。为了进一步提升算法效率,提出基于通用矩阵乘法(GEMM)算法的GGCN(GPU based Cube-CNN improved by GEMM)并行加速算法,通过G-PNPE(GEMM based Parallel Neighbor Pixels Extraction)对输入数据和卷积核进行重新组织排列,实现卷积的并行计算,有效地提高了GPU的利用率并进一步提升了算法的训练效率。通过分析在三个数据集上的实验结果发现,改进算法的分类精度与原算法保持一致,而且模型的训练时间缩短了30%左右,表明算法的有效性和优越性。

成像系统高光谱图像图形处理器通用矩阵乘法并行计算

PDF全文 Full Text

激光与光电子学进展

2020, 57(20): 201101

生物医学光子学与激光医学

基于并行计算优化的WindSTORM PLUS算法

下载：1033次

肖文 ^1,2吴天琦 ^1,2李仁剑 ^1,2唐黎 ^1,2,*陈玲玲 ^1,2

作者单位

摘要

¹ 深圳大学物理与光电工程学院,光电子器件与系统广东省/教育部重点实验室, 广东深圳 518060

² 深圳技术大学健康与环境工程学院, 广东深圳 518118

随机光学重建显微镜(STORM)关键技术包括大量随机闪烁图像的数据定位与重建算法,而现有的常用开源算法在大数据量情况下存在用时过长或内存受限等限制,影响了STORM技术的进一步推广应用。基于MATLAB和并行计算的方法构建了WindSTORM PLUS开源算法,采用该算法进行单分子定位数据处理。在模拟数据集下,对比WindSTORM和ThunderSTORM,WindSTORM PLUS算法的处理速度提高了1000%,且对比WindSTORM,内存需求降低了60%。此外,搭建了easySTORM系统,在实验数据的处理耗时对比中,WindSTORM PLUS只有WindSTORM和Gauss-WLS的9%,验证了其在超大数据集下处理速度的优越性。WindSTORM PLUS开源算法为超分辨图像处理提供了一个新的高速处理方案。

显微随机光学重建显微镜并行计算超分辨成像图形处理器

PDF全文 Full Text

中国激光

2020, 47(6): 0607001

量子光学

基于CPU/GPU异构平台的连续变量量子密钥分发多维数据协调

下载：938次

穆健健郭大波 ^*马识途贺超

作者单位

摘要

山西大学物理电子工程学院, 山西太原 030006

针对当前连续变量量子密钥分发系统数据协调运算速率低的问题,采用中央处理器/图形处理器(CPU/GPU)异构平台实现了多维数据协调算法的并行加速运算,提出了对于异构计算要求的大规模校验矩阵静态双向十字链表及多维并行协调算法。在该平台上对码长为2.048×10 ⁵的情况进行了仿真计算。通过仿真可获取收敛信噪比和协调计算时间,并计算得出协调速率、密钥传输距离和协调效率。结果表明:当码长为2.048×10 ⁵时,在保证协调效率的前提下,采用CPU/GPU异构平台并行加速的协调速率为CPU平台的5倍。

量子光学量子密钥分发中央处理器/图形处理器异构平台多维数据协调低密度奇偶校验码稀疏矩阵

PDF全文 Full Text

激光与光电子学进展

2019, 56(15): 152702

大气光学与海洋光学

无波前传感自适应波前校正系统的图形处理器加速

下载：1097次

柯熙政张云峰 ^*张颖雷思琛

作者单位

摘要

西安理工大学自动化与信息工程学院, 陕西西安 710048

基于随机并行梯度下降(SPGD)算法的无波前传感自适应波前校正系统的收敛速度较慢,很难满足无线光相干通信系统对实时性的要求。介绍了SPGD算法的并行化处理,利用图形处理器(GPU)并行计算提高校正系统的收敛速度。选用CCD相机采集的实时光斑形心的周围400个像素平均灰度值作为系统性能指标;利用GPU多线程运算,对性能指标求解过程和变形镜控制电压向量更新过程进行加速处理。室内实验和外场相干光实验结果表明,斯特列尔比达到了0.8以上,时间加速比最大达到了8.6,GPU加速的波前校正系统在提升收敛速度的同时保证了校正效果。

大气光学波前校正加速并行计算随机并行梯度下降算法图形处理器

PDF全文 Full Text

激光与光电子学进展

2019, 56(7): 070101

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索