1 深圳大学物理与光电工程学院,光电子器件与系统广东省/教育部重点实验室, 广东 深圳 518060
2 深圳技术大学健康与环境工程学院, 广东 深圳 518118
随机光学重建显微镜(STORM)关键技术包括大量随机闪烁图像的数据定位与重建算法,而现有的常用开源算法在大数据量情况下存在用时过长或内存受限等限制,影响了STORM技术的进一步推广应用。基于MATLAB和并行计算的方法构建了WindSTORM PLUS开源算法,采用该算法进行单分子定位数据处理。在模拟数据集下,对比WindSTORM和ThunderSTORM,WindSTORM PLUS算法的处理速度提高了1000%,且对比WindSTORM,内存需求降低了60%。此外,搭建了easySTORM系统,在实验数据的处理耗时对比中,WindSTORM PLUS只有WindSTORM和Gauss-WLS的9%,验证了其在超大数据集下处理速度的优越性。WindSTORM PLUS开源算法为超分辨图像处理提供了一个新的高速处理方案。
显微 随机光学重建显微镜 并行计算 超分辨成像 图形处理器
1 杭州电子科技大学电子信息学院,浙江杭州 310000
2 中国电子科技集团公司第五十研究所,上海 200331
定位型振动光纤探测主机输出的是一个巨大的传感器阵列信号,数据量大且实时性处理要求高,对数据处理提出了很高的要求。本文立足于定位型光纤周界安防系统,基于英伟达公司(NVIDIA)的统一计算设备架构( CUDA)平台对预处理算法进行图像处理器( GPU)加速。结果表明预处理算法运行在 GPU上可以达到很好的加速效果,对系统的实时性能有明显提升。
光纤周界 信号处理 图像处理器加速 统一计算设备架构并行计算 optical fiber perimeter signal processing GPU acceleration CUDA parallel computation 太赫兹科学与电子信息学报
2019, 17(5): 898
战略支援部队信息工程大学信息系统工程学院, 河南郑州 450002
伴随大数据量的应用任务在中央处理器 (CPU)与图形处理器(GPU)组成的异构处理平台上的部署日益广泛, 如何高效利用 GPU硬件中的并行资源, 成为亟待解决的问题。通过对单 GPU任务映射策略进行研究, 提出多 Stream有向无环图 (MS-DAG)任务映射策略。通过分析 DAG图中的节点依赖关系, 根据节点依赖关系的不同, 划分合理的并行分支, 利用多 Stream流水线并行的方式, 实现适合GPU硬件特点的任务映射策略。通过与HEFT在不同条件下的性能对比, 可以看出: 当HEFT算法中的各处理器性能不一致时, MS-DAG任务映射策略的任务映射效率相比 HEFT算法有约 10%的提升; 当 HEFT算法中的各处理器性能一致时, MS-DAG任务映射策略的任务映射效率相比 HEFT算法有30%的提升。
CPU+GPU异构平台 任务映射 有向无环图 并行计算 CPU+GPU heterogeneousplatform task mapping Direction Acyclic Graph parallel computation 太赫兹科学与电子信息学报
2019, 17(2): 299
1 中国人民解放军国防科技大学电子对抗学院, 安徽 合肥 230037
2 中国科学技术大学近代物理系, 安徽 合肥 230026
量子密钥分发(QKD)过程中,保密增强算法用于消除QKD过程本身泄露以及可能被窃听者窃取的密钥信息,从而保证生成的量子密钥的安全。现有多种CPU软件实现方案。为提高算法安全性、集成度,并降低功耗,研究了采用FPGA实现的高速Toeplitz矩阵相乘保密增强算法方案。通过采用矩阵分块并行计算、流水线结构等加速运算方法,该方案在每次处理256 Kbits输入密钥时最大安全成码速率达到20 Mbps,在每次处理1 Mbits输入密钥时最大安全成码速率达到5 Mbps。此外,还能适应一次计算1 Mbits内任意长度的输入密钥,也能适 应0~1之间的任意压缩比例,有助于未来实用化高速QKD系统研制。
量子光学 保密增强 矩阵分块并行计算 Toeplitz矩阵 量子密钥分发 quantum optics privacy amplification matrix block parallel computation Toeplitz matrix FPGA FPGA quantum key distribution
四川大学 电子信息学院, 四川 成都 610065
提出了一种基于双目立体相机的实时集成成像拍摄系统。不同于采用传统的摄像机阵列, 该系统采用双目相机对三维场景进行拍摄, 有效地简化了集成成像拍摄系统的结构。该系统首先利用双目相机获取三维场景的左右视差图, 然后上传到图形处理器生成三维场景的高分辨率深度图, 之后利用深度图和彩色纹理图在图形处理器中并行生成新视点视差图像, 并利用像素映射算法生成高分辨率微图像阵列, 实现实时的集成成像显示。实验中系统获取的深度图像素数目是微软Kinect2获取深度图像素数目的4.25倍, 当系统运行在1 920 pixel×1 080 pixel、9×9视点数的环境下, 可实现三维场景的实时拍摄与显示, 实验结果证明了所提系统的可行性。
集成成像 实时拍摄 并行计算 深度图 integral imaging real-time pickup parallel computation depth map 红外与激光工程
2017, 46(11): 1103007
中国核动力研究设计院 核反应堆系统设计技术重点实验室, 成都 610041
三维多群中子扩散方程的精确、高效求解是核动力堆芯设计及燃料管理的基础。应用有限差分方法求解该方程具有简便、精确、成熟的优点; 然而,该方法的计算量和存储量均较大,极大地限制了它的计算规模和应用范围。本文基于大规模并行计算,研究三维多群中子扩散方程有限差分方法:采用中心有限差分格式离散中子扩散方程; 基于MPI并行编程模型,采用空间区域分解的方式实现大规模并行计算; 采用多群多区域耦合PGMRES算法进行并行加速。在集群服务器上开发了ParaFiDi程序,并采用IAEA3D,PHWR等多个基准题对该程序进行验证。数值结果表明,ParaFiDi程序具有较高的计算精度和计算效率。
三维多群中子扩散方程 有限差分方法 大规模并行计算 区域分解算法 多群多区域耦合PGMRES算法 3D multi-group neutron diffusion equation finite difference method large-scale parallel computation domain decomposition algorithm multi-group multi-domain coupled PGMRES algorithm 强激光与粒子束
2017, 29(8): 086001
1 解放军理工大学气象海洋学院, 江苏 南京 211101
2 解放军理工大学电磁环境效应与光电工程国家级重点实验室, 江苏 南京 210007
3 中国洛阳电子装备实验中心, 河南 洛阳 471000
为解决串行时域多分辨率(MRTD)散射模型运行时间长和内存消耗大的问题, 基于消息传递接口(MPI)技术设计了一种非球形气溶胶散射并行计算模型。介绍了MRTD散射模型的基本框架和2种并行数据通信方案, 并基于MPI重复非阻塞通信技术实现了MRTD散射模型的并行化设计; 搭建了网络并行计算平台, 实现了模型的并行化计算。将MRTD散射模型与Mie散射模型、T矩阵法进行了对比, 验证了并行MRTD散射模型的计算准确性。结果表明, MRTD模型可较准确地模拟非球形粒子散射特性, 并行计算技术可显著提高计算效率; 电磁场分量同时交换的并行设计方案的计算效率略高于仅交换磁场分量的方案; 通过增加中央处理器核数, 程序的并行加速比随之增大, 但单核运行效率却略有降低。随着粒子尺度参数的增大, 单核计算效率随之增加, 复折射率的改变并不会显著影响并行计算效率。
大气光学 非球形气溶胶 散射 时域多分辨率 并行计算
1 中国工程物理研究院北京应用物理与计算数学研究所,北京 100094
2 中国工程物理研究院高性能数值模拟软件中心,北京 100088
介绍了一种粒子沿折线 (zigzag-line)运动的守恒型 PIC算法在自编三维全电磁粒子模拟大规模并行程序 NEPTUNE3D中的实现与应用情况。相对于经典 PIC算法,该算法不需要修正电场,可以避免大型矩阵求逆问题,使得程序鲁棒性更高; 相对其他守恒型算法,该算法不需判断语句,代码执行效率更高,更适合大规模并行计算环境。通过与经典 PIC算法对比,给出采用 zigzag-line守恒型 PIC算法的 NEPTUNE3D程序对磁绝缘线振荡器天线一体化模型与太赫兹折叠波导行波管 2个实际算例的验证测试结果、应用效果,结果表明: zigzag-line守恒型 PIC算法模拟结果正确可靠,相对经典 PIC算法,大大缩短了计算时间,显著提升了器件模拟设计效率。
高功率微波 全电磁粒子模拟 束波互作用 电荷守恒型算法 大规模并行计算 high power microwave fully electromagnetic Particle -In-Cell simulation beam -waveinteraction charge -conservation method large -scale parallel computation 太赫兹科学与电子信息学报
2016, 14(4): 574
1 华北电力大学 电气与电子工程学院, 北京 102206
2 北京应用物理与计算数学研究所, 北京 100094
3 西南交通大学 物理科学与技术学院, 成都 610031
介绍了2.5维自主研制的并行电磁粒子模拟程序NEPTUNE2D初步研发情况。该程序基于JASMIN并行自适应结构网格支撑框架研制,并行效能高,可扩展性强,且支持动态负载平衡;采用新型PIC算法替代传统算法,避免求解泊松方程修正电场,更适用于大规模并行计算;程序支持r-z坐标系下的器件仿真,可应用于高功率微波器件、电真空器件的快速模拟设计。该程序现已完成电磁场更新、粒子推进、电磁场注入/引出、粒子发射/吸收等基本物理功能模块的研制,并通过同轴线、圆波导、同轴二极管及无箔二极管算例模拟验证了模块的正确性。最后,应用NEPTUNE2D程序设计了一个高效同轴相对论返波管,给出了粒子模拟结果和并行性能测试结果。
高功率微波 粒子模拟 并行计算 同轴相对论返波管 high power microwave particle-in-cell simulation parallel computation coaxial relativistic backward wave oscillator 强激光与粒子束
2016, 28(3): 033007
1 中物院高性能数值模拟软件中心, 北京 100088
2 中国工程物理研究院 复杂电磁环境重点实验室, 四川 绵阳 621900
3 北京应用物理与计算数学研究所, 北京 100094
复杂电磁环境的研究包括多方面内容,其中飞行器的电磁环境效应研究受到了较多的关注。随着计算机技术的飞速发展,利用数值模拟技术获得飞行器电磁特性已经成为飞行器电磁环境效应研究的一个重要手段。我们将自主研发的大规模并行三维时域全波电磁模拟软件JEMS-FDTD应用于运输机整机电磁特性仿真,计算并分析了飞机的电磁耦合散射特性,获得了飞行器在电磁脉冲照射下的时域/频域、近场/远场等电磁信息。计算中为保证精度采用了非均匀以及高阶FDTD计算技术。
数值模拟 时域有限差分方法 并行计算 非均匀 高阶方法 numerical simulation FDTD parallel computation non-uniform high order methods 强激光与粒子束
2015, 27(10): 103217