强激光与粒子束
2021, 33(5): 053003
1 中国科学院 光学天文重点实验室(国家天文台), 北京 100101
2 中国科学院大学, 北京 100049
小行星地基光学观测是小行星搜寻和性质研究的重要手段。近年来, 小行星搜寻项目朝着大口径大视场的方向发展, 探测能力提升的同时数据量也大大增长, 为了提高小行星光学观测图像的处理速率, 本文提出基于GPU的小行星光学观测图像实时处理方法。对Source Extractor算法进行研究, 在满足提取精度的前提下, 实现Source Extractor算法的简化和基于GPU的并行化; 同时, 采用Match匹配算法进行天文定位, 并对Match匹配算法进行优化, 提高算法适用性和准确率。实验结果表明: 利用NVIDA GeForce GTX 2080Ti显卡搭建的实验平台实现简化和并行化后的算法, 相比于CPU下的串行算法, 提速比可达17(S/N阈值设置为3), 且随着高性能显卡的进一步发展, 提速比还有提升空间, 此方法还适用于其他光学巡天观测图像的处理。
小行星光学观测, 目标提取, GPU, 并行算法 asteroid optical observation target extraction GPU code parallelization 光学 精密工程
2020, 28(11): 2527
1 中国工程物理研究院,微系统与太赫兹研究中心,四川成都 610200
2 中国工程物理研究院,电子工程研究所,四川绵阳 621999
为满足太赫兹无线通信系统对大容量基带信号处理算法的要求, 基于直接从多项式分解导出的传统滤波器并行实现算法, 通过矩阵变化推导出复杂度更小的快速有限冲激响应(FIR)滤波器并行实现。在此基础上通过张量积的表示给出了 2并行、 4并行和 8并行的转换公式以及实现架构。既而推导出 2N并行快速 FIR滤波器的通用实现公式, 并对比了优化前后的复杂度差异。最后给出了 64并行的快速 FIR滤波器的推导公式和具体实现架构, 以及优化前后的硬件复杂度对比, 64并行的快速 FIR滤波器算法资源消耗更少。
FIR滤波器 并行化 数字信号处理 FIR filter parallelization digital signal processing algorithm research 太赫兹科学与电子信息学报
2020, 18(4): 560
1 四川大学 电子信息学院, 成都 610065
2 北京应用物理与计算数学研究所, 北京 100088
时域有限差分(FDTD)中采用环路法(CP)进行复杂金属细缝结构建模,可突破细缝结构对空间步长的约束而大大减少计算资源的消耗。提出CP-FDTD在大规模并行化平台的建模方法,通过对工程金属细缝结构自动建模以及对CP算法的自动适配,实现CP-FDTD的并行化处理。利用所开发的并行CP-FDTD算法分析了开不同工程细缝金属腔在0.05~3.00 GHz内的电磁屏蔽效能,结果表明所开发的具有金属细缝建模功能的并行化CP-FDTD自动适配处理技术,与加密网格的传统FDTD(fine-FDTD)计算结果吻合良好,且计算效率显著提升。
并行化 细缝 环路法 时域有限差分法 屏蔽效能 parallelization thin slot contour path finite-difference time-domain shielding effectiveness 强激光与粒子束
2019, 31(5): 053202
分别用CTF和反应堆蒙卡程序RMC对BEAVRS基准题进行全堆精细建模, 由RMC统计径向及轴向功率分布并作为CTF的功率输入。利用CTF的区域分解技术, 进行BEAVRS全堆pin by pin子通道计算, 采用193个核并行计算, 耗时268 s, 得到了精细的燃料棒中心及表面温度、冷却剂温度及密度、空泡份额、包壳温度等重要参数, 验证了CTF进行全堆子通道计算的高效性及可靠性, 为实现基于RMC和CTF的核热耦合计算奠定了重要基础。
BEAVRS基准题 区域分解 并行 BEAVRS domain decomposition parallelization CTF CTF RMC RMC 强激光与粒子束
2017, 29(1): 016008
中国工程物理研究院 流体物理研究所, 四川 绵阳 621900
研究了闪光X射线辐射照像蒙特卡罗程序(FXRMC)在MPI平台下的并行计算实现,给出了实现过程中并行随机数的产生方法。对并行程序的测试结果表明: 并行程序与串行程序结果一致,加速比比较理想,呈线性增长,并行效率在16个处理器上可达80%以上。算例的结果说明了并行化可有效地解决程序计算散射技术性能时的耗时问题,从而有效化解FXRMC耗时和大规模计算的困难,提高了FXRMC程序的计算规模和计算速度,达到了研究要求。
蒙特卡罗 MPI并行化 伪随机数 Monte Carlo FXRMC FXRMC MPI parallelization pseudo-random number 强激光与粒子束
2012, 24(12): 2965
1 电子科技大学计算机科学与工程学院, 四川 成都 611731
2 中国科学院成都计算机应用研究所, 四川 成都 610041
3 中国科学院光电技术研究所自适应光学重点实验室, 四川 成都 610209
自适应光学系统的性能受限于伺服系统的延迟误差和波前传感器的光电子噪声。提出了一种多模型单变量预测模型,该模型采用基于Levenberg-Marquardt学习算法的前馈型神经网络。利用计算机多核处理器,设计了一个具有并行处理能力的预测控制器,来实现对自适应光学闭环控制电压的预测,以消除延迟误差的影响。通过数值仿真实验,研究了预测控制器对控制电压和远场斯特雷尔比的影响,与未采用预测控制器的系统进行了比较,并对预测算法的并行性能进行了分析。实验结果表明,使用并行化方法的预测控制器可以有效缩短系统的预测时间,提高预测算法的加速比,与经典比例积分(PI)控制算法相比可以更有效地降低系统由于伺服延迟引起的误差,远场的斯特雷尔比有明显地提高。
大气光学 自适应光学 预测控制器 多模型单变量预测模型 并行化 多核 神经网络
1 中国科学院 西安光学精密机械研究所, 瞬态光学与光子技术国家重点实验室, 西安 710119
2 西安邮电学院 电子工程学院, 西安 710061
3 空军工程大学 理学院, 西安 710051
根据磁瓶飞行时间谱仪磁场系统的基本要求,设计了一套符合其使用的复合磁场系统。最高强度达1.2 T的强非均匀磁场部分由永久磁铁和结构经过优化的截圆锥状磁极靴所产生。永久磁铁为N52系列NdFeB,磁极靴材料为高磁导率珀明德合金。强度为1.0×10-3 T的弱均匀引导磁场由半径为3 cm、长度为3 m螺线管提供。磁极靴与螺线管之间的距离为5 cm。
磁瓶飞行质谱仪 飞行时间 极靴 准直化 绝热参数 magnetic-bottle time-of-flight spectrometer time-of-flight pole piece parallelization adiabatic parameter