牛朝旭 1,2孙海江 1,2,*
作者单位
摘要
1 中国科学院 长春光学精密机械与物理研究所,吉林 长春 130033
2 中国科学院大学,北京 100049
为实现卷积神经网络在低功耗、边缘计算等场景中的加速计算,设计了一种基于现场可编程门阵列(FPGA)的Winograd算法卷积神经网络加速器。首先,将图像数据和权重数据量化为8位定点数,并设计了硬件卷积计算过程中的量化流程,提升了数据传输速度和计算速度。接着,设计了输入数据缓存复用模块,将多输入通道数据融合后传输,复用了行重叠数据。然后设计了Winograd流水线卷积模块,实现列数据的组合复用,从而最大化重用了片上数据,降低了片上数据存储的占用和带宽压力。最后将加速器在Xilinx的ZCU104开发板上部署。经过实验验证,加速器的卷积层计算性能达到354.5 GOPS,片上DSP计算效率达到0.69,与相关研究相比,实现了1.6倍以上的提升。该加速器能够以高能效比完成基于VGG-16网络的遥感图像分类任务。
卷积神经网络 现场可编程门阵列 Winograd算法 流水线 并行计算 convolution neural network field programmable gate array winograd algorithm assembly line parallel computing 
液晶与显示
2023, 38(11): 1521
作者单位
摘要
1 中国科学院 长春光学精密机械与物理研究所, 吉林 长春 130033
2 中国科学院大学, 北京 100049
空间相机地面检测系统在投入使用之前, 必须进行严格的自检功能测试。为了解决测试时与庞大的CCD相机系统对接造成的时间和物力资源浪费问题, 本文结合TDICCD空间相机工作原理, 设计了一种空间相机图像模拟源系统。本系统通过USB总线进行图像数据的下传, 然后经SRAM缓存, 并以流水线作业方式下载到FLASH中实现8通道图像数据的固存。并且可实现对相机行频大小、图像大小进行调整的功能, 进而模拟不同型号空间相机。实验结果表明, 该图像模拟源USB接口的下载速度可达到40 MB/s, 空间相机地面检测系统显示的图像与上位机发送的图像一致, 无数据丢失和误码的情况。该相机图像模拟源设计灵活, 性能稳定可靠, 适用范围广。
图像模拟源 流水线操作 image simulation system USB USB FLASH FLASH assembly line 
液晶与显示
2016, 31(2): 208

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!