光学学报, 2018, 38 (4): 0411004, 网络出版: 2018-07-10   

基于总变分最小化模型的异步并行GPU加速算法 下载: 764次

Asynchronous Parallel GPU Acceleration Method Based on Total Variation Minimization Model
作者单位
解放军信息工程大学信息系统工程学院, 河南 郑州 450002
图 & 表

图 1. (a)同步并行计算;(b)异步并行计算

Fig. 1. (a) Synchronous parallel computing; (b) asynchronous parallel computing

下载图片 查看原文

图 2. GPU机群的组成结构

Fig. 2. Structures of GPU cluster

下载图片 查看原文

图 3. 原始图像及4组实验在第2000轮迭代时中间层的重建结果。(a)原始图像;(b)实验1的结果;(c)实验2的结果;(d)实验3中同步并行结果;(e)实验3中非同步并行结果;(f)实验4中同步并行结果;(g)实验4中非同步并行结果

Fig. 3. Original image and reconstruction results of middle slices at iteration of 2000 times. (a) Original image; (b) result of experiment 1; (c) result of experiment 2; (d) result of sync-parallel computing in experiment 3; (e) result of async-parallel computing in experiment 3; (f) result of sync-parallel computing in experiment 4; (g) result of async-parallel computing in experiment 4

下载图片 查看原文

表 1重建加速的实验平台参数

Table1. Parameters of reconstruction acceleration experimental platform

ItemComputing server model
GPU computing server IGPU computing server II
CPUIntel IvyBridgeE5-2630v2 (2.6 GHz)Intel IvyBridgeE5-2630v2 (2.6 GHz)
GPUTesla K20 (5 G)×1Tesla K20 (5 G)×1Tesla K40 (12 G)×1
RAM32 G32 G
Operating systemWindows 7, 64 bitWindows 7, 64 bit
Number22

查看原文

表 2锥束CT系统扫描参数

Table2. Scanning parameters of cone-beam CT system

ItemParameter
Scanning angle range /(°)0-360
Number of probes1024×1024
Distance from source to rotation center /mm600
Distance from source to detector /mm1200
Projection number60
Total of projection data1024×1024×60
Reconstruction scale512×512×512
Pixel size /mm×mm0.25×0.25

查看原文

表 34组实验在第2000轮迭代时结果的RMSE以及平均每轮迭代时间

Table3. RMSE of results at iteration of 2000 times and average iteration time of each iteration for four experiments

ResultExperiment 1Experiment 2Experiment 3Experiment 4
Synchronous parallelAsynchronous parallelSynchronous parallelAsynchronous parallel
RMSE6.78×10-46.78×10-46.78×10-45.69×10-46.78×10-45.34×10-4
Average single time /s6842.00130.5053.9351.4953.2645.67
Rspeed (compared with CPU)-52.4126.9132.9128.5149.8
Rspeed (compared with single GPU)--2.422.532.452.86

查看原文

路万里, 蔡爱龙, 郑治中, 王林元, 李磊, 闫镔. 基于总变分最小化模型的异步并行GPU加速算法[J]. 光学学报, 2018, 38(4): 0411004. Wanli Lu, Ailong Cai, Zhizhong Zheng, Linyuan Wang, Lei Li, Bin Yan. Asynchronous Parallel GPU Acceleration Method Based on Total Variation Minimization Model[J]. Acta Optica Sinica, 2018, 38(4): 0411004.

本文已被 1 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!