激光与光电子学进展, 2019, 56 (12): 122201, 网络出版: 2019-06-13   

一种快速收敛的随机并行梯度下降算法 下载: 1478次

Fast Convergence Stochastic Parallel Gradient Descent Algorithm
作者单位
1 江南大学理学院, 江苏 无锡 214122
2 江苏省轻工光电工程技术研究中心, 江苏 无锡 214122
摘要
理论模拟仿真了基于变形镜与随机并行梯度下降(SPGD)算法的无波前探测自适应光学系统(AOS)。为提高基于SPGD算法的无波前探测AOS的收敛速度,在不降低精度的前提下,对SPGD算法中关键参数随机扰动幅值和增益系数的关系进行了优化。实验发现, AOS存在参数优选区域,且与初始畸变大小有关。进行了理论验证并与模拟退火算法进行了比较,结果表明,SPGD算法收敛精度比模拟退火算法高6.32%,具有更好的收敛速度。
Abstract
In this paper, based on deformable mirrors and the stochastic parallel-gradient-descent (SPGD) algorithm, an adaptive optics system (AOS) without wavefront detection is theoretically simulated. In order to improve the convergence speed of the AOS without reducing its accuracy, this paper optimizes the relationship between the amplitude of random perturbation and the gain coefficient in the SPGD algorithm. The experiment conducted in this study shows that the AOS has a parameter preference area, which is related to the initial distortion magnitude. Furthermore, the results of the theoretical verification and the comparison with that by the simulated annealing algorithm reveal that the convergence accuracy of the SPGD algorithm is 6.32% higher than that of the SA algorithm and the SPGD algorithm has a larger convergence speed.

1 引言

大气湍流引起的像差具有随机且变化迅速的特点,自适应光学技术的基本目标就是实时校正大气湍流引起的波前畸变,获得近衍射极限的图像分辨能力[1]。无波前探测自适应光学系统不需要波前探测器,具有结构紧凑的特点,在激光大气通信、显微镜[2-4]等领域有广泛的应用前景。无波前探测自适应光学技术中,常用的优化控制算法有随机并行梯度下降(SPGD)算法[5-8]、模拟退火(SA)算法[9]和遗传算法[10]等,其中SPGD算法在收敛精度与收敛速度上表现尤为出色。

SPGD算法由Vorontsov等[5-6]于1997年提出,被应用于自适应光学系统中并成功改善了图像质量,解决了畸变校正中的多通道控制问题。2000年,Vorontsov等[7]基于SPGD算法,分别对由127单元液晶空间光调制器和37单元变形镜构建的自适应激光束聚焦系统进行自适应补偿控制。2005年,Masino等[11]使用超大规模集成电路硬件提高了SPGD算法的执行速度,每秒迭代7000次,使算法可以投入实际应用。SPGD算法被广泛应用于自由空间光通信[12-13]、激光大气传输[14]和稀疏孔径成像系统[15]等。研究人员在算法优化方面也进行了大量工作,例如解耦SPGD算法[8]和基于功率谱反演法的SPGD算法[16]等,以提高迭代收敛速度与精度;2000年,Weyrauch等[17]提出增益系数随迭代过程自适应变化,同类方法还包括分段增益系数[18]、分段随机扰动[19]、变增益系数[20]、收敛前后期采用不同的电压优化控制方式[21]等,这类动态调节的方法与固定参数相比,更有利于与迭代中的系统变化进行匹配并提高收敛速度与收敛精度。但动态调节的方法也需要对随机扰动信号与增益系数作技术优化,即初始值的选择。随机电压扰动幅度δ和增益系数γ取值影响系统的收敛速度和收敛精度,传统的基于SPGD算法无波前探测自适应光学(AO)系统在工作前要选择合理的δ-γ,一般选择经验值,之后的工作便在固定的δ-γ下进行[22]。但经验值仅适用于特定实验系统和实验条件,当条件发生变化时,所选取的经验值工作效率和收敛效果均会降低。

为了解决该问题,实现高精度、快速的收敛效果,对SPGD算法的随机扰动信号幅值δ与增益系数γ等关键参数进行了大量研究。结果表明,静态畸变波前的闭环校正效果在δ-γ的选择上具有优选区域。

2 基于SPGD的无波前探测AOS仿真原理

2.1 系统仿真过程

无波前探测自适应光学系统原理如图1所示,光路部分的波前残差信号可表示为

φres=φ0+φDM,(1)

式中:初始畸变波前φ0经变形镜反射后到达电子耦合器件(CCD)探测器,CCD探测器接收到的是经变形镜的校正波前φDM补偿后的残余波前φres的远场像点。系统通过合适的算法与控制器实现波前畸变的补偿。

图 1. 无波前探测自适应光学系统控制框图

Fig. 1. Block diagram of adaptive optics system without wavefront detection

下载图片 查看所有图片

对于初始的畸变波前,考虑到生物医学显微成像中的畸变以离焦和像散等低阶畸变为主,可以利用低阶的Zernike多项式产生初始畸变波前。变形镜在本自适应光学系统中作为波前校正器,其面形φDM可表示为[23]

φDM=j=1nuj·fj(x,y),(2)

式中:uj为第j个驱动器的电压值;fj(x,y)为驱动器的响应函数;(x,y)为镜面上的点坐标;n为总驱动器数。第j个驱动器的响应函数fj(x,y)由驱动器结构和材料决定,其描述了单位电压下的驱动形变量,表示为[24]

fj(x,y)=explnω(x-xj)2+(y-yj)2d0α,(3)

式中:ω为耦合值;(xj,yj)为第j个驱动器的坐标;d0为相邻驱动器的间隔;α为高斯指数。理论仿真中模拟了69单元变形镜,其驱动单元分布如图2所示,且ω=0.2,d0=1,α=1.73。至此,可用(2)式和(3)式具体表述变形镜在控制电压下的形变分布φDM,变形镜产生的形变仅需入射波前畸变的一半。

图 2. 69单元变形镜驱动器的分布

Fig. 2. Actuator distribution of 69-actuator deformable mirror

下载图片 查看所有图片

2.2 SPGD算法

SPGD算法流程如图3所示,第k次迭代的控制电压Uk={uj(k)},式中:uj(k)为第k次迭代下第j个驱动器的控制电压;δuj为随机电压,由δ和随机数arand得到;目标函数J用残余波前φres的方均根(RMS)表示,即

J=1sφres(x,y)-φ-res2dxdy,(4)

式中:s为变形镜面积; φ-res为残余波前平均值。迭代中,第k次迭代下的控制电压Uk=Uk-1+γ·ΔU·ΔJ,式中,γ为增益系数,目标函数差ΔJ=J+-J-,且电压U下载入正随机电压ΔU与负随机电压-ΔU下的系统目标函数分别为J+=J(UU)和J-=J(UU)。

图 3. SPGD算法流程

Fig. 3. Flow chart of SPGD algorithm

下载图片 查看所有图片

SPGD算法为随机盲优化算法,图4为800次SPGD算法迭代下系统目标函数的收敛情况,其中灰色细虚线表示20次独立实验的目标函数收敛情况,黑色粗实线表示20次实验的平均收敛情况,可见目标函数收敛情况具有随机性,这是由算法本身决定的。因此,为了减少随机性对结果的影响,需要采用多次实验取平均的方法。本文选取5次、10次、15次和20次实验取平均,并以20次实验平均作为消除随机性的标准,5次平均的误差即可降为1.58%。因此,为了有效消除随机影响,理论仿真实验均采用5次实验取平均。

图 4. 800次算法迭代下的单次随机性实验与多次实验取平均的收敛情况

Fig. 4. Convergence for single random test and averaging after multiple tests under 800 iterations

下载图片 查看所有图片

3 增益系数与随机扰动幅度的优化

以单次SPGD算法的收敛为基础, 选择大量δ-γ组合进行相同迭代次数的仿真并记录对应的目标函数。目标函数越小, δ-γ的组合越优, 由此实现δ-γ组合的优选过程。根据控制电压与目标函数的数值大小,δ的取值范围为0~2,等分40份,γ取值范围为-5~0,等分40份,用此40×40组δ-γ参数分别进行800次算法迭代,得残余波前的评价函数J(δ,γ)。图5为800次算法迭代下的J的分布,可见在选择的δ-γ组合区域内,J的收敛情况具有一定规律。在此基础上,对J进行低通滤波,保留区域中最优的2%,并对优选的δ-γ进行曲线拟合,图5中用灰点标记了筛选出来的高精度优选参数点,灰色实线为对应的拟合曲线。至此可得800次算法迭代后的优选δ-γ曲线, 可见随机扰动电压幅值越大, 对应的增益系数大并趋于0。

图 5. 扰动幅度δ 与增益系数γ对残余波前的影响及其优化拟合曲线

Fig. 5. Effects of perturbation amplitude δ and gain coefficient γ on residual wavefront and its optimal fitting curve

下载图片 查看所有图片

在不考虑算法随机性的情况下,对于上述优选曲线,选择其上任意一点作为算法的输入δ-γ,经800次算法迭代后将获得残余波前的评价函数J800, 即最优的收敛情况。优选曲线为选择合适的参数提供了方便,实际上曲线附近的区域也在优选范围内,所对应的参数也能够达到很高的收敛精度。大量模拟结果表明,优选范围略有变化,反映在不同的畸变、不同的变形镜下所得到的优选曲线略有不同。在实际情况下,对于具体的自适应光学系统,其变形镜的具体参数是固定的,因此,仅需考虑不同畸变大小对δ-γ优选范围的影响。

3.1 不同初始畸变大小的影响

通过取不同的Zernike系数,以离焦和像散为主,准备了3个不同畸变波前如图6(a)所示,在δ为-5~0,γ为0~2的范围内进行δ-γ值的优选,优选阈值为2%,得到如图6(b)所示的优选范围比较图。不同形状的点集代表不同初始畸变大小下的优选点,圆点、叉和五角星分别代表初始波前评价函数J0等于0.3312,0.8448,1.3180 rad的情况,依次对应的拟合曲线为图中的细实线、实线和粗实线。可见,初始畸变波前不同,优选范围出现了偏移,随着J0的增大,拟合曲线在目标区域往下偏移。

选取收敛范围内外的若干组δ-γ考察上述3个不同的畸变波前在仿真迭代中的收敛情况。收敛范围内的点在收敛程度上是等价的,为了使实验结果清晰,选择优选曲线之间分离较大处的点进行仿真迭代。选择δ-γ组合(1,-0.7)、(1,-1)和(1,-1.3) 作为固定参数,其中(1,-0.7)在圆点集内,(1,-1)在叉点集内,(1,-1.3)在五角星点集内。

图 6. 不同初始畸变波前下的最优方案。(a) 3个不同大小的初始畸变波前;(b)不同初始畸变波前下最优曲线的分布情况

Fig. 6. Optimal solution for wavefronts with different initial distortions. (a) Wavefronts with three initial distortion magnitudes; (b) distribution of optimal curve for wavefronts with different initial distortions

下载图片 查看所有图片

3.2 验证比较

为了验证上述关系,重新构建图6(a)中3个不同大小的畸变波前,x,y为归一化坐标。同时可得对应的优选曲线上的优选参数组合,如表1~3所示,分别给出了不同畸变波前下,不同参数组合时的迭代补偿结果,并与模拟退火算法进行比较。图7为800次迭代补偿后不同情况下的目标函数收敛情况,单位为弧度。图7(a)~(c)分别为初始畸变波前RMS为0.3312,0.8448,1.3180 rad的目标函数收敛情况,虚线、点线和点划线分别表示δ-γ组合为对应优选参数组合(1,-0.7)、(1,-1)和(1,-1.3)下的迭代情况。由表1可见,当初始畸变波前RMS为0.3312 rad时,800次迭代后,残余波前评价函数J800δ-γ组合取(1,-0.7)时降至0.0258 rad,收敛效率η=(J800-J0)/J0达92.2%,分别高出δ-γ取(1,-1)和(1,-1.3)的参数组合1.2%和3.1%;由表2可见,当初始畸变波前RMS为0.8448 rad时,J800在参数组合取(1,-1)时降至0.0645 rad,收敛效率为92.4%,比参数组合取(1,-0.7)和(1,-1.3)时分别高0.8%和1.1%;由表3可见,当初始畸变波前RMS为1.3180 rad时,J800在参数组合(1,-1.3)时降至0.088 rad,η为93.3%,比参数组合取(1,-0.7)和(1,-1)时分别高1.7%和0.2%。

表 1. 初始畸变波前RMS为0.3312 rad时不同参数组合的收敛情况

Table 1. Convergence under different parameter combinations for wavefront with initial distortion RMS of 0.3312 rad

AlgorithmSPGDSA
Disturbanceamplitude δ111N/A
Gaincoefficient γ-0.7-1-1.3N/A
Wavefront RMS after800 iterations J800 /rad0.02580.02990.03610.0720
Convergenceefficiency η /%92.2190.9789.1078.26

查看所有表

表 2. 初始畸变波前RMS为0.8448 rad时不同参数组合的收敛情况

Table 2. Convergence of different parameter combinations for wavefront with initial distortion RMS of 0.8448 rad

AlgorithmSPGDSA
disturbanceamplitude δ111N/A
gaincoefficient γ-0.7-1-1.3N/A
Wavefront RMS after800 iterations J800 /rad0.07080.06450.07360.1338
Convergenceefficiency η /%91.6292.3791.2984.16

查看所有表

表 3. 初始畸变波前RMS为1.3180 rad时不同参数组合的收敛情况

Table 3. Convergence of different parameter combinations for wavefront with initial distortion RMS of 1.3180 rad

AlgorithmSPGDSA
Disturbanceamplitude δ111N/A
Gaincoefficient γ-0.7-1-1.3N/A
Wavefront RMS after800 iterations J800 /rad0.10980.08950.08770.1718
Convergenceefficiency η /%91.6593.1793.3286.97

查看所有表

模拟退火(SA)算法[9]也被广泛应用于无波前校正自适应光学系统,在一定程度上SA算法可以有效逃离局部最优的陷阱。图7中黑实线为SA算法下波前畸变的校正过程,整体收敛速度比SPGD算法慢,且收敛精度不如SPGD算法。根据表1~3可得,表中N/A(Not applicable)表示δ-γ对SA算法不适用,在800次迭代过程中,初始畸变波前RMS在0.3312 rad时,SA算法的J800降至0.0720 rad,其收敛效率比SPGD算法低13.95%;与此同时,初始畸变为0.8448 rad,1.3180 rad时,SA算法的J800分别降至0.1338 rad,0.1718 rad,收敛效率比SPGD算法低8.21%和6.35%。可见参数优化后的SPGD算法比SA算法的收敛精度高。

图 7. 不同初始畸变波前下不同参数组合的收敛情况。(a) 0.3312 rad;(b) 0.8448 rad;(c) 1.3180 rad

Fig. 7. Convergence under different parameter combinations for wavefronts with different initial distortions. (a) 0.3312 rad;(b)0.8448 rad;(c)1.3180 rad

下载图片 查看所有图片

4 结论

基于误差评价对SPGD算法中的δγ值进行优化,并针对不同幅度的初始畸变,给出了优化的δ-γ关系曲线;该曲线为SPGD算法在应用过程选择高精度、收敛速度快的合理参数组合提供了理论依据,也为SPGD算法校正动态变化的畸变提供了可能。依据实验数据均值,优选曲线上的参数组合收敛精度提高了1.3%。因此,在静态畸变补偿中,由初始畸变大小判断最优的δ-γ,可获得更高的收敛精度。与SA算法相比,优化后的SPGD算法的收敛精度提高了6.3%。本文所描述的静态补偿实际上可以应用于帧率较低的动态补偿,但与实际应用中高速的动态补偿还有一定区别。下一步将在实验室验证SPGD算法中优选参数在静态补偿中的效果,并实现动态补偿中载入动态参数,从而提高系统稳定性。

参考文献

[1] Baranova N B, Mamaev A V, Pilipetsky N F, et al. Wave-front dislocations: topological limitations for adaptive systems with phase conjugation[J]. Journal of the Optical Society of America, 1983, 73(5): 525-528.

[2] Booth M J. Adaptive optics in microscopy[J]. Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, 2007, 365(1861): 2829-2843.

[3] Booth M J. Wavefront sensorless adaptive optics for large aberrations[J]. Optics Letters, 2007, 32(1): 5-7.

[4] Antonello J, van Werkhoven T, Verhaegen M, et al. . Optimization-based wavefront sensorless adaptive optics for multiphoton microscopy[J]. Journal of the Optical Society of America A, 2014, 31(6): 1337-1347.

[5] Vorontsov M A, Carhart G W, Ricklin J C. Adaptive phase-distortion correction based on parallel gradient-descent optimization[J]. Optics Letters, 1997, 22(12): 907-909.

[6] Vorontsov M A, Sivokon V P. Stochastic parallel-gradient-descent technique for high-resolution wave-front phase-distortion correction[J]. Journal of the Optical Society of America A, 1998, 15(10): 2745-2758.

[7] Vorontsov M A, Carhart G W, Cohen M, et al. Adaptive optics based on analog parallel stochastic optimization: analysis and experimental demonstration[J]. Journal of the Optical Society of America A, 2000, 17(8): 1440-1453.

[8] Vorontsov M A. Decoupled stochastic parallel gradient descent optimization for adaptive optics: integrated approach for wave-front sensor information fusion[J]. Journal of the Optical Society of America A, 2002, 19(2): 356-368.

[9] Zommer S, Ribak E N, Lipson S G, et al. Simulated annealing in ocular adaptive optics[J]. Optics Letters, 2006, 31(7): 939-941.

[10] Yang P, Ao M W, Liu Y, et al. Intracavity transverse modes controlled by a genetic algorithm based on Zernike mode coefficients[J]. Optics Express, 2007, 15(25): 17051-17062.

[11] Masino A J, Link D J. Adaptive optics without a wavefront sensor[J]. Proceedings of SPIE, 2005, 5895: 58950T.

[12] Cao J T, Zhao X H, Li Z K, et al. Stochastic parallel gradient descent laser beam control algorithm for atmospheric compensation in free space optical communication[J]. Optik, 2014, 125(20): 6142-6147.

[13] 杨慧珍, 李新阳, 姜文汉. 自适应光学技术在大气光通信系统中的应用进展[J]. 激光与光电子学进展, 2007, 44(10): 61-68.

    Yang H Z, Li X Y, Jiang W H. Applications of adaptive optics technology in atmospheric laser communications system[J]. Laser & Optoelectronics Progress, 2007, 44(10): 61-68.

[14] Piatrou P, Roggemann M. Beaconless stochastic parallel gradient descent laser beam control: numerical experiments[J]. Applied Optics, 2007, 46(27): 6831-6842.

[15] Xie Z L, Ma H T, He X J, et al. Adaptive piston correction of sparse aperture systems with stochastic parallel gradient descent algorithm[J]. Optics Express, 2018, 26(8): 9541-9551.

[16] Song Y, Chen T, Wang J L, et al. Optimization of stochastic parallel gradient descent algorithm via power spectrum method[J]. Applied Mathematics & Information Sciences, 2016, 10(1): 325-332.

[17] Weyrauch T, Vorontsov M A, Bifano T G, et al. Adaptive optics system with micromachined mirror array and stochastic gradient descent controller[J]. Proceedings of SPIE, 2000, 4124: 178-189.

[18] 徐友会, 佟首峰. 自适应光学随机并行梯度下降控制算法的研究[J]. 长春大学学报, 2013, 23(4): 391-393.

    Xu Y H, Tong S F. Research of adaptive optics based on SPGD[J]. Journal of Changchun University, 2013, 23(4): 391-393.

[19] 吴健, 杨慧珍, 龚成龙. 基于分段随机扰动幅值的随机并行梯度下降算法研究[J]. 中国激光, 2014, 41(7): 0712001.

    Wu J, Yang H Z, Gong C L. Research of stochastic parallel gradient descent algorithm based on segmentation random disturbance amplitude[J]. Chinese Journal of Lasers, 2014, 41(7): 0712001.

[20] 黄智蒙, 唐选, 刘仓理, 等. 变增益随机并行梯度下降算法及其在相干合成中的应用[J]. 中国激光, 2015, 42(4): 0402004.

    Huang Z M, Tang X, Liu C L, et al. Stochastic parallel gradient descent algorithm with a variable gain coefficient and its application in coherent beam combining[J]. Chinese Journal of Lasers, 2015, 42(4): 0402004.

[21] 蒋鹏志, 梁永辉, 许洁平, 等. 一种改进的全局耦合的随机并行梯度下降算法[J]. 光学学报, 2014, 34(s2): s214003.

    Jiang P Z, Liang Y H, Xu J P, et al. Improved method of stochastic parallel gradient descent algorithm with global coupling[J]. Acta Optica Sinica, 2014, 34(s2): s214003.

[22] 杨慧珍, 李新阳, 姜文汉. 自适应光学系统随机并行梯度下降控制算法仿真与分析[J]. 光学学报, 2007, 27(8): 1355-1360.

    Yang H Z, Li X Y, Jiang W H. Simulation and analysis of stochastic parallel gradient descent control algorithm for adaptive optics system[J]. Acta Optica Sinica, 2007, 27(8): 1355-1360.

[23] Harvey J E, Callahan G M. Wavefront error compensation capabilities of multi-actuator deformable mirrors[J]. Proceedings of SPIE, 1978, 141: 50-58.

[24] 饶学军, 凌宁, 姜文汉. 用数字干涉仪测量变形镜影响函数的实验研究[J]. 光学学报, 1995, 15(10): 1446-1451.

    Rao X J, Ling N, Jiang W H. Experiment of measuring influence function of deformable mirror using digital interferometer[J]. Acta Optica Sinica, 1995, 15(10): 1446-1451.

胡栋挺, 申文, 马文超, 刘新宇, 苏宙平, 朱华新, 张秀梅, 阙立志, 朱卓伟, 张逸新, 陈国庆, 胡立发. 一种快速收敛的随机并行梯度下降算法[J]. 激光与光电子学进展, 2019, 56(12): 122201. Dongting Hu, Wen Shen, Wenchao Ma, Xinyu Liu, Zhouping Su, Huaxin Zhu, Xiumei Zhang, Lizhi Que, Zhuowei Zhu, Yixin Zhang, Guoqing Chen, Lifa Hu. Fast Convergence Stochastic Parallel Gradient Descent Algorithm[J]. Laser & Optoelectronics Progress, 2019, 56(12): 122201.

本文已被 5 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!