红外与激光工程, 2022, 51 (7): 20210759, 网络出版: 2022-12-20  

空间光波前畸变校正中的元启发式SPGD算法 下载: 531次

Meta-heuristic SPGD algorithm in spatial light wavefront distortion correction
作者单位
1 重庆邮电大学 通信与信息工程学院,重庆 400065
2 信号与信息处理重庆市重点实验室,重庆 400065
摘要
为了改善传统随机并行梯度下降(Stochastic Parallel Gradient Descent, SPGD)算法收敛速度慢且容易陷入局部极值的问题,提出了一种元启发式随机并行梯度下降(Meta-Heuristic SPGD, MHSPGD)算法。该算法将SPGD算法和元启发式算法的开发与探索两步结合,首先利用SPGD算法的梯度下降搜索得到局部最优解,然后进行邻域搜索得到局部最优区域以外的可能最优解,通过所有解性能指标的比较来确定新的迭代起点。随着搜索范围的自适应扩展,该算法能够避免陷入局部极值并趋向收敛于全局最优。同时,为了避免重复搜索,建立了记忆表来记录迭代过程中产生的次最优解。搭建了无波前探测器自适应光学系统模型,运用所提算法对不同湍流强度下的波前畸变进行了仿真校正,并针对不同Zernike阶数的像差进行了仿真实验。在三种湍流强度下,MHSPGD算法所能达到的斯特列尔比(Strehl Ratio, SR)分别为0.7621、0.6554、0.3749,相比于SPGD算法分别提升了0.1%、2%和18.6%。此外,当畸变中含有较多高阶成分时,文中所提优化算法相比传统的SPGD算法,SR收敛到0.6所需的迭代次数减少了约47%,且SR收敛极限值也提升了约9.4%。结果表明:与三种主流优化算法相比,MHSPGD在保持较快收敛速度的同时,能够在各种湍流强度下达到更高的收敛极限,有效地解决了算法的局部收敛问题。
Abstract
To improve the problem of slow convergence speed and ease of falling into the local extreme value of the traditional stochastic parallel gradient descent (SPGD) algorithm, a meta-heuristic SPGD (MHSPGD) algorithm is proposed. The proposed algorithm combines the exploration and exploitation of the metaheuristic algorithm with the SPGD algorithm. First, the gradient descent search of the SPGD algorithm is used to obtain the local optimal solution, and then the neighborhood search is carried out to obtain the possible optimal solution outside the local optimal region. The new starting point of iteration is determined by comparing the performance indexes of all solutions. With the adaptive expansion of the search range, the algorithm can avoid falling into the local extremum and tends to converge to the global optimum. At the same time, to avoid repeated searches, a memory table is established to save the suboptimal solution generated in the iterative process. The model of the wavefront sensor-less adaptive optics system was established, and the proposed algorithm was used to correct the wavefront distortion under different turbulence intensities. A simulation of distortions under different Zernike orders was also carried out. Under three turbulence intensities, the Strehl ratios (SR) of the MHSPGD algorithm are 0.7621, 0.6554 and 0.3749, which are 0.1%, 2% and 18.6% higher than those of the SPGD algorithm. In addition, when the distortion contains more high-order components, compared with the traditional SPGD algorithm, the number of iterations required for SR convergence to 0.6 is reduced by approximately 47%, and the limit value of SR convergence is increased by approximately 9.4% for the proposed algorithm. The results show that compared with the three main optimization algorithms, MHSPGD can achieve a higher convergence limit under various turbulence intensities while maintaining a faster convergence rate, which means it effectively solves the problem of local convergence.

0 引 言

自由空间光通信(Free space optical communication, FSOC)是一种利用激光作为信息载体,以大气作为传输媒介进行信息传输的技术。FSOC系统综合了无线通信和微波通信的优点,具有频谱宽、容量大、架设方便和抗干扰能力强等特点[1]。然而,光传播路径上的大气湍流会导致激光光束在传输过程中产生相位畸变、光束漂移和扩散,使得接收端的光信号能量不稳定、集中度不高,从而造成光纤耦合效率下降、误码率升高[2]。为此,研究人员提出并深入研究了多种大气效应抑制技术,如:大孔径接收技术[3]、分集技术[4]、部分相干光技术[5]、自适应光学(Adaptive Optics, AO)技术[6]等。其中,AO技术以较易实现且能够对光束波前进行动态检测和实时校正的优点在FSOC领域得到广泛应用。

目前,用于波前畸变校正的AO系统主要有两类,即基于波前传感器的AO系统[7]和无波前传感器(Wave Front Sensor-less, WFS-less)AO系统[8]。相较于前者,WFS-less AO系统具有结构简单、无需进行波前测量和重构的特点,其利用波前畸变校正算法优化波前校正器的控制信号,通过迭代实现波前畸变的校正。因此,算法本身的性能直接影响着WFS-less AO系统的波前畸变校正效果[9]。在众多校正算法,如随机并行梯度下降(Stochastic Parallel Gradient Descent, SPGD)算法[10]、模拟退火算法[11]、蚁群算法[12]中,SPGD算法由于其效率高、易于实现等优点受到广泛关注。然而,由于不同实验条件下参数的最优取值范围不同,SPGD算法存在收敛速度慢、对不同初始值和初始像差的适应性较差、容易因搜索路径上的极值点陷入局部最优等缺点。

近年来,众多学者在提升SPGD算法的收敛速度和改善收敛极限方面进行了大量研究。马士青等提出了一种自适应增益及联合指标优化的SPGD算法[13],通过自适应地调整相关系数指标函数和环围能量比指标函数在迭代过程中的比重,实现算法的高效收敛。然而,由于没有考虑局部极值点的存在,无法解决SPGD算法局部收敛的问题。Hu等将Adam优化器和自适应增益系数估计结合到SPGD算法中,提出了自适应随机并行梯度下降(Adaptive Stochastic Parallel Gradient Descent,ASPGD)算法[14]。该算法加快了SPGD算法的收敛速度,实现了高效光纤耦合,但是当迭代次数足够大的时候,算法的步长搜索方向会出现偏差,导致性能指标值下降。Yang等将动量方法与SPGD算法相结合,采用内斯特罗夫动量法作为传统动量法的修正,提出了动量随机并行梯度下降(Momentum Stochastic Parallel Gradient Descent,MSPGD)算法[15],不仅加快了迭代速度,而且保证了相干光束合成过程的稳定性。但是算法缺乏对局部极值的考虑,无法很好地满足实时性要求。

为了解决SPGD算法容易陷入局部极值的问题,文中提出一种MHSPGD算法。MHSPGD算法将SPGD算法和元启发式算法的开发与探索两步结合,利用SPGD算法的梯度下降搜索得到局部最优解,然后以该解为起点,在合适范围内寻找可能的最优解。通过搜索范围的自适应扩展,该算法能够避免陷入局部极值并趋向收敛于全局最优。

1 基本原理

1.1 WFS-less AO系统工作原理

典型的WFS-less AO系统结构如图1所示[16]。待校正波前通过变形镜(Deformable Mirror, DM)反射后,通过聚焦透镜将含有畸变信息的光束传递给电荷耦合器件(Charge Coupled Device, CCD)相机接收;CCD相机将接收到的含有畸变的波前信息传递给波前控制器;波前控制器(通常包含图像采集部分、控制算法部分和D/A转换部分)将接收到的图像信息进行分析处理后,通过所搭载的性能优化算法对波前信息的性能评价函数进行计算,从而得到作用于变形镜的使残余波前畸变最小的最优控制电压,然后通过D/A转换和高压放大部分将控制电压传递给变形镜,使其产生与波前畸变相位共轭的面形,最终使得波前畸变得到校正。

图 1. WFS-less AO系统原理图

Fig. 1. Schematic diagram of WFS-less AO system

下载图片 查看所有图片

1.2 畸变波前的相位屏模拟

在AO系统中,光束经过大气湍流干扰后产生的带有畸变的波前相位可以用Zernike多项式描述[17],如下所示:

$ \phi \left( r \right) = \displaystyle \sum\limits_{i = 1}^\infty {{a_i}{Z_i}\left( r \right)} $ (1)

式中: $ \phi \left( r \right) $为畸变相位; $ {Z_i}\left( r \right) $为Zernike多项式的第 $ i $项; $ {a_i} $为Zernike多项式第 $ i $项的加权系数。 $ {Z_i}\left( r \right) $及其偶数项 $ {Z_{eveni}} $、奇数项 $ {Z_{oddi}} $的表达式分别为:

$ Z_n^m\left( {r,\theta } \right)\left\{ {\begin{array}{*{20}{l}} {{Z_i}\left( r \right) = \sqrt {n + 1} R_n^0\left( r \right),m = 0} \\ {{Z_{eveni}} = \sqrt {n + 1} R_n^m\left( r \right)\sqrt 2 \cos \left( {m\theta } \right),m \ne 0} \\ {{Z_{oddi}} = \sqrt {n + 1} R_n^m\left( r \right)\sqrt 2 \sin \left( {m\theta } \right),m \ne 0} \end{array}} \right. $ (2)

式中: $ R_n^m\left( r \right) $为径向多项式。且

$ R_n^m\left( r \right) = \displaystyle \sum\limits_{s = 0}^{\left( {n - m} \right)/2} {\dfrac{{{{\left( { - 1} \right)}^s}\left( {n - s} \right)!}}{{s!\left[ {\left( {n + m} \right)/2 - s} \right]!\left[ {\left( {n - m} \right)/2 - s} \right]!}}} {r^{n - 2s}} $ (3)

式中: $ m $表示方位频率; $ n $表示径向次数; $ {a_i} $可由Noll定义的Kolmogorov湍流下Zernike模式间的统计相关性和基于Zernike多项式的Karhunen-Loeve函数展开法计算得到。根据公式(1)~(3)可以得到拟合波前所需的所有Zernike多项式。

1.3 DM模型和波前质量评价指标

DM是执行AO系统中畸变校正的器件,其根据驱动电压产生形变从而改变光波的几何长度,进而改变相位分布,产生与波前像差共轭的补偿相位,最终达到对畸变相位的校正。文中采用36单元DM对畸变相位进行校正,其驱动器位置排布如图2所示。DM镜面形变产生的相位分布可以表示为[18]

图 2. 36单元变形镜驱动器位置排布图

Fig. 2. Actuators location of 36-element deformable mirror

下载图片 查看所有图片

$ {u_c}\left( {x,y} \right) = \displaystyle \sum\limits_{j = 1}^N {{u_j}{S_j}\left( {x,y} \right)} $ (4)

式中: $ N $为变形镜驱动器的个数; $ {u_j} $为第 $ j $个驱动器上的驱动电压; $ {S_j}\left( {x,y} \right) $为第 $ j $个驱动器的影响函数,服从高斯分布:

$ {S_j}\left( {x,y} \right) = \exp \left\{ {\ln {C_m}\dfrac{{{{\left[ {{{\left( {x - {x_j}} \right)}^2} + {{\left( {y - {y_j}} \right)}^2}} \right]}^g}}}{{{r_c^{2g}}}}} \right\} $ (5)

式中: $ \left( {{x_j},{y_j}} \right) $为镜面上第 $ j $个驱动器的中心坐标; $ {C_m} $为驱动器交连值; $ g $为高斯指数; $ {r_c} $为驱动器间距。

在FSOC系统中,用于衡量波前图像成像质量的性能评价指标有强度分布平方和、环围能量比、斯特列尔比(Strehl Ratio, SR)等。其中,被广泛使用的是SR[19],其表达式为:

$ SR = \exp \left[ { - \sigma _\varphi ^2} \right] $ (6)

式中: $ \sigma _\varphi ^2 $为波前畸变相位的方差。可见,SR仅取决于相位的方差,而且对相位方差很敏感,因此非常适合于评价波前的质量。

2 元启发式SPGD算法

2.1 传统SPGD算法

SPGD算法利用波前校正器的控制电压与指标函数的近似正相关关系,通过寻优算法优化指标函数获得校正电压信号,是一种多次迭代、并行扰动的算法,其电压迭代更新公式为:

$ u_i^{(n + 1)} = u_i^{(n)} + \gamma \delta {u_i}\delta {J^{\left( n \right)}} $ (7)

式中: $ u_i^{(n + 1)} $$ u_i^{(n)} $分别代表第 $ n + 1 $次和第 $ n $次迭代施加在DM上的控制电压; $ \gamma $代表增益系数; $ \delta {u_i} $为第 $ n $次迭代时施加的随机扰动电压向量; $ \delta {J^{\left( n \right)}}{\text{ = }}\left[ {J_ + ^{(n)} - J_ - ^{(n)}} \right] $$ J_ + ^{(n)} $$ J_ - ^{(n)} $分别通过将电压 $ u_i^{(n)} + \delta u_i^{(n)} $$ u_i^{(n)} - \delta u_i^{(n)} $施加到变形镜上计算得到。

SPGD算法缺乏对局部极值的有效处理,当算法搜索的解空间中存在多个相似性能指标 $ J $值时, $ J $值计算的微小差异使得 $ \delta J $值变化很小,算法会在一个局部区域内重复搜索多次,而固定的梯度更新方向使得算法无法跳出这一区域去寻找剩余解空间中的全局最优解,从而造成算法的局部收敛。针对这一问题,下面结合元启发式算法对SPGD算法进行优化,以取得更好的波前畸变校正效果。

2.2 元启发式SPGD算法原理

元启发式算法[20]通常包含探索和开发两个基本步骤。探索是一种局部搜索,其目的是找到目前为止的最优解,确保算法搜索的深度;开发是在探索中解的有效性无法得到改善时启动的全局搜索步骤,确保算法搜索的广度。文中将SPGD算法和元启发式算法的开发与探索两步结合,利用SPGD算法的梯度下降搜索得到局部最优解。然后以该解为起点,在合适范围内寻找可能的最优解,通过搜索范围的自适应扩展避免算法陷入局部极值并趋向收敛于全局最优。同时,为了避免重复搜索,模拟禁忌搜索算法的禁忌列表策略,建立记忆内存表以记录迭代过程中产生的次优解,避免表中的解再次出现在迭代过程中。

由1.3节可知,波前相位畸变主要由DM产生的形变进行补偿。假设DM引入的相位为:

$ u\left( r \right) =\displaystyle \sum\limits_{j = 1}^N {{v_j}{S_j}\left( r \right)} + \displaystyle \sum\limits_{k = 2}^M {{a_k}{{\hat Z}_k}\left( r \right)} $ (8)

式中: $ {\hat Z_k}\left( r \right) $为Zernike多项式的近似; $ {S_j}\left( r \right) $为第 $ j $个驱动器所对应的响应函数。由于需要校正的畸变不仅包括大气湍流产生的,还有经DM补偿后的残余相位畸变,所以 $ {\hat Z_k}\left( r \right) $可以表示为:

$ \begin{split} &{\widehat{Z}}_{k}\left(r\right)={\displaystyle \sum _{j=1}^{N}{c}_{kj}{S}_{j}\left(r\right)} \\ &{c}_{kj}\text=\dfrac{1}{{a}^{2}}{\displaystyle \int {Z}_{k}\left({r}^{\prime }\right){S}_{j}\left({r}^{\prime }\right){d}^{2}{r}^{\prime }},k=2,\cdots M \end{split} $ (9)

式中: $ a $为校正器直径。由公式(8)和公式(9)可得施加到DM上的实际驱动信号为:

$  u\left(r\right)={\displaystyle \sum _{j=1}^{N}{u}_{j}{S}_{j}\left(r\right)}  {u}_{j}={v}_{j}+{\displaystyle \sum _{k=2}^{M}{c}_{kj}{a}_{k}} $ (10)

式中:代表平均相位的 $ {Z_1}\left( r \right) $可以忽略; $ \left\{ {{v_j}} \right\} $$ \left\{ {{a_k}} \right\} $是对性能度量函数 $ J $有影响的控制参数,分别与大规模畸变和残余小规模畸变有关,其作用原理与扰动电压 $ {u_i} $相同,通过将它们代入迭代过程中进行分析,可以得知 $ {u_i} $在各种畸变混合存在的湍流中对校正效果的影响。根据SPGD算法的迭代过程可以将其表示为:

$ \begin{split} &{v}_{j}^{\left(m+1\right)}={v}_{j}^{\left(m\right)}-\mu \delta J\delta {v}_{j},j=1,\cdots ,N \\ &a_k^{\left( {m + 1} \right)} = a_k^{\left( m \right)} - \mu \delta J\delta {a_k},k = 2, \cdots ,M \end{split} $ (11)

由于 $ \left\{ {{v_j}} \right\} $$ \left\{ {{a_k}} \right\} $为统计独立的随机变量,其对光束质量的影响相互独立,故有:

$ \begin{split} &\langle \delta {v}_{j}\delta {a}_{i}\rangle =0 \\ &\langle \delta {v}_{j}\delta {v}_{i}\rangle ={\sigma }^{2}{\delta }_{ji} \\ &\langle \delta {a}_{j}\delta {a}_{i}\rangle ={\alpha }_{0}^{2}\langle {a}_{j}^{2}\rangle {\delta }_{ji} \end{split} $ (12)

式中: $ \left\langle {a_j^2} \right\rangle {\text{ = }}\beta _j^2{\left( {D/{r_0}} \right)^{5/3}} $为Zernike扩展系数的方差; $\; \beta _j^2 $为Zernike模式系数; $ {\delta _{ji}} $为Kronecker符号( $ j = i $时取值1,其他情况下取值0); $ {\sigma ^2} = \left\langle {b_j^2} \right\rangle $$ {b_j} = \dfrac{1}{s}\int {\phi \left( r \right){S_j}\left( r \right){{\rm{d}}^2}r} $为残余相位的系数。由公式(10)和(12)可得:

$ \begin{split} \langle \delta {u}_{j}\delta {u}_{i}\rangle =&{\sigma }^{2}{\delta }_{ji}+{\displaystyle \sum _{k=2}^{M}{c}_{kj}{c}_{ki}\langle {a}_{k}^{2}\rangle }=\\ &{\sigma }^{2}{\delta }_{ji}+{\alpha }_{0}^{2}\left({\displaystyle \sum _{k=2}^{M}{c}_{kj}{c}_{ki}{\beta }_{k}^{2}}\right){\left(D/{r}_{0}\right)}^{5/3} \end{split} $ (13)

式中: ${\alpha _0} = P{\left( {\displaystyle \sum\limits_{j = 1}^N {\left\langle {b_j^2} \right\rangle } } \right)^{ - 1/2}}$$ P \ll 1 $为一个常数。

随机扰动信号 $  \delta {u}_{i} $导致的性能指标变化可表示为:

$ \delta J = J\left( {{u_1} + \delta {u_1},{u_2} + \delta {u_2}, \cdots ,{u_N} + \delta {u_N}} \right) - J\left( {{u_1},{u_2}, \cdots ,{u_N}} \right) $ (14)

将公式(14)进行泰勒级数展开可得:

$ \delta J={\displaystyle \sum _{j}^{N}\dfrac{\partial J}{\partial {u}_{j}}\delta }{u}_{j}+\dfrac{1}{2}{\displaystyle \sum _{j,k}^{N}\dfrac{{\partial }^{2}J}{\partial {u}_{j}\partial {u}_{k}}}\delta {u}_{j}\delta {u}_{k}+\cdots $ (15)

将公式(15)两边同时乘以 $  \delta {u}_{i} $并求数学期望可得:

$ \left\langle {\delta J\delta {u_i}} \right\rangle = \displaystyle \sum\limits_j^N {\dfrac{{\partial J}}{{\partial {u_j}}}} \left\langle {\delta {u_j}\delta {u_i}} \right\rangle + \dfrac{1}{2}\sum\limits_{j,k}^N {\dfrac{{{\partial ^2}J}}{{\partial {u_j}\partial {u_k}}}} \left\langle {\delta {u_j}\delta {u_i}\delta {u_k}} \right\rangle + \cdots $ (16)

由公式(13)和(16)可得:

$ \begin{split} \langle \delta J\delta {u}_{i}\rangle \text=&\dfrac{\partial J}{\partial {u}_{i}}\langle {\left(\delta {u}_{i}\right)}^{2}\rangle +{\displaystyle \sum _{j\ne i}^{N}\dfrac{\partial J}{\partial {u}_{j}}}\langle \delta {u}_{j}\delta {u}_{i}\rangle +\\ &\dfrac{1}{2}{\displaystyle \sum _{j,k}^{N}\dfrac{{\partial }^{2}J}{\partial {u}_{j}\partial {u}_{k}}}\langle \delta {u}_{j}\delta {u}_{k}\delta {u}_{i}\rangle +\cdots \cong\\ & \dfrac{\partial J}{\partial {u}_{j}}\left[{\sigma }^{2}+\kappa {\displaystyle \sum _{k=2}^{M}\left({c}_{kj}\langle {\beta }_{k}^{2}\rangle \right)}\right]+\\ & \kappa {\displaystyle \sum _{i\ne j}^{N}\dfrac{\partial J}{\partial {u}_{i}}}{\displaystyle \sum _{k=2}^{M}\left({c}_{kj}{c}_{ki}\langle {\beta }_{k}^{2}\rangle \right)} \end{split} $ (17)

式中: $ \kappa {\text{ = }}\alpha _0^2{\left( {D/{r_0}} \right)^{5/3}} $。因为随机并行扰动 $ \delta {u_i} $为服从伯努利分布的统计独立变量,所以有:

$  \langle \delta {u}_{i}\rangle =0,\langle \delta {u}_{i}\delta {u}_{j}\delta {u}_{k}\rangle =0 $ (18)

因此,公式(17)可简化为:

$  \langle \delta J\delta {u}_{i}\rangle \text=\dfrac{\partial J}{\partial {u}_{i}}{\sigma }^{2}+o\left({\sigma }^{4}\right) $ (19)

可见,扰动电压 $ \left\{ {{u_i}} \right\} $的取值对梯度更新的关键变量 $ \delta J\delta {u_i} $有重要影响。通过寻找使性能指标函数表现最好的 $ \left\{ {{u_i}} \right\} $的取值,就可以找到给定解空间中使性能指标函数收敛到全局最优的解,从而实现对应于Zernike多项式模拟的波前畸变的全局优化,使算法取得更好的校正效果。

为此,当算法陷入局部最优区域后,文中通过公式:

$ {Y_i} = {u_i} + rand \times \left[ {{u_b} - {u_i}} \right],i = 1, \cdots ,5 $ (20)

在局部最优解附近进行邻域搜索以获得新的解。这里 $ rand $为0~1之间的随机数, $ {u_b} $为局部最优解,其为判定算法局部收敛时扰动电压的取值, $ {u_i} $为当前解, $ {Y_i} $代表扩展的解空间中的侯选最优解。

此外,为了提升算法的收敛速度和效率,避免反复搜索次优解,采用记忆内存表来存储迭代过程中产生的次优解。首先,将得到的新解与局部最优解放入同一种群中,通过计算种群中解的性能指标并进行排序得到最优解。若最优解的性能指标优于当前局部最优解,则以该解为起点继续进行算法迭代,其余解放入记忆内存表中;反之,则将所有解放入记忆内存表中,并由公式(20)继续寻找最优解。

2.3 算法流程

综上,元启发式SPGD算法的处理流程如图3所示,主要步骤如下:

图 3. MHSPGD算法流程图

Fig. 3. Flow chart of MHSPGD algorithm

下载图片 查看所有图片

(1) 探索:此步骤对应于传统SPGD算法的梯度下降搜索。程序初始化增益系数 $ \gamma $、电压向量 $ {u^{\left( 0 \right)}} $及迭代计数器 $ n $后,进入主循环。第 $ n $次迭代时,首先生成扰动电压 $ \Delta {u^{\left( n \right)}} $,把电压 $ {u^{\left( {n - 1} \right)}} + \Delta {u^{\left( n \right)}} $$ {u^{\left( {n - 1} \right)}} - \Delta {u^{\left( n \right)}} $分别加到DM各驱动器,然后计算得到 $ J_ + ^{\left( n \right)} $$ J_ - ^{\left( n \right)} $,根据公式(7)得到控制电压并计算得到当前SR值 $ {J^{\left( {n + 1} \right)}} $

(2) 开发:动态比较前后两次迭代的SR值,当SR的变化量越来越小时,根据收敛的数学定义,则可以认为算法正在逐步收敛,此时可以判定算法陷入了局部最优区域,启动全局搜索步骤纠正算法的搜索方向,并通过公式(20)在相邻范围内寻找可能存在的其他最优解。

(3) 记忆内存:通过比较候选最优解与局部最优解的性能指标判断扩展解空间中是否存在全局最优解。若存在,将该解替换为当前最优解;若不存在,则将所有的解放入记忆内存表中,避免重复搜索。

(4) 算法停止:随着搜索范围的不断扩展,记忆内存表中的解会不断更新,直到当前解的性能指标函数优于内存表中的所有元素,或者达到一定迭代次数时,算法停止迭代。

3 仿真结果与分析

为了验证所提算法的有效性,文中搭建了WFS-less AO系统模型,采用前36阶Zernike多项式模拟波前畸变,DM单元数为36,参数 $ {C_m} $$ g $$ {r_c} $的值分别为0.36、2、和0.3。仿真环境为64位Win10系统,处理器为Intel Core i5-9500,MATLAB版本为R2020b。以上述仿真环境为基础,分别在三种湍流条件下比较了文中所提MHSPGD算法与SPGD算法、ASPGD算法和MSPGD算法的波前畸变校正效果,每次的迭代次数设置为800。湍流的强弱程度用接收望远镜直径 $ D $和大气相干长度 $ {r_0} $的比值 $ D/{r_0} $表示,比值越大,湍流越强。波前质量评价指标为SR,其由公式(6)根据波前相位畸变的方差计算得到。

为了验证不同像差类型以及DM单元数对算法校正效果的影响,文中还进行了Zernike阶数为65以及DM单元数为61的情况下的仿真实验。

3.1 步长对收敛极限的影响

将扰动幅度固定为1,步长分别取如下四个值: $ {\gamma _1}{\text{ = }}0.5 $$ {\gamma _2}{\text{ = }}1 $$ {\gamma _3}{\text{ = }}1.5 $$ {\gamma _4}{\text{ = }}2 $。对不同取值的步长分别进行30次实验,分别画出每个步长的平均收敛曲线如图4所示。

图 4. 不同步长的收敛曲线

Fig. 4. Convergence curves of different step sizes

下载图片 查看所有图片

图4可知,当步长取值为1和1.5,算法收敛效果较好,当步长小于1时,收敛速度太慢,而大于1.5时,会造成收敛极限严重下降。因此,在后续的实验中,文中将收敛极限设置为1,以使得算法取得最佳的校正效果。

3.2 波前相位和远场图像

图5给出了三种湍流条件下SPGD算法和MHSPGD算法对不同波前畸变的10次平均校正效果对比。由图中可以看出,校正前三种湍流条件下的波前相位都存在着明显的像差且分布很不规则,相应的远场图像则存在着光斑质心漂移和分裂,中心区域周围散斑较多。这是由于大气湍流作用于传输信息的光束,使得波前相位发生畸变导致的,并且随着湍流强度的增大,湍流对波前相位和远场光斑的影响也越强。

图 5.

Fig. 5. Comparison of wavefront phase and farfield image correction effect between MHSPGD algorithm and SPGD algorithm. (a) ; (b) ; (c) MHSPGD算法和SPGD算法的波前相位和远场图像校正效果比较。(a) ;(b) ;(c)

下载图片 查看所有图片

图5(a)为 $ D/{r_0} = 5 $时SPGD算法和MHSPGD算法的校正效果比较。可见,经两种算法处理后,远场光斑质心收拢于中心区域,周围的散斑明显减少。这说明两种算法都对此湍流下的相位畸变有较好的校正效果。

图5(b)和5(c)所示,在 $ D/{r_0} $分别为8和10的湍流条件下,经SPGD算法处理后的远场光斑周围仍然分布着较多的杂散斑,并且由波前相位图像可以看出,校正后的光束中仍然存在着较多非共轭的严重畸变,尤其是在 $ D/{r_0}{\text{ = }}10 $的湍流条件下。而经过MHSPGD算法处理后,两种湍流条件下波前相位的严重畸变部分均有所减少,远场图像中的散斑逐渐消失,光斑光强明显增加,并且能量更加集中。但由于 $ D/{r_0} $的比值越大时,湍流所引起的光束光斑质心漂移和分裂现象就越严重,因此DM产生与畸变相位共轭的补偿相位的难度就会越大。因此,在 $ D/{r_0}{\text{ = }}10 $的仿真结果中,经校正的光斑图像仍然存在较大的校正残差。但相较于SPGD算法,文中所提MHSPGD算法在各种湍流条件下的校正效果都更优,算法的稳定性更高。

图 5.

Fig. 5. Comparison of wavefront phase and farfield image correction effect between MHSPGD algorithm and SPGD algorithm. (a) ; (b) ; (c) MHSPGD算法和SPGD算法的波前相位和远场图像校正效果比较。(a) ;(b) ;(c)

下载图片 查看所有图片

3.3 SR收敛曲线与算法计算时间

在相同湍流强度下,算法对不同初始畸变的校正效果比较接近,因此,选择其中一种初始畸变来进行收敛曲线的分析,图6为三种湍流条件下,SPGD算法、ASPGD算法、MSPGD算法和文中提出的MHSPGD算法对相同初始畸变进行30次校正后的平均SR曲线对比。如图6(a)所示,当湍流强度为5时,各算法最终收敛时的SR值相差不大,这说明各种算法都对此湍流条件下的畸变具有较好的校正效果。但从SR达到0.6时各算法所需的迭代次数可以看出,MHSPGD算法的收敛速度优于其他算法。此外,ASPGD算法在迭代后期会出现SR下降的现象,而其他算法则没有此现象。图6(b)所示为当湍流强度为8时,MHSPGD、ASPGD、MSPGD算法所能达到的最大SR相差不大,其中MHSPGD和MSPGD算法能保持稳定的收敛值,而ASPGD算法则会出现SR值下降的情况。与SPGD算法相比,MHSPGD算法在保持较快收敛速度的同时还具有更高的收敛值。如图6(c)所示,当湍流强度为10时,迭代前期MHSPGD算法的校正速度略低于APSGD算法和SPGD算法,但是最终达到的收敛极限最高。此外,ASPGD算法后期仍会出现收敛值振荡的现象,SPGD算法的最终收敛值远低于其他算法。综上,MHSPGD算法在收敛速度仅次于ASPGD算法的情况下达到了最高的收敛值,且能保持收敛稳定。

图 6.

Fig. 6. SR convergence curve comparison of different algorithms. (a) ; (b) ; (c) 不同算法的SR收敛曲线对比。(a) ;(b) ;(c)

下载图片 查看所有图片

表1列出了各算法在三种湍流条件下最终收敛时的SR值。可见,文中提出的MHSPGD算法在各种湍流条件下都能达到最高的SR,尤其是在 $ D/{r_0} $分别为8和10的湍流条件下优势更加明显。当 $ D/{r_0} $为10时,MHSPGD算法最终收敛时的SR相较于传统SPGD算法的提升了18.6%,这说明MHSPGD算法能有效地改善SPGD算法容易陷入局部极值的问题。

表 1. 不同湍流强度下各算法的SR值对比

Table 1. Comparison of SR value for each algorithm under different turbulence intensities

$ D/{r_0} $Initial SRSPGDMHSPGDASPGDMSPGD
50.08790.76140.76210.70110.7607
80.08350.63860.65540.61070.6545
100.00330.31610.37490.35160.3684

查看所有表

表2所示,为每个算法在各种湍流强度下的计算时间。由表2可知,当湍流强度为5时,除了MSPGD算法,其他算法的计算时间相差不大;当湍流强度为8时,MHSPGD算法相对于SPGD算法花费了多大约20 s的计算时间,但由图6(b)可知收敛极限也提高了,因此这可能是由于MHSPGD算法花费了更多的时间去寻找全局最优解;当湍流强度为10时,MHSPGD所花费的时间大约比SPGD算法多42 s,但仍然少于MSPGD算法和ASPGD算法,这同样是由于MHSPGD算法的局部最优区域跳出机制所带来的额外运算量,但考虑到最终收敛极限的提升,这样的代价是值得的。

表 2. 不同湍流强度下各算法的计算时间对比

Table 2. Comparison of computation time for each algorithm under different turbulence intensities

$ D/{r_0} $SPGD/sMHSPGD/sASPGD/sMSPGD/s
5211.91210.37214.49282.19
8243.46262.03325.96304.95
10207.40249.95363.15293.54

查看所有表

3.4 65阶Zernike多项式模拟像差

不同阶数的Zernike多项式描述的像差模式不同。前六阶分别代表几何光学像差中的活塞、倾斜、离焦、像散、彗形、球形像差等,而高阶部分则是各种像差的演变与延伸。适当增加Zernike阶数能改善湍流成分拟合的精度,但阶数增加过多会使得运算量显著提升,算法的拟合效率大大下降,对于拟合效果的改善却微乎其微。因此,文中采用Zernike阶数为65, $ D/{r_0} $为5时的仿真结果来对比算法在包含较多高阶像差时的校正效果。

图7(a)所示,当Zernike阶数为65时,相同湍流条件下,经SPGD算法校正后的波前相位相较于MHSPGD算法来说仍然有较多的非平稳成分,图像中的散斑较多。从图7(b)中可以看出,无论收敛速度还是收敛极限,MHSPGD算法都要优于SPGD算法。迭代速度方面,在达到SR为0.6时SPGD算法需要约148次迭代,而MHSPGD算法只需要78次迭代。收敛极限方面,SPGD算法迭代结束后的SR为0.6495,而MHSPGD算法为0.7105。

图 7. Zernike阶数为65时,MHSPGD算法和SPGD算法校正效果比较。(a)波前相位和远场图像;(b) SR收敛曲线

Fig. 7. Comparison of correction effect between MHSPGD algorithm and SPGD algorithm when Zernike order is 65. (a) Wavefront phase and far-field images; (b) SR convergence curve

下载图片 查看所有图片

可见,当畸变中包含较多高阶成分时,MHSPGD算法的校正效果要优于SPGD算法,这说明MHSPGD算法对于高阶像差的校正能力要强于SPGD算法。

3.5 DM单元数对校正效果的影响

在自适应光学中,为了达到更好的校正效果,通常会同通过增加DM单元数的方法来实现,为了研究不同DM单元数对校正效果的影响,本节在湍流强度为10的条件下对比分析了MHSPGD算法和SPGD算法分别在36单元DM和61单元DM下的SR曲线,其中61单元变形镜的驱动器位置排布如图8所示。

图 8. 61单元变形镜驱动器位置排布图

Fig. 8. Actuators location of 61 units deformable mirror

下载图片 查看所有图片

图9所示,在61单元DM下,MHSPGD算法和SPGD算法的收敛极限均有所提高,分别达到了0.42和0.35;另外,算法的收敛速度也取得了一定的提升。但是,在实际应用中,增加DM单元数会增加系统的复杂度,因此,需要权衡两者的关系,选择最合适的数目。

图 9. 36和61单元DM下MHSPGD算法和SPGD算法的SR曲线对比

Fig. 9. SR curve comparison of MHSPGD algorithm and SPGD algorithm under 36 and 61 units DM

下载图片 查看所有图片

4 结 论

针对空间光通信中的波前相位畸变问题,文中提出了一种元启发式随机并行梯度下降算法,并进行了不同湍流强度下的波前畸变校正仿真实验。结果表明:在弱、中湍流条件下,相比SPGD算法、ASPGD算法和MSPGD算法,文中所提MHSPGD算法在具有更快收敛速度的同时能够达到更高的收敛极限,这使得MHSPGD算法在实时性要求较高的FSOC系统中具有更大的优势;而在强湍流条件下,MHSPGD算法能够达到最高的收敛极限,对比SPGD算法提升了约18.6%。在包含较多高阶成分的65阶Zernike多项式模拟的畸变条件下,相比于SPGD算法,MHSPGD算法收敛时的SR提升了约9.4%,而对于SR达到0.6时的迭代次数,MHSPGD算法减少了约47%。综上所述,MHSPGD算法能有效地解决SPGD算法容易陷入局部极值的问题,具有良好的抑制湍流的能力,对于改善FSOC系统的信息传输质量有一定的应用前景。

参考文献

[1] 闫宝罗, 李晓龙, 张红伟, , et al. 锥形光纤在空间光通信耦合系统中的应用[J]. 光学精密工程, 2019, 27(2): 287-294.

    Yan B L, Li X L, Zhang H W, . Application of tapered fibers to free-space optical communication coupling system[J]. Optics and Precision Engineering, 2019, 27(2): 287-294.

[2] 李波, 王挺峰, 王弟男, , et al. 激光大气传输湍流扰动仿真技术[J]. 中国光学, 2012, 5(3): 289-295.

    Li B, Wang T F, Wang D N, . Simulation of laser beam propagation through turbulence[J]. Chinese Optics, 2012, 5(3): 289-295.

[3] Yuksel H, Davis C C. Aperture averaging analysis and aperture shape invariance of received scintillation in free space optical communication links[J]. Applied Physics Letters, 2006, 89(11): 234.

[4] 赵太飞, 王秀峰, 王花, , et al. 弱湍流中紫外光非直视分集接收技术的研究[J]. 红外与激光工程, 2018, 47(12): 1222002.

    Zhao T F, Wang X F, Wang H, . Research on ultraviolet non-line-of-sight diversity reception technology in weak turbulence[J]. Infrared and Laser Engineering, 2018, 47(12): 1222002.

[5] Deng Y, Wang H, Ji X L, , et al. Characteristics of high-power partially coherent laser beams propagating upwards in the turbulent atmosphere[J]. Optics Express, 2020, 28(19): 27927-27939.

[6] Cui S Y, Zhao X H, He X, , et al. A quick hybrid atmospheric-interference compensation method in a WFS-less free-space optical communication system[J]. Current Optics & Photonics, 2018, 2(6): 612-622.

[7] 贾启旺, 李新阳, 罗曦. 自适应光学系统运行失稳检测方法[J]. 红外与激光工程, 2020, 49(10): 20200299.

    Jia Q W, Li X Y, Luo X. Detection methods for instability of adaptive optics system[J]. Infrared and Laser Engineering, 2020, 49(10): 20200299.

[8] Tian Q H, Lu C D, Liu B, , et al. DNN-based aberration correction in a wavefront sensorless adaptive optics system[J]. Optics Express, 2019, 28(8): 10765-10766.

[9] Zhai Y W, Fu S Y, Zhang J Q, , et al. Turbulence aberration correction for vector vortex beams using deep neural networks on experimental data[J]. Optics Express, 2020, 28(5): 7515-7527.

[10] 宋纪坤, 李远洋, 车东博, , et al. 湍流大气对光束相干合成效果的影响[J]. 中国光学, 2020, 13(4): 884-898.

    Song J K, Li Y Y, Che D B, . Influence of turbulent atmosphere on the effect of coherent beam combining[J]. Chinese Optics, 2020, 13(4): 884-898.

[11] 龙柏君, 欧龙, 向汝建, , et al. 利用模拟退火优化快速反射镜控制策略[J]. 光学精密工程, 2016, 24(9): 2232-2239.

    Long B J, Ou L, Xiang R J, . Optimization of control strategy for FSM system by using simulated annealing algorithm[J]. Optics and Precision Engineering, 2016, 24(9): 2232-2239.

[12] 石晓东, 李勇军, 赵尚弘, , et al. 软件定义卫星光网络蚁群优化波长路由技术[J]. 红外与激光工程, 2020, 49(10): 20200295.

    Shi X D, Li Y J, Zhao S H, . Ant colony optimization routing and wavelength technology for software-defined satellite optical networks[J]. Infrared and Laser Engineering, 2020, 49(10): 20200295.

[13] 马士青, 杨平, 赖柏衡, , et al. 基于高效随机并行梯度下降算法的板条激光光束净化[J]. 中国激光, 2020, 47(8): 0805001.

    Ma S Q, Yang P, Lai B H, . Slab laser beam cleanup based on efficient stochastic parallel gradient descent algorithm[J]. Chinese Journal of Lasers, 2020, 47(8): 0805001.

[14] Hu Q T, Zhen L L, Mao Y, , et al. Adaptive stochastic parallel gradient descent approach for efficient fiber coupling[J]. Optics Express, 2020, 28(9): 13141-13154.

[15] Yang G Q, Liu L S, Jiang Z H, , et al. Incoherent beam combining based on the momentum SPGD algorithm[J]. Optics & Laser Technology, 2018, 101: 372-378.

[16] 吴加丽, 柯熙政. 无波前传感器的自适应光学校正[J]. 激光与光电子学进展, 2018, 55(3): 030103.

    Wu J L, Ke X Z. Adaptive optics correction of wavefront sensorless[J]. Laser & Optoelectronics Progress, 2018, 55(3): 030103.

[17] Noll R J. Zernike polynomials and atmospheric turbulence[J]. Journal of the Optical Society of America, 1976, 66(3): 207-211.

[18] Lei X, Wang S, Yan H, , et al. Double-deformable-mirror adaptive optics system for laser beam cleanup using blind optimization[J]. Optics Express, 2012, 20: 22143-22157.

[19] 张森, 张军伟, 母杰, , et al. 基于随机并行梯度下降算法的相干合成动态相差控制与带宽分析[J]. 光学学报, 2018, 38(5): 0514003.

    Zhang S, Zhang J W, Mu J, . Dynamical phase error control and bandwidth analysis for coherent beam combination based on stochastic parallel gradient descent algorithm[J]. Acta Optica Sinica, 2018, 38(5): 0514003.

[20] Hayyolalam V, Kazem A. Black widow optimization algorithm: A novel meta-heuristic approach for solving engineering optimization problems[J]. Engineering Applications of Artificial Intelligence, 2020(87): 103249.

赵辉, 吕典楷, 安静, 邝凯达, 余孟洁, 张天骐. 空间光波前畸变校正中的元启发式SPGD算法[J]. 红外与激光工程, 2022, 51(7): 20210759. Hui Zhao, Diankai Lv, Jing An, Kaida Kuang, Mengjie Yu, Tianqi Zhang. Meta-heuristic SPGD algorithm in spatial light wavefront distortion correction[J]. Infrared and Laser Engineering, 2022, 51(7): 20210759.

引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!