基于强化学习的准分子激光器能量控制算法研究 下载: 1010次
Energy Control of Excimer Laser Based on Reinforcement Learning
1 中国科学院微电子研究所光电研发中心, 北京 100029
2 中国科学院大学, 北京 100049
图 & 表
图 1. 准分子激光器恒高压工作模式下单脉冲能量变化规律
Fig. 1. Single pulse energy change under constant high voltage working mode of excimer laser
下载图片 查看原文
图 2. 准分子激光器单脉冲能量仿真模型示意图
Fig. 2. Schematic of single pulse energy simulation model of excimer laser
下载图片 查看原文
图 3. 相同工作模式下实测和模型产生一个Burst的脉冲能量变化对比。(a)实测Burst脉冲能量;(b)模型Burst脉冲能量
Fig. 3. Comparison of Burst's pulse energy change measured and model under the same working mode. (a) Measured Burst pulse energy; (b) model Burst pulse energy
下载图片 查看原文
图 4. 基于强化学习的准分子激光器控制系统
Fig. 4. Control system of excimer laser based on reinforcement learning
下载图片 查看原文
图 5. 出光能量值对比。(a) Z-N参数整定的PI算法;(b) PSO整定的PI算法;(c)基于强化学习的算法
Fig. 5. Comparison of light energy values. (a) Z-N parameter tuning PI algorithm; (b) PSO tuning PI algorithm; (c) algorithm based on reinforcement learning
下载图片 查看原文
图 6. 算法单脉冲能量直方图对比。(a) Z-N参数整定的PI算法;(b) PSO整定的PI算法;(c)基于强化学习的算法
Fig. 6. Comparison of algorithm single pulse energy histograms. (a) Z-N parameter tuning PI algorithm; (b) PSO tuning PI algorithm; (c) algorithm based on reinforcement learning
下载图片 查看原文
图 7. Burst能量稳定性对比图。(a) Z-N参数整定的PI算法;(b) PSO整定的PI算法;(c)基于强化学习的算法
Fig. 7. Comparison of Burst energy stability. (a) Z-N parameter tuning PI algorithm; (b) PSO tuning PI algorithm; (c) algorithm based on reinforcement learning
下载图片 查看原文
图 8. Burst剂量精度对比。(a)Z-N参数整定的PI算法;(b)PSO整定的PI算法;(c)基于强化学习的算法
Fig. 8. Comparison of Burst dose stability. (a) Z-N parameter tuning PI algorithm; (b) PSO tuning PI algorithm; (c) algorithm based on reinforcement learning
下载图片 查看原文
图 9. 动态稳定性对比。(a) Z-N参数整定的PI算法;(b) PSO整定的PI算法;(c)基于强化学习的算法
Fig. 9. Comparison of dynamic stability. (a) Z-N parameter tuning PI algorithm; (b) PSO tuning PI algorithm; (c) algorithm based on reinforcement learning
下载图片 查看原文
表 1PI控制器参数变化范围
Table1. Parameter range of PI controller
Parameter | Kp1 | Ki1 | Kp2 | Ki2 | Kp3 | Ki3 |
---|
Range | [90,110] | [240,260] | [40,60] | [30,50] | [40,60] | [10,30] | Table | Q-table1 | Q-table2 | Q-table3 | Q-table4 | Q-table5 | Q-table6 |
|
查看原文
表 2算法能量数据信息
Table2. Algorithm energy data information
Algorithm | Min | Max | Average | Median | Range | σ |
---|
Z-N | 9.263 | 10.66 | 10 | 10 | 1.397 | 0.1645 | PSO | 9.196 | 10.72 | 9.999 | 10 | 1.524 | 0.1889 | RL | 9.055 | 10.62 | 10 | 10 | 1.565 | 0.1293 |
|
查看原文
表 3动态稳定性数据
Table3. Dynamic stability data
Algorithm | Pulse | Energy /mJ | Time /s |
---|
Z-N | 3009 | 10.89 | 0.101 | PSO | 2404 | 10.80 | 0.165 | RL | 1509 | 10.89 | 0.068 |
|
查看原文
孙泽旭, 冯泽斌, 周翊, 刘广义, 韩晓泉. 基于强化学习的准分子激光器能量控制算法研究[J]. 中国激光, 2020, 47(9): 0901002. Sun Zexu, Feng Zebin, Zhou Yi, Liu Guangyi, Han Xiaoquan. Energy Control of Excimer Laser Based on Reinforcement Learning[J]. Chinese Journal of Lasers, 2020, 47(9): 0901002.