中国激光, 2020, 47 (9): 0901002, 网络出版: 2020-09-16   

基于强化学习的准分子激光器能量控制算法研究 下载: 1010次

Energy Control of Excimer Laser Based on Reinforcement Learning
孙泽旭 1,2冯泽斌 1,2周翊 1,2刘广义 1,2韩晓泉 1,2,*
作者单位
1 中国科学院微电子研究所光电研发中心, 北京 100029
2 中国科学院大学, 北京 100049
图 & 表

图 1. 准分子激光器恒高压工作模式下单脉冲能量变化规律

Fig. 1. Single pulse energy change under constant high voltage working mode of excimer laser

下载图片 查看原文

图 2. 准分子激光器单脉冲能量仿真模型示意图

Fig. 2. Schematic of single pulse energy simulation model of excimer laser

下载图片 查看原文

图 3. 相同工作模式下实测和模型产生一个Burst的脉冲能量变化对比。(a)实测Burst脉冲能量;(b)模型Burst脉冲能量

Fig. 3. Comparison of Burst's pulse energy change measured and model under the same working mode. (a) Measured Burst pulse energy; (b) model Burst pulse energy

下载图片 查看原文

图 4. 基于强化学习的准分子激光器控制系统

Fig. 4. Control system of excimer laser based on reinforcement learning

下载图片 查看原文

图 5. 出光能量值对比。(a) Z-N参数整定的PI算法;(b) PSO整定的PI算法;(c)基于强化学习的算法

Fig. 5. Comparison of light energy values. (a) Z-N parameter tuning PI algorithm; (b) PSO tuning PI algorithm; (c) algorithm based on reinforcement learning

下载图片 查看原文

图 6. 算法单脉冲能量直方图对比。(a) Z-N参数整定的PI算法;(b) PSO整定的PI算法;(c)基于强化学习的算法

Fig. 6. Comparison of algorithm single pulse energy histograms. (a) Z-N parameter tuning PI algorithm; (b) PSO tuning PI algorithm; (c) algorithm based on reinforcement learning

下载图片 查看原文

图 7. Burst能量稳定性对比图。(a) Z-N参数整定的PI算法;(b) PSO整定的PI算法;(c)基于强化学习的算法

Fig. 7. Comparison of Burst energy stability. (a) Z-N parameter tuning PI algorithm; (b) PSO tuning PI algorithm; (c) algorithm based on reinforcement learning

下载图片 查看原文

图 8. Burst剂量精度对比。(a)Z-N参数整定的PI算法;(b)PSO整定的PI算法;(c)基于强化学习的算法

Fig. 8. Comparison of Burst dose stability. (a) Z-N parameter tuning PI algorithm; (b) PSO tuning PI algorithm; (c) algorithm based on reinforcement learning

下载图片 查看原文

图 9. 动态稳定性对比。(a) Z-N参数整定的PI算法;(b) PSO整定的PI算法;(c)基于强化学习的算法

Fig. 9. Comparison of dynamic stability. (a) Z-N parameter tuning PI algorithm; (b) PSO tuning PI algorithm; (c) algorithm based on reinforcement learning

下载图片 查看原文

表 1PI控制器参数变化范围

Table1. Parameter range of PI controller

ParameterKp1Ki1Kp2Ki2Kp3Ki3
Range[90,110][240,260][40,60][30,50][40,60][10,30]
TableQ-table1Q-table2Q-table3Q-table4Q-table5Q-table6

查看原文

表 2算法能量数据信息

Table2. Algorithm energy data information

AlgorithmMinMaxAverageMedianRangeσ
Z-N9.26310.6610101.3970.1645
PSO9.19610.729.999101.5240.1889
RL9.05510.6210101.5650.1293

查看原文

表 3动态稳定性数据

Table3. Dynamic stability data

AlgorithmPulseEnergy /mJTime /s
Z-N300910.890.101
PSO240410.800.165
RL150910.890.068

查看原文

孙泽旭, 冯泽斌, 周翊, 刘广义, 韩晓泉. 基于强化学习的准分子激光器能量控制算法研究[J]. 中国激光, 2020, 47(9): 0901002. Sun Zexu, Feng Zebin, Zhou Yi, Liu Guangyi, Han Xiaoquan. Energy Control of Excimer Laser Based on Reinforcement Learning[J]. Chinese Journal of Lasers, 2020, 47(9): 0901002.

本文已被 4 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!