基于随机配置网络的光纤入侵信号识别算法 下载: 1112次
1 引言
光纤预警系统(OFPS)可以实时监测运输管道状态,一旦管道发生泄漏或者是被人为破坏,光纤就将振动信号传回终端并准确地报告破坏位置[1-3]。在光纤预警研究中,文献[ 4-5]研究了基于光纤信号的反射和干涉对光纤入侵信号进行直接提取的可行性,虽然在一定程度上可以检测到入侵信号,但是面对背景噪声较强的低信噪比信号时并不能直接提取。文献[ 6]中提出了一种基于恒虚警率(CFAR)算法的光纤入侵信号检测方法,针对不同的背景噪声,该方法能够自适应地调节阈值,极大地提高了OFPS的检测性能。但在光纤信号识别方面,主要是通过对信号进行特征提取,再经过分类器训练得到信号的识别模型[7-9]。这类识别方法存在两个缺点:一是经过特征提取再进行分类识别耗时较多,二是有效的信号特征并不易提取,同时,固定的特征容易导致信号识别模型的适应性较差。因此,在OFPS中,一种适应性强、准确率高的快速识别方法对于光纤入侵信号的识别尤为重要。
神经网络中有许多非线性隐藏单元,这使得它们拥有非常强大的学习表示能力,可以逼近任何模型,并且能够学习到输入和输出之间的复杂关系[10-11]。其中,随机算法由于其强大的快速学习能力以及较低的计算代价逐渐引起了人们的重视[12]。Wang等[13]提出了一种通过不等式约束随机配置输入权重和偏置,并且隐藏节点可变的随机配置网络(SCN)模型,有效地保障了随机算法模型的通用逼近性质,并降低了模型复杂度。其后续研究也进一步地证明了SCN建模的可行性[14-15]。然而,在进行最后一层线性回归运算时,若特征矩阵存在秩亏,或奇异值之间相差很大时,SCN网络的稳健性以及泛化性急剧下降,引起网络的过拟合,使得网络模型测试性能不可靠。关于病态数据离散化问题的研究详见文献[ 16-17]。为了计算得到一个更加稳定的解集,有必要对SCN网络线性回归部分进行正则化处理,以保证SCN模型的泛化能力。
Dropout是一种常见且有效的方法,用以阻止网络过拟合问题。该方法以一定的概率删除或保留节点,能够有效打破网络节点之间的共适性,有效提高网络的泛化能力[18]。本文提出一种基于Dropout方法的改进SCN网络模型(Dropout-SCN)。在SCN网络隐藏层和输出层之间的线性回归部分使用Dropout,利用一种近似等效替代的思想,以概率
2 基于Dropout-SCN的光纤入侵信号识别模型
2.1 OFPS原理及应用
OFPS主要由分布式光纤传感器、数据采集处理模块、计算机(PC)三大部分组成。OFPS工作流程如
OFPS具有体积小、精度高、监测范围广、维护成本低等优点,被广泛应用于石油和天然气管道运输以及周界防护中。通过对分布式光纤的监测,实现对其周围环境的实时监控,在预防油气泄露、周界预警方面发挥了巨大的作用,保障了国家和人民财产的安全。经测试,OFPS能够在长度60 km、单根光纤周围2 m范围内有效地实现实时安全监测。由于入侵信号不一定是单一的纯振动信号,还常常伴随着多种环境噪声的叠加混合,仅仅通过“人工设计特征”方法来提取振动信号特征不能满足OFPS的需求。一方面,有效的人工设计特征不易提取,且效果不是很理想;另一方面,由于信号之间相互叠加、背景噪声复杂等问题,增加了对入侵信号的识别难度。在实际应用中,常常需要对多种入侵信号进行高精确度的实时检测和识别,这向分类器的学习能力和逼近能力提出了挑战。一个拥有优秀的学习能力和较为简单网络结构的学习模型对OFPS的性能至关重要。
2.2 SCN原理介绍
SCN作为一种随机网络,广泛应用在处理数据的回归和分类问题上,并取得了很不错的效果。与传统的前向神经网络对比,SCN在网络权重配置、网络节点数量、网络计算量等方面都有较大的优势。
2.2.1 SCN训练过程
SCN是一个标准的由输入层、隐藏层、输出层组成的3层前向反馈网络结构,其标准模型如
式中:
若隐藏层节点输出权重为
在反向推导进行输出权值更新的时候,输出权重[
式中:
得益于SCN独特的权值赋值方式,通过不等式约束随机配置输入权重
2.2.2 SCN通用逼近性质
作为学习器的核心,通用逼近性质是保障训练过程中学习器性能的前提。对于SCN而言,在训练过程中,随着节点数量的增加,保障网络的误差趋于0,无限逼近原函数,从而,得到一个学习能力强且拥有较强模型泛化能力的学习器是至关重要的。SCN通用逼近性质由如下定理1进行约束:
令[
定理1:
假设span(
式中:
SCN在面对大多数数据的时候都会有不错的表现。但由于其本身性质以及光纤数据的分布特性,输入矩阵的数据会出现奇异值趋近于零的现象,造成特征矩阵中的特征值相差很大。在进行最小二乘法求解输出权重的时候,会出现病态条件的情况,从而使得输出矩阵权值值域分布松散而不紧凑。SCN计算中过分地拟合了训练数据中低贡献率的特征,而忽略了具有共性的高贡献率的数据特征。这些往往会引起原网络的稳健性降低,泛化能力下降。
2.3 Dropout-SCN模型算法
Dropout是一种常见的、有效的、用于抵制网络过拟合的技术。可以将Dropout理解成一种在隐藏节点中加入噪声的正则化方法[18]。该方法将Dropout有效地应用于隐藏层中,并通过一种类似于模型平均的思想重构整个网络的无噪声模。与传统的正则化方法相比,Dropout的不同之处在于节点选择的随机性。每一个节点的Hidden 或 Visible都是服从概率为
在随机配置网络中加入Dropout相当于在其隐藏层和输出层之间的线性回归部分删除和保留节点。Dropout-SCN模型如
式中:
图 3. Dropout-SCN模型:展示了一个标准的多输入多输出网络模型
Fig. 3. Dropout-SCN model: standard multi-input and multi-output network model is presented
令
式中:
对角阵
1. Initialization settings
2.While
3.For
4. For
5. Randomly assign
6. Calculate
Let
If
7. min {
8. Save
9. Else go back to Step 4;
10. End If
11. End For (Corresponds to Step 4)
12. If
13. Find
Set
14. Break (go to Step 18);
15. Else randomly take
Return to Step 4;
16. End If
17. End For (Corresponds to Step 3)
18. Calculate
19. Compute
20. Renew
21.End While
22.Return output [
其中
3 实验结果与分析
所有实验和仿真结果均来自MATLAB-2017b, Intel(R)Core(TM) i5-6200U CPU,Windows 10系统平台。SCN算法训练的停止条件为:最大节点数
3.1 光纤数据预处理
在本实验中,使用了3种不同类型的光纤振动信号,分别为电钻产生的机械信号、铁锤敲打产生的敲击信号、镐刨挖地产生的挖掘信号,其归一化之后的原始信号如
图 4. 原始信号。(a)挖掘信号;(b)敲击信号;(c)机械信号
Fig. 4. Original signals. (a) Digging signal; (b) knocking signal; (c) electric drill signal
图 5. SCN、Dropout-SCN和L2正则化SCN输出权重分布散点图
Fig. 5. Scatter plot of output weight distributions of SCN, Dropout-SCN and SCN with L2 regularization
3.2 权值约束能力
实验比较了原始SCN、Dropout-SCN和L2正则化SCN 3种学习模型对输出权值的限制能力。在30个节点数且保证相同正则项系数的前提下,输出权值散点分布如
3.3 Dropout概率对测试集影响
Dropout-SCN网络拥有一个可以调节的超参数
图 6. 隐藏节点数L=70条件下,Dropout概率对测试误差的影响
Fig. 6. Effect of Dropout probability on test error under number of hidden nodes L=70
3.4 测试误差实验
选用原始SCN以及L2正则化SCN模型作为对比进行实验,并使用固定的Dropout概率
为了验证相比SCN网络,Dropout-SCN的泛化能力确实有提升,给出3种学习者模型在不同节点数
3.5 对比实验
对SCN、L2正则化SCN、Dropout-SCN 3种网络在不同节点数
表 1. 光纤数据测试集结果
Table 1. Results of optical fiber test data
|
4 结论
提出了一种基于Dropout方法的SCN模型(Dropout-SCN),用于减缓原始SCN存在的过拟合问题。通过理论证明:在SCN中使用Dropout技术等效于对原始SCN作不同权值约束的L2正则化。Dropout-SCN通过引入海森对角矩阵使得不同节点之间的标准差对输出权重大小进行了不同程度的权值约束。光纤数据实验结果表明:与原始SCN模型相比, Dropout-SCN能够降低光纤入侵信号约4%的测试误差,有效地提升了光纤预警系统的泛化性能。
[1] Qu Z G, Zhou Y, Zeng Z M, et al. Detection of the abnormal events along the oil and gas pipeline and multi-scale chaotic character analysis of the detected signals[J]. Measurement Science and Technology, 2008, 19(2): 025301.
[2] 孙茜. Ф-OTDR光纤预警系统模式识别方法研究[D]. 天津: 天津大学, 2015.
SunQ. Research on recognition method for Ф-OTDR optical fiber pre-warning pattern[D]. Tianjin: Tianjin University, 2015.
[3] 杨洋, 沙洲, 封皓, 等. 输水管道预警与泄漏定位中Φ-OTDR技术信号处理法[J]. 激光与光电子学进展, 2018, 55(4): 040607.
[4] 吴永红, 朱莎, 许蔚, 等. 分布式光纤裂缝传感工程应用研究进展[J]. 激光与光电子学进展, 2018, 55(9): 090002.
[7] 杨丹. 光纤振动信号特征提取与识别算法研究[D]. 北京: 北方工业大学, 2018.
YangD. Characteristics extraction and recognition research in optical fiber pre-warning signal[D]. Beijing: North China University of Technology, 2018.
[8] 王照勇, 潘政清, 叶青, 等. 用于光纤围栏入侵告警的频谱分析快速模式识别[J]. 中国激光, 2015, 42(4): 0405010.
[9] 王永洪, 刘俊伟, 张明义, 等. 基于光纤布拉格光栅的双壁模型管桩轴力测试[J]. 激光与光电子学进展, 2018, 55(11): 110605.
[10] 郭小乐. 关于神经网络插值与逼近问题的研究[D]. 银川: 宁夏大学, 2017.
Guo XL. Study on interpolation and approximation problem of neural networks[D]. Yinchuan: Ningxia University, 2017.
[11] Rumelhart D E, Hinton G E, Williams R J. Learning representations by back-propagating errors[J]. Nature, 1986, 323(6088): 533-536.
[12] Mahoney M W. Randomized algorithms for matrices and data[J]. Foundations and Trends® in Machine Learning, 2011, 3(2): 647-672.
[13] Wang D H, Li M. Stochastic configuration networks: fundamentals and algorithms[J]. IEEE Transactions on Cybernetics, 2017, 47(10): 3466-3479.
[14] Wang D H, Cui C H. Stochastic configuration networks ensemble with heterogeneous features for large-scale data analytics[J]. Information Sciences, 2017, 417: 55-71.
[15] Wang DH, Li M. Robust stochastic configuration networks with kernel density estimation for uncertain data regression[J]. Information Sciences, 2017, 412/413: 210- 222.
[16] 李豪. 病态问题的奇异值双参数修正解法及其应用[D]. 郑州: 战略支援部队信息工程大学, 2018.
LiH. Singular values correction methods with double parameters for ill conditioned problems and their applications[D]. Zhengzhou: PLA Strategic Support Force Information Engineering University, 2018.
[17] 刘婷, 戴亚康, 杨莹雪, 等. 基于奇异值分解和最小L2范数解的动态脑磁源重建[J]. 中国体视学与图像分析, 2015, 20(3): 235-241.
Liu T, Dai Y K, Yang Y X, et al. Dynamic magnetoencephalography source reconstruction based on singular value decomposition and minimum L2-norm estimation[J]. Chinese Journal of Stereology and Image Analysis, 2015, 20(3): 235-241.
[18] Sutskever I, Hinton G, Krizhevsky A, et al. Dropout: a simple way to prevent neural networks from overfitting[J]. Journal of Machine Learning Research, 2014, 15(1): 1929-1958.
Article Outline
盛智勇, 曾志强, 曲洪权, 李伟. 基于随机配置网络的光纤入侵信号识别算法[J]. 激光与光电子学进展, 2019, 56(14): 140602. Zhiyong Sheng, Zhiqiang Zeng, Hongquan Qu, Wei Li. Fiber Intrusion Signal Recognition Algorithm Based on Stochastic Configuration Network[J]. Laser & Optoelectronics Progress, 2019, 56(14): 140602.