激光与光电子学进展, 2020, 57 (1): 010001, 网络出版: 2020-01-03   

基于机器学习的可见光通信信号处理研究现状 下载: 3526次封面文章

Research Status of Machine Learning Based Signal Processing in Visible Light Communication
作者单位
复旦大学通信科学与工程系电磁波信息科学教育部重点实验室, 上海 200433
摘要
随着无线通信领域的发展,具有诸多优点的可见光通信(VLC)已经发展成为了一种具有广阔前景的通信手段。然而,可见光通信中的各种非线性效应会给其信号处理带来诸多的困难,并恶化系统的性能。机器学习在解决非线性问题方面具有很大的优势和潜力,结合机器学习算法的可见光通信技术必然具有巨大的研究价值。已有研究表明,传统的机器学习算法如K-means、DBSCAN以及支持向量机(SVM)等在预均衡、后均衡、抗系统抖动,以及相位纠正等方面均有很好的表现。而深度神经网络(DNN)则因为其强大的非线性拟合能力能够更进一步提升VLC系统的性能。对以上几种方法进行了分析和介绍,并对其在可见光通信信号处理领域的应用进行了分析与总结,希望可以为机器学习解决可见光通信方面的各种非线性问题提供参考。
Abstract
With the development of wireless communication, visible light communication (VLC) has become very promising technology owing to its many advantages. However, the nonlinear effect of VLC introduces many challenges for signal processing and deteriorates system performance. As machine learning has many advantages and significant potential for solving nonlinearity issues, the VLC that utilizes machine learning algorithms is bound to have tremendous research value. Existing research shows that traditional machine learning algorithms, such as K-means, DBSCAN, and support vector machine, perform well in pre-equalization, post-equalization, anti-system jitter, and phase correction. A deep neural network can further improve the performance of the VLC system because of its strong nonlinear fitting ability. In this article, we analyze the aforementioned methods and introduce their application to the signal processing in VLC. We hope this paper provides a reference for solving the nonlinearity problems related to machine learning in VLC.

1 引言

可见光通信(VLC)是一种基于可见光频谱进行数据通信的新兴无线通信手段[1]。VLC的概念由日本学者于2000年提出[2],到如今LiFi等VLC概念及设备已大规模普及,VLC经历了飞速发展的20年[3]。作为一种新兴的通信方式,VLC可以提供近400 THz的丰富的频谱资源,并且具有很强的抗电磁干扰特性,以及很好的保密性能。由于VLC具有照明与通信一体化的特殊优势,一经问世便得到了国内外学者的广泛关注[4-5]。同时,伴随着LED的大规模普及,与之紧密联系的VLC也有着巨大的发展潜力和市场前景[6]

研究人员发现,可见光信道是一个极为特殊的传输信道,信号在信道中传输时会受到严重的线性与非线性效应的影响[7]。尤其是在一些空间复杂信道和高发射功率下,可见光的非线性效应会占主导地位,并会严重影响系统的传输性能,导致误码率急剧上升。对于VLC系统而言,其非线性效应主要来自于LED器件本身的非线性效应、信道的非线性、接收端PIN器件的非线性,以及诸如放大器等器件的非线性[8-9]。文献[ 10]中采用线性后均衡方式(DD-LMS)和非线性后均衡算法(Volterra)相结合的方式,在无载波幅相(CAP)调制格式下取得了良好的效果。但是,随着非线性复杂度的提升,Volterra等非线性后均衡算法的计算复杂度急剧增大,使得VLC系统几乎无法实现。

机器学习在过去的十多年已被成功用于预测、分类、模式识别、数据挖掘、特征提取,以及行为识别等领域[11-13]。随着5G通信的发展以及海量通信数据处理带来的挑战,通信系统与机器学习相结合已成为大势所趋[14]。已有研究表明,机器学习领域的诸多算法均可以用于解决通信系统中的非线性问题,如从噪声中估计参数,确定输入与输出之间的复杂映射关系,推断接收信号的概率分布,以及基于输入样本估计输出值等[15]。例如人工神经网络(ANN)、深度神经网络(DNN)、支持向量机(SVM)和主成分分析(PCA)都可用于检测实现光通信系统中的损伤探测和性能监测[16-17]。与此同时,在面对信号解调、信道均衡和比特率识别等任务时,传统的机器学习算法如K-means、ANN、PCA、变分贝叶斯期望最大化等也已被证明具有良好的效果[18-20]。而最近的研究成果表明,在对恶劣信道下的正交频分复用(OFDM)无线通信系统以及多输入多输出(MIMO)系统进行信道估计时,DNN可以获得比传统信道估计算法更好的系统性能[21-24]

本文首先描述基于机器学习的可见光系统架构,对机器学习在VLC中的应用场景进行概括;然后将对机器学习中的部分算法,如K-means、SVM、基于密度的聚类算法(DBSCAN)、ANN以及DNN在VLC中的应用进行分析和总结,为其他机器学习算法在VLC中的应用提供参考。

2 机器学习方法及其在VLC中的应用

2.1 可见光系统架构

基于机器学习算法的VLC系统架构如图1所示,Tx代表发射端,Rx代表接收端。整个VLC系统可以划分为5部分:可见光发射机、发射端硬件、信道、接收端硬件和可见光接收机。

图 1. 基于机器学习的VLC系统框图

Fig. 1. Block diagram of machine learning based VLC system

下载图片 查看所有图片

可见光发射机部分主要完成对随机二进制数据流的编码、调制、预均衡和上变换,并生成可以在发射端硬件上加载的幅度调制信号。

发射端硬件由随机波形发生器(AWG)、电子放大器(Amp.)、硬件均衡器(Eq.)、直流耦合器(Bias Tee)以及发光二极管(LED)构成。其中,AWG将上载的幅度调制信号通过数模转换器(DA)转换成电压信号,硬件均衡器扩展可用带宽,直流耦合器对电信号加入直流偏置(DC)后,由LED将电信号通过红灯(R,其他颜色灯也可)转换为光信号。

可见光信道主要分为自由空间光和水下信道两种,两种信道会对信号产生不同的衰减和频率响应。

接收硬件包括PIN管、跨阻放大器(TIA)、电子放大器、衰减器(Att.)以及示波器(OSC)。光信号由PIN管转换成微弱的电信号后,由TIA进行处理,再经电子放大器和衰减器共同作用后,被调节到合适的放大倍数,通过示波器接收并传递给接收解调系统。

可见光接收机主要分5部分,分别为差分信号处理、下变换、后均衡,以及解调和解码。最终系统输出接收解调后的二进制码流,并与发射数据进行对比异或操作(XOR)得到误码率(BER)等参数。

机器学习算法在VLC系统中主要用于实现信号的预均衡(预失真)与后均衡。

2.2 机器学习在VLC中的应用概述

机器学习是一门新兴的学科,是一门多领域的交叉学科,涉及概率论、统计学、逼近论凸分析、算法复杂度理论等。如图2所示,机器学习在VLC领域里的应用前景非常广阔,其主要应用场景包括非线性抑制、抖动消减、调制格式识别(MFI)和相位估计。非线性抑制算法主要通过从接收的数据中学习不同的非线性损伤并综合它们的概率模型,以便于在以后补偿系统的非线性并量化引入的串扰。在VLC中主要可以通过使用深度神经网络(DNN)[25-26]、带高斯核函数的深度神经网络(GK-DNN)[27]、辅助核函数深度神经网络(AK-DNN)以及长短期记忆网络(LSTM)[28]实现后均衡器,补偿信号的非线性损伤。对于VLC系统中的信号抖动问题,主要采用聚类算法中的二维以及三维具有噪声的基于密度的聚类方法(2D,3D-DBSCAN)[29-31]来解决。而对于盲调制格式识别,尤其是在星座点出现非线性失配的情况下,可以使用基于K均值聚类(K-means)[32]算法及其聚类算法感知边界(CAPD)来实现。SVM[33]可以用于相位估计并纠正相偏。笔者对聚类算法中的K-means和DBSCAN、分类方法中的SVM,以及深度神经网络进行介绍,并分析其在VLC领域中的应用。

图 2. 机器学习在可见光通信中的应用

Fig. 2. Application of machine learning in visible light communication

下载图片 查看所有图片

2.3 基于K-means算法的调制格式识别

在VLC系统中,有许多原因会导致信号受到非线性的影响,其中主要包括LED非线性、PIN非线性、发射驱动电路以及接收放大电路的非线性等。如图3所示,对于正交振幅调制(QAM)信号,很强的非线性会导致接收数据星座点出现严重的IQ相位及幅度失配,进而导致传统的判决门限失效。机器学习聚类算法中的K-means算法作为后均衡器,将欧氏距离作为判定准则,将距离较近的点归为一类,通过寻找接收信号每个类的中心,得到CAPD,并将其替代原有的标准星座点判定边界,可以有效抵抗系统带来的非线性,提升系统的性能。

图 3. K-means算法后均衡示意图,黑色点为经过后均衡后的接收星座点,IQ分别表示接收数据的同相分量和正交分量。(a)接收星座图及其正常的判决门限,黑色小圈内为会被误判的点;(b)CAPD判决门限

Fig. 3. Diagram of post equalization of K-means algorithm, in which black points are receiving constellation points after post-equalization, and I and Q represent in-phase component and orthogonal component of receiving data, respectively. (a) Receiving constellation and normal decision board, in which points in black circle will be misjudged; (b) CAPD decision board

下载图片 查看所有图片

K-means算法的具体流程如图4所示[31]。基本步骤如下:

1) 首先选取接收数据的一部分{rx1,rx2,…,rxp,…,rxn}作为训练序列使用,其中rxp为接收数据在星座图上的复数值坐标,n为接收数据的个数。

图 4. K-means算法流程图

Fig. 4. Flowchart of K-means algorithm

下载图片 查看所有图片

2) 对接收数据作功率归一化。

3) 对于接收数据的训练序列,初始化聚类中心点,中心点的个数即为要分成的类的个数。初始化时选用归一化后的标准16QAM星座点会加快运算速度,但不会提升精度。

4) 计算训练序列中rxp到聚类中心cq的最小距离dp,公式为

dp=argminqf(rxp,cq),(1)

式中:f(rxp,cq)为求解接收星座点在星座图上的坐标rxp与聚类中心在星座图上坐标之间cq的欧氏距离;q为聚类中心中的某个点。此时通过最小距离dp即可将接收星座点归为聚类中心对应的类。

5) 重新求解属于一类的接收星座点的聚类中心,并更新聚类中心的坐标值。

6) 反复迭代4)~5)直到聚类中心坐标改变的绝对值小于阈值E,得到每个类与距离其最近的标准星座点之间的误差幅度向量v

通过聚类后的相邻中心坐标两两相连取中垂线,可以得到基于聚类中心的CAPD,将其作为新的判别门限。也可以通过误差幅度向量将受到非线性影响的接收星座点拉回到标准星座点,抵消系统非线性带来的影响。

Lu等[31]使用K-means算法在多带无载波幅相调制VLC系统(Multi-CAP VLC)中分别对IQ两路的非线性不均衡损伤进行了后均衡,并完成了调制格式识别。作者使用了5个子带,采用的调制格式为16阶QAM,每个子带的中心频点分别为15,38,61,84,107 MHz。每个子带带宽均为20 MHz,则每个带的速率为80 Mbit/s,5个带的速率共计为400 Mbit/s。相比于纯线性均衡方式,CAPD判别方式在1、3、4、5子带上的Q_dB值均有1.6~2.5 dB的提升,其中Q_dB=20lg 2·erfc-12BER),BER为系统的误码率,erfc-1(·)为互补误差函数的倒数。相比于非线性均衡器Volterra,采用CAPD至少可以使误码率降低10%。

图 5. 基于K-means算法的预均衡原理示意图

Fig. 5. Principle diagram of K-means algorithm based pre-equalization

下载图片 查看所有图片

类似地,Lu等[32]K-means算法用在系统的预均衡中,如图5所示,其与基于K-means的后均衡算法相同,区别在于预均衡是通过K-means得出接收星座点每个类的中心坐标,求出与其最近的标准星座点之间的距离并将其作为预失真向量,然后根据预失真向量对发射星座点进行预失真,来抵消系统带来的非线性的影响。实验结果证明,对于每个子带带宽为20 MHz,中心频点分别为15,38,61,84,107 MHz的CAP-16QAM VLC系统,基于K-means的预失真(CAE)可以有效抵抗系统的非线性,并将误码率降低到原先的50%~99%。

2.4 DBSCAN的抗抖动作用

在VLC系统中,LED、PIN以及各种发射接收器件均存在信号幅度抖动的现象。此时接收信号会受到非常大的干扰,影响系统的性能。图6是一个PAM4信号随时间抖动的示意图[33]。可以看出,由于受系统抖动的影响,原先的判决门限将会导致抖动时间点附近的信号发生误判。而基于中心和欧氏距离的K-means聚类算法很难解决系统抖动的问题。同时,系统中的信号抖动是随机发生的,并不存在固定的规律,因此其他分类或更复杂的神经网络算法对此也无能为力。此时使用DBSCAN,以密度聚类的方式对接收的PAM4信号星座点进行分类,就可以缓解由信号抖动带来的信号误判。

图 6. PAM4信号抖动及DBSCAN重新分类示意图[33]。(a) PAM4接收信号抖动示意图;(b) DBSCAN重新分类示意图

Fig. 6. Diagrams of PAM4 signal fluctuation and DBSCAN re-classification[33]. (a) Fluctuation of PAM4 receiving signal; (b) diagram of DBSCAN reclassification

下载图片 查看所有图片

具体的办法是对一维PAM信号或者二维QAM信号扩展出时间轴T,将信号由一维(二维)变成二维(三维),并使用基于密度和噪声的聚类算法(DBSCAN)实现信号的重新分类和判决[30]。这里仅讨论更复杂的QAM信号,PAM信号的分类判决步骤与QAM信号的I路或者Q路的分类判决步骤相同。

首先,取相邻的N个二维接收QAM信号,将其扩展为IQT三路信号,表达式为

XI+XQ·j(XI+j·XQ)·N,Xindex,(2)

式中:XI为接收信号的同向分量;XQ为接收信号的正交分量;j为虚数单位;Xindex为该接收信号在时域上的索引。这样取是因为时间轴相对于坐标轴而言变化的间距比较大,将(XI+j·XQ)乘以N后作为归一化因子,这样可以将时间轴和星座点坐标之间的变化拉到一个量级上。如果接收信号长度为L,那么一次DBSCAN处理的IQT信号的长度就为N,且满足NL

对于IQT三维信号,两个符号间的欧氏距离可以定义为

d(Xk,Xl)=[(XIk-XIl)2+(XQk-XQl)2+(Xindexk-Xindexl)2]-1/2,(3)

式中:X(k)为第k个QAM接收信号;X(l)为第l个QAM接收信号; XIk为第k个QAM接收信号的同向分量; XIl为第l个接收信号的同向分量; XQk为第k个QAM接收信号的正交分量; XQl为第l个QAM接收信号的正交分量; Xkindex为第k个QAM接收信号在时间上的索引; Xlindex为第l个QAM接收信号在时间上的索引。

DBSCAN需要将整个接收序列划分为每段长为N的若干序列,并定义其最重要的两个参数:邻域半径E和核心对象的个数M,即给定对象半径为E的判决区域及判决该对象为核心对象时其半径为E的范围内所拥有的样本点数。对于接收序列中的某一段长为m的序列X(1,…,m)中的某个点X(k),计算它与该序列中其他所有点之间的符号欧氏距离,并计算符号欧氏距离小于E的点的个数,公式为

NUM(Xk)={d(Xk-Xl)<E},Xk,XlX(1,,m)andlk,(4)

式中:NUM(X(k))为序列中与X(k)欧氏距离小于领域值E的点的个数;X(l)为序列中的第l个点,且lk。遍历第k个符号与序列中其他符号之间的距离即可得到NUM(X(k))。

这时可以根据如下规则对某个点X(k)进行标记,即

L(Xk)=C,NUM(Xk)MA,NUM(Xk)<Md[Xk,Xl(L(Xl)=C)]<E,l1,,mandlkZ,otherwise,(5)

式中:C表示核心点;A表示非核心点;Z表示噪声点; d[Xk,Xl(L(Xl)=C)]<E≠∅表示X(k)与被标记为核心点的符号之间的符号距离有小于E的情况。三种点的实际效果如图7所示。完成这一步后,可以将所有核心点及其附近欧氏距离小于E的核心点与非核心点进行融合,并归为一类。

图 7. DBSCAN核心点、非核心点、噪声点描述图

Fig. 7. Description of core points, accessory points, and noise points of DBSCAN

下载图片 查看所有图片

Lu等[30]使用DBSCAN算法在CAP-16QAM 单带VLC系统中进行了IQT三维后均衡,以减弱系统幅度抖动的影响。作者通过对信号加入外部噪声并调节噪声幅度达到原始星座点欧氏距离的10%~80%进行实验,结果发现在50%以上噪声幅度的情况下,使用DBSCAN的BER仍然维持在门限下,而不使用DBSCAN的系统的BER已经高于门限。同时,在带宽为200~300 MHz范围内,信号峰峰值电压在0.4~0.8 V的情况下,DBSCAN后均衡算法在抖动幅度为55%和70%的情况下均能带来额外的1.5 dB~2.5 dB Q_dB值的增益。通过实验,作者得到如下结果:最佳的处理长度N为600~1300,M为44~77,邻域E为3~7。

类似地,Yu等[29]将DBSCAN用在CAP-PAM8系统中验证其对缓解系统抖动影响的作用。作者在600 Mbit/s速率下进行了实验,在0.04~0.12抖动范围内相比无DBSCAN的系统得到了2.299 dB~3.299 dB的增益。通过遍历信号峰峰值Vpp和LED偏置电压发现,在抖动幅度为10%的情况下,使用DBSCAN可以使系统在1.85~2.25 V偏压范围以及Vpp在0.42~0.80 V范围内的BER达到7% 前向纠错(FEC)误码门限下,而不使用DBSCAN的系统其误码始终大于7%FEC门限。通过实验,作者得到了CAP PAM8 VLC系统的最佳N值范围为350~1000,最佳M范围为23~30,最佳邻域值E为177~360。

2.5 基于SVM的相位估计

在可见光多带CAP-QPSK系统中,在非线性较强的情况下存在严重的相偏情况。而传统的恒模算法(CMA)对于频偏和相偏并不敏感。如果仍然采用CMA作为均衡算法,将会导致接收星座点误判,进而劣化系统的性能。此时可以考虑使用SVM对系统相偏进行估计和纠正。

SVM 是一种有监督的机器学习算法,可用于分类或回归问题,如图8所示。它通过寻找最优分界面以及支持向量来对数据进行分类。图中的XY分别表示每个样本的接收信号的X坐标和Y坐标。对于四阶相移键控(QPSK)信号,需要根据其相角将每个星座点分为4类,则采用SVM的one versus one(OVO)方式就需要生成 4(4-1)2=6个分类器。这里仅表达其中某两类的分类算法,对于多类的分类方法,只要构建多个分类器即可[34]

图 8. SVM分类示意图

Fig. 8. Description of SVM classification

下载图片 查看所有图片

由于SVM是有监督的学习方式,因此需要将接收数据打乱顺序,并取其中的一部分作为训练集 (x1,d1),,(xk,dk),,(xS,dS)。其中训练集的特征xk为其IQ两路的坐标,是一个二维向量,标签dk为其发射星座点所属的类,k为其中的第k组数据,S为训练集的数据总数。使用SVM的目的就是找到每两个类之间的分类超平面,及其所对应的支持向量,即保证离最优超平面最近的接收星座点。根据QPSK的具体情况,对于其中某两类星座点,超平面的表达式可以写为[35]

ω'·x-b=0,ωR2,bR,(6)

式中:x为训练集中接收数据的IQ两路分量的向量表示;b为超平面的截距;ω'为超平面的法向量ω的转置;R表示数据的维度为一维,R2表示数据的维度为二维;ω为超平面的法线向量。对于线性可分的两类数据,可以根据超平面得到两个分类公式:

ω'·x-b1,dk=1ω'·x-b-1,dk=-1(7)

根据(7)式即可对每两类接收星座点进行分类。SVM的关键就是求解超平面的法线向量和b这两个参数,使得离超平面最近的星座点与超平面的距离最大化,表达式为

argmaxω,bmindk·(ω'x+b)·1ω(8)

上述问题可以简化为

argmax(1ω)ormin12ω2s.t.y·(ω'·x+b)-10,(9)

这个问题可以使用拉格朗日乘子法求解。设置拉格朗日乘子α=(α1,α2,…,αN),并令

J(ω,b,α)=12·ω-k=1Sαkdk(ω'·xk+b)-1,(10)

式中:J(·)为目标函数。

分别对ω以及b求偏导数,得到

Jω=ω-k=1Sαk(dkxk)ω=k=1Sαk(dkxk)Jb=-k=1Sαkdk=0,(11)

将以上关系式代入J(ω,b,α)中,得到新的表达式为

J(α)=12k=1Sαkdkxkl=1Sαldlxl-k=1Sαkdk=k=1Sαk-12k=1Sl=1Sαkdkxkαldlxl(12)

J(α)求导等于0,可得到α的值,再将其代入(13)式即可得到支持向量

ω=k=1Sαk(dkxk),(13)

式中:αk>0对应的样本为支持向量。求解得到的分类公式即可用于对数据的分类。

这里需要注意的是,上述算法实现的前提条件是数据线性可分。如果数据线性不可分,那么需要对输入特征进行非线性映射。主要采用的方法是核方法(kernel trick)[36],将输入数据升到更高维度的空间,然后再计算最优分界面和支持向量,对数据进行分类。QPSK纠正相偏的情况基本属于线性可分情况,因此采用线性核作为分类核函数即可。

Niu等[34]采用线性核SVM对多带CAP可见光系统中进行了相位估计和纠偏。作者采用CAP-QPSK作为调制格式,使用线性核SVM进行分类和纠偏,并在两个带上进行了实验。图9(a)为第一个带在速率为400 Mbit/s时接收线性均衡星座图,图9 (b)为400 Mbit/s速率下SVM分类效果图,图9(c)为SVM纠偏后的星座图。可以看出,通过在可见光CAP的通信系统中使用后均衡算法如改进型级联多模算法(MCMMA)等,接收星座图经呈现出一定程度的收敛。然而此时接收星座点存在很严重的相偏,传统判决方式将导致很严重的误判。此时采用SVM分类器可以对相偏进行纠正,这里需要先取一部分接收数据作为样本进行训练。当SVM模型训练好后,再将剩余的接收数据作为测试集输入训练好的模型中进行分类测试。结果表明,SVM可以有效地对产生相偏的星座点进行分类,并可以纠正相偏。在333,400,467 Mbit/s下,使用SVM相比于没有使用SVM纠偏的系统误码率分别由0.00437,0.01429,0.03152下降为1.83×10-4,1.37×10-4,1.44×10-4

图 9. SVM分类及纠偏效果图。(a)纠偏前接收的星座图;(b) SVM分类效果图,底部4种颜色分别代表根据QPSK数据4种星座点所分的4个类,红绿蓝三色代表输入的训练集;(c)纠偏后的效果图

Fig. 9. Effects of SVM classification and phase correction. (a) Receiving constellation before phase correction; (b) effect of SVM classification, in which Four colors at the bottom represent the four categories of the four constellation points according to the QPSK data, and Red, green, blue colors represent the input training set; (c) effect after phase correction

下载图片 查看所有图片

2.6 基于GK-DNN的可见光信道非线性抑制方法

在可见光系统中,理想的响应应该是发射信号光强与发射信号的峰峰值成正比,接收信号的峰峰值与接收光强成正比。然而,各种器件的非线性效应以及信道的非线性会严重影响可见光系统的性能。其中,LED的非线性、电子放大器等器件的非线性,以及信道的非线性是系统出现非线性效应的主要因素。传统的Volterra级数等均衡算法可以有效地抑制非线性,然而随着其阶数的增大,计算复杂度呈指数级上升,导致其实现的困难程度急剧增大,因此阶数常使用二阶(该算法对三阶以上的非线性响应无能为力)。

深度神经网络对复杂的非线性问题强大的拟合能力为VLC系统性能的提升提供了新途径。已有的研究成果表明,基于高斯核函数的深度神经网络(GK-DNN)可以有效抑制系统的非线性,并减少训练中迭代的时长和次数[27]。GK-DNN的网络结构如图10所示。整个网络主要分为三部分:输入层(KL)、深度神经网络层(DNN)和输出层(OL)。其中,G(Xi)表示第i个高斯核函数节点, Fjk(Σ)为全连接层第k层的第j个节点,Si(Σ)表示Softmax输出节点。首先,输入层中输入经过MCMMA等均衡算法后的接收信号,设置输入层的节点数为2n-1个,即考虑中心电平周围的n-1个电平对中心电平的影响,同时需要对输入的数据进行一个高斯核函数映射,将其映射到一个非线性空间,以减少拟合的迭代次数和时长。这里需要调节高斯核函数的β,它与高斯核映射函数的方差成反比。β越大,训练达到最优系统性能的时间越短,但是系统的BER越高。反之,则会延长训练时间,但是能得到更好的系统性能。随后,经过核函数映射后的信号被输入到深度神经网络中。这里取2层隐藏层,并使用激活函数产生非线性。最后,通过Softmax层输出判决结果。

图 10. GK-DNN神经网络结构

Fig. 10. Neural network structure of GK-DNN

下载图片 查看所有图片

Chi等[27]研究了GK-DNN在CAP-PAM8系统中的后均衡性能。由于系统非线性的影响,采用传统的PAM8解调方式得到的误码率会非常高,这时需要采用GK-DNN对接收数据进行训练,以尽可能拟合接收信号与发射信号之间的非线性映射关系。这里GK-DNN完成了非线性后均衡和解映射的过程。通过将高斯核减少迭代次数的能力与DNN强大的非线性映射功能相结合,实现了信号的后均衡和解调,提升了系统的性能。实验中需要选取接收信号的一部分作为训练集训练GK-DNN网络,以得到系统的非线性映射模型,并将另一部分接收数据输入到模型中,测试模型的训练结果。整个模型的输入是接收的PAM8符号及其前后相邻的若干个符号的电平值,输出是与输入的中心符号对应的发射信号的电平值。这样做主要是为了考虑前后符号间的互相干扰。在PAM8 水下VLC系统中使用GK-DNN网络的实验结果表明,在β=0.075以及达到误码门限的情况下,使用GK-DNN的深度神经网络比传统DNN使用的迭代次数减少了52.9%(从1700次减少到800次)。当迭代次数为2000次时,系统的性能比传统DNN提升了25%,并在水下1.2 m 距离下实现了1.5 Gbit/s的数据传输,其误码始终在0.0038门限下。

2.7 基于ANN的可见光后均衡器

ANN约兴起于20世纪80年代,可简称其为神经网络。ANN中每两个节点之间的连接代表对输出信号的加权,而每个节点则代表一个输出,该输出根据网络结构的不同而不同。普通的人工神经网络结构如图11所示,可以看出,整个网络结构分为三层:输入层、隐藏层和输出层。其中,输入节点为2p+1个,隐藏层节点数为n个,输出节点数为1个。假设总的层数为q,则输入层为第1层,隐藏层共有q-2层,输出层为第q层,那么连接权重 ωabl就表示第l层的第a个节点与第l+1层的第b个节点之间的连接权重。其中,O(Σ)为输出层节点,Yp为输出值。通过不断地输入测试样本,并使用反向传播算法和损失函数来训练模型的权重,最终可以使整个系统的误差缩小到一定的阈值下。

图 11. ANN结构图

Fig. 11. Structure of ANN

下载图片 查看所有图片

函数连接ANN(FLANN)与一般结构的ANN略有不同,其区别主要在输入层上。函数连接层负责对输入的信号进行多项式映射,而输入的节点数则由其考虑的相邻电平的个数n和阶数决定。如果考虑当前输入信号前后的n个值,并考虑多项式的阶数到p,那么经过函数连接层后将出现(n+1)·p个节点。后端的结构与传统ANN结构类似。ANN的结构简单,函数连接层调节灵活,非线性不是很强的VLC系统对ANN和FLANN来说是很好的应用场景。

经过近十年的发展,ANN及FLANN已在通信系统中得到了广泛应用和深入研究。Haigh等[37]以ANN作为后均衡器实现了170 Mbit/s速率的VLC OOK通信系统,这是人工神经网络首次作为后均衡器出现在VLC系统中。作者将ANN作为后均衡器可以有效补偿系统的非线性响应,提升系统的最大可达速率。作者以BER为1×10-6作为门限,使用ANN作为后均衡器得到的系统最大可达速率在使用蓝光滤镜和不使用蓝光滤镜的情况下分别为170 Mbit/s和150 Mbit/s,比使用基于判决反馈均衡的递归最小二乘算法(RLS-DFE)和线性递归最小二乘(RLS)算法得到的最大可达速率分别提升了80,20和130,80 Mbit/s。

Guan等[38]采用ANN对可见光定位系统中的一阶反射效应引起的信道非线性进行了补偿。这里ANN的作用是得到非视距(NLOS)和视距(LOS)范围内灯与定位点之间的距离以及信道增益之间的关系。ANN的输入taps为NLOS以及LOS的信道增益,输出为终端到灯之间的距离。网络中一共有2个隐藏层,每层10个节点,输入节点为1个,输出节点使用Sigmoid激活函数,并使用列文伯格-马夸尔特算法(LM)作为ANN的学习算法。激活函数选取方均误差函数(MSE),一次训练符号数为121个。在信道有反射非线性存在的情况下,本算法可成功地将4个灯的平均定位精度从11.94 cm缩小到0.95 cm。在6 m×6 m×4 m的仿真环境下,对于正在运动的机器人目标,其定位精度在95%的情况下均小于4.05 cm。

Haigh等[39]首次使用4个硅基LED和4个有基光电探测器(Organic photodetectors, OPDs)实现了4发4收MIMO-ANN可见光系统。通过使用ANN对OOK信号进行分类,纠正MIMO矩阵转换后引入的误差,系统的总比特速率由750 kbit·s-1提升到1.8 Mbit·s-1

2.8 不同机器学习算法的误码性能比较及抗噪效果

上文所述的几种在VLC系统中应用的机器学习算法大多用于接收端,这符合其能够很好地描述高非线性映射的特点。对于比较简单或阶数较低的非线性问题,如IQ路映射不均衡导致的星座点失配,以及短时的系统抖动,使用较为简单的无监督的聚类方法,如K-means以及DBSCAN等算法,既能在很大程度上提升系统的性能,又不会引入很高的计算复杂度。然而,对于光路饱和以及器件劣化等引入的非线性问题,使用无监督的聚类方法已经不能实现更多的提升,甚至可能因为非线性问题过于复杂而会导致系统性能进一步恶化。此时,能够实现复杂非线性映射的机器学习算法,如DNN、ANN以及SVM等有监督的学习算法,可以在很大程度上降低系统的误码率,提升系统的性能,然而带来的负面作用就是引入了较大的计算资源开销。未来,随着集成电路的迅猛发展以及计算能力的不断提升,DNN以及ANN将在非线性效应严重、码间干扰较大的高速高功率VLC系统中发挥更大的作用,而复杂度较低的K-means、DBSCAN以及SVM等传统机器学习算法则可以在低速、较低功率的VLC系统中补偿非线性效应带来的系统性能的劣化。

与此同时,信噪比是影响系统性能的主要因素之一,也是衡量各种算法性能的标准之一。各种机器学习算法对系统信噪比的影响可以大致总结如下:

1) 对于K-means和DBSCAN等基于聚类和分类的机器学习算法,其仅能对相偏等因素导致的噪声有一定的作用,而对其他噪声的作用很小,甚至有可能使系统的性能进一步劣化。但是K-means和DBSCAN等算法的计算复杂度是上述算法中是最低的,且在基于聚类的应用场合中具有良好的效果。

2) 对于SVM等有监督学习的机器学习算法,由于其存在核技巧,可以进行高维度的非线性映射,因此其抗噪性能比K-means和DBSCAN等要强,但对于各种非线性相互影响的复杂问题的作用有限。SVM的计算复杂度介于ANN和聚类算法之间。

3) DNN和ANN具有强大的拟合能力,其中具有激活函数的DNN在节点数足够的情况下几乎可以拟合任何非线性映射关系,其性能比ANN更强。几乎可以这样认为:对于任意映射,在节点数足够的情况下,DNN都可以对其进行任意精度的逼近。然而,DNN带来的计算复杂度是最高的,对硬件有很高的要求。

需要注意的是,对于无规律的噪声信号,如高斯白噪声等,机器学习算法都是无法对其进行建模回归的,即机器学习算法无法处理无规律的噪声信号。因此,一旦无规律的噪声信号的信噪比降低到一定阈值,机器学习算法也就无法使通信系统得到更好的响应。

3 分析与讨论

机器学习作为一门新兴的学科,其强大的输入输出映射能力以及分类、回归性能已经得到了各行各业的广泛关注。虽然机器学习已经在图像、人工智能(AI)等领域取得了巨大成功,但其在VLC领域的应用还处于起步阶段。上文介绍的几种机器学习算法在VLC中应用总结如表 1所示,其中,Generalization表示泛化性,Pre-equ表示预均衡,Post-equ表示后均衡,Phase estimation表示相位估计,Nonlinear mitigating表示非线性缓解,CAP为无载波幅相调制,QAM为正交振幅调制,QPSK为四阶相移键控,PAM表示脉冲振幅调制。

表 1. 各种机器学习方法的总结

Table 1. Summarization of machine learning algorithms

ML algorithmApplicationActionpositionSupervisionModulationformatGeneralizationComputationcomplexity
K-meansPre-equPost-equTxRxNoCAP-16QAMWeakLow
DBSCANJitterMitigationRxNoCAP-16QAMWeakLow
SVMPhaseestimationRxYesCAP-QPSKMiddleMiddle
ANNPost-equRxYesPAM,QAMStrongMiddle
GK-DNNNonlinearmitigationRxYesPAM8StrongHigh

查看所有表

4 结束语

以上罗列的各种机器学习算法均有其不同的优势,在实际应用中需要实验人员根据自身的需求和实验的特点合理地加以选择,包括计算复杂度、系统非线性的强弱程度以及成本等问题。可以预见,随着大规模集成电路的发展和计算能力的快速提高,具有更加复杂网络的DNN,以及能够考虑前后电平信号的长短期记忆网络将会与VLC系统更好地结合。同时,对于目前还未在VLC系统中得到深入研究的卷积神经网络(CNN),由于其具有很强的特征提取能力,而可见光的空间信道非常复杂,需要从噪声中提取出有用的信息,因此可以预见在不远的将来CNN将被应用于可见光系统中。

如今,机器学习已经迎来了自己的第三波浪潮。各个学科与机器学习算法交叉融合,已经产生出了无数令人心潮澎湃的成果。笔者相信,伴随着LED市场的不断扩大,集成电路计算能力的指数级增长,结合机器学习的VLC必将拥有一个广阔的舞台和光明的未来。

参考文献

[1] Chi N, Haas H, Kavehrad M, et al. Visible light communications: demand factors, benefits and opportunities[Guest Editorial][J]. IEEE Wireless Communications, 2015, 22(2): 5-7.

[2] TanakaY, HaruyamaS, NakagawaM. Wireless optical transmissions with white colored LED for wireless home links[C]∥11th IEEE International Symposium on Personal Indoor and Mobile Radio Communications. PIMRC 2000. Proceedings (Cat. No.00TH8525), September 18-21, 2000, London, UK. New York: IEEE, 2000: 1325- 1329.

[3] Haas H, Yin L, Wang Y L, et al. What is LiFi?[J]. Journal of Lightwave Technology, 2016, 34(6): 1533-1544.

[4] O'Brien D. Minh H L, Zeng L B, et al. Indoor visible light communications: challenges and prospects[J]. Proceedings of SPIE, 2008, 7091: 709106.

[5] 贾科军, 靳斌, 郝莉. 室内可见光通信OFDM自适应比特功率加载算法性能分析[J]. 激光与光电子学进展, 2019, 56(3): 030603.

    Jia K J, Jin B, Hao L. Performance analysis of optical OFDM adaptive bit-power loading in indoor visible light communications[J]. Laser & Optoelectronics Progress, 2019, 56(3): 030603.

[6] 杨玉峰, 蒋明争, 张颖, 等. 基于单光源的全双工可见光通信系统设计[J]. 激光与光电子学进展, 2019, 56(1): 010603.

    Yang Y F, Jiang M Z, Zhang Y, et al. Design of full duplex visible light communication system based on single light source[J]. Laser & Optoelectronics Progress, 2019, 56(1): 010603.

[7] Neokosmidis I, Kamalakis T, Walewski J W, et al. Impact of nonlinear LED transfer function on discrete multitone modulation: analytical approach[J]. Journal of Lightwave Technology, 2009, 27(22): 4970-4978.

[8] Ying K, Yu Z H, Baxley R J, et al. Nonlinear distortion mitigation in visible light communications[J]. IEEE Wireless Communications, 2015, 22(2): 36-45.

[9] Inan B. Jeffrey Lee S C, Randel S, et al. Impact of LED nonlinearity on discrete multitone modulation[J]. Journal of Optical Communications and Networking, 2009, 1(5): 439-451.

[10] Wang Y G, Tao L, Huang X X, et al. 8-Gb/s RGBY LED-based WDM VLC system employing high-order CAP modulation and hybrid post equalizer[J]. IEEE Photonics Journal, 2015, 7(6): 7904507.

[11] Bishop CM. Pattern recognition and machine learning[M]. New York: Springer, 2006: 103- 107.

[12] 卓刘, 陈晓琪, 谢振平, 等. 基于深度神经网络的迷彩目标发现仿真学习方法[J]. 激光与光电子学进展, 2019, 56(7): 071102.

    Zhuo L, Chen X Q, Xie Z P, et al. Simulation learning method for discovery of camouflage targets based on deep neural networks[J]. Laser & Optoelectronics Progress, 2019, 56(7): 071102.

[13] 曲磊, 王康如, 陈利利, 等. 基于RGBD图像和卷积神经网络的快速道路检测[J]. 光学学报, 2017, 37(10): 101003.

    Qu L, Wang K R, Chen L L, et al. Fast road detection based on RGBD images and convolutional neural network[J]. Acta Optica Sinica, 2017, 37(10): 101003.

[14] 朱玥, 覃尧, 董岚, 等. 人工智能在移动通信网络中的应用: 基于机器学习理论的信道估计与信号检测算法[J]. 信息通信技术, 2019, 13(1): 19-25.

    Zhu Y, Qin Y, Dong L, et al. Application cases of artificial intelligence in mobile communication networks: machine-learning-based channel estimator and signal detector[J]. Information and Communications Technologies, 2019, 13(1): 19-25.

[15] Khan FN, LuC, Lau A P T. Machine learning methods for optical communication systems[C]∥Advanced Photonics 2017 (IPR, NOMA, Sensors, Networks, SPPCom, PS), July 24-27, 2017, New Orleans, Louisiana, United States. Washington, D.C.: OSA, 2017: SpW2F. 3.

[16] Khan F N. Shen T S R, Zhou Y D, et al. Optical performance monitoring using artificial neural networks trained with empirical moments of asynchronously sampled signal amplitudes[J]. IEEE Photonics Technology Letters, 2012, 24(12): 982-984.

[17] TanimuraT, HoshidaT, Rasmussen JC, et al. OSNR monitoring by deep neural networks trained with asynchronously sampled data[C]∥2016 21st OptoElectronics and Communications Conference (OECC) held jointly with 2016 International Conference on Photonics in Switching (PS), July 3-7, 2016, Niigata, Japan. New York: IEEE, 2016: 16424746.

[18] Skoog R A, Banwell T C, Gannett J W, et al. Automatic identification of impairments using support vector machine pattern classification on eye diagrams[J]. IEEE Photonics Technology Letters, 2006, 18(22): 2398-2400.

[19] Tan M C, Khan F N. Al-Arashi W H, et al. Simultaneous optical performance monitoring and modulation format/bit-rate identification using principal component analysis[J]. Journal of Optical Communications and Networking, 2014, 6(5): 441-448.

[20] Gonzalez NG, ZibarD, Monroy IT. Cognitive digital receiver for burst mode phase modulated radio over fiber links[C]∥36th European Conference and Exhibition on Optical Communication, September 19-23, 2010, Torino, Italy. New York: IEEE, 2010: 11636818.

[21] Khan F N, Zhou Y D. Lau A P T, et al. Modulation format identification in heterogeneous fiber-optic networks using artificial neural networks[J]. Optics Express, 2012, 20(11): 12422-12431.

[22] Khan F N, Yu Y, Tan M C, et al. Experimental demonstration of joint OSNR monitoring and modulation format identification using asynchronous single channel sampling[J]. Optics Express, 2015, 23(23): 30337-30346.

[23] Khan F N, Zhong K P. Al-Arashi W H, et al. Modulation format identification in coherent receivers using deep machine learning[J]. IEEE Photonics Technology Letters, 2016, 28(17): 1886-1889.

[24] He H T, Wen C K, Jin S, et al. Deep learning-based channel estimation for beamspace mmWave massive MIMO systems[J]. IEEE Wireless Communications Letters, 2018, 7(5): 852-855.

[25] Ye H, Li G Y, Juang B H. Power of deep learning for channel estimation and signal detection in OFDM systems[J]. IEEE Wireless Communications Letters, 2018, 7(1): 114-117.

[26] Ha Y, Niu W Q, Chi N. Frequency reshaping and compensation scheme based on deep neural network for a FTN CAP 9QAM signal in visible light communication system[J]. Proceedings of SPIE, 2019, 11048: 110482F.

[27] Chi N, Zhao Y H, Shi M, et al. Gaussian kernel-aided deep neural network equalizer utilized in underwater PAM8 visible light communication system[J]. Optics Express, 2018, 26(20): 26700-26712.

[28] Lu X Y, Lu C, Yu W X, et al. Memory-controlled deep LSTM neural network post-equalizer used in high-speed PAM VLC system[J]. Optics Express, 2019, 27(5): 7822-7833.

[29] Yu W X, Lu X Y, Chi N. Signal decision employing density-based spatial clustering of machine learning in PAM-4 VLC system[J]. Proceedings of SPIE, 2018, 10849: 108491D.

[30] Lu X Y, Qiao L, Zhou Y J, et al. An I-Q-Time 3-dimensional post-equalization algorithm based on DBSCAN of machine learning in CAP VLC system[J]. Optics Communications, 2019, 430: 299-303.

[31] Lu X Y, Wang K H, Qiao L, et al. Nonlinear compensation of multi-CAP VLC system employing clustering algorithm based perception decision[J]. IEEE Photonics Journal, 2017, 9(5): 7906509.

[32] Lu XY, Zhao MM, QiaoL, et al. Non-linear compensation of multi-CAP VLC system employing pre-distortion base on clustering of machine learning[C]∥Optical Fiber Communication Conference, March 11-15, 2018, San Diego, California, United States. Washington, D.C.: OSA, 2018: M2K. 1.

[33] Lu X, Zhou Y, Qiao L, et al. Amplitude jitter compensation of PAM-8 VLC system employing time-amplitude two-dimensional re-estimation base on density clustering of machine learning[J]. Physica Scripta, 2019, 94(5): 055506.

[34] Niu WQ, HaY, ChiN. Novel phase estimation scheme based on support vector machine for multiband-CAP visible light communication system[C]∥2018 Asia Communications and Photonics Conference (ACP), October 26-29, 2018, Hangzhou, China. New York: IEEE, 2018: 18382490.

[35] Suykens J A K, Vandewalle J. Least squares support vector machine classifiers[J]. Neural Processing Letters, 1999, 9(3): 293-300.

[36] ScholkopfB, Smola AJ. Learning with kernels: support vector machines, regularization, optimization, and beyond[M]. Cambridge: MIT Press, 2001: 133- 145.

[37] Haigh P A, Ghassemlooy Z, Rajbhandari S, et al. Visible light communications: 170 Mb/s using an artificial neural network equalizer in a low bandwidth white light configuration[J]. Journal of Lightwave Technology, 2014, 32(9): 1807-1813.

[38] Guan W P, Wu Y X, Xie C Y, et al. High-precision approach to localization scheme of visible light communication based on artificial neural networks and modified genetic algorithms[J]. Optical Engineering, 2017, 56(10): 106103.

[39] Haigh PA, GhassemlooyZ, PapakonstantinouI, et al. A MIMO-ANN system for increasing data rates in organic visible light communications systems[C]∥2013 IEEE International Conference on Communications (ICC), June 9-13, 2013, Budapest, Hungary. New York: IEEE, 2013: 5322- 5327.

邹鹏, 赵一衡, 胡昉辰, 迟楠. 基于机器学习的可见光通信信号处理研究现状[J]. 激光与光电子学进展, 2020, 57(1): 010001. Peng Zou, Yiheng Zhao, Fangchen Hu, Nan Chi. Research Status of Machine Learning Based Signal Processing in Visible Light Communication[J]. Laser & Optoelectronics Progress, 2020, 57(1): 010001.

本文已被 9 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!