一种低复杂度和便于硬件移植的非线性均衡算法及其UWOC实时补偿实验演示

提出一种低复杂度、低功耗且便于硬件移植、可应用于水下无线光通信（UWOC）系统的基于链表和线性表的稀疏Volterra（3l-sVolterra）算法，它通过结合链表与线性表的新数据结构来存储Volterra算法中的所有参数，有效降低了Volterra算法更新参数所需的片上资源消耗，同时能对参与运算的非线性项进行稀疏处理，便于移植到小型硬件系统中。随后，在C6748芯片上实现了所提出的算法，并搭建了基于绿光LED的UWOC系统，对设计的数字信号处理（DSP）系统和UWOC系统进行了性能测试。结果表明，与无稀疏操作的Volterra算法相比，所提算法能在保留相近非线性补偿能力的同时，将资源消耗降低30%，在5 m长水箱信道UWOC系统中实现了20 Mbit/s的通信速率。

Abstract

Objective

Underwater wireless optical communication (UWOC) has advantages such as high bandwidth, high data rate, low latency, and small form factor. It can support the transmission of high-speed, high-capacity, real-time, and multimedia services like underwater images and videos. Light-emitting diodes (LEDs) are cost-effective light sources with high energy efficiency, and their wide-angle beam profile relaxes the alignment requirements between the transmitter and receiver. However, high-power LED sources have narrow bandwidth and exhibit strong non-linear effects. Additionally, the underwater optical channel is affected by absorption, scattering, turbulence, and bubbles, while the photodetectors may also exhibit non-linear effects. These factors lead to non-linear distortion of the optical signal, severely affecting communication bandwidth and limiting transmission distance. The Volterra algorithm is commonly used for non-linear compensation in communication systems, but it has high complexity and computational overhead. Most existing research on the Volterra algorithm involves offline processing, which is not conducive to miniaturization and low power consumption in underwater environments. Therefore, we propose a low-complexity, low-power, and hardware-friendly 3l-sVolterra (link and linear list-based sparse Volterra) algorithm for UWOC systems. By combining new data structures based on linked lists and linear lists to store all the parameters of the Volterra algorithm, the on-chip resources required for updating the Volterra algorithm's parameters are effectively reduced. It also facilitates sparse processing of the participating non-linear terms, making it suitable for small-scale hardware systems. Compared with the 3l-Volterra algorithm without sparsity operations, this algorithm reduces resource consumption by 30% while preserving similar non-linear compensation capabilities. We hope that the proposed 3l-sVolterra algorithm can promote miniaturization and real-time underwater applications of UWOC systems.

Methods

The 3l-sVolterra algorithm utilizes a combined data format of linked lists and linear lists to store the parameters for Volterra operations. The algorithm achieves parameter updates through N multiplications, one node insertion, and traversal of the remaining N-1 nodes in the linked list, significantly improving the efficiency of each update and operation. The algorithm's sparse operations on the non-linear terms further reduce on-chip resource consumption. We implement and validate the 3l-sVolterra algorithm on a low-power and miniaturize digital signal processing (DSP) chip, the C6748. We also design a DSP subsystem based on the C6748 as the core. In the receiving end, the optical signal is converted into an electrical signal by an avalanche photo diode (APD). The electrical signal is then amplified and input to an analog-to-digital conversion (ADC) module. Finally, the converted digital signal is synchronized, demodulated, and subjected to non-linear equalization by the DSP subsystem.

Results and Discussions

In a 5 m-long underwater channel, the UWOC system employs the CAP-4 modulation scheme for data transmission. The experiment tests the compensation capability of the 3l-sVolterra algorithm in the entire UWOC system with four different memory lengths (10, 14, 18, and 20) and varying numbers of retained terms (4, 8, 12, and 16). As the memory length increases, the 3l-Volterra algorithm (the 3l-sVolterra algorithm without sparse operations) enhances the compensation capability of the entire UWOC system, achieving a channel bandwidth expansion of up to 20 Mbit/s. While maintaining similar non-linear compensation capabilities to the algorithm without sparsity operations, the 3l-sVolterra algorithm reduces on-chip resource consumption by 30%. When a non-linear compensation algorithm with a memory length of N is processed, the number of retained non-linear terms should be greater than N/2, so as to ensure the majority of non-linear compensation capability. The influence of non-linear terms beyond the N/2 range gradually diminishes. This algorithm is suitable for DSP hardware systems and can be ported to hardware systems of other architectures.

Conclusions

We propose a low-complexity, low-power, and hardware-friendly 3l-sVolterra algorithm. The algorithm adopts a new data structure that combines linked lists and linear lists to store all the parameters of the Volterra algorithm, effectively reducing the on-chip resources required for parameter updates. It also allows sparse operations on the non-linear terms of the Volterra algorithm and facilitates portability to different small-scale hardware systems. Furthermore, a DSP subsystem based on the 3l-sVol algorithm is implemented on the C6748 chip, and a UWOC system is constructed using a 5 m-long water tank to test the designed DSP subsystem. Compared with the 3l-Vol algorithm, the proposed algorithm reduces on-chip resource consumption by 30% while maintaining similar non-linear compensation capability. By changing the memory length and the number of retained terms in the Volterra algorithm, the variation of the algorithm's non-linear compensation capability in the constructed UWOC system is tested. Reducing the number of retained terms can effectively reduce the on-chip resource consumption of the Volterra algorithm. This is the first time that a non-linear equalization algorithm has been ported to a DSP chip, achieving synchronous data transmission and real-time non-linear compensation in the DSP-based UWOC system. The DSP subsystem has good compensation capability for both linear and non-linear distortions, as well as system bandwidth extension ability, which is of great significance for miniaturizing the UWOC system and promoting its real-time underwater applications.

1　引言

海洋的探索与保护、资源的开发和利用等都离不开水下信息的高效采集与通信^［1］。常见的水下无线通信主要有水声通信、水下射频通信和水下无线光通信，相较于前二者，水下无线光通信具有带宽大、速率高、时延短、设备功耗低、体积小等优点，能支持水下图像、视频等高速率、大容量、实时多媒体业务的传输，在未来高速局域组网或与长距离水声通信混合组网中，必将发挥重要作用^［2］。发光二极管（LED）和激光二极管（LD）被广泛用作水下无线光通信（UWOC）系统的光源。LED具有成本低、能效高的特点，而且它的宽角度光束轮廓可以放宽光发射机与光接收机之间对准的要求。由于成本低、对温度不敏感，且可通过增加LED光源的输出功率或采用LED阵列来延长通信距离，LED作为光源能在水下中/短距离通信中发挥重要作用。

大功率LED光源不仅带宽窄，而且存在较强的非线性效应。同时，水下光信道也存在吸收、散射、湍流和气泡等不良现象^［3-4］，光电探测器可能还存在非线性效应等^［5］，这些都会造成光信号的非线性失真，严重影响通信带宽、限制传输距离^［6］。在自由空间光通信中，不少研究通过离线仿真的方式，验证了调制方式的复杂程度同样会影响LED光源的非线性，进而影响整个通信系统的性能，如脉冲幅度调制（PAM）^［7］、无载波幅度相位（CAP）调制^［8］和多载波系统［如正交频分复用（OFDM）］等^［9-10］。文献［11］离线分析了无载波幅度相位调制、正交频分复用^［12］以及离散傅里叶变化扩频（DFT-S）OFDM这3种调制方式在UWOC系统中的传输性能。文献［13］在实验中测试了开关键控调制（OOK）和16进制的正交幅度调制^［14］（QAM）在UWOC系统中的性能。当采用高阶调制方式时，系统所受的总非线性效应的影响会加剧。

针对UWOC系统非线性效应的影响，大多数研究是在接收端采用Volterra算法进行后均衡处理，以增加系统的复杂度为代价换取系统性能的提升。为了降低Volterra算法的复杂度，文献［15］在离线处理中通过减少参与运算项来降低Volterra算法的复杂度，以对基于LD的UWOC系统进行非线性均衡。文献［16］在离线解调中将Volterra算法中的交叉项乘法操作替换为两个输入样本和的绝对值，并展示了一种基于绝对值操作的稀疏剪枝项非线性决策反馈均衡方法。但是，现有的非线性均衡算法大多是在接收端通过高速数字存储示波器（DSO）采集数据后，在PC端离线处理以实现均衡补偿^［15-18］，而离线处理无法满足UWOC系统水下小型化部署的实际需求。此外，在实现小型硬件系统时，Volterra算法的复杂度高、占用片上资源多以及数据处理计算开销大。

为了满足UWOC光端机的小型化、低成本和强鲁棒性的实用需求，本文提出一种低复杂度、低功耗且便于硬件移植的3l-sVolterra算法，它结合链表与线性表的数据结构来存储Volterra算法中的所有参数，且对参数中非线性项进行稀疏操作处理，并在功耗低、小型化的DSP芯片C6748上进行实验验证。随后，在实验室搭建了基于所设计的DSP子系统的5 m长的UWOC实验系统，对其进行性能测试。结果表明，与基于链表和线性表的无稀疏操作Volterra算法（即3l-Volterra算法）相比，所提出的3l-sVolterra算法能在保留与3l-Volterra算法相近的非线性补偿能力的同时，将资源消耗降低30%，在CAP-4调制方式下将UWOC系统的传输速率增大至20 Mbit/s。此外，该算法还便于移植到不同的硬件系统，利于UWOC系统的实时处理与小型化。本文将非线性均衡算法移植到DSP芯片上，实现了基于DSP的UWOC系统的同步数据传输和实时非线性补偿。

2　UWOC系统构成

在强度调制/直接检测（IM/DD）光通信系统中，CAP是一种提高数据传输速率的低成本、低复杂度的调制技术^［19］，可以在带宽有限的情况下大幅提升通信系统的传输速率。与传统的单载波调制技术相比，CAP在调制过程中不存在载波相乘的过程，而是直接利用两组相互正交的成型滤波器来产生带通脉冲信号，通过改变同相和正交支路的波形来反映传输的数据流，故被称为“无载波”调制技术。IM/DD光通信CAP调制原理框图如图1所示。

图 1. CAP调制通信系统原理框图

Fig. 1. Block diagram of CAP modulation communication system

下载图片查看所有图片

发送端输入二进制数据比特流进行QAM星座图映射。将映射生成的复数信号分成同相I路和正交Q路两路信号，这两路信号可以生成M进制的CAP调制星座图，称为CAP-M调制。对I（n）和Q（n）两路信号分别进行上采样后，让它们再分别通过同相滤波器 $f (t)$ 和正交滤波器 $\hat{f} (t)$ ，然后将这两路信号相减，导入任意波形发生器（AWG）进行数/模转换，输出信号x（t）可表示为

x (t) = \sum_{n = - \infty}^{\infty} I (n) \cdot f (t - n T) - Q (n) \cdot \hat{f} (t - n T)

，（1）

式中：T为符号周期；同相滤波器 $f (t)$ 和正交滤波器 $\hat{f} (t)$ 的冲激响应为

\{\begin{array}{l} f (t) = g (t) c o s (2 π f_{c} t) \\ \hat{f} (t) = g (t) s i n (2 π f_{c} t) \end{array}

，（2）

式中：g（t）为根升余弦滤波器；f_c为载波频率（与码元速率相同）。图1的接收端采集到的信号经过匹配滤波器后，分别被接收端的同相匹配滤波器和正交匹配滤波器滤波处理，在下采样进行时间恢复并进行星座图解映射得到数据x（n）。恢复后的数据x（n）再经非线性均衡处理得到结构y（n），将y（n）作为结果存储在片外存储器中。

3　非线性均衡算法及其实现

3.1　Volterra算法

由于Volterra均衡算法具有灵活的线性和非线性补偿能力，本文选择Volterra非线性均衡算法来提高UWOC系统的通信性能。在接收端，DSP的输入信号x（n）与输出信号y（n）之间的关系为

y (n) = w_{0} + \sum_{i = 0}^{N_{1} - 1} w_{1} (i) x (n - i) + \sum_{i = 0}^{N_{2} - 1} \sum_{j = i}^{N_{2} - 1} w_{2} (i, j) x (n - i) x (n - j)

，（3）

式中：x（n）为需要进行均衡处理的序列；y（n）为经过均衡算法处理的结果；w₁（i）和w₂（i，j）分别对应Volterra算法的线性项和二阶非线性项的权重；N₁和N₂分别为线性和二阶非线性的记忆长度。若增加高阶项或者延长记忆长度，Volterra算法对信道的拟合和补偿效果更好，但是其算法的复杂度会呈指数式增加。为此，本文提出一种低复杂度、低功耗且便于硬件移植的3l-sVolterra算法，它结合链表与线性表的数据结构来存储Volterra算法中的所有参数，且对参数中的非线性项进行稀疏操作。

3.2　3l-sVolterra均衡补偿算法

3.2.1　数据结构的更新操作

为了方便处理数据，通常使用线性表来存储一阶线性项和二阶交叉项的参数，并将各阶项首尾相连地拼接在一起，方便后续的DSP点乘运算。假定记忆长度N为6，当前时刻采样值为x_n，存储当前数据的顺序表和未来更新的数据表如图2所示。通常情况下，通过乘法重新计算所有交叉项来更新下一组参数^{［15-16，20］}，算法运算量为N×（N+1）/2次乘法运算。对于采用DSP芯片进行数据存储和处理的水下小型端机，可以在运算过程中通过减少乘法操作来进一步降低算法复杂度。对比图2（a）和图2（b），可以保留当前时刻顺序表中的部分结果来减少更新乘法的运算量。在每次更新参数线性表时，通过移动需要保留的数据可以将每次更新的开销简化为N次乘法，以及N次存储器的块搬移［需要搬移（N×（N-1）/2）个元素］，但是其操作复杂度始终为O（N²）。

图 2. Volterra算法各阶项线性表存储格式。（a）当前时刻；（b）下一时刻

Fig. 2. Linear list storage format for each order term in the Volterra algorithm. (a) Current time; (b) next time

下载图片查看所有图片

为了优化算法、降低复杂度，通常进行剪枝操作来稀疏需要运算的参数^［10-11］，这可以通过将权重较小的参数设置为0或移除该参数来实现。但在DSP芯片架构中，置0操作并不能降低算法的复杂度。此外，如果使用线性表［图2（a）］进行删除操作，则需要移动大量数据，从而增加移动操作开销。因此，线性表并不适合稀疏操作优化。相比之下，链表存储数据可以有效地实现删除操作，但在后续的乘法运算中需要从节点中逐次提取数据，这就影响到算法的效率。结合上述情况，3l-sVolterra算法使用一种链表与线性表相结合的数据格式来存储Volterra运算的参数。

设定的节点包含整型数据（表示当前节点指向线性表中有效数据的个数）、指向数据浮点型指针和指向下一个节点的指针。该数据结构将交叉项以x_n_-_i（i=0，1，2，…，n）为键值进行划分。如图3（a）所示，记忆长度N为6，头指针中浮点型指针指向一阶线性项，后续的指针分别指向二阶非线性项，有效值递减。同时设定尾指针指向数据链表的尾部，以方便操作。

图 3. 数据结构参数更新流程。（a）设计的数据结构；（b）执行操作①后的数据结构；（c）执行操作②后的数据结构；（d）执行操作③后的数据结构

Fig. 3. Data structure parameter update process. (a) Designed data structure; (b) data structure after executing operation ①; (c) data structure after executing operation ②; (d) data structure after executing operation ③

下载图片查看所有图片

所提出的数据结构参数更新流程如下：①将要更新的数据加入指针头部，同时将更新的二阶交叉项覆盖尾指针的数据，更新尾指针的有效值为N，如图3（b）所示；②将尾指针插入到头指针后的节点处，如图3（c）所示；③尾指针从第二个节点开始，遍历剩余节点，将剩余节点中有效值减1［图3（d）］，复位尾指针。

3l-sVolterra算法通过N次乘法、一次节点插入和对链表中剩下的N-1个节点的遍历，同时重置尾指针来完成参数更新，从而显著提高每次更新和运算的效率。随着记忆长度的增加，由更新带来片上消耗的复杂度降低为O（N）。后续可以通过增加链表的节点来对三阶级数交叉项进行存储和操作，以适应不同的环境需求。当面对高速率的UWOC系统需要较长的记忆长度时，所设计的数据结构能够直接映射到硬件系统的寄存器、内存上，更适合在DSP硬件系统上实现，并可以移植到其他架构的硬件系统上。

3.2.2　非线性项稀疏操作

3l-sVolterra算法稀疏操作的原理是通过剔除Volterra算法中“不重要”的权重，以减少参数的存储量和计算量，同时尽量保证算法的非线性补偿能力不受影响。根据设计的数据结构，将交叉项数据以x_n_-_i（i>0）划分为最小操作单位。如图4（a）所示，在算法完成对各阶参数的w（n）权重估计后，根据式（4），计算各组非线性项的均方值，以保证后续稀疏操作只与各个数据组中参数的权重有关。同时，在DSP芯片上能够简单快速地实现一组数据均方值的计算，从而降低算法的资源消耗。式（4）中w_n_，_k对应图4（a）中的参数， ${\bar{w}}_{n}$ 表示图4（a）中每一组的均方值，并作为后续非线性项稀疏操作的判断值。

图 4. 各阶参数权重w（n）存储结构。（a）w（n）的存储结构；（b）稀疏操作后的数据结构

Fig. 4. Storage structure for the weights of each order parameter w(n). (a) Storage structure of w(n); (b) data structure after sparse operation

下载图片查看所有图片

{\bar{w}}_{n} = \frac{1}{n} \sum_{k = 1}^{n} | w_{n, k} |^{2} (n = 1,2, \dots, N)

。（4）

随后，根据记忆长度N和需求确定保留项m（比如N为6时，m为4），再设计一个节点数为m、以链表head1指向进行稀疏操作的数据结构。根据 ${\bar{w}}_{n}$ 从大到小将保留的数据组与链表head1中对应的节点连接来实现稀疏操作［如删除第3和第5非线性项，如图4（b）所示］，后续历遍head1链表与其对应的图4（a）中参数权重进行点乘运算。双链表保证了算法在进行更新和稀疏操作时不会相互影响。记忆长度为N的3l-Volterra算法需要进行N+N×（N+1）/2次乘法运算，而稀疏操作后的乘法运算次数为N+（2×N-m+1）×m/2，进一步降低了片上资源消耗。

4　UWOC系统实验原理与装置

所搭建的基于绿色LED光源的DSP-based UWOC实验系统框图如图5所示，实物与实验现场图如图6所示。在实验中，光信号穿过一个长为5 m的清澈海水信道（水箱体积为5 m×0.5 m×0.5 m，实验中传输距离受限于实验室水箱的长度），通过传输m伪随机序列（PRBS）来测试所设计的DSP子系统对UWOC系统的线性和非线性失真的补偿能力。为了生成m伪随机序列信号，将预先调制好的波形数据导入任意波形发生器（AWG；RIGOL-DG4062）。将要传输的信号通过bias-T直流偏置器叠加在10 V的直流源上来驱动绿光LED，如图6（a）所示。为了验证算法对非线性畸变的补偿能力，绿光LED采用普通的国产仿流明灯珠，其发射光功率为0.7815 W，波长为520 nm。

图 5. DSP-based UWOC实验系统构成框图

Fig. 5. Block diagram of DSP-based UWOC experimental system

下载图片查看所有图片

图 6. UWOC系统的实验装置和实验现场图。（a）发送端；（b）实验的水箱环境；（c）接收端

Fig. 6. Experimental setup and site of UWOC system. (a) Transmitter; (b) water tank for the experiment; (c) receiver

下载图片查看所有图片

到达光接收端的光束经过凸透镜聚焦后，由型号为LSSAPD9-500-C1-NF-1-1的雪崩光电二极管（APD）进行光/电转换，如图6（c）所示。在凸透镜的焦点处测得的光功率为0.0201 W，可计算出衰减系数为c（λ）=0.0664。APD的带宽为1 kHz~150 MHz，它输出的电信号经过增益为32 dB的低噪声放大器放大后，利用AD9226模/数转换芯片（最高采样速率为65 MSa/s）进行采样和量化，生成精度为12位的数据。最后，模/数转换生成的数字信号通过通用并行端口（uPP）通信协议，传输到DSP子系统的双倍速率同步动态随机存储器（DDR2）存储模块。本文选择一个60 MHz的有源晶振（由DSP开发板的5 V接口供电）来驱动uPP通信。

5　实验结果与分析

5.1　非线性均衡算法消耗

实验测试了所提出5组记忆长度为10、12、14、16、18的非线性均衡算法在保留项为8组（Base-8）和4组（Base-4）时芯片上的时间周期消耗，其中Traditional Vol表示使用乘法运算来更新参数的Volterra算法，3l-Vol表示基于链表和线性表无稀疏操作的Volterra算法，3l-sVol-Base-m表示基于链表和线性表稀疏操作的Volterra算法，其保留项为m组。DSP子系统在得到采样数据时标记一个时间戳，在存储完算法补偿的结果后再标记一个时间戳，将两个时间戳之差作为算法的片上资源消耗记录。各种算法的片上资源消耗结果如图7（a）和表1所示，其单位为机器周期（machine cycle）。随着记忆长度的增加，Traditional Vol由于使用乘法更新Volterra算法中的参数，其耗费的片上资源远超过其他算法。如表1所示，随着记忆长度增加至18，3l-sVol-Base-4算法可以有效地将片上资源消耗降低至41.9%，3l-sVol-Base-8算法则能在保留相近的非线性补偿能力的同时将资源消耗降低至70.9%。越接近当前时刻的参数项对当前时刻的影响越大，如图7（b）所示，4幅子图的横纵坐标都表示记忆长度，图中方块的颜色越深，表示权重值越大。由此可见，根据权值 ${\bar{w}}_{n}$ 挑选出的分组主要集中在当前时刻后。

图 7. Volterra算法消耗实验结果。（a）不同修剪长度在不同记忆长度Volterra算法的片上消耗；（b）权值估计后二阶参数的权重

Fig. 7. Experimental results of Volterra algorithm consumption. (a) On-chip consumption of different pruning conditions in Volterra algorithm with different memory lengths; (b) weights of second-order parameters after weight estimation

下载图片查看所有图片

表 1. 不同修剪长度在不同记忆长度Volterra算法的片上消耗

Table 1. On-chip consumption of different pruning conditions in Volterra algorithm with different memory lengths unit: machine cycle

On-chip consumption	10	12	14	16	18
Traditional Vol	7725399	19511789	36966534	55607325	79576008
3l-Vol	5282229	10442093	20599141	29230005	38838373
3l-sVol-Base-4	4127597	5299149	10383723	13208999	16261499
3l-sVol-Base-8	5064865	8322381	15060121	22303329	27536529

查看所有表

5.2　稀疏操作的效果

所使用的稀疏操作是一种粗剪枝策略，通过将交叉项数据以x_n_-_i（i>0）为单位进行剪枝，如图4（b）所示。这种操作方式能够减少参与运算的参数数量，从而降低运算的复杂度。然而，参数的减少可能会影响非线性补偿效果。图8和图9展示了记忆长度为10、14、18、20时不同保留项的稀疏操作在CAP-4调制下随码元速率（R_b）变化的误码率曲线，其中3l-Vol-N表示记忆长度为N时基于链表和线性表的Volterra算法，3l-sVol-N-Base-m则表示对3l-Vol-N算法增加非线性项稀疏操作。

图 8. Volterra算法在不同剪枝情况下随着码元速率变化的误码率曲线。（a）记忆长度为10；（b）记忆长度为14

Fig. 8. BER of Volterra algorithm with different pruning conditions as a function of symbol rate. (a) Memory length of 10; (b) memory length of 14

下载图片查看所有图片

图 9. 记忆长度为18和20时Volterra算法在不同剪枝情况下随着码元速率变化的误码率曲线。（a）记忆长度为18；（b）记忆长度为20

Fig. 9. BER of Volterra algorithm with memory lengths of 18 and 20 under different pruning conditions as a function of symbol rate. (a) Memory length of 18; (b) memory length of 20

下载图片查看所有图片

记忆长度为10的非线性均衡算法的误码率曲线如图8（a）所示，在没有进行稀疏操作的情况下（即所提出的3l-Vol-10），其信道带宽被展宽至12 Mbit/s以上。受到记忆长度的限制，该算法对UWOC系统的信道补偿能力受到一定限制，因此，当3l-sVol-10保留项为8和4时，对应的误码率进一步增大。如图8（b）所示，对于记忆长度为14的非线性均衡算法，所提出的3l-Vol-14算法能将信道带宽展宽至15 Mbit/s。Base-8保留了算法的大部分非线性项，误码率曲线接近无稀疏操作时的曲线。对于保留项为4的情况，较少的非线性项使算法对系统的补偿能力较差。面对更高的码元速率，Base-4的误码率显著上升，与Base-8的非线性补偿能力差距不断增大。

如图9所示，记忆长度为18和20的无稀疏非线性均衡算法（3l-Vol-18和3l-Vol-20）能够将UWOC系统的信道带宽补偿至20 Mbit/s以上。从图9（a）、（b）可看出，保留项数为8时的误码率曲线明显高于无稀疏操作的情况。由于Base-8算法在18和20两种记忆长度下只保留了少于N/2的非线性项，无法在20 Mbit/s速率时满足前向纠错（FEC）阈值（3.8×10^-3）的要求。为了更详细地分析保留项的数量与信道补偿能力之间的关系，进一步增加保留项数进行实验。Base-12算法在18和20两种记忆长度下，能够将UWOC系统的信道带宽补偿至20 Mbit/s左右，可保证无稀疏算法的大部分非线性补偿能力。当记忆长度为20时，Base-12和Base-16两种算法的误码率曲线差距不大，对整个UWOC系统的非线性补偿能力近似。当通信速率超过21 Mbit/s时，各个算法的误码率曲线急剧上升。

稀疏算法能够通过删除权重较小的项来减少算法的资源消耗。由于Base-4算法保留的非线性项数较少，其性能近似于线性均衡，无法有效地补偿高速UWOC系统的非线性畸变。在本研究中，3种记忆长度下Base-4算法的误码率都无法满足通信性能的要求。在记忆长度N为10和14的情况下，Base-8算法保留的非线性项数大于N/2，能够在减少片上消耗的同时，保留Volterra算法非线性补偿的大部分性能。当记忆长度为18和20时，Base-8算法由于保留的非线性项数小于N/2，无法将UWOC系统的信道带宽展宽至20 Mbit/s以上。在记忆长度为18和20的情况下，Base-12算法由于保留的非线性项数大于N/2，其误码率曲线逼近未经稀疏操作的情况。对于记忆长度为20的情况，随着通信速率的提高，Base-12算法与Base-16算法对UWOC系统的非线性均衡补偿能力相当，这是因为它们都保留了超过N/2的权重较大的非线性项。面对记忆长度为N的非线性补偿算法时，为了保证大部分非线性补偿能力，所保留的非线性项数要大于N/2，而超出N/2范围的非线性项对非线性补偿能力的影响逐渐变小。

当通信速率超过20 Mbit/s时，非线性均衡算法无法通过提高记忆长度来有效地降低误码率。从图9可以看出，当通信速率为24 Mbit/s和27 Mbit/s时，经过算法均衡后的星座图依旧交织在一起，存在不同程度的旋转。调制信号的频率严重超过LED带宽的限制，导致光信号发生严重的非线性畸变。因此，提高记忆长度或者增加高阶参数（三阶交叉项），并不能进一步提高算法对整个UWOC系统的非线性补偿能力，只能通过选择带宽更大的LED光源来提高通信速率。

6　结论

提出一种低复杂度、低功耗且便于硬件移植的3l-sVolterra算法。该算法采用新的数据结构，将链表和线性表相结合，以存储Volterra算法的所有参数，有效降低了Volterra算法参数更新所需的片上资源，还能对Volterra算法非线性项进行稀疏操作，且便于移植到不同的小型硬件系统上。此外，在C6748芯片实现了基于3l-sVol算法的DSP子系统，利用5 m长水箱搭建一个UWOC系统来测试所设计的DSP子系统。与3l-Vol算法相比，所提出的算法在保持与其相近的非线性补偿能力的同时，将片上资源消耗降低了30%。通过更改Volterra算法的记忆长度和保留项数量，在搭建的UWOC系统中测试算法对系统非线性补偿能力的变化。通过减少保留项能有效降低Volterra算法的片上资源消耗。将非线性均衡算法移植到DSP芯片上，实现了基于DSP的UWOC系统的同步数据传输和实时非线性补偿。该DSP子系统具有较好的线性和非线性失真的补偿能力以及系统带宽扩展能力，对于UWOC系统的小型化和推动其水下实时应用，具有重要意义。

参考文献

[1] Zhu S J, Chen X W, Liu X Y, et al. Recent progress in and perspectives of underwater wireless optical communication[J]. Progress in Quantum Electronics, 2020, 73: 100274.

[2] Saeed N, Celik A, Al-Naffouri T Y, et al. Underwater optical wireless communications, networking, and localization: a survey[J]. Ad Hoc Networks, 2019, 94: 101935.

[3] 张建磊, 寇琳琳, 王洁, 等. 水下无线光信道并行仿真方法研究[J]. 激光与光电子学进展, 2022, 59(19): 1901001.

Zhang J L, Kou L L, Wang J, et al. Research on parallel simulation method of underwater wireless optical channel[J]. Laser & Optoelectronics Progress, 2022, 59(19): 1901001.

[4] 周龙杰, 周东, 曾文兵. 基于平顶光束的水下无线光通信系统的仿真分析[J]. 激光与光电子学进展, 2018, 55(7): 070603.

Zhou L J, Zhou D, Zeng W B. Simulation analysis of undersea wireless optical communication system based on flat-topped beam[J]. Laser & Optoelectronics Progress, 2018, 55(7): 070603.

[5] Ju C, Liu N, Chen X, et al. SSBI mitigation in A-RF-tone-based VSSB-OFDM system with a frequency-domain Volterra series equalizer[J]. Journal of Lightwave Technology, 2015, 33(23): 4997-5006.

[6] 石佳, 黄爱萍, 陶林伟. 深度学习辅助水下光通信信道估计和信号检测[J]. 中国激光, 2022, 49(17): 1706004.

Shi J, Huang A P, Tao L W. Deep learning aided channel estimation and signal detection for underwater optical communication[J]. Chinese Journal of Lasers, 2022, 49(17): 1706004.

[7] Stepniak G, Siuzdak J, Zwierko P. Compensation of a VLC phosphorescent white LED nonlinearity by means of Volterra DFE[J]. IEEE Photonics Technology Letters, 2013, 25(16): 1597-1600.

[8] Wang Y G, Tao L, Huang X X, et al. Enhanced performance of a high-speed WDM CAP64 VLC system employing Volterra series-based nonlinear equalizer[J]. IEEE Photonics Journal, 2015, 7(3): 7901907.

[9] Li J F, Huang Z T, Liu X S, et al. Hybrid time-frequency domain equalization for LED nonlinearity mitigation in OFDM-based VLC systems[J]. Optics Express, 2015, 23(1): 611-619.

[10] ZhangG W, FeiC, HeS L, et al. Sparse nonlinear equalization with match pursuit for LED based visible light communication systems[C]∥2017 Asia Communications and Photonics Conference (ACP), November 10-13, 2017, Guangzhou, China. New York: IEEE Press, 2017.

[11] Chi N, Shi M. Advanced modulation formats for underwater visible light communications[J]. Chinese Optics Letters, 2018, 16(12): 120603.

[12] 任秀云, 李秀娜, 张延超, 等. 基于直流偏置正交频分复用的水下光通信自适应光强探测电路设计[J]. 光学学报, 2023, 43(24): 2406002.

Ren X Y, Li X N, Zhang Y C, et al. Design of adaptive light intensity detection circuit for underwater optical communication based on direct-curren-biased optical orthogonal frequency division multiplexing[J]. Acta Optica Sinica, 2023, 43(24): 2406002.

[13] 黄安, 殷洪玺, 季秀阳, 等. 基于现场可编程门阵列和大功率LED阵列光源的小型化水下无线光通信系统的研究与实现[J]. 光学学报, 2024, 44(6): 0606002.

Huang A, Yin H X, Ji X Y, et al. Research and implementation of miniaturized underwater wireless optical communication system based on field programmable gate array and high-power LED array light source[J]. Acta Optica Sinica, 2024, 44(6): 0606002.

[14] 王建英, 殷洪玺, 季秀阳, 等. 采用mQAM和孔径平均的水下弱湍流MIMO系统性能分析[J]. 光学学报, 2021, 41(19): 1901002.

Wang J Y, Yin H X, Ji X Y, et al. Performance analysis of MIMO UWOC systems with weak turbulence channels using mQAM and aperture averaging[J]. Acta Optica Sinica, 2021, 41(19): 1901002.

[15] Dai Y Z, Chen X, Yang X Q, et al. 200-m/500-Mbps underwater wireless optical communication system utilizing a sparse nonlinear equalizer with a variable step size generalized orthogonal matching pursuit[J]. Optics Express, 2021, 29(20): 32228-32243.

[16] Fei C, Chen R L, Du J, et al. Underwater wireless optical communication utilizing low-complexity sparse pruned-term-based nonlinear decision-feedback equalization[J]. Applied Optics, 2022, 61(22): 6534-6543.

[17] YuM Q, GeldardC T, PopoolaW O. Comparison of CAP and OFDM modulation for LED-based underwater optical wireless communications[C]∥2022 International Conference on Broadband Communications for Next Generation Networks and Multimedia Applications (CoBCom), July 12-14, 2022, Graz, Austria. New York: IEEE Press, 2022.

[18] Chi N, Hu F C. Nonlinear adaptive filters for high-speed LED based underwater visible light communication[J]. Chinese Optics Letters, 2019, 17(10): 100011.

[19] Wu F M, Lin C T, Wei C C, et al. 1.1-gb/s white-LED-based visible light communication employing carrier-less amplitude and phase modulation[J]. IEEE Photonics Technology Letters, 2012, 24(19): 1730-1732.

[20] Fei C, Hong X J, Du J, et al. High-speed underwater wireless optical communications: from a perspective of advanced modulation formats[J]. Chinese Optics Letters, 2019, 17(10): 100012.

3.2　3l-sVolterra均衡补偿算法

肖胡浩, 殷洪玺, 王建英, 黄安, 季秀阳. 一种低复杂度和便于硬件移植的非线性均衡算法及其UWOC实时补偿实验演示[J]. 光学学报, 2024, 44(6): 0606004. Huhao Xiao, Hongxi Yin, Jianying Wang, An Huang, Xiuyang Ji. A Low-Complexity and Hardware-Portable Non-Linear Equalization Algorithm and Experimental Demonstration of Its Real-Time Compensation for UWOC[J]. Acta Optica Sinica, 2024, 44(6): 0606004.