光学学报, 2021, 41 (3): 0306002, 网络出版: 2021-02-28   

一种基于可见光的隐式成像通信调制算法研究 下载: 655次

Modulation Algorithm for Implicit Imaging Communications Based on Visible Light
作者单位
北京科技大学计算机与通信工程学院, 北京 100083
摘要
针对现有可见光隐式成像通信调制算法隐式效果差、算法复杂的问题,提出了一种基于蓝色通道拉普拉斯最高层金字塔的隐式信息调制算法。该算法利用人眼视觉系统对黄蓝分量不敏感的特性,仅对蓝色通道图像进行拉普拉斯金字塔分解,并在最高层嵌入隐式信息。此外,考虑到图像纹理差异对隐式效果的影响,采用图像熵作为衡量图像间纹理复杂程度的指标,设计了一种基于纹理复杂度的图像分类器,并对不同分类图像的隐式效果进行了分析。仿真结果显示,所提调制算法的峰值信噪比平均可达到40.46 dB,相较于一般拉普拉斯金字塔调制算法,性能提升了5 dB,可有效增强系统的隐式效果。
Abstract
An implicit information modulation algorithm based on the highest layer of the Laplacian pyramid of the blue channel is proposed to solve the problems of poor implicit effect and complex algorithm occurring in the existing visible light implicit imaging communication modulation algorithm. The proposed algorithm takes the advantage of the insensitivity of the human visual system to the yellow and blue components, performs the Laplace pyramid decomposition only on the blue channel image, and embeds the implicit information at the highest level. In addition, considering the effect of the texture difference among images on the implicit effect, the image entropy is used as an indicator to measure the texture complexity of images. An image classifier is designed based on the texture complexity and the implicit effect is also analyzed. The simulation results show that the proposed modulation algorithm can achieve an average peak signal-to-noise ratio value of 40.46 dB. Compared with that of the general Laplace pyramid modulation algorithm, the performance is improved by 5 dB, and the implicit effect of the system is effectively improved.

1 引言

可见光通信(Visible Light Communication, VLC)由于具有绿色健康、秘密安全、高速通信和成本低廉[1]等特点,受到研究者的广泛关注。随着电子显示屏、广告牌等显示设备的大量使用以及CMOS(Complementary Metal Oxide Semiconductor)等成像器件的大规模普及,一种被称为光学成像通信(Optical Camera Communication, OCC)的新型可见光通信技术应运而生,该技术广泛应用于数据传输[2]、信息安全[3]等邻域。

可见光隐式成像通信是可见光成像通信技术的一种方式。其发送端由计算机、电子标牌等显示设备组成,待传输的信息经调制后嵌入图像,进而呈现在显示屏上;接收终端为包含成像传感设备(摄像头)的智能终端,通过对采集到的图像信息进行解调来恢复信息。该方式在保证原始图像正常显示的同时具备信息传输的功能。在保障信息正常传输的前提下,隐式成像通信需满足原始图像与嵌入信息的图像没有明显差异的要求。

近年来,有关可见光隐式成像通信的研究越来越多,包括基于强度调制的图像数据传输[4]及视觉MIMO(Multi Input Multi Output)与无线通信相结合的隐式信息传输[5]。此外,还有基于频域变换的隐式信息传输算法[6]等。文献[ 7-8]通过改变正交透明信道来调制比特信息,实现了数据的隐式通信。文献[ 9]利用人眼视觉系统的闪烁融合特性,提出了一种新型的互补帧合成设计,实现了高速数据通信,然而高屏幕刷新率和高相机帧速率会带来较高的误码率和明显的闪烁现象。文献[ 10]针对通信过程中的丢帧和混合帧问题,提出了一种帧同步的补偿算法,实现了信息的可靠传输。人类视觉系统对强度的变化较为敏感[11],图像纹理的复杂程度会影响人眼的视觉感知[12]。文献[ 13]通过将视频内容分为纹理区域和非纹理区域,提出了一种空间自适应嵌入方案TextureCode,利用HVS(Human Visual System)在纹理丰富的区域实现了无闪烁通信。

基于以上分析可知,在现有算法中,嵌入数据量与闪烁效果成反比,即嵌入数据量大则闪烁明显,嵌入数据量小则闪烁效果不明显,现有调制算法对图像纹理差异因素考虑不足。本文提出了一种基于蓝色通道(B通道)拉普拉斯最高层金字塔的调制算法。首先对载体图像的蓝色通道图像进行拉普拉斯变换,同时对拟传输的信息进行二维信息变换,将信息隐藏在蓝色通道拉普拉斯金字塔的最高层。在嵌入过程中,对信息的调制强度和准确率问题进行了分析。此外,设计了一种基于纹理复杂度的图像分类器,对载体图像进行了分类,根据图像纹理复杂度的分类,预估了可见光隐式成像通信算法的性能。

2 可见光隐式成像通信系统模型

本文提出的可见光隐式成像通信系统模型如图1所示。在发送端,首先对待传输的隐式信息进行编码,生成二维信息图像。考虑到载体图像纹理差异对系统性能的影响,采用图像分类器对输入的载体图像进行预测分类和选择。然后,对图像的蓝色通道进行拉普拉斯金字塔分解,利用调制算法将二维信息图像隐藏于拉普拉斯金字塔的最高层。最后,在显示屏上播放包含隐式信息的图像。

图 1. 可见光隐式成像通信模型

Fig. 1. Visible light implicit imaging communication model

下载图片 查看所有图片

假设发送端显示屏与接收端智能设备已同步,并且发送端像素与接收端像素一一对应,接收端完美聚焦在显示屏上。在接收端,智能终端设备利用图像传感器采集图像,对采集到的图像信号进行拉普拉斯金字塔分解,从而解调恢复传输的隐式信息。

3 基于蓝色通道的拉普拉斯金字塔调制算法

本文提出的基于B通道的拉普拉斯金字塔调制算法是将原始图像的蓝色分量图像作为高斯金字塔最底层,其与具有高斯低通特性的高斯核进行卷积运算后,进行隔行隔列采样,得到高斯金字塔第二层,重复这一步骤可得到多层高斯金字塔。在高斯金字塔分解过程中,将高斯金字塔的当前层图像与插值放大后的上一层高斯金字塔图像相减,得到多层拉普拉斯金字塔图像。在拉普拉斯金字塔最高层嵌入二维信息图像,实现隐式信息的传输。

3.1 调制解调算法的设计

本文提出的可见光隐式成像通信系统的调制和解调算法如图2所示。调制算法如图2(a)所示,步骤如下。

1) 将所需传输的信息编码成一张大小为n pixel×n pixel的二维信息图像m

2) 首先将载体图像i的蓝色分量图像ib作为高斯金字塔第一层,进行高斯金字塔N层分解。然后,进行N层拉普拉斯金字塔分解,分解后的最高层图像表示为 LibN,其尺寸大小与二维信息图像m相同。将隐式信息m隐藏在拉普拉斯金字塔的最高层,则隐藏信息图像的拉普拉斯金字塔最高层图像 LbN[14]

LbN=(1-α)LibN+αm,(1)

式中:α为调制强度系数,直接影响图像的隐式效果和解调算法的准确率,文中取值范围为0.01~0.1。结果表明,当调制强度系数α取0.03时,效果最好。

3) 对调制信息后的拉普拉斯金字塔进行重建,可得隐藏信息后的蓝色分量图像i'b

4) 用i'b代替原始图像的蓝色分量图像ib,将i'b与原始图像的绿(G)、红(R)分量图像重新组合,可得隐藏信息的图像i'

解调算法主要完成信息的解调,如图2(b)所示。接收端接收到不含信息的图像i和调制信息后的图像i',对ii'的蓝色分量图像进行拉普拉斯金字塔分解,在金字塔的最高层对调制的信息进行提取,可得信息m':

m'=LbNα-(1-α)LibNα(2)

图 2. 可见光隐式成像通信系统的调制和解调算法设计。(a)调制;(b)解调

Fig. 2. Design of modulation and demodulation algorithms for visible light implicit imaging communication system. (a) Modulation; (b) demodulation

下载图片 查看所有图片

3.2 调制强度系数的分析

在本文提出的调制算法中,调制强度系数对隐式效果和准确率均有较大影响。图像的隐式效果通常采用峰值信噪比(Peak Signal to Noise Ratio, PSNR,PS)和结构相似性(Structural Similarity Index ,SSIM,SS)进行评估,表达式分别为

PS=10lgR2/MS,(3)MS=1MNx=0M-1y=0N-1r(x,y)-s(x,y)2,(4)

式中:图像点颜色的最大数值R取255;M×N为图像r,s的尺寸;MS为均方误差(MSE);(x,y)为载体图像的像素点坐标。

SS(r,s)=lum(r,s)×con(r,s)×str(r,s),(5)

式中:lum(r,s),con(r,s),str(r,s)分别表示图像rs的像素亮度相似性、对比度相似性和结构相似性,它们对应的函数可以分别为

lum(r,s)=2σrσs+A1σr2+σs2+A1,(6)con(r,s)=2δrδs+A2δr2δs2+A2,(7)str(r,s)=δrs+A3δrδs+A3,(8)

式中:σr, σs分别表示图像rs的像素平均强度;δr, δs分别表示图像rs的像素强度标准差;δrs表示图像rs的像素协方差;A1,A2,A3为常数。

将原始二维信息图像m和解调的二维信息图像m'进行二进制图像转换对比后,正确传输的像素值与总像素值的比值即为准确率(Accuracy Rate,Ac)。假定二维信息图像的尺寸为n×n,准确率计算公式为

Ac=i=1nj=1nm(i,j)m'(i,j)n×n,(9)

式中:☉为同或运算符,对应像素点值相同时说明传输准确;(i,j)为二维信息图像的像素点坐标。

图3(a)、(b)分别为不同调制强度系数对调制后图像的SSIM和PSNR的影响。结果显示,图像的PSNR和SSIM的值均随着调制强度系数α的增大而减小。这是因为调制强度系数越大,隐式信息在生成的隐式图像中的占比越大,对载体图像的改变越大,原始图像与隐藏信息图像之间的MSE越大。由(3)式可知,MSE越大,PSNR值越小,因此隐式效果越差。图3(c)展示了隐式信息的传输准确率与调制强度系数之间的关系,结果表明,调制强度系数越大,隐式信息的传输准确率越高。当调制强度系数小于0.03时,准确率较低,当调制强度系数大于0.03时,准确率趋于稳定。综合考虑,最佳调制强度系数α可取0.03。

图 3. 不同调制强度系数下的PSNR、SSIM和准确率。(a) PSNR;(b) SSIM;(c)准确率

Fig. 3. PSNR, SSIM and accuracy rate under each modulation intensity coefficient. (a) PSNR; (b) SSIM; (c) accuracy rate

下载图片 查看所有图片

图4为本文所提出的算法和一般的拉普拉斯调制算法[14]的对比结果。对500张图像进行了测试,可以看出,相较于一般的调制算法,本文提出的调制算法的PSNR值平均提升了5 dB,说明本文所提算法具有更好的隐式性能。

图 4. 所提算法与一般算法的对比

Fig. 4. Comparison between proposed and general algorithms

下载图片 查看所有图片

4 基于图像熵的图像分类器

调制后的隐式图像的隐式效果与载体图像本身的特征有关。图像的纹理复杂程度能表征图像的信息量,图像的纹理复杂度越高,图像包含的信息越多,而一幅图像的熵(Entropy)能够表征图像的纹理复杂程度。本文设计了一种基于图像熵的图像分类器,将图像熵作为衡量图像纹理复杂程度的指标,并将其作为图像的分类指标,对图像进行分类。

4.1 图像纹理复杂度对隐式效果的影响

纹理是图像的一个重要特征,它表征的是像素及其周围邻域的灰度分布情况。一副图像所包含的信息量可以用该图像的纹理复杂程度来表示,而图像的熵是表征图像中聚集特征信息量的物理量。因此,本文采用图像熵来衡量图像的纹理复杂程度。图像熵的定义为

En=-i'=1255p(i')lbp(i'),(10)

式中:p(i')是灰度i'在该图像中出现的概率。图像熵能够描述图像含有的信息量,同时直接表征了图像纹理的差异程度。图像的熵越大,图像包含的信息量越大,图像的纹理复杂程度越高;图像的熵越小,图像所包含的信息量越小,纹理复杂程度越低。

本文利用具有不同纹理复杂度的图像,对调制算法的性能进行了评估,如图5所示。由图5(a)可以看出,采用本文调制算法后,各种纹理图像中的PSNR值基本都在39 dB以上,平均可达到40.46 dB。图5(b)显示,图像熵越大, SSIM值越高,说明纹理越复杂的图像,隐式效果越好。

图 5. 纹理图像的PSNR和SSIM。(a) PSNR;(b) SSIM

Fig. 5. PSNR and SSIM of texture image. (a) PSNR; (b) SSIM

下载图片 查看所有图片

4.2 基于图像熵的图像分类器设计

考虑到图像熵对SSIM的影响,本文设计了一种基于图像熵的纹理图像分类器。采用K-means聚类算法对训练图像进行聚类分析。K-means聚类算法是一种迭代类型求解方法,将数据集划分为K类。首先给定所需数据集合和所需的聚类数目K,随机选取K个数据点作为初始聚类中心;计算数据集合内每个点到各个聚类中心的距离,并将该点分配给离它最近的聚类中心,这样就形成了K个簇类。重新计算每个簇类的聚类中心,直至聚类中心不发生变化或迭代次数达到预设值,算法终止。

基于图像熵的图像分类器设计流程如图6所示,相关步骤如下。

图 6. 基于图像熵的图像分类器的设计流程

Fig. 6. Design process of image classifier based on image entropy

下载图片 查看所有图片

1) 计算训练图像中每幅图像的熵,构成数据集合D

2) 利用K-means算法,对图像熵进行聚类分析,首先指定聚类数目K=4,随机选取4个初始聚类中心。计算D中每个数据到4个初始聚类中心的距离并将该数据分配给离它最近的聚类中心,这样就构成了4个簇类。重新计算每个簇类的中心,重复上述过程,达到迭代次数时,算法终止。

3) 提取每类图像的熵特征,构建训练样本特征向量和训练样本标签,用分类器训练得到分类模板。

4) 对测试图像进行特征提取,通过步骤3)获得的模板对测试图像进行预测分类。

对训练图像提取熵特征后,采用K-means算法对特征数据进行聚类分析,结果如图7所示。图像被分为四类,并被贴上标签(bad, general, well, excellent),计算其SSIM的平均值。由图7可以看出,在四类图像中,熵越大的图像,其SSIM值越高,隐式效果越好。

图 7. 不同分类图像的SSIM

Fig. 7. SSIM for each classification image

下载图片 查看所有图片

5 仿真结果与分析

采用Matlab7.0作为实验平台,对上述算法进行验证与分析。实验选取尺寸为512 pixel×512 pixel的彩色图像作为载体图像,将隐式信息转化为尺寸为128 pixel×128 pixel的二维信息图像(图8)进行仿真实验。当拉普拉斯分解层数为2时,信息隐藏在较浅的一层,隐式效果相对较差;当拉普拉斯分解层数为4时,信息隐藏在较深的一层,隐式效果很好,但准确率会下降,如表1所示,因此本文采用的拉普拉斯分解层数为3。图9以Lena图像为例,分析了不同调制强度系数对隐式效果的影响,可见图像的PSNR值随调制强度系数的增大而减小。

图 8. 所需隐藏的二维信息

Fig. 8. Two dimensional information to be hidden

下载图片 查看所有图片

图 9. 不同调制强度系数下隐藏信息的图像及其PSNR值

Fig. 9. Image with hidden information and PSNR value under each modulation intensity coefficient

下载图片 查看所有图片

当调制强度系数为0.03时,采用图像熵衡量图像的纹理复杂程度,并对隐式性能进行评估,结果如图10所示。可以看出,熵越大的图像,嵌入信息后图像的SSIM值越大,纹理复杂程度越高的图像,隐式效果越好。

表 1. 拉普拉斯分解层数分析

Table 1. Analysis of number of Laplacian decomposition layers

Number of Laplacedecomposition layersPSNR /dBAccuracy rate /%
239.90498.74
340.46297.55
441.64080.76

查看所有表

图 10. 具有不同纹理复杂度的图像及其SSIM值

Fig. 10. Images with different texture complexity and their SSIM values

下载图片 查看所有图片

当调制强度系数为0.03时,采用本文设计的图像分类器预选出纹理复杂的图像进行隐式信息传输,如图11所示,可以看出,隐式效果均较好。

图 11. 原始图像与对应的隐藏信息的图像。(a)原始图像;(b)隐藏信息的图像

Fig. 11. Original images and corresponding images with hidden information. (a) Original images; (b) images with hidden information

下载图片 查看所有图片

对隐藏信息的图像添加椒盐噪声和高斯白噪声,测试结果如图12所示。在隐藏信息的图像中添加不同密度的椒盐噪声,进行滤波处理后,解调得到准确率,结果如图12(a)所示。可以看出,准确率基本没有出现较大的波动,说明本文提出的调制算法具有很好的鲁棒性,抗椒盐噪声的能力强。在加入均值为0且具有不同方差的高斯白噪声情况下,降噪处理之后的准确率如图12(b)所示。可以看出,准确率随方差的增大而减小,当方差大于0.02时,准确率的下降较为明显。说明系统中含有较多高斯白噪声时,系统解调得出的准确率下降,但平均准确率为94.93%,说明本文提出的调制算法具有较好的性能。

图 12. 不同噪声下的准确率。(a)椒盐噪声;(b)高斯白噪声

Fig. 12. Accuracy rate under each noise. (a) Salt and pepper noise; (b) Gaussian white noise

下载图片 查看所有图片

6 结论

提出了一种基于蓝色通道拉普拉斯最高层金字塔的隐式信息调制算法,并在不同调制强度下对图像的隐式效果及其准确率进行了分析。结果显示,调制强度系数与系统性能密切相关,调制强度系数越大,系统的隐式效果越差。实验结果显示,当调制强度系数为0.03时,系统性能最佳。此外,分析了图像间的纹理复杂度差异对图像隐式效果的影响,结果表明,纹理复杂度越高的图像,隐式效果越好。基于此设计了一种基于图像熵的图像分类器,对具有不同纹理复杂度的图像进行分类,并对载体图像进行预筛选,从而提高了隐式通信的性能。

参考文献

[1] Chang C H, Li C Y, Lu H H, et al. A 100-gb/s multiple-input multiple-output visible laser light communication system[J]. Journal of Lightwave Technology, 2014, 32(24): 4723-4729.

[2] AshokA, JainS, GruteserM, et al. Capacity of pervasive camera based communication under perspective distortions[C]∥2014 IEEE International Conference on Pervasive Computing and Communications, March 24-28, 2014, Budapest, Hungary. New York: IEEE, 2014: 112- 120.

[3] Zhang B S, Ren K, Xing G L, et al. SBVLC: secure barcode-based visible light communication for smartphones[J]. IEEE Transactions on Mobile Computing, 2016, 15(2): 432-446.

[4] Hossain MA, IslamA, Jang YM. Pixel to signal conversion based invisible image sensor communication[C]∥2016 Eighth International Conference on Ubiquitous and Future Networks, July 5-8, 2016, Vienna, Austria. New York: IEEE, 2016: 448- 452.

[5] Yuan WJ, DanaK, AshokA, et al. Dynamic and invisible messaging for visual MIMO[C]∥2012 IEEE Workshop on the Applications of Computer Vision, January 9-11, 2012, Breckenridge, CO, USA. New York: IEEE, 2012: 345- 352.

[6] 刘艳飞, 胡赟鹏, 唐艳群. 一种基于可见光的隐式传输算法研究[J]. 信息工程大学学报, 2018, 19(3): 317-320.

    Liu Y F, Hu Y P, Tang Y Q. Research on invisible transmission algorithm based on visible light[J]. Journal of Information Engineering University, 2018, 19(3): 317-320.

[7] Li TX, An CK, CampbellA, et al. HiLight: hiding bits in pixel translucency changes[C]∥Proceedings of the 1st ACM MobiCom workshop on Visible light communication systems — VLCS '14, September 7, 2014, Maui, Hawaii, USA. New York: ACM, 2014: 45- 50.

[8] Li TX, An CK, Xiao XR, et al. Demo: real-time screen-camera communication behind any scene[C]∥Proceedings of the 13th Annual International Conference on Mobile Systems, Applications, and Services, May 18-22, 2015, Florence, Italy. New York: ACM, 2015: 197- 211.

[9] Wang AR, Li ZR, Peng CY, et al. InFrame++: achieve simultaneous screen-human viewing and hidden screen-camera communication[C]∥Proceedings of the 13th Annual International Conference on Mobile Systems, Applications, and Services, May 18-22, 2015, Florence, Italy. New York: ACM, 2015: 181- 195.

[10] 李明超, 胡赟鹏, 姚祥文, 等. 一种可见光隐式成像通信帧同步补偿算法[J]. 光学学报, 2018, 38(1): 0106002.

    Li M C, Hu Y P, Yao X W, et al. Frame synchronization compensation algorithm for visible light implicit imaging communication[J]. Acta Optica Sinica, 2018, 38(1): 0106002.

[11] Adelson E H. Lightness perception and lightness illusions[J]. The New Cognitive Neurosciences, 2000, 3: 339-351.

[12] Chubb C, Sperling G, Solomon J A. Texture interactions determine perceived contrast[J]. PNAS, 1989, 86(23): 9631-9635.

[13] NguyenV, Tang YQ, AshokA, et al. High-rate flicker-free screen-camera communication with spatially adaptive embedding[C]∥The 35th Annual IEEE International Conference on Computer Communications, April 10-14, 2016, San Francisco, CA, USA. New York: IEEE, 2016: 1- 9.

[14] 刘艳飞. 可见光隐式成像通信技术研究[D]. 郑州:信息工程大学, 2017: 19- 26.

    Liu YF. Research on invisible information for visible imaging light communications[D]. Zhengzhou: Information Engineering University, 2017: 19- 26.

谷五勋, 冯莉芳. 一种基于可见光的隐式成像通信调制算法研究[J]. 光学学报, 2021, 41(3): 0306002. Wuxun Gu, Lifang Feng. Modulation Algorithm for Implicit Imaging Communications Based on Visible Light[J]. Acta Optica Sinica, 2021, 41(3): 0306002.

本文已被 1 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!