一种基于可见光的隐式成像通信调制算法研究 下载: 655次
1 引言
可见光通信(Visible Light Communication, VLC)由于具有绿色健康、秘密安全、高速通信和成本低廉[1]等特点,受到研究者的广泛关注。随着电子显示屏、广告牌等显示设备的大量使用以及CMOS(Complementary Metal Oxide Semiconductor)等成像器件的大规模普及,一种被称为光学成像通信(Optical Camera Communication, OCC)的新型可见光通信技术应运而生,该技术广泛应用于数据传输[2]、信息安全[3]等邻域。
可见光隐式成像通信是可见光成像通信技术的一种方式。其发送端由计算机、电子标牌等显示设备组成,待传输的信息经调制后嵌入图像,进而呈现在显示屏上;接收终端为包含成像传感设备(摄像头)的智能终端,通过对采集到的图像信息进行解调来恢复信息。该方式在保证原始图像正常显示的同时具备信息传输的功能。在保障信息正常传输的前提下,隐式成像通信需满足原始图像与嵌入信息的图像没有明显差异的要求。
近年来,有关可见光隐式成像通信的研究越来越多,包括基于强度调制的图像数据传输[4]及视觉MIMO(Multi Input Multi Output)与无线通信相结合的隐式信息传输[5]。此外,还有基于频域变换的隐式信息传输算法[6]等。文献[ 7-8]通过改变正交透明信道来调制比特信息,实现了数据的隐式通信。文献[ 9]利用人眼视觉系统的闪烁融合特性,提出了一种新型的互补帧合成设计,实现了高速数据通信,然而高屏幕刷新率和高相机帧速率会带来较高的误码率和明显的闪烁现象。文献[ 10]针对通信过程中的丢帧和混合帧问题,提出了一种帧同步的补偿算法,实现了信息的可靠传输。人类视觉系统对强度的变化较为敏感[11],图像纹理的复杂程度会影响人眼的视觉感知[12]。文献[ 13]通过将视频内容分为纹理区域和非纹理区域,提出了一种空间自适应嵌入方案TextureCode,利用HVS(Human Visual System)在纹理丰富的区域实现了无闪烁通信。
基于以上分析可知,在现有算法中,嵌入数据量与闪烁效果成反比,即嵌入数据量大则闪烁明显,嵌入数据量小则闪烁效果不明显,现有调制算法对图像纹理差异因素考虑不足。本文提出了一种基于蓝色通道(B通道)拉普拉斯最高层金字塔的调制算法。首先对载体图像的蓝色通道图像进行拉普拉斯变换,同时对拟传输的信息进行二维信息变换,将信息隐藏在蓝色通道拉普拉斯金字塔的最高层。在嵌入过程中,对信息的调制强度和准确率问题进行了分析。此外,设计了一种基于纹理复杂度的图像分类器,对载体图像进行了分类,根据图像纹理复杂度的分类,预估了可见光隐式成像通信算法的性能。
2 可见光隐式成像通信系统模型
本文提出的可见光隐式成像通信系统模型如
假设发送端显示屏与接收端智能设备已同步,并且发送端像素与接收端像素一一对应,接收端完美聚焦在显示屏上。在接收端,智能终端设备利用图像传感器采集图像,对采集到的图像信号进行拉普拉斯金字塔分解,从而解调恢复传输的隐式信息。
3 基于蓝色通道的拉普拉斯金字塔调制算法
本文提出的基于B通道的拉普拉斯金字塔调制算法是将原始图像的蓝色分量图像作为高斯金字塔最底层,其与具有高斯低通特性的高斯核进行卷积运算后,进行隔行隔列采样,得到高斯金字塔第二层,重复这一步骤可得到多层高斯金字塔。在高斯金字塔分解过程中,将高斯金字塔的当前层图像与插值放大后的上一层高斯金字塔图像相减,得到多层拉普拉斯金字塔图像。在拉普拉斯金字塔最高层嵌入二维信息图像,实现隐式信息的传输。
3.1 调制解调算法的设计
本文提出的可见光隐式成像通信系统的调制和解调算法如
1) 将所需传输的信息编码成一张大小为n pixel×n pixel的二维信息图像m。
2) 首先将载体图像i的蓝色分量图像ib作为高斯金字塔第一层,进行高斯金字塔N层分解。然后,进行N层拉普拉斯金字塔分解,分解后的最高层图像表示为
式中:α为调制强度系数,直接影响图像的隐式效果和解调算法的准确率,文中取值范围为0.01~0.1。结果表明,当调制强度系数α取0.03时,效果最好。
3) 对调制信息后的拉普拉斯金字塔进行重建,可得隐藏信息后的蓝色分量图像i'b。
4) 用i'b代替原始图像的蓝色分量图像ib,将i'b与原始图像的绿(G)、红(R)分量图像重新组合,可得隐藏信息的图像i'。
解调算法主要完成信息的解调,如
图 2. 可见光隐式成像通信系统的调制和解调算法设计。(a)调制;(b)解调
Fig. 2. Design of modulation and demodulation algorithms for visible light implicit imaging communication system. (a) Modulation; (b) demodulation
3.2 调制强度系数的分析
在本文提出的调制算法中,调制强度系数对隐式效果和准确率均有较大影响。图像的隐式效果通常采用峰值信噪比(Peak Signal to Noise Ratio, PSNR,PS)和结构相似性(Structural Similarity Index ,SSIM,SS)进行评估,表达式分别为
式中:图像点颜色的最大数值R取255;M×N为图像r,s的尺寸;MS为均方误差(MSE);(x,y)为载体图像的像素点坐标。
式中:lum(r,s),con(r,s),str(r,s)分别表示图像r和s的像素亮度相似性、对比度相似性和结构相似性,它们对应的函数可以分别为
式中:σr, σs分别表示图像r和s的像素平均强度;δr, δs分别表示图像r和s的像素强度标准差;δrs表示图像r和s的像素协方差;A1,A2,A3为常数。
将原始二维信息图像m和解调的二维信息图像m'进行二进制图像转换对比后,正确传输的像素值与总像素值的比值即为准确率(Accuracy Rate,Ac)。假定二维信息图像的尺寸为n×n,准确率计算公式为
式中:☉为同或运算符,对应像素点值相同时说明传输准确;(i,j)为二维信息图像的像素点坐标。
图 3. 不同调制强度系数下的PSNR、SSIM和准确率。(a) PSNR;(b) SSIM;(c)准确率
Fig. 3. PSNR, SSIM and accuracy rate under each modulation intensity coefficient. (a) PSNR; (b) SSIM; (c) accuracy rate
4 基于图像熵的图像分类器
调制后的隐式图像的隐式效果与载体图像本身的特征有关。图像的纹理复杂程度能表征图像的信息量,图像的纹理复杂度越高,图像包含的信息越多,而一幅图像的熵(Entropy)能够表征图像的纹理复杂程度。本文设计了一种基于图像熵的图像分类器,将图像熵作为衡量图像纹理复杂程度的指标,并将其作为图像的分类指标,对图像进行分类。
4.1 图像纹理复杂度对隐式效果的影响
纹理是图像的一个重要特征,它表征的是像素及其周围邻域的灰度分布情况。一副图像所包含的信息量可以用该图像的纹理复杂程度来表示,而图像的熵是表征图像中聚集特征信息量的物理量。因此,本文采用图像熵来衡量图像的纹理复杂程度。图像熵的定义为
式中:p(i')是灰度i'在该图像中出现的概率。图像熵能够描述图像含有的信息量,同时直接表征了图像纹理的差异程度。图像的熵越大,图像包含的信息量越大,图像的纹理复杂程度越高;图像的熵越小,图像所包含的信息量越小,纹理复杂程度越低。
本文利用具有不同纹理复杂度的图像,对调制算法的性能进行了评估,如
图 5. 纹理图像的PSNR和SSIM。(a) PSNR;(b) SSIM
Fig. 5. PSNR and SSIM of texture image. (a) PSNR; (b) SSIM
4.2 基于图像熵的图像分类器设计
考虑到图像熵对SSIM的影响,本文设计了一种基于图像熵的纹理图像分类器。采用K-means聚类算法对训练图像进行聚类分析。K-means聚类算法是一种迭代类型求解方法,将数据集划分为K类。首先给定所需数据集合和所需的聚类数目K,随机选取K个数据点作为初始聚类中心;计算数据集合内每个点到各个聚类中心的距离,并将该点分配给离它最近的聚类中心,这样就形成了K个簇类。重新计算每个簇类的聚类中心,直至聚类中心不发生变化或迭代次数达到预设值,算法终止。
基于图像熵的图像分类器设计流程如
1) 计算训练图像中每幅图像的熵,构成数据集合D。
2) 利用K-means算法,对图像熵进行聚类分析,首先指定聚类数目K=4,随机选取4个初始聚类中心。计算D中每个数据到4个初始聚类中心的距离并将该数据分配给离它最近的聚类中心,这样就构成了4个簇类。重新计算每个簇类的中心,重复上述过程,达到迭代次数时,算法终止。
3) 提取每类图像的熵特征,构建训练样本特征向量和训练样本标签,用分类器训练得到分类模板。
4) 对测试图像进行特征提取,通过步骤3)获得的模板对测试图像进行预测分类。
对训练图像提取熵特征后,采用K-means算法对特征数据进行聚类分析,结果如
5 仿真结果与分析
采用Matlab7.0作为实验平台,对上述算法进行验证与分析。实验选取尺寸为512 pixel×512 pixel的彩色图像作为载体图像,将隐式信息转化为尺寸为128 pixel×128 pixel的二维信息图像(
图 9. 不同调制强度系数下隐藏信息的图像及其PSNR值
Fig. 9. Image with hidden information and PSNR value under each modulation intensity coefficient
当调制强度系数为0.03时,采用图像熵衡量图像的纹理复杂程度,并对隐式性能进行评估,结果如
表 1. 拉普拉斯分解层数分析
Table 1. Analysis of number of Laplacian decomposition layers
|
图 10. 具有不同纹理复杂度的图像及其SSIM值
Fig. 10. Images with different texture complexity and their SSIM values
当调制强度系数为0.03时,采用本文设计的图像分类器预选出纹理复杂的图像进行隐式信息传输,如
图 11. 原始图像与对应的隐藏信息的图像。(a)原始图像;(b)隐藏信息的图像
Fig. 11. Original images and corresponding images with hidden information. (a) Original images; (b) images with hidden information
对隐藏信息的图像添加椒盐噪声和高斯白噪声,测试结果如
图 12. 不同噪声下的准确率。(a)椒盐噪声;(b)高斯白噪声
Fig. 12. Accuracy rate under each noise. (a) Salt and pepper noise; (b) Gaussian white noise
6 结论
提出了一种基于蓝色通道拉普拉斯最高层金字塔的隐式信息调制算法,并在不同调制强度下对图像的隐式效果及其准确率进行了分析。结果显示,调制强度系数与系统性能密切相关,调制强度系数越大,系统的隐式效果越差。实验结果显示,当调制强度系数为0.03时,系统性能最佳。此外,分析了图像间的纹理复杂度差异对图像隐式效果的影响,结果表明,纹理复杂度越高的图像,隐式效果越好。基于此设计了一种基于图像熵的图像分类器,对具有不同纹理复杂度的图像进行分类,并对载体图像进行预筛选,从而提高了隐式通信的性能。
[2] AshokA, JainS, GruteserM, et al. Capacity of pervasive camera based communication under perspective distortions[C]∥2014 IEEE International Conference on Pervasive Computing and Communications, March 24-28, 2014, Budapest, Hungary. New York: IEEE, 2014: 112- 120.
[3] Zhang B S, Ren K, Xing G L, et al. SBVLC: secure barcode-based visible light communication for smartphones[J]. IEEE Transactions on Mobile Computing, 2016, 15(2): 432-446.
[4] Hossain MA, IslamA, Jang YM. Pixel to signal conversion based invisible image sensor communication[C]∥2016 Eighth International Conference on Ubiquitous and Future Networks, July 5-8, 2016, Vienna, Austria. New York: IEEE, 2016: 448- 452.
[5] Yuan WJ, DanaK, AshokA, et al. Dynamic and invisible messaging for visual MIMO[C]∥2012 IEEE Workshop on the Applications of Computer Vision, January 9-11, 2012, Breckenridge, CO, USA. New York: IEEE, 2012: 345- 352.
[6] 刘艳飞, 胡赟鹏, 唐艳群. 一种基于可见光的隐式传输算法研究[J]. 信息工程大学学报, 2018, 19(3): 317-320.
[7] Li TX, An CK, CampbellA, et al. HiLight: hiding bits in pixel translucency changes[C]∥Proceedings of the 1st ACM MobiCom workshop on Visible light communication systems — VLCS '14, September 7, 2014, Maui, Hawaii, USA. New York: ACM, 2014: 45- 50.
[8] Li TX, An CK, Xiao XR, et al. Demo: real-time screen-camera communication behind any scene[C]∥Proceedings of the 13th Annual International Conference on Mobile Systems, Applications, and Services, May 18-22, 2015, Florence, Italy. New York: ACM, 2015: 197- 211.
[9] Wang AR, Li ZR, Peng CY, et al. InFrame++: achieve simultaneous screen-human viewing and hidden screen-camera communication[C]∥Proceedings of the 13th Annual International Conference on Mobile Systems, Applications, and Services, May 18-22, 2015, Florence, Italy. New York: ACM, 2015: 181- 195.
[10] 李明超, 胡赟鹏, 姚祥文, 等. 一种可见光隐式成像通信帧同步补偿算法[J]. 光学学报, 2018, 38(1): 0106002.
[11] Adelson E H. Lightness perception and lightness illusions[J]. The New Cognitive Neurosciences, 2000, 3: 339-351.
[12] Chubb C, Sperling G, Solomon J A. Texture interactions determine perceived contrast[J]. PNAS, 1989, 86(23): 9631-9635.
[13] NguyenV, Tang YQ, AshokA, et al. High-rate flicker-free screen-camera communication with spatially adaptive embedding[C]∥The 35th Annual IEEE International Conference on Computer Communications, April 10-14, 2016, San Francisco, CA, USA. New York: IEEE, 2016: 1- 9.
[14] 刘艳飞. 可见光隐式成像通信技术研究[D]. 郑州:信息工程大学, 2017: 19- 26.
Liu YF. Research on invisible information for visible imaging light communications[D]. Zhengzhou: Information Engineering University, 2017: 19- 26.
Article Outline
谷五勋, 冯莉芳. 一种基于可见光的隐式成像通信调制算法研究[J]. 光学学报, 2021, 41(3): 0306002. Wuxun Gu, Lifang Feng. Modulation Algorithm for Implicit Imaging Communications Based on Visible Light[J]. Acta Optica Sinica, 2021, 41(3): 0306002.