基于频率约束的相机与屏幕通信隐写算法 下载: 1318次
1 引言
在日常生活中,利用移动设备与二维码进行信息传递越来越常见[1-6]。使用智能手机的用户可以通过拍摄二维码图片并解码它们,使手机连接到更多的内容,包括文档、电影剪辑或网址等。二维码可以应用在不同场合。例如:图书馆中的所有书籍都标记有条形码以表示其属性和信息,从而方便图书管理[7];邮件上的条形码可以跟踪物品信息[8];被广告商广泛应用的二维码常标记在屏幕或其他产品上,通过智能手机扫描后即可直接链接到目的地址[9]。但在图片或视频上放置二维码,不但占据宝贵的屏幕资源,而且有时还影响使用。
这一难题促使研究人员尝试将二维码嵌入到屏幕图像或视频中,经过隐藏处理的代码既可以被照相机接收器探测到,又让人类视觉系统难以察觉。Woo等[10]利用只有混合颜色才能被人眼感知这一事实,基于高频红色和绿色光在相机和相机之间进行通信,而人眼无法感知;Wang等[11]利用人类视觉系统的闪烁融合特性嵌入数据,依赖于高的屏幕刷新率和相机捕获帧率实现人眼视觉的不可感知;Li等[12]提出一种通过轻微像素半透明度变化来传递信息的方法;Nguyen等[13]利用高屏幕刷新率和相机捕捉速率,在空间和时间域均嵌入信息,提高了系统的吞吐量。
上述研究虽然都取得了一系列的成果,都有各自的突破,但稳健性都较弱,而且对光感知的有效性使上述方法在短距离的检测下难以获得高准确率,存在短距离通信的弊端。短距离的条件要求和弱稳健性的缺点限制了上述技术在实际应用中的发展。因此,提出适用于远距离的强稳健通信方法是非常有必要的。本文通过对相关算法进行研究,提出新的算法,并对其步骤进行详细描述,最后通过实验验证了新方法的有效性。
2 相机与屏幕通信隐写算法
算法流程如
2.1 信息嵌入
不同的DCT系数作为信息嵌入的载体对图像质量有不同影响[14]。一般说来,低频系数集中了图像大部分的能量,对图像较为重要。人眼对低频分量比较敏感,对高频分量则不太敏感,因而在离散余弦变换(DCT)的高频区域进行频率约束。具体地,基于频率约束模板对视频帧的频域幅值图进行信息嵌入,实现信息携带。利用频率约束模板实现对频率的约束,既可以是频率抑制,也可以是频率增强,只要能实现频率成形,就可完成信息携带。
2.1.1 频率幅值
利用人类视觉系统的亮度掩蔽效应[15],将信息全部嵌入到视频的
式中
式中(
2.1.2 约束模板
此处构造方形的频率截断模板。模板与图像大小相同,平均分成若干块,块数与进行分块DCT变换的块数相同,共(
传递比特0的公式定义为
式中
2.1.3 频率约束
利用约束模板实现频率幅值控制的过程叫频率约束。约束频率的过程定义为
式中
2.2 信息提取
针对频率约束的信息嵌入算法,设计与之对应的提取算法。首先对采集的视频进行预处理,再提出频率域的能量统计直方图分析方法,对频率进行统计,分析出频率是否进行约束成形,从而实现信息的初步提取。
2.2.1 预处理
在信息嵌入步骤完成后,将各帧
图 4. 正负训练特征的提取。(a)训练块;(b)训练特征;(c)正负样本
Fig. 4. Extraction of training feature. (a) Training block; (b) training feature; (c) positive and negative samples
2.2.2 能量统计直方图
利用能量统计直方图方法从频域幅值图中提取出
式中
式中
2.3 纠错机制
由于算法的时间信息冗余,即有连续4帧采用的是相同频率约束模板,所以对特征进行支持向量机(SVM)训练提取初步信息后,增加了时间域纠错机制步骤。利用信息冗余来提高信息检测准确率。最后将可以确定所属类别的原测试集帧作为第二次训练的训练集,未确定的原测试集帧再次作为测试集,然后获得未确定帧的新一轮检测。
式中
3 实验结果及分析
本文实验使用的测试序列共16个,既包括静态场景和动态场景,又包括纹理丰富和平坦视频,且均为352 pixel×288 pixel大小的YUV格式。每个序列有96个样本,所以总共有1536个样本。16个测试序列如
实验中约束模板块采用2 pixel×2 pixel模式。按照(5)式和(6)式进行约束,以及(7)式进行特征提取。在此实验环境下,根据一定的实验经验和结果,选择实验参数:
测试样本集进行0或者1的对应标记。对标记后的测试集用SVM训练模型进行分类和预测。因为有16个测试序列,所以采用十六折交叉验证方法。测试序列分为16个子集,每个子集均做一次测试集,其余作为训练集。交叉验证重复16次,并将16次的平均交叉验证识别正确率作为结果。最后对预分类结果进行纠错实现二次标记,重复SVM训练,得到最终结果。
实验的评估指标有处理视频的频率波动程度和准确率两方面。在发送端,将频率波动程度作为评估标准。因为现在还没有评价视频的客观标准,所以通过观察者的视觉体验评价视频质量。在帧率为30 frame·s-1、屏幕刷新率为60 Hz的普通情况下,所有的测试视频在距离屏幕2 m远处观察均没有频率波动情况,近距离观察时,纹理少的视频有轻微频率波动,纹理丰富的视频几乎无频率波动。总体展现的效果显示,该算法具有良好的不可见性。在接收端,以准确率作为评估标准。
本文算法得到的实验结果如
表 1. 实验结果准确率
Table 1. Accuracy of experimental results%
|
对本文算法具稳健性和可行性作深层次理论剖析。相机与屏幕的通信过程涉及的噪声对频率的影响类似于低通滤波器,存在固有截止频率,本文算法也相当于低通滤波器,截断参数
将本文算法与目前效果较好的InFrame++[11]、HiLight[12]、ImplicitCode[18]算法等进行比较,在检测距离和检测准确率方面的比较结果如
检测距离和准确率是一对矛盾变量,在应用中要根据实际需求进行平衡。由
4 结论
提出了一种新颖的相机与屏幕通信框架,该方法是一种跨学科的方法,将计算机视觉(隐写、目标检测)和通信原理相结合。采用视觉多输入多输出的概念,其中屏幕是发送端,摄像机是接收端。以这种方式,计算机视觉技术可以与来自无线通信的原理相结合,以创建光视线通信信道。在光视线通信信道下,提出基于频率约束的相机与屏幕通信隐写方法。设计频率约束方法进行嵌入、能量统计图分析法进行信息提取,再结合纠错机制和二次训练提高准确率。在2 m远处通信,能获得95%左右的准确率,说明该算法具有强稳健性。同时,信息嵌入具有不可见性,不影响视频的原使用价值。信息传输容量取决于约束模板分块的密集程度,实验中使用的约束模板所传输信息容量偏小。同时,约束模板的分块情况也会影响稳健性:容量和稳健性是一对矛盾的存在。此外,快速运动内容造成的运动模糊也会导致隐写内容提取困难。因此,如何寻找算法的平衡点,增加信息容量,克服运动模糊带来的影响是后续算法提升和改进的方向。
[1] 丁伟利, 王明魁, 谷朝, 等. 一种多目标QR码图像快速校正方法[J]. 光学学报, 2017, 37(10): 1010001.
[2] 王红娟, 王志鹏, 张颖颖, 等. 利用QR码在光学干涉多图像加密系统中实现信息高质量恢复[J]. 光学学报, 2014, 34(9): 0907001.
[3] 李建华, 张郁天, 伊煊, 等. 激光标刻铝锭二维码图像灰度与加工参数计算模型[J]. 激光与光电子学进展, 2017, 54(7): 071203.
[4] RekimotoJ, AyatsukaY. Cybercode: designing augmented reality environments with visual tags[C]∥ Proceedings of DARE 2000 on Designing Augmented Reality Environments, 2000: 1- 10.
[5] ChaisatienP, AkahoriK. Introducing QR code in classroom management and communication via mobile phone application system[C]. World Conference on Educational Media and Technology, 2006: 2181- 2187.
[6] Tarjan L, Senk I, Tegeltija S, et al. A readability analysis for QR code application in a traceability system[J]. Computers & Electronics in Agriculture, 2014, 109: 1-11.
[7] Pulliam B, Landry C. Tag, you're it! Using QR codes to promote library services[J]. Reference Librarian, 2010, 52(1/2): 68-74.
[10] WooG, LippmanA, RaskarR. VRCodes: unobtrusive and active visual codes for interaction by exploiting rolling shutter[C]∥ Proceedings of the 2012 IEEE International Symposium on Mixed and Augmented Reality, 2012: 59- 64.
[11] WangA, LiZ, PengC, et al. InFrame++: achieve simultaneous screen-human viewing and hidden screen-camera communication[C]∥ Proceedings of the 13th Annual International Conference on Mobile Systems, Applications, and Services, ACM, 2015: 181- 195.
[12] LiT, AnC, XiaoX, et al. Real-time screen-camera communication behind any scene[C]∥ Proceedings of the 13th Annual International Conference on Mobile Systems, Applications, and Services, ACM, 2015: 197- 211.
[13] NguyenV, TangY, AshokA, et al. High-rate flicker-free screen-camera communication with spatially adaptive embedding[C]. IEEE INFOCOM 2016,The 35th Annual IEEE International Conference on Computer Communications, 2016: 1- 9.
[14] 谢建全, 谢勍, 田立军. 离散余弦变换域隐藏算法隐藏容量与频域系数选择研究[J]. 计算机应用, 2011, 31(4): 963-965.
Xie J Q, Xie Q, Tian L J. The discrete cosine transform domain hiding algorithm hiding capacity and frequency coefficient[J]. Application Research of Computers, 2011, 31(4): 963-965.
[15] Wang Y, Yu N, Wang T. Ada-Sal Network: emulate the human visual system[J]. Signal Processing: Image Communication, 2016, 47: 519-528.
[16] 向方明, 朱遵义, 许敬, 等. YUV到RGB颜色空间转换算法研究[J]. 现代电子技术, 2012, 35(22): 65-68.
Xian F M, Zhu Z Y, Xu J, et al. Research on algorithm of color space conversion from YUV to RGB[J]. Modern Electronics Technique, 2012, 35(22): 65-68.
[17] YuanW, DanaK, AshokA, et al. Dynamic and invisible messaging for visual MIMO[C]. Applications of Computer Vision, IEEE, 2012: 345- 352.
[18] ShiS, ChenL, HuW, et al. Reading between lines: high-rate, non-intrusive visual codes within regular videos via ImplicitCode[C]. ACM International Joint Conference on Pervasive and Ubiquitous Computing, ACM, 2015: 157- 168.
褚晶辉, 田叶, 苏育挺. 基于频率约束的相机与屏幕通信隐写算法[J]. 激光与光电子学进展, 2018, 55(5): 051003. Jinghui Chu, Ye Tian, Yuting Su. Screen-Camera Communication Steganography Based on Frequency Constraint[J]. Laser & Optoelectronics Progress, 2018, 55(5): 051003.