1 天津科技大学 机械工程学院, 天津 300222
2 天津大学 微光机电系统技术教育部重点实验室, 天津 300072
提出了一种新的快速物体检测与识别方法, 用于检测和识别在运动过程中图像尺寸不断变化的物体。该方法基于多级定向执行长度编码法(MORLC)生成一种新的多级字节编码和物体特征样本形式, 其属于字符数据样本, 具有数据量小、占用存储空间少、构造过程简单、可根据不同的应用需求选择不同级次的样本形式等特点。对MORLC方法中二级字节编码和样本的系统理论进行了分析, 给出了利用MORLC二级字节编码和样本检测和识别运动物体的实验数据。对静态背景中的行人及位置进行了检测和识别实验, 结果显示多级字节编码和物体特征样本形式匹配处理速度快, 匹配和识别的鲁棒性好, 不易产生错误匹配。该方法特别适用于场景中由于被探测物体运动产生投影图像比例发生变化的情况, 即对图像大小不敏感。该方法的另一个突出优点是高的执行处理效率。
产品分类 特征检测 特征识别 图像编码 product classification character inspection character recognition image coding
江西理工大学 信息工程学院, 江西 赣州 341000
对整数DCT变换矩阵填充规则加以改进, 得到一类新的整数变换基, 称为“类整数DCT”变换基。从海量“类整数DCT”变换基中搜索出若干优选变换基, 应用于MPEG4编解码实验, 经实验测试和数据分析, 结果表明优选“类整数DCT”变换基归一化正交矩阵与DCT变换的去相关性能相近, 可替代整数DCT变换在图像编码中所起的作用。由于“类整数DCT”变换有完全快速算法, 便于硬件实现, 应用于图像编码, 可降低编码器复杂度。
整数DCT 去相关 快速算法 图像编码 硬件实现 integer DCT transform de-correlation rapid algorithm image coding implemented by hardware
吉林大学 通信工程学院, 吉林 长春 130022
为了适应人眼视网膜细胞的正六边形结构的排列方式并充分利用彩色图像各颜色分量间的相关性, 提出了一种基于六边形采样的三维离散余弦变换方法。该方法根据传统的矩形采样和正六边形采样之间的关系来完成两者的转换; 然后在已有的六边形离散余弦变换的基础上提出三维六边形采样的离散余弦变换, 并验证它的能量集中性。最后, 在同一个模型下建立彩色图像的空间位置和颜色分量, 并利用提出的方法分别以不同的子图大小对不同的图像进行整体变换。实验结果表明: 相对于传统的矩形采样, 提出方法的压缩比提高了约51.1%, 峰值信噪比提高了约16.3%, 从而有效地降低了彩色图像各颜色分量间的相关性。得到的结果表明, 利用六边形采样技术可以提高采样率, 降低编码速率。
三维离散余弦变换 彩色图像编码 六边形采样 矩形采样 Three-dimensional Discrete Cosine Transform(3D HDC color image coding hexagonal sampling rectangular sampling
1 中国科学院西安光学精密机械研究所, 陕西 西安 710119
2 西安交通大学人工智能与机器人研究所, 陕西 西安 710049
在基于点到线模型扩展LBG(linde-buzo-gray algorithm)矢量量化算法的基础上, 提出了一种更为高效的新型自适应LBG矢量量化算法, 并给出了该算法在干涉高光谱图像无损压缩中的实际压缩方案。 该算法在LBG算法码书中利用点到线的垂线关系基础上进行了改进, 执行进一步的自适应化迭代进而获得了更小的残差。 将自适应LBG矢量量化算法应用于干涉高光谱LASIS(large aperture static imaging spectrometer)图像数据无损压缩中, 实验结果表明, 该方法比原有的扩展LBG矢量量化算法在无损压缩性能上有显著的提高, 并且在与LASIS图像双向预测结合后, 点到线模型扩展LBG矢量量化算法的压缩比相对于传统LBG算法有所下降, 而采用本文提出算法的压缩比则有明显的提高。
干涉高光谱 图像编码 LBG矢量量化 Interferential multi-spectral image LASIS LASIS Image coding LBG vector quantification 光谱学与光谱分析
2011, 31(4): 1033
1 中国科学院 光电技术研究所,四川 成都 610209
2 中国科学院 研究生院,北京100039
给出一种上下文自适应的游程编码和扩展指数哥伦布编码。利用游程编码算法对图像小波系数及ROI掩模进行上下文自适应建模并输出三元组样本;然后扩展普通的指数哥伦布编码,使其可以编码由游程编码建模输出的三元组样本,在对小波系数编码的同时可以携带感兴趣区域掩模标记信息。由此得到一种可以区别感兴趣区域和背景区域的高效编码算法,并以此算法为基础提出一种感兴趣区域编码的编解码框架,该框架包括5/3小波变换、小波域掩模标记生成、不均匀最佳量化、游程编码和扩展的指数哥伦布编码。该算法的游程建模过程简单,熵编码算法可用闭合公式表达,具有较高的可实现性。实验结果表明,提出的算法支持多个任意形状的感兴趣区域,感兴趣区域相对于背景区域的编码优先级可调,并且可以获得高于基于BbB-shift的SPIHT算法的压缩性能。
图像编码 感兴趣区域编码 自适应游程编码 指数哥伦布编码 image coding Region of Interest(ROI) coding adaptive Run-length coding generalized Exp-Golomb coding
1 中国科学院 长春光学精密机械与物理研究所,吉林 长春 130033
2 中国科学院 研究生院,北京100039
根据小波-Contourlet变换对图像分解具有多尺度和多方向性的特点,提出了一种结合小波-Contourlet 变换和集合分裂嵌入块(SPECK)编码的图像压缩算法(CSPECK)。小波-Contourlet通过方向滤波器组把小波分解的高频子带进一步分解为多个方向子带,从而可更稀疏地表示图像的边缘和纹理。SPECK算法编码具有复杂度低和编码效率高的优点。实验结果表明,CSPECK算法对纹理丰富的图像有很好的压缩效果,与基于小波-Contourlet 变换的CSPIHT算法相比,峰值信噪比提高了0.2~0.6 dB。
小波-Contourlet变换 图像编码 方向滤波器组 峰值信噪比 wavelet-based contourlet image coding directional filter bank PSNR
西安电子科技大学 ISN国家重点实验室,陕西 西安 710071
深度图像能够有效表示三维场景几何信息,需要传输至三维电视终端用以辅助生成任意视点虚拟视图。为降低深度图像传输开销,需要对其进行压缩编码。深入分析了视频图像运动信息与深度图像运动信息的相似性,提出一种视频图像与深度图像联合预测编码方案,在编码深度图像过程中重用已编码视频图像的运动信息。该方案由视频-深度运动信息复制与视频-深度运动信息预测两部分组成。实验表明,提出的视频-深度联合预测编码能够高效利用已编码视频图像的运动信息,显著提高深度图像编码效率。
图像处理 三维电视 深度图像编码 视频图像编码 运动信息复制 运动信息预测
1 空军工程大学 信号与信息处理实验室,西安 710038
2 驻420 厂军事代表室,成都 610067
提出了一种基于形态学膨胀操作和差分缩减的DCT 域图像编码方法,该方法根据块内DCT 系数的聚集特性和块间DCT 系数的相似性,使用形态学膨胀算子优化DCT 重要系数的编码,并对重要性检测和符号编码精心设计了上下文自适应算术模型,有效去除了块内、块间DCT 的统计相关性;使用差分缩减方式对各DCT 系数聚类簇的起始位置和稀疏系数进行编码,提高对不重要DCT 系数的编码效率;算法还结合预处理和后处理滤波器,进一步提高编码效率的同时可有效抑制解码图像的方块效应。编码器基于位平面实现,码流具有渐进性。实验结果表明本文算法的编码性能普遍优于目前主流的图像编码器,例如在0.25 bpp 下,Lena 和Barbara 图像的峰值信噪比分别较JPEG2000 提高0.4 dB 和1.7 dB。
图像编码 形态学膨胀 差分缩减 image coding DCT DCT morphological dilation difference reduction
1 南京理工大学计算机科学与技术学院模式识别与智能系统实验室, 江苏 南京 210094
2 中科院自动化所 国家专用集成电路设计工程研究中心, 北京 100190
根据图像的几何结构特性,从人类视觉系统特性出发,建立了Gabor感知多成份字典,进而模拟人类视觉通路的层次处理机制,构建了稀疏编码网络,能够有效去除图像中的高阶冗余,形成更为稀疏的表示。对稀疏表示系数重组后进行比特平面量化,实现了低比特率的可伸缩编码。实验结果表明,在低比特率下,本文算法压缩后重构图像的感知质量要明显优于JPEG2000,峰值信噪比也与其相当,并且对于图像中的边缘和纹理等细节保持效果更佳。
稀疏表示 图像压缩 感知字典 可伸缩
1 陕西师范大学物理学与信息技术学院,西安,710062
2 宝鸡文理学院物理系,宝鸡,721007
3 中国科学院西安光学精密机械研究所瞬态光学与光子学国家重点实验室,西安,710068
根据MPEG-4静态纹理编码工具中所定义的解码过程,建立了与标准相容的静态纹理编解码框架,然后从零树符号的信息含义及其与编码层目标图像的一致性出发,研究MPEG-4 VTC工具中位平面模式编码的改进问题,提出一种基于符号分解的预测性嵌入式小波零树编码方法,并用SP-PEZW方法对彩色参考图像Lena进行了压缩和解码实验研究.实验表明,SP-PEZW方法在低比特率编码层上比PEZW有更好的压缩效率,同时对高分辨率编码层压缩比并无大的影响,甚至在高分辨率空间层以指定码率解码时图像质量略有提高.
图像处理 MPEG-4静态纹理 小波变换 位平面模式 可扩展图像编码 Image processing MPEG-4 VTC Wavelet transform Bilevel-Quant Scalable image coding