吴立栋 1彭宗举 1,2,*李欣 2苏涛 2[ ... ]王晓东 1
作者单位
摘要
1 宁波大学信息科学与工程学院,浙江 宁波 315000
2 重庆理工大学电气与电子工程学院,重庆 310027
海洋生物相互聚集形成遮挡现象是误检和漏检的重要原因。为了解决这个问题,提出一种采用样本迭代融合辅助网络训练的海洋生物检测方法。首先,选用改进后的深度空洞残差结构作为特征提取网络,提升了网络的特征提取能力;然后,结合海洋生物图像目标遮挡、密集的特点,改进损失函数避免发生误检、漏检现象;最后,为了进一步解决目标遮挡、数据不平衡的问题,提出样本迭代融合方法,生成模拟图像扩充训练集,提高了网络训练的有效性和对小样本量海洋生物的检测能力。实验结果表明,所提海洋生物检测方法在URPC2018和台湾鱼类数据集上的准确率分别达91.36%和90.27%,检测准确率和速度高于现有目标检测算法。
海洋生物检测 样本迭代融合 深度学习 水下目标检测识别 数字图像处理 
激光与光电子学进展
2023, 60(2): 0220001
作者单位
摘要
1 宁波大学信息科学与工程学院, 浙江 宁波 315201
2 重庆理工大学电气与电子学院, 重庆 400054
针对显微图像领域色彩恒常(CC)数据集缺乏、CC算法跨数据集训练效果不佳的问题,通过相机采集和模拟生成两个步骤建立了显微CC数据集,并提出了一种基于自编码器的显微图像CC算法。该算法用改进的UNet结构自编码器进行半监督训练,同时引入一种新的复合损失函数优化网络参数,使恢复的图像色彩更准确。实验结果表明,相比传统自编码器,本算法训练的图像清晰度更高,在NUS-8 CC数据集、RECommended CC数据集和自建显微CC数据集中的角误差估计值更小。
图像处理 显微图像 色彩恒常 自编码器 角误差估计 
激光与光电子学进展
2021, 58(20): 2010010
作者单位
摘要
宁波大学 信息科学与工程学院, 浙江 宁波 315211
与前一代高效视频编码标准相比, 未来视频编码标准增加了新的二叉树加四叉树编码结构。针对该结构虽然显著提升了超高清视频编码效率, 但是大幅增加了编码复杂度的问题, 提出了联合多特征快速编码算法。该算法联合多个编码特征的后验概率信息, 估计当前编码单元的划分方式, 通过提前终止若干编码单元的划分来节省编码时间。此外, 针对单个特征贝叶斯分类不准确的问题, 算法在简化联合概率模型的同时提升了分类算法的准确度。实验结果表明: 在随机访问配置、低延迟P配置和低延迟B配置下, 算法可以平均减少35.7%, 25.6%和26.7%的编码复杂度, 而BDBR只分别增长了4.3%, 3.1%和2.89%。算法在保证视频主观质量的前提下, 节省了编码时间。
未来视频编码 联合多特征快速编码算法 二叉树加四叉树结构 快速编码 future video coding joint multi-feature classification algorithm quadtree plus binary tree block structure fast coding technique 
光学 精密工程
2019, 27(4): 990
作者单位
摘要
1 宁波大学信息科学与工程学院,浙江 宁波 315211
2 南京大学计算机软件新技术国家重点实验室,南京 210023
高动态范围图像合成中容易出现鬼影现象,而传统的矩阵完成算法没有考虑多曝光图像序列的运动特征,导致高动态范围图像中的鬼影未能完全去除。针对这一问题,本文提出一种基于低动态范围图像内容自适应矩阵完成算法以去除高动态范围图像中的鬼影。首先,根据图像的亮度和色度信息,确定低动态范围图像的运动区域;然后根据这一运动先验信息,调整矩阵完成算法过程中的正则化约束强度,从而得到每幅低动态范围图像的背景信息;最后,考虑到不同曝光度的图像在每一区域所包含的细节不同,采用与曝光相关的融合策略合成去鬼影的高动态范围图像。实验分别采用简单背景图像序列和复杂背景图像序列,结果表明,所提出的算法相比于奇异值部分和最小化矩阵完成算法,能取得更好的合成效果,适用于复杂背景下的高动态范围图像合成。
高动态范围成像 运动先验知识 矩阵完成 曝光相关 high dynamic range imaging prior knowledge of motion matrix completion related to exposure 
光电工程
2017, 44(11): 1056
作者单位
摘要
宁波大学 信息科学与工程学院, 浙江 宁波 315211
考虑到人眼视觉关注特性在视频质量评价(VQA)中所具有的重要作用, 提出了一种结合人眼视觉关注特性的视频质量评价方法。首先利用三维Sobel算子以及恰可察觉失真模型得到全局显著图, 对全局显著图的每个显著像素点构建结构张量来求取一帧的全局质量; 然后利用视频运动信息以及人眼中心关注特性求得局部显著图来进行感知加权, 得到一帧的局部质量; 最后均衡局部与全局质量得到视频中一帧的质量,并采用机器学习的方法获得时域加权模型, 对视频帧进行加权, 从而得到客观视频质量评价值。在LIVE视频数据库上进行性能测试, 得到PLCC(Pearson Linear Correlation Coefficient)为0.827, SROCC(Spearman Rank Order Correlation Coefficient)为0.802, 与已有相关算法相比, 所提出的VQA方法的评价结果更接近人眼的主观感知。
视频质量评价 人眼感知特性 恰可察觉失真模型 显著图 结构张量 机器学习 video quality assessment human visual characteristics just-noticeable-difference model saliency map structure tensor machine learning 
光学技术
2016, 42(4): 351
作者单位
摘要
1 宁波大学 信息科学与工程学院,浙江 宁波 315211
2 南京大学 计算机软件新技术国家重点实验室,南京 210093
如何准确有效的评价立体视频质量对于视频通信系统的发展有着重要的作用。本文着重于从单视点相邻帧中提取的结构信息相关性提出了一种立体视频质量评估方法。空域梯度对空域失真和时域局部失真同样敏感,对于立体视频的左右视点,首先结合时空域梯度特征和对图像质量评价有显著影响的颜色特征,得到单视点视频的时空域结构相似度。在时空域质量融合阶段,时空域局部质量首先通过空域融合得到单视点帧级质量值,然后再利用左右视点能量比率图加权的方法将同一时刻左右视点之间的质量值融合为立体视频单帧质量值。最后考虑人眼不对称追踪效应进行单帧质量融合得到最终的立体视频质量。在NAMA3DS1-COSPAD1 数据库上的实验表明该方法可以准确预测立体视频质量且时间复杂度非常低。
视频质量评价 时空域信息 质量融合 时域效应 stereoscopic video quality assessment spatial-temporal information quality fusion temporal effects 
光电工程
2016, 43(11): 82
作者单位
摘要
宁波大学信息科学与工程学院, 浙江 宁波 315211
多视点彩色加深度视频 (MVD)是目前 3D场景的主流表示方式之一。在 3D-HEVC的编码框架中, 深度视频帧内编码具有较高的编码复杂度。本文提出了一种基于区域分割的 3D-HEVC深度视频快速帧内编码算法。首先根据对应彩色视频的纹理特征和深度视频的边界提取结果, 把深度图分为四个区域;然后统计分析了各区域中深度视频编码失真对绘制中间视点质量的影响以及帧内编码预测模式的分布规律;最后设计了在不同区域里采用不同的 CU尺寸提前决定、模式粗选限定和快速 DMMs模式决定的算法。实验结果表明, 本文提出的算法在绘制的中间视点质量不变的情况下平均节省 55.11%的总体编码时间, 对于深度视频的编码时间平均节省 61.57%。
深度视频编码 帧内编码 模式选择 depth video coding 3D-HEVC 3D-HEVC intra coding mode decision DMM DMM 
光电工程
2015, 42(8): 47
作者单位
摘要
宁波大学 信息科学与工程学院, 浙江 宁波 315211
为了降低深度视频编码的复杂度,提高深度视频编码的效率,本文利用深度视频纹理复杂度的一致性,提出了一种深度视频快速宏块模式选择算法。该算法首先对不同区域模式复杂度进行分析,定义一个宏块模式复杂度因子,根据该因子将深度视频划分为简单模式区域和复杂模式区域。然后,分析深度视频的宏块模式分布情况及宏块模式选择的相关特性,为提出的算法提供理论依据。最后,根据模式区域选择相应的编码策略完成深度视频宏块模式的快速选择。实验结果表明,提出的算法在几乎不影响编码率失真性能及保证绘制质量的情况下可明显降低计算复杂度,能节约65.57%~92.72%的编码时间;而在低码率的情况下节约的编码时间会更多。因此,该算法在较低网络带宽限制下更加有效。
深度视频 模式选择 模式复杂度 复杂度因子 率失真性能 绘制质量 depth video mode selection mode complexity complexity factor rate-distortion performance quality of virtual view 
光学 精密工程
2014, 22(8): 2196
作者单位
摘要
宁波大学 信息科学与工程学院, 浙江 宁波 315211
根据人类视觉系统(Human Visual System, HVS)中双目视觉信息处理的过程, 结合一系列图像特征, 提出一种基于双目信息融合的立体图像质量评价模型。该模型通过复小波变换模拟HVS对立体图像的融合过程。提取结构活跃度(Structural Activity, SA)以及相位一致性(Phase Congruency, PC)作为图像特征。最后通过度量融合图像特征的改变程度获得立体图像客观质量。采用本文所提出的客观评价模型对立体图像数据库进行评价, 其线性相关系数值在0.92以上, 均方根误差值接近6, 异常值比率值为0%。实验结果表明, 该模型符合人眼视觉特性, 能够很好地预测立体图像质量。
立体图像质量评价 人类视觉系统 双目信息融合 结构活跃度 stereo image quality metric human visual system binocular fusion structural activity引言 
光电子技术
2014, 34(2): 102
蒋刚毅 1,2,*杨小祥 1彭宗举 1郁梅 1,2[ ... ]陈芬 1
作者单位
摘要
1 宁波大学 信息科学与工程学院, 浙江 宁波 315211
2 南京大学 计算机软件新技术国家重点实验室, 江苏 南京 210093
为了降低新一代高效视频编码 (High Efficiency Video Coding, HEVC) 标准的编码复杂度,提出了一种基于四叉树结构类型分析和早期编码单元(Coding Unit, CU)裁剪的HEVC快速编码新算法。首先,通过分析已编码的最大编码单元(Largest CU, LCU)四叉树结构类型,确定其深度遍历区间(Depth Range, DR)类型。然后,利用相邻已编码的LCU以及前向参考帧和后向参考帧中坐标位置相同的LCU的DR类型来预测当前LCU的DR类型,并根据预测得到的DR类型对当前LCU设定CU深度遍历区间。最后,采用贝叶斯决策原理获取阈值,并利用该阈值在CU分割过程进行早期CU裁剪。实验结果表明:相对于原始HEVC编码结构,本文算法在随机访问模式下编码时间平均减少41.55%,BDBR(Bjontegaard Delta Bit Rate)只增加约1.94%,BDPSNR(Bjontegaard Delta Peak Signaltonoise Rate)只降低了0.06 dB;与Shen方案相比,该算法可以降低12%左右的计算复杂度,BDBR只增加约1.09%,BDPSNR只降低了0.03 dB。
高效视频编码 编码单元(CU) CU深度遍历选择 CU裁剪 四叉树结构类型分析 High Efficiency Video Coding (HEVC) Coding Unit(CU) CU Depth Range Selection (CUDR) CU pruning quad-tree type analysis 
光学 精密工程
2014, 22(5): 1322

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!