作者单位
摘要
北京理工大学 集成电路与电子学院, 北京 100081
为了提升行人重识别算法的检索准确率, 提出了基于软掩膜前景分割和多信息融合重排序的行人重识别算法。通过基于U-Net的软掩膜前景分割算法去除图像背景信息, 同时减缓图像分割边界的突变, 以保留图像中行人的关键信息; 通过基于孪生深度网络的多信息融合重排序算法融合行人图像的多种信息, 提升检索结果质量。实验结果表明, 提出的两种方法是对行人重识别算法流程的有效补充, 可作为提升准确率的有效方法应用于多数现有行人重识别算法中。
行人重识别 视频监控 前景分割 重排序 person re-identification video surveillance foreground segmentation re-ranking 
光学技术
2023, 49(6): 756
作者单位
摘要
1 河池学院 物理与机电工程学院,广西 宜州 546300
2 广西科技大学 宏达威爱科技学院,广西 柳州 545006
由于异常定义的模糊性和真实数据的复杂性,视频异常检测是智能视频监控中最具挑战性的问题之一。基于自动编码器(AE)的帧重建(当前或未来帧)是一种流行的视频异常检测方法。使用在正常数据上训练的模型,异常场景的重建误差通常比正常场景的重建误差大得多。但是,这类方法忽略了正常数据本身的内部结构,效率较低。基于此,提出了一种深度自动编码高斯混合模型(DAGMM)。首先利用深度自动编码器获得输入视频片段的生成低维表示和重构误差,并将其进一步输入高斯混合模型(GMM)。而估计网络则通过高斯混合模型预测能量概率,然后通过能量密度概率判断异常。DAGMM以端到端的方式同时联合优化深度自动编码器和GMM的参数,能够平衡自动编码重建、低维表示的密度估计和正则化,泛化能力强。在两个公共基准数据集上的实验结果表明,DAGMM达到了现有最高技术发展水平,在UCSD Ped2和ShanghaiTech两个数据集上分别取得了95.7%和72.9%的帧级AUC。
视频监控 异常事件 自编码网络 高斯混合模型 深度学习 video surveillance anomalous event auto-encoding network Gaussian mixture model deep learning 
红外与激光工程
2022, 51(6): 20210547
作者单位
摘要
济宁学院 数学与计算机应用技术学院,山东 曲阜 273155
随着视频监控数据的快速增长,对大规模视频数据的自动异常检测的需求越来越大,基于深度自编码器重构误差检测方法已经被广泛探讨。但是,有时自编码器“泛化”得很好,能够很好地重建异常并导致漏检。为了解决这个问题,提出了采用记忆力模块来增强自动编码器,称为记忆力增强自编码(Memory-augmented autoencoder, Memory AE)方法。给定输入,Memory AE首先从编码器获取编码,然后将其用作查询以检索最相关的记忆项来进行重建。在训练阶段,记忆内容被更新以表示正常数据的原型元素。在测试阶段,将学习到的记忆元素固定下来,从正常数据的几个选定的记忆记录中获得重建,因此重建将趋向于接近正常样本。因此,将加强对异常的重构误差以进行异常检测。对两个公共视频异常检测数据集,即Avenue数据集和ShanghaiTech数据集的研究证明了所提出方法的有效性。
异常事件检测 视频监控 自编码网络 记忆力增强 深度学习 anomalous event detection video surveillance auto-encoding network memory-augmented model deep learning 
红外与激光工程
2022, 51(6): 20210680
作者单位
摘要
上海工程技术大学 电子电气工程学院上海 201620
视频中的异常检测是一个具有挑战性的计算机视觉问题。现有的最先进视频异常检测方法主要集中在深度神经网络的结构设计上,以获得性能改进。与主要研究趋势不同,本文侧重于将集成学习和深度神经网络相结合,提出了一种基于集成生成对抗网络(Generative Adversarial Networks,GAN)的方法。在所提出的方法中,一组生成器和一组判别器一起训练,因此每个生成器可以从多个判别器获得反馈,反之亦然。与单个GAN相比,集成GAN可以更好地对正常数据的分布进行建模,从而更好地检测异常。在两个公开数据集上测试了所提出的方法性能。结果表明,集成学习显著提高了单个检测模型的性能,在两个数据集上比现有最近方法分别超过0.4%和0.3%的帧级AUC。
视频监控 异常事件 深度学习 集成学习 生成对抗网络 video surveillance anomaly detection deep learning ensemble learning generative adversarial networks 
液晶与显示
2022, 37(12): 1607
作者单位
摘要
中国人民公安大学侦查学院,北京 100038
结合现场鞋印和周边监控视频锁定犯罪嫌疑人是公安机关刑事侦查破案的一种重要技战法,然而该技战法自动化程度低、耗时耗力,限制了应用范围。针对这一问题,本文提出一种基于YOLOv4算法的目标检测方法,可实现对监控视频下行人鞋部的自动检测。根据行人鞋部区域的特点,首先使用K-means聚类算法获得先验框尺度,并确定其数量;然后根据构建的数据集选取合适的检测层以强化对鞋部特征的学习;最后,通过多尺度特征融合,将调整后的空间金字塔池化结构迁移到剪枝后的网络内,增强模型的学习能力。结果表明,提出的YOLOv4_shoe算法训练权重仅为39.56 MB,参数量约为原模型的六分之一,mAP值达到了97.93%,比原YOLOv4模型提升了2.07%。
图像处理 鞋部检测 YOLOv4 特征融合 空间金字塔池化 视频监控 
激光与光电子学进展
2022, 59(8): 0810007
作者单位
摘要
中国矿业大学(北京)机电与信息工程学院,北京 100083
为满足矿井视频监控需求,针对现有图像融合算法获取的融合图像存在伪目标、模糊目标、晕光遮挡目标等问题,提出了一种基于多尺度和自适应高斯差分变换,结合修正非线性单元和VGG-16的矿井双波段图像融合算法。设计了基于多尺度和自适应高斯差分变换的源图像分解模型,将红外和可见光图像分解为基础图像和细节图像;构造了一种修正非线性单元函数,使红外基础图像的权值随可见光基础图像的灰度自动调节,并采用“加权平均”的基础图像融合策略,以获得消除光源干扰的融合基础图像;利用预训练的VGG-16网络模型提取细节图像的4层网络深度特征,获取4对具有不同网络深度特征的融合图像后,通过“极大值选择”方法得到融合细节图像;对融合基础图像和融合细节图像进行重构,获取最终的融合图像。实验结果表明:所提算法能够消除矿井下人工光源干扰,得到场景清晰、特征显著的融合图像,更符合人的视觉特性;同时,改善了异源图像的融合效率,有利于图像的进一步分析处理。与其他典型算法相比,该算法鲁棒性好,克服了传统算法难以提取图像深度特征的缺点,更易于消除光源干扰,获得更加全面、可靠和丰富的场景信息。
视频监控 图像融合 自适应高斯差分 修正非线性单元 神经网络 深度特征 池化反运算 Video surveillance Image fusion Adaptive difference of Gaussian ReNLU function Neural network Depth feature Pooling inverse operation 
光子学报
2022, 51(3): 0310002
作者单位
摘要
西北核技术研究所, 西安
针对外场大场景视频监控需求, 分析研究了单台全景摄像机全景图像缺点, 多台全景摄像机多路全景图像拼接融合难点和拼接融合算法原理, 设计了一种多路全景图像拼接融合算法。研究结果认为, 该算法设计合理, 可有效拼接融合多路全景图像, 具有良好的视觉观感和图像质量, 可对提升外场全景监控能力提供借鉴。
视频监控 图像处理 全景拼接 图像融合 试验保障 video surveillance image processing panoramic mosaic image fusion test support 
光电技术应用
2021, 36(6): 71
作者单位
摘要
江西科技学院 信息工程学院,江西 南昌 330098
由于异常定义的模糊性,异常数据的稀少性,以及复杂的环境背景和人类行为,视频异常检测是计算机视觉领域中一大难题。现有基于深度学习的异常检测方法往往是利用训练好的网络提取特征或者是基于现有网络结构的,而并非针对于异常检测这个目标而设计网络的。提出一种基于深度支持向量数据描述(Deep Support Vector Data Description, DSVDD)的方法,通过学习一个深度神经网络,使得输入的正常样本空间能够映射到最小超球面。通过DSVDD,不仅能找到最小尺寸的数据超球面以建立SVDD,而且可以学习有用的数据特征表示以及正常模型。在测试时,映射在超球面内的样本被判别为正常,而映射在超球面外的样例判别为异常。提出的方法在CUHK Avenue和ShanghaiTech Campus数据集上分别取得了87.4%和74.5%的帧级AUC,检测结果优于现有的最新方法。
视频监控 异常检测 深度支持向量数据描述 深度学习 video surveillance anomaly detection Deep Support Vector Data Description(DSVDD) deep learning 
红外与激光工程
2021, 50(9): 20210094
作者单位
摘要
1 西安思源学院 电子信息工程学院, 陕西 西安 710038
2 西安交通大学 理学院, 陕西 西安 710049
3 郑州轻工业大学 软件学院, 河南 郑州 450002
传统基于卷积神经网络(CNN)算法的人群异常行为检测方法由于采用二维卷积核提取图像特征, 故无法准确捕捉视频流在时序上的动态特征。为此, 提出一种基于改进C3D网络与随机森林(RF)算法相结合的检测方法。利用具有时间特征捕捉能力的C3D网络进行视频流梯度方向直方图(HOG)特征提取, 并作为三维卷积核输入以实现对视频时空特征的提取;使用随机森林分类器替代softmax全连接层以避免训练过程中繁琐的梯度计算操作, 并降低对训练数据集样本规模的要求;基于基准数据集的算例结果表明, 所提出的改进C3D-RF方案对人群异常行为的检测准确率保持在90%以上, 且与传统C3D网络、支持向量数据描述模型(SVDD)、编码深度卷积神经网络(CAE)等方法相比, 其训练时间缩短了15.34%以上。
信息光学 异常行为检测 C3D网络 随机森林 视频监控 时空特征提取 information optics abnormal behavior detection C3D network random forest video surveillance spatio-temporal feature extraction 
光学技术
2021, 47(2): 187
作者单位
摘要
1 佛山职业技术学院 电子信息学院, 广东 佛山 528137
2 华南理工大学 经济管理学院, 广东 广州 510000
为了对监控视频中的异常行为进行准确高效地检测, 提出了一种利用改进型YOLOv3的弱监督式异常行为检测。采用多尺度融合的方式改进YOLOv3网络, 利用改进型YOLOv3完成视频中的目标检测, 提高计算效率与方法的通用性; 利用光流可有效捕捉运动信息这一特性, 提出大尺度光流直方图描述符(LSOFH)描述目标行为, 以更好地提取异常行为特征; 训练最小二乘支持向量机(LSSVM), 用于识别监控视频中的异常行为。基于MATLAB仿真平台对所提方法进行实验论证, 结果表明, 相比于其他方法, 所提方法在UCSD数据集、UMN数据集和地铁出口数据集上的表现最佳, 曲线下面积(AUC)最大、等错误率(EER)最小且检测率最高, 具有较好的应用前景。
视频监控 异常行为 弱监督式 改进型YOLOv3 大尺度光流直方图描述符 最小二乘支持向量机 video surveillance abnormal behavior weak supervision improved YOLOv3 large scale optical flow histogram descriptor least squares support vector machine 
光学技术
2021, 47(1): 120

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!