相同关键词【video surveillance】论文列表 -- 中国光学期刊网

作者单位

摘要

北京理工大学集成电路与电子学院, 北京 100081

为了提升行人重识别算法的检索准确率, 提出了基于软掩膜前景分割和多信息融合重排序的行人重识别算法。通过基于U-Net的软掩膜前景分割算法去除图像背景信息, 同时减缓图像分割边界的突变, 以保留图像中行人的关键信息; 通过基于孪生深度网络的多信息融合重排序算法融合行人图像的多种信息, 提升检索结果质量。实验结果表明, 提出的两种方法是对行人重识别算法流程的有效补充, 可作为提升准确率的有效方法应用于多数现有行人重识别算法中。

行人重识别视频监控前景分割重排序 person re-identification video surveillance foreground segmentation re-ranking

PDF全文 Full Text

光学技术

2023, 49(6): 756

光电测量

基于深度自编码-高斯混合模型的视频异常检测方法

钟友坤 ¹莫海宁 ^2,*

作者单位

摘要

¹ 河池学院物理与机电工程学院，广西宜州 546300

² 广西科技大学宏达威爱科技学院，广西柳州 545006

由于异常定义的模糊性和真实数据的复杂性，视频异常检测是智能视频监控中最具挑战性的问题之一。基于自动编码器(AE)的帧重建（当前或未来帧）是一种流行的视频异常检测方法。使用在正常数据上训练的模型，异常场景的重建误差通常比正常场景的重建误差大得多。但是，这类方法忽略了正常数据本身的内部结构，效率较低。基于此，提出了一种深度自动编码高斯混合模型(DAGMM)。首先利用深度自动编码器获得输入视频片段的生成低维表示和重构误差，并将其进一步输入高斯混合模型(GMM)。而估计网络则通过高斯混合模型预测能量概率，然后通过能量密度概率判断异常。DAGMM以端到端的方式同时联合优化深度自动编码器和GMM的参数，能够平衡自动编码重建、低维表示的密度估计和正则化，泛化能力强。在两个公共基准数据集上的实验结果表明，DAGMM达到了现有最高技术发展水平，在UCSD Ped2和ShanghaiTech两个数据集上分别取得了95.7%和72.9%的帧级AUC。

视频监控异常事件自编码网络高斯混合模型深度学习 video surveillance anomalous event auto-encoding network Gaussian mixture model deep learning

PDF全文 Full Text

红外与激光工程

2022, 51(6): 20210547

光电测量

视频监控下利用记忆力增强自编码的行人异常行为检测

孙敬波季节

作者单位

摘要

济宁学院数学与计算机应用技术学院，山东曲阜 273155

随着视频监控数据的快速增长，对大规模视频数据的自动异常检测的需求越来越大，基于深度自编码器重构误差检测方法已经被广泛探讨。但是，有时自编码器“泛化”得很好，能够很好地重建异常并导致漏检。为了解决这个问题，提出了采用记忆力模块来增强自动编码器，称为记忆力增强自编码（Memory-augmented autoencoder, Memory AE）方法。给定输入，Memory AE首先从编码器获取编码，然后将其用作查询以检索最相关的记忆项来进行重建。在训练阶段，记忆内容被更新以表示正常数据的原型元素。在测试阶段，将学习到的记忆元素固定下来，从正常数据的几个选定的记忆记录中获得重建，因此重建将趋向于接近正常样本。因此，将加强对异常的重构误差以进行异常检测。对两个公共视频异常检测数据集，即Avenue数据集和ShanghaiTech数据集的研究证明了所提出方法的有效性。

异常事件检测视频监控自编码网络记忆力增强深度学习 anomalous event detection video surveillance auto-encoding network memory-augmented model deep learning

PDF全文 Full Text

红外与激光工程

2022, 51(6): 20210680

研究论文

基于集成生成对抗网络的视频异常事件检测方法

顾嘉城龙英文 ^*吉明明

作者单位

摘要

上海工程技术大学电子电气工程学院上海 201620

视频中的异常检测是一个具有挑战性的计算机视觉问题。现有的最先进视频异常检测方法主要集中在深度神经网络的结构设计上，以获得性能改进。与主要研究趋势不同，本文侧重于将集成学习和深度神经网络相结合，提出了一种基于集成生成对抗网络（Generative Adversarial Networks，GAN）的方法。在所提出的方法中，一组生成器和一组判别器一起训练，因此每个生成器可以从多个判别器获得反馈，反之亦然。与单个GAN相比，集成GAN可以更好地对正常数据的分布进行建模，从而更好地检测异常。在两个公开数据集上测试了所提出的方法性能。结果表明，集成学习显著提高了单个检测模型的性能，在两个数据集上比现有最近方法分别超过0.4%和0.3%的帧级AUC。

视频监控异常事件深度学习集成学习生成对抗网络 video surveillance anomaly detection deep learning ensemble learning generative adversarial networks

PDF全文 Full Text

液晶与显示

2022, 37(12): 1607

图像处理

基于改进YOLOv4的行人鞋部检测算法

下载：651次

杨智雄唐云祁 ^*张家钧耿鹏志

作者单位

摘要

中国人民公安大学侦查学院，北京 100038

结合现场鞋印和周边监控视频锁定犯罪嫌疑人是公安机关刑事侦查破案的一种重要技战法，然而该技战法自动化程度低、耗时耗力，限制了应用范围。针对这一问题，本文提出一种基于YOLOv4算法的目标检测方法，可实现对监控视频下行人鞋部的自动检测。根据行人鞋部区域的特点，首先使用K-means聚类算法获得先验框尺度，并确定其数量；然后根据构建的数据集选取合适的检测层以强化对鞋部特征的学习；最后，通过多尺度特征融合，将调整后的空间金字塔池化结构迁移到剪枝后的网络内，增强模型的学习能力。结果表明，提出的YOLOv4_shoe算法训练权重仅为39.56 MB，参数量约为原模型的六分之一，mAP值达到了97.93%，比原YOLOv4模型提升了2.07%。

图像处理鞋部检测 YOLOv4 特征融合空间金字塔池化视频监控

PDF全文 Full Text

激光与光电子学进展

2022, 59(8): 0810007

成像光谱

MS-ADoG域结合ReNLU与VGG-16的矿井双波段图像融合算法

孙继平范伟强 ^*

作者单位

摘要

中国矿业大学（北京）机电与信息工程学院，北京 100083

为满足矿井视频监控需求，针对现有图像融合算法获取的融合图像存在伪目标、模糊目标、晕光遮挡目标等问题，提出了一种基于多尺度和自适应高斯差分变换，结合修正非线性单元和VGG-16的矿井双波段图像融合算法。设计了基于多尺度和自适应高斯差分变换的源图像分解模型，将红外和可见光图像分解为基础图像和细节图像；构造了一种修正非线性单元函数，使红外基础图像的权值随可见光基础图像的灰度自动调节，并采用“加权平均”的基础图像融合策略，以获得消除光源干扰的融合基础图像；利用预训练的VGG-16网络模型提取细节图像的4层网络深度特征，获取4对具有不同网络深度特征的融合图像后，通过“极大值选择”方法得到融合细节图像；对融合基础图像和融合细节图像进行重构，获取最终的融合图像。实验结果表明：所提算法能够消除矿井下人工光源干扰，得到场景清晰、特征显著的融合图像，更符合人的视觉特性；同时，改善了异源图像的融合效率，有利于图像的进一步分析处理。与其他典型算法相比，该算法鲁棒性好，克服了传统算法难以提取图像深度特征的缺点，更易于消除光源干扰，获得更加全面、可靠和丰富的场景信息。

视频监控图像融合自适应高斯差分修正非线性单元神经网络深度特征池化反运算 Video surveillance Image fusion Adaptive difference of Gaussian ReNLU function Neural network Depth feature Pooling inverse operation

PDF全文 Full Text

光子学报

2022, 51(3): 0310002

信号与信息处理

一种多路全景图像拼接融合算法研究

李晓龙刘立武刘超锋张龙 [ ... ]李哲

作者单位

摘要

西北核技术研究所, 西安

针对外场大场景视频监控需求, 分析研究了单台全景摄像机全景图像缺点, 多台全景摄像机多路全景图像拼接融合难点和拼接融合算法原理, 设计了一种多路全景图像拼接融合算法。研究结果认为, 该算法设计合理, 可有效拼接融合多路全景图像, 具有良好的视觉观感和图像质量, 可对提升外场全景监控能力提供借鉴。

视频监控图像处理全景拼接图像融合试验保障 video surveillance image processing panoramic mosaic image fusion test support

PDF全文 Full Text

光电技术应用

2021, 36(6): 71

图像处理

监控视频中采用深度支持向量数据描述的异常检测

李芳丽

作者单位

摘要

江西科技学院信息工程学院，江西南昌 330098

由于异常定义的模糊性，异常数据的稀少性，以及复杂的环境背景和人类行为，视频异常检测是计算机视觉领域中一大难题。现有基于深度学习的异常检测方法往往是利用训练好的网络提取特征或者是基于现有网络结构的，而并非针对于异常检测这个目标而设计网络的。提出一种基于深度支持向量数据描述（Deep Support Vector Data Description, DSVDD）的方法，通过学习一个深度神经网络，使得输入的正常样本空间能够映射到最小超球面。通过DSVDD，不仅能找到最小尺寸的数据超球面以建立SVDD，而且可以学习有用的数据特征表示以及正常模型。在测试时，映射在超球面内的样本被判别为正常，而映射在超球面外的样例判别为异常。提出的方法在CUHK Avenue和ShanghaiTech Campus数据集上分别取得了87.4%和74.5%的帧级AUC，检测结果优于现有的最新方法。

视频监控异常检测深度支持向量数据描述深度学习 video surveillance anomaly detection Deep Support Vector Data Description(DSVDD) deep learning

PDF全文 Full Text

红外与激光工程

2021, 50(9): 20210094

光学测量

视频监控下利用改进型C3D-RF的人群异常行为检测

张娓娓 ^1,*陈绥阳 ²陈锐 ³

作者单位

摘要

¹ 西安思源学院电子信息工程学院, 陕西西安 710038

² 西安交通大学理学院, 陕西西安 710049

³ 郑州轻工业大学软件学院, 河南郑州 450002

传统基于卷积神经网络(CNN)算法的人群异常行为检测方法由于采用二维卷积核提取图像特征, 故无法准确捕捉视频流在时序上的动态特征。为此, 提出一种基于改进C3D网络与随机森林(RF)算法相结合的检测方法。利用具有时间特征捕捉能力的C3D网络进行视频流梯度方向直方图(HOG)特征提取, 并作为三维卷积核输入以实现对视频时空特征的提取;使用随机森林分类器替代softmax全连接层以避免训练过程中繁琐的梯度计算操作, 并降低对训练数据集样本规模的要求;基于基准数据集的算例结果表明, 所提出的改进C3D-RF方案对人群异常行为的检测准确率保持在90%以上, 且与传统C3D网络、支持向量数据描述模型(SVDD)、编码深度卷积神经网络(CAE)等方法相比, 其训练时间缩短了15.34%以上。

信息光学异常行为检测 C3D网络随机森林视频监控时空特征提取 information optics abnormal behavior detection C3D network random forest video surveillance spatio-temporal feature extraction

PDF全文 Full Text

光学技术

2021, 47(2): 187

光学图像处理与识别

视频监控下利用改进型YOLOv3的弱监督式异常行为检测

赵雪章 ^1,*丁犇 ¹席运江 ²

作者单位

摘要

¹ 佛山职业技术学院电子信息学院, 广东佛山 528137

² 华南理工大学经济管理学院, 广东广州 510000

为了对监控视频中的异常行为进行准确高效地检测, 提出了一种利用改进型YOLOv3的弱监督式异常行为检测。采用多尺度融合的方式改进YOLOv3网络, 利用改进型YOLOv3完成视频中的目标检测, 提高计算效率与方法的通用性; 利用光流可有效捕捉运动信息这一特性, 提出大尺度光流直方图描述符(LSOFH)描述目标行为, 以更好地提取异常行为特征; 训练最小二乘支持向量机(LSSVM), 用于识别监控视频中的异常行为。基于MATLAB仿真平台对所提方法进行实验论证, 结果表明, 相比于其他方法, 所提方法在UCSD数据集、UMN数据集和地铁出口数据集上的表现最佳, 曲线下面积(AUC)最大、等错误率(EER)最小且检测率最高, 具有较好的应用前景。

视频监控异常行为弱监督式改进型YOLOv3 大尺度光流直方图描述符最小二乘支持向量机 video surveillance abnormal behavior weak supervision improved YOLOv3 large scale optical flow histogram descriptor least squares support vector machine

PDF全文 Full Text

光学技术

2021, 47(1): 120

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索