作者单位
摘要
1 西安工程大学,西安70048
2 西安交通大学信通学院,西安710049
使用双摄像头监控视频,设计一种考试作弊异常行为检测算法,检测考生替考、考试现场出现考试无关的物品及人员、考生在考试过程中说话、考生注意力漂移等四种常见的考试异常行为。首先使用基于注意力YOLOv5s算法检测考试中的禁用物品;然后用基于Dlib的人脸识别确认考生的身份信息和有无替考行为;最后利用唇动检测和头部姿态估计进行考生的异常行为检测。双摄像头的使用减少了视野死角,防止考生在摄像头的视野死角区域放置作弊工具。实验表明所提的算法具有较好的检测精度和实时性。
图像分类 人脸识别 异常行为检测 注意力机制 卷积神经网络 image classification face recognition abnormal behaviors detection attention mechanism convolutional neural network 
光电子技术
2023, 43(3): 276
作者单位
摘要
华北理工大学 电气工程学院,河北 唐山 063210
烧结火焰图像中具有细粒度的局部火焰状态特征信息和复杂多变的全局火焰状态特征信息,而传统的卷积神经网络往往对局部特征更加敏感,难以提取火焰状态的全局特征信息,从而制约烧结火焰特征的表达能力,导致烧结火焰状态分类识别精度低。针对此类问题,提出一种基于CNN-Transformer的双流网络特征融合分类方法,该方法包含CNN(convolutional neural networks)流和Transformer流两个模块,首先将CNN块和Transformer块并行设计,CNN流提取烧结火焰RGB图像中的局部特征信息,Transformer流提取烧结火焰GRAY图像的全局特征信息;然后,将双流网络分别提取的烧结火焰状态局部特征信息和全局特征信息进行级联交互特征融合;最后,利用softmax分类器实现烧结火焰状态的分类。实验结果表明,火焰分类准确率可达96.20%,与传统卷积神经网络相比提升6%~8%的识别准确率。
卷积神经网络 Transformer 特征融合 烧结火焰 图像分类 convolutional neural network Transformer feature fusion sintering flame image classification 
应用光学
2023, 44(5): 1030
作者单位
摘要
南京理工大学 电子工程与光电技术学院,南京 210094
提出一种基于残差网络改进的卷积神经网络模型,应用于乳腺组织光学相干层析图像的辅助诊断。该方法采用残差网络作为基础框架,利用级联的小卷积层替换大卷积层,使用八度卷积替换部分卷积层,并且加入注意力机制,构造出一个具有双重过滤结构的残差网络模型。双重过滤结构不仅能够减少模型整体的参数计算量,还能使模型在特征提取时侧重于含有丰富结构信息的高频分量,降低低频分量占比,减少信息冗余,从而提高模型对于近似结构图像的分类识别能力。对比实验结果表明,提出的双重过滤残差网络模型对纤维脂肪、基质和肿瘤3类乳腺组织光学相干层析图像实现96.88%的分类精确度,且分类性能比目前经典的卷积神经网络模型更加优异,在乳腺癌切缘术实时诊断领域具有潜力。
光学相干层析术 图像分类 高频信息 八度卷积 注意力机制 深度学习 Optical coherence tomography Image classification High-frequency information Octave convolution Attention mechanism Deep learning 
光子学报
2023, 52(12): 1210001
作者单位
摘要
内蒙古农业大学计算机与信息工程学院, 内蒙古 呼和浩特 010018
近年来, 基于深度学习的模型在高光谱图像(HSI)分类方面效果显著。 针对小样本数据基于深度学习的高光谱图像分类方法分类精度不高的问题, 提出一种融合卷积长短期记忆(ConvLSTM)和多注意力机制网络的高光谱图像分类方法。 该方法分三个分支: 光谱分支、 空间X分支和空间Y分支分别提取光谱特征、 空间X特征和空间Y特征, 并将三个方向的特征融合进行高光谱图像分类。 由于ConvLSTM在学习有价值的特征和对光谱数据中的长期依赖关系建模方面表现出良好的性能, 所以在光谱分支中用了3个隐藏层、 卷积核大小为3×3、 通道分别为150、 100和60提取光谱信息。 在空间X分支和空间Y分支, 采用基于DenseNet和3D-CNN的Dense空间X块和Dense空间Y块分别提取空间X特征和空间Y特征。 为了增强特征提取, 在这三个分支中还分别引入了其特征方向的注意力机制, 针对信息丰富的光谱波段设计了光谱注意块, 信息丰富的像素点分别设计了空间X和空间Y注意块。 在三个公开的高光谱数据集上进行了实验, 即Indian Pines(IP)、 Pavia University(UP)和Salinas Valley(SV)数据集; 并对比了其他五种方法: 基于RBF径向核的支持向量机模型(SVM)、 更深更广的卷积神经网络模型(CDCNN)、 快速密集光谱-空间卷积网络模型(FDSSC)、 空谱残差网络模型(SSRN)、 双分支双注意力机制网络模型(DBDA)。 实验中, IP数据集上训练样本和验证样本的大小设为总样本的3%, UP和SV数据集上训练样本和验证样本的大小设为总样本的0.5%。 该方法和所有基于深度学习的方法, 批处理大小均设置为16, 优化器设为Adam, 学习率设置为0.000 5, 并动态调整学习率。 由于SVM直接利用光谱信息进行分类, 输入样本块像素大小为1×1, 其他基于深度学习方法的输入样本块像素均设置为9×9。 实验结果表明, 该方法能充分利用高光谱图像的光谱和空间特征, 在OA、 AA、 KAPPA等评价标准上均获得了更好的效果, 其中, 该方法的OA指标比次优的算法平均提高0.12%~2.04%。
高光谱图像分类 深度学习 卷积神经网络 注意力机制 Hyperspectral image classification Deep learning ConvLSTM ConvLSTM Convolutional neural network Attention mechanism 
光谱学与光谱分析
2023, 43(8): 2608
刘敬 1,*李洋 1刘逸 2
作者单位
摘要
1 西安邮电大学 电子工程学院,陕西西安702
2 西安电子科技大学 电子工程学院,陕西西安710071
针对高光谱遥感图像的特征提取与地物分类,提出一种基于分数阶微分的高光谱图像特征提取方法,设计二维分数阶微分掩模提取高光谱图像的像素空间分数阶微分(SpaFD)特征,并提出一种空谱联合准则用于选取微分掩模阶数。为充分利用高光谱图像的空间特征与光谱特征,将SpaFD特征与原始特征直连融合获得SpaFD-Spe-Spa混合特征,并采用三维卷积神经网络(3DCNN)、先采用主成分分析(PCA)对像素光谱进行降维处理再送入三维卷积神经网络(3DCNNPCA)以及采用混合光谱网络(HybridSN)验证SpaFD-Spe-Spa混合特征的有效性。实验中分别采用3✕3,5✕5和7✕7的分数阶微分掩模进行空间特征提取,4个真实高光谱图像的实验结果表明,所提取的SpaFD特征和SpaFD-Spe-Spa特征可有效提升高光谱图像的地物分类精度,且SpaFD-Spe-Spa特征对地物分类准确率的提升更为明显:SpaFD特征相比原始特征在Indian Pines,Botswana,Pavia University和Salinas 4个数据上的分类识别率在最优情况下分别提升了3.87%,1.42%,2.41%和2.87%;SpaFD-Spe-Spa特征相比原始特征在Indian Pines,Botswana,Pavia University和Salinas 4个数据上的分类识别率在最优情况下分别提升了3.90%,5.62%,3.35%和5.18%。
高光谱图像分类 分数阶微分 特征提取 卷积神经网络 hyperspectral images classification fractional differentiation feature extraction convolutional neural network 
光学 精密工程
2023, 31(21): 3221
作者单位
摘要
1 东南大学 机械工程学院,江苏南京289
2 无锡尚实电子科技有限公司,江苏无锡14174
在TFT-LCD面板缺陷检测中,检测对象背景复杂、缺陷细微且种类繁多,而工业生产实时性要求高,传统的缺陷分类算法往往难以兼顾精度和速度要求,无法适用于实际生产应用。为均衡TFT-LCD面板缺陷分类的准确率和速率,提出一种基于Swin Transformer的轻量化深度学习图像分类模型。首先对模型每层输入的特征图进行Token融合以减少模型计算量,从而提高模型的轻量化水平。其次引入深度可分离卷积模块以帮助模型增加卷积归纳偏置,从而缓解模型对海量数据的依赖问题。最后使用知识蒸馏方法来克服模型轻量化导致的检测精度下降问题。在自制TFT-LCD面板缺陷分类数据集上的实验表明,本文提出的改进模型相比基线模型,FLOPs计算量降低了2.6 G,速度指标提升了17%,而Top-1 Acc精度仅损失1.3%,且与其他图像分类主流模型相比,在自制数据集和公开数据集上都具有更均衡的精度和速度。
TFT-LCD Transformer 图像分类 计算机视觉 Thin Film Transistor Liquid Crystal Display(TFT-LCD) transformer image classification computer vision 
光学 精密工程
2023, 31(22): 3357
程寅翥 1,2刘松 1,2王楠 1,2师悦天 1,2张耿 1,*
作者单位
摘要
1 中国科学院西安光学精密机械研究所 光谱成像技术重点实验室,西安 710119
2 中国科学院大学,北京 100049
针对普通的三维卷积神经网络(3D CNN)从一个尺度上提取特征,会丢失部分细节信息,且对小样本任务表现一般的问题,本文提出了一种三支路的3D CNN,从不同尺度上提取特征后进行加权特征融合,从而获取了更为全面的特征;并引入数据增强技术,从而改善了小样本情形下的分类性能。现有特征融合方法通常对各个支路直接进行拼接,本文采用加权拼接的特征融合方法,将各特征分别乘以一个加权系数后再进行拼接,该系数通过模拟退火算法求取。本文方法在公开数据集Indian Pines,Pavia University,Salinas等上采用10%的数据进行训练,分别得到了98.60%、99.83%、99.97%的总体准确率,与各类对比方法相比,提升了高光谱遥感影像分类问题的准确率。
光学遥感影像 深度学习 图像分类 卷积神经网络 特征融合 多尺度 Optical image sensing images Deep learning Image classification Convolutional neural network Feature fusion Multiscale 
光子学报
2023, 52(11): 1110002
作者单位
摘要
电子科技大学 信息与软件工程学院,成都 610054
该文针对新工科软件专业图像分类任务的新生项目课程存在的3个问题进行分析设计,包括Python语言不熟悉,图像分类入门时间短以及实操环境学生难以搭建,提出了基于百度的AI Studio平台和以PaddleHub预训练模型的应用为中心的课程教学设计,包括融合线性代数的实际应用,预训练模型fine-tune实践以及组队分工线上线下结合学习等,后续可以改进为由学生自主选择设计识别任务内容。该课程设计内容有助于学生奠定工程基础,提高专业技能,培养团队合作能力,最终达到增强专业兴趣和专业信心的课程设计目标。
新生项目课 图像分类 迁移训练 数据增强 freshman project course image classification migration training data enhancement 
实验科学与技术
2023, 21(4): 49
李峙含 1,2,3,4花海洋 1,2,*张浩 1,2,3,4
作者单位
摘要
1 中国科学院沈阳自动化研究所,辽宁 沈阳 110016
2 中国科学院光电信息处理重点实验室,辽宁 沈阳 110016
3 中国科学院机器人与智能制造创新研究院,辽宁 沈阳 110169
4 中国科学院大学,北京 100049
为了提高在少标签数据条件下的地物分类精度,提出一种利用高光谱图像(HSI)数据与机载激光雷达(LiDAR)数据进行对比学习的地物分类方法。首先利用不带标签的HSI数据与LiDAR数据进行对比学习,通过对比学习可以建立这两种数据的空间特征之间的联系,实现对这两种数据的空间特征提取;设计了卷积模块与Transformer模块相结合的网络,使模型能够利用提取出的局部特征建立全局交互关系。在Houston 2013数据集和Trento数据集上进行对比实验,所提方法的分类精度高于其他多源数据融合地物分类的对照方法,在Houston 2013数据集上当每类标签样本量为5时,所提方法的分类精度比对照方法提高20.73个百分点,在Trento数据集上当每类标签样本量为2时,所提方法的分类精度比对照方法提高8.35个百分点。
图像处理 高光谱图像分类 机载激光雷达 地物分类 多源数据 
激光与光电子学进展
2023, 60(22): 2228006
王彬 1兰海 2俞辉 2,3郭杰龙 2,3魏宪 2,3,*
作者单位
摘要
1 福州大学 先进制造学院,福建 泉州 362200
2 中国科学院 福建物质结构研究所,福建 福州 350002
3 中国福建光电信息科学与技术创新实验室(闽都创新实验室),福建 福州 350108
针对目前小样本学习方法易过拟合、跨域泛化能力不足等问题,受启发于储备池计算不依赖于训练而缓解过拟合的特性,提出了一种基于储备池计算的小样本学习方法(Reservoir Computing based Network for Few-shot Image Classification,RCFIC)。整个方法由特征提取模块、特征增强模块和分类器模块构成。特征增强模块由储备池模块和基于储备池的注意力机制构成,分别对特征提取网络的特征进行通道级增强和像素级增强,同时联合余弦分类器促使网络学习具有高类间方差、低类内方差特性的特征分布。实验结果表明,本文算法在Cifar-FS、FC100、Mini-ImageNet等数据集上的分类精度至少比现有方法高1.07%,在从Mini-ImageNet到CUB-200的跨域场景设置下的分类精度优于次优方法1.77%。同时,消融实验验证了RCFIC的有效性。所提方法泛化性强,能够有效缓解小样本图像分类中的过拟合问题并在一定程度上解决跨域问题。
小样本学习 储备池计算 注意力机制 特征增强 图像分类 few-shot learning reservoir computing attention mechanism feature enhancement image classification 
液晶与显示
2023, 38(10): 1399

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!