作者单位
摘要
上海理工大学 光电信息与计算机工程学院,上海 200093
近年来,样本较少场景下的目标检测引起了广泛的关注。由于少样本提供的信息有限,大部分少样本目标检测模型采用改进的Faster RCNN检测框架进行研究。但由于Faster RCNN框架中潜在的模块矛盾问题,现有的少样本目标检测模型的特征捕捉和分类的能力有待提高。为解决以上问题,以Faster RCNN框架为基础,加入了梯度反传解耦机制,缓解在反向传播过程中,RPN和RCNN的冲突对主干网络的负面影响。为提高目标检测模型的特征捕捉能力,采用元学习框架,并融合基于注意力机制的蒸馏模块和多尺度注意力模块,充分利用查询集和支持集的信息,捕捉更多全局特征信息。大量的实验证明,在随机采样目标数k=1, 2, 3, 5, 10设置下,改进后的模型在Pascal VOC数据集的新类上,分别达到21.8%,34.7%,40.9%,44.5%,51.7% mAP(AP50)。在k = 10, 30设置下,改进后的模型在COCO数据集的新类上,分别达到25.1%,27.6% mAP(AP50)。
深度学习 少样本学习 目标检测 deep learning few-shot learning object detection 
光学仪器
2023, 45(6): 14
作者单位
摘要
上海理工大学 光电信息与计算机工程学院,上海 200093
眼底血管图像在临床中通常被用于眼部疾病的诊断及监测,其中血管的形态结构能够反映疾病的重要特征,因此,眼底血管图像的分割处理对眼部疾病的诊断和预防具有十分重要的医学意义。针对目前人工智能主流算法中卷积和池化操作会导致很多特征丢失,提取特征时会忽视图像中的空间信息,图像中的细小血管很难分割出来等问题,基于U-net模型进行了相关研究,结合空间注意力模块对空间特征进行细化,同时提出了一种下补偿结构LC-SAnet。该结构能够减少网络提取特征信息过程中的特征损失,从而提高分割精度。研究实验在DRIVE数据集上完成,LC-SAnet的分割准确率达到96.97%,F1值达到74.36%。结果证明,LC-SAnet表现出更好的分割性能,对细小血管的结构识别更加准确。
医学图像分割 神经网络 空间注意力 下补偿结构 medical image segmentation neural network spatial attention low compensation structure 
光学仪器
2023, 45(3): 15
作者单位
摘要
上海理工大学 光电信息与计算机工程学院,上海 200093
水果作为人们日常必备的食物,其越来越高的消费需求使得行业对自动损伤检测和自动分类的要求日益提高。针对这一需求,近年来水果损伤自动检测成为研究的热门话题。针对现有的深度学习技术,即卷积神经网络在水果的特征提取和分类方面的应用进行了探讨,提出了一种以ResNet34作为主干网络,并在此基础上引入注意力机制SE和CBAM模块的方法来实现水果损伤的检测和基本分类。在fruit fresh and rotten for classification数据集上完成了该方法的验证。经过与VGG16,GoogLeNet,MobileNetV2等常见网络的比较分析,结果显示改进后的模型分类准确度达到98.8%。通过加入新的苹果数据集,该模型相比原网络ResNet34,在性能方面进一步提升,有效提高了模型的泛化性。该模型提升了水果损伤检测和分类处理的精确性,在实际中,可为复杂的水果图片的多特征分类处理提供借鉴。
深度学习 水果损伤检测 ResNet 注意力机制 deep learning fruit damage detection ResNet attention mechanism 
光学仪器
2023, 45(2): 26
作者单位
摘要
上海理工大学 光电信息与计算机工程学院 ,上海 200093
汽车轮速传感器是防抱死制动系统(ABS)的关键部件之一,其性能的好坏直接决定了ABS性能的高低。磁电式ABS转速传感器的输出近似为正弦信号,通过对正弦信号幅值、频率、有效值的测定,可以分析获得传感器性能。本文以STM32F407为主控制板,以快速傅里叶变换为主要工具,设计了一款数字控制正弦信号测量装置进行各参数测量。经过实验验证,本装置可在5%的误差内精确测量输入信号的频率、有效值、峰值、失真度并还原信号波形。此外,为了便于观测,本设计借助蓝牙通信模块将测量数据同步上传到手机端。
ABS传感器 正弦信号测量 STM32 快速傅里叶变换 蓝牙通信 anti-lock braking system sensor sinusoidal signal measurement STM32 fast Fourier transform bluetooth communication 
光学仪器
2023, 45(2): 36
作者单位
摘要
上海理工大学 光电信息与计算机工程学院,上海 200093
智能微型化的医用器械在医疗行业逐渐被人们所重视。这些产品主要是由一些微型电子元器件构成,其中器件核心芯片部分的点线连接结构需通过高精密焊接工作完成。因此焊点和被焊芯线的识别精度要求越来越高,两者是否能准确有效识别直接影响焊接的最终质量。为高质量完成焊接过程中的焊点和芯线识别,本文主要使用电子显微仪器结合上位机VS17+OpenCV软硬结合的方法完成图像处理,对所采集图像中的焊点和芯线端头进行识别。以焊点和芯线端头的颜色及几何特征作为分析对象,经预处理后再通过各自特征分析突出感兴趣区域部分,通过特定颜色阈值选取方式和对比度提升算法完成焊点和芯线端头的分割过程,要求所测量焊点及芯线端头的识别精度误差≤0.1 mm。实验结果表明:本文印刷电路板(PCB)焊点及芯线端头的识别算法能有效识别焊点及芯线端头图中所在位置并显示其像素坐标值;经数据整理分析,本文算法的识别精度误差均控制在允许的误差范围内。
HSV颜色空间 RGB通道分离 阈值分割 连通域分析 轮廓检测 HSV color space RGB channel separation threshold segmentation connected domain analysis contour detection 
光学仪器
2022, 44(5): 42
作者单位
摘要
上海理工大学 光电信息与计算机工程学院,上海 200093
电子内窥镜作为现代医疗仪器中的重要设备,随着产量的不断增加,实现内窥镜信号线自动化焊接已成为一个必然趋势。为精确高效采集内窥镜镜头模组的焊点坐标,设计了一种基于现场可编程逻辑门阵列(field programmable gate array,FPGA)图像处理的内窥镜焊点检测系统。整个系统以OV5640作为图像采集器件对目标板的图像数据进行采集,通过Verilog HDL硬件描述语言进行图像处理,实现焊点检测和瑕疵判别算法的设计。硬件测试结果表明,该系统能实时采集焊点坐标并检测焊点之间的瑕疵,采集到的焊点坐标最大误差小于0.1 mm,检测精度高,实时性强,具有广泛的应用前景。
可编程逻辑门阵列(FPGA) 图像处理 焊点检测 field programmable gate array image processing solder joint inspection 
光学仪器
2022, 44(5): 53
作者单位
摘要
上海理工大学 光电信息与计算机工程学院,上海 200093
针对目前眼球定位追踪算法存在的眼球定位精准度不高问题,以及为了改进眼球追踪算法的精准度并保证一定的图片处理速度,将可变形卷积网络应用于YOLO网络,对特征分布提取层面进行改进。利用可变形卷积的形变建模能力对卷积核中的各个采样点的位置增加一定的偏移变量,从而从原始单帧图像中提取更具有表征特征的信息,并与先进眼球定位追踪检测网络进行了实验对比。研究表明,可变形卷积YOLO网络的精准度可以达到0.685,平均处理图片刷新率达42帧/s,优于原YOLO网络以及其他眼球定位追踪检测网络。
可变形卷积 YOLO网络 眼球定位 形变建模 deformable convolution YOLO network eyeball positioning deformation modeling 
光学仪器
2021, 43(6): 26
作者单位
摘要
上海理工大学 光电信息与计算机工程学院,上海 200093
多聚焦图像融合技术是为了突破传统相机景深的限制,将焦点不同的多幅图像合成一幅全聚焦图像,以获得更加全面的信息。以往基于空间域和基于变换域的方法,需要手动进行活动水平的测量和融合规则的设计,较为复杂。所提出的方法与传统的神经网络相比增加了提取浅层特征信息的部分,提高了分类准确率。将源图像输入训练好的多尺度特征网络中获得初始焦点图,然后对焦点图进行后处理,最后使用逐像素加权平均规则获得全聚焦融合图像。实验结果表明,本文方法融合而成的全聚焦图像清晰度高,保有细节丰富且失真度小,主、客观评价结果均优于其他方法。
多聚焦图像融合 卷积神经网络 多尺度特征 multi-focus image fusion convolutional neural network multi-scale features 
光学仪器
2021, 43(5): 40
作者单位
摘要
上海理工大学 光电信息与计算机工程学院,上海 200093
为了解决雷达探测数据中噪点过多的问题,提出了结合基于密度的噪声聚类算法(DBSCAN)和拉依达准则(3σ)的去噪方法。以雷达实际测量的目标运动信息为实验数据,运用DBSCAN算法进行聚类,剔除数据中的离群噪点,再通过拉依达准则去除影响较大的奇异值。实验结果表明,去噪之后雷达测距的线性误差由12 mm减少到0.36 mm,性能优于经典的半径滤波算法,可为实际雷达测量提供参考。
雷达技术 基于密度的噪声聚类算法(DBSCAN) 拉依达准则(3σ) 去噪算法 radar technology density-based spatial clustering of applications with noise (DBSCAN) pauta criterion(3σ) denoising algorithm 
光学仪器
2021, 43(4): 55
作者单位
摘要
上海理工大学 光电信息与计算机工程学院,上海 200093
为了精确采集前端雷达信号,设计了一种基于现场可编程逻辑门阵列(field programmable gate array,FPGA)的雷达采集系统。采用FPGA作为核心主控芯片,通过给雷达收发芯片赋值产生雷达信号,用FPGA控制板间的AD芯片对回波信号进行采样。最后将信号传输到上位机中,从而实现雷达信号获取、数据采集控制、数据缓存、数据传输以及时钟同步控制等功能。实验结果表明,该系统达到了设计要求且具有易携带、成本低、构造简单、可靠性强、速率快等特点,经过该系统采集的信号可用于对实际场景下物体速度、距离的解析。
现场可编程逻辑门阵列(FPGA) 系统设计 数据采集 field programmable gate array(FPGA) system design data acquisition 
光学仪器
2021, 43(4): 78

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!