作者单位
摘要
1 浙江工业大学计算机科学与技术学院,浙江 杭州 310023
2 中国科学院深海科学与工程研究所,海南 三亚 572000
水下目标检测 YOLO ZYNQ 声呐图像 深度学习 轻量化 underwater target detection YOLO ZYNQ sonar image deep learning lightweight 
光电工程
2024, 51(1): 230284
作者单位
摘要
1 内蒙古科技大学 信息工程学院,内蒙古包头市0400
2 内蒙古工业大学 信息工程学院,内蒙古呼和浩特010051
U型网络结构的脑肿瘤自动分割方法由于多次卷积和采样操作会造成信息损失,导致分割效果不佳。为解决这一问题,提出了能够利用语义信息流引导上采样特征恢复的特征对齐单元,并在此基础上设计轻量级的双重注意力特征对齐网络(DAFANet)。首先,将特征对齐单元分别引入3D UNet、DMFNet和HDCNet三个经典网络,以验证其有效性和泛化性。其次,在DMFNet基础上构造轻量级的双重注意力特征对齐网络DAFANet,利用特征对齐单元强化上采样过程中的特征恢复,3D期望最大化注意力机制同时作用于特征对齐路径和级联路径,用于重点获取上下文的全程依赖关系。同时使用广义Dice损失函数提升数据不平衡时的分割精度并加快模型收敛。最后,在BraTS2018和BraTS2019公开数据集进行验证,文中所提算法在ET,WT和TC区域的分割精度分别达到80.44%,90.07%,84.57%和78.11%,90.10%,82.21%。相较于当前流行的分割网络,具有对增强肿瘤区域更好的分割效果,更擅长处理细节和边缘信息。
脑肿瘤 图像分割 特征对齐 注意力机制 轻量化 brain tumors image segmentation feature alignment attention mechanism lightweight 
光学 精密工程
2024, 32(4): 565
作者单位
摘要
1 广西大学计算机与电子信息学院,广西 南宁 530004
2 广西大学机械工程学院,广西 南宁 530004
为了实时检测乘客的异常行为,提出一种基于YOLOv5s算法的轻量化自动扶梯乘客异常行为实时检测算法YOLO-STE。首先在主干网络中引入轻量化ShuffleNetV2网络,以减少主干网络的参数量和计算量;其次在骨干网络的最后一层引入基于Transformer编码的C3TR模块,以更好地提取丰富的全局信息和融合不同尺度的特征;最后在YOLOv5s的特征融合网络中嵌入SE(Squeeze-and-excitation)注意力机制,以更好地关注主要信息,从而提高模型精度。自建数据集并进行实验,实验结果表明,相比于原YOLOv5s,改进算法的全类平均精度值(mAP)高出1.9百分点,达到了96.1%,模型大小减少了70.8%。并且在Jetson Nano硬件上部署测试所得,改进后的算法前传耗时比原YOLOv5s模型缩短了39.9%。通过对比改进前后的算法,后者能更好地实现对自动扶梯乘客异常行为的实时检测,从而可以更好地保障乘客乘梯安全。
目标检测 轻量化 YOLOv5s ShuffleNetV2 C3TR模块 注意力机制 
激光与光电子学进展
2024, 61(8): 0812004
作者单位
摘要
1 中国科学院 长春光学精密机械与物理研究所,吉林 长春 130033
2 中国科学院大学,北京 100049
3 西南交通大学-利兹学院,四川 成都 610097
为解决无人机在室外实际飞行时的自主避障问题,提出一种基于Ghost改进的YOLOv5轻量化双目视觉无人机避障算法。首先,引入Ghost模块改进YOLOv5中的CBL和CSP_X单元,使用CIOUloss作为回归损失函数,并将非极大值抑制CIOUnms修改为DIOUnms以优化损失函数;其次,对双目相机进行标定和校正;使用ORB特征点提取和滑动窗口匹配算法得到检测目标的视差值,再根据视差值和相机内参求解出障碍物的距离信息;最后,根据障碍物的位置和距离实现无人机的自主避障。该避障算法在嵌入式系统中运行的平均FPS达到14.3,并用无人机避障飞行试验证实了该算法的可行性;改进后的网络检测平均准确率为76.88%,与YOLOv5相比,平均检测精度均值下降0.37%,但检测时间下降22%,参数量下降25%。该算法对无人机的自主避障具有重要的应用价值。
目标检测 轻量化 特征匹配 无人机避障 object detection lightweight feature matching obstacle avoidance unmanned aerial vehicles 
液晶与显示
2024, 39(1): 111
作者单位
摘要
1 河海大学地球科学与工程学院,江苏 南京 211000
2 江苏省测绘工程院,江苏 南京 211000
针对传统语义分割网络变化检测结果易受阴影及其他地物干扰、建筑物边界分割较为粗糙的问题,提出一种轻量级双侧输入的变化检测网络D-WNet。新网络从W-Net出发,采用深度可分离卷积块和空洞空间金字塔池化模块代替原本繁琐的卷积和下采样过程,利用右侧线特征编码器加强高低维特征的融合,同时在解码器上采样部分引入通道和时空注意力机制获取网络在不同维度下的有效特征,得到的D-WNet在性能方面有明显提升。在公开的WHU和LEVIR-CD建筑物变化检测数据集上进行实验,并与W-Net、U-Net、ResNet、SENet和DeepLabv3+语义分割网络进行对比。实验结果表明,D-WNet在交并比、F1值、召回率、准确率和运行时间等5项指标中综合表现优异,对阴影干扰及建筑物边缘区域具有更精确的变化检测结果。
航空遥感 建筑物变化检测 D-WNet 双侧输入 轻量级网络 
激光与光电子学进展
2024, 61(8): 0828003
作者单位
摘要
长安大学工程机械学院,陕西 西安 710000
裂缝是路面最主要的病害之一,及时、有效地检测和评估裂缝对路面养护至关重要。为实现路面裂缝图像快速、准确的语义分割,提出一种基于DeepLabv3+模型的路面裂缝检测方法。为减小模型参数量、提高推理速度,采用MobileNetv3作为模型的主干特征提取网络,且在空洞空间金字塔池化模块中使用Ghost卷积代替普通卷积,使模型更加轻量化。为避免替换主干网络降低模型精度:首先,在空洞空间金字塔池化模块中使用条形池化模块代替全局平均池化,有效捕获裂缝结构的上下文信息,避免无关区域噪声的干扰;其次,引入轻量级通道注意力机制efficient channel attention(ECA)模块,增强特征的表达能力,并设计浅层特征融合结构丰富图像的细节信息,优化模型对裂缝的识别效果;最后,构造混合损失函数解决裂缝数据集类别不平衡而导致检测精度较低的问题,利用迁移学习的训练方式提高模型的泛化能力。实验结果表明:所提路面裂缝检测模型参数仅为14.53 MB,比原模型参数量减少93.04%,平均帧率达到47.18,满足实时检测的要求;在精度方面,该模型裂缝检测结果的交并比和F1值分别为57.21%和72.76%,优于经典的DeepLabv3+、PSPNet、U-Net模型和先进的FPBHN、ACNet等模型。所提方法可大幅减小模型参数量,在保证路面裂缝检测精度的同时满足实时性,为基于语义分割的路面裂缝在线检测奠定基础。
图像处理 路面裂缝检测 语义分割 DeepLabv3+ 轻量化 检测精度 
激光与光电子学进展
2024, 61(8): 0812001
毕程程 1,2,3黄妙华 1,2,3,*刘若璎 1,2,3王量子 1,2,3
作者单位
摘要
1 武汉理工大学现代汽车零部件技术湖北省重点实验室,湖北 武汉 430070
2 武汉理工大学汽车零部件技术湖北省协同创新中心,湖北 武汉 430070
3 武汉理工大学湖北省新能源与智能网联车工程技术研究中心,湖北 武汉 430070
为解决行人检测任务中低能见度场景下单模态图像漏检率高和现有双模态图像融合检测速度低等问题,提出了一种基于双模态图像关联式融合的轻量级行人检测网络。网络模型基于YOLOv7-Tiny设计,主干网络嵌入关联式融合模块RAMFusion用以提取和聚合双模态图像互补特征;将特征提取部分的1×1卷积替换为带有空间感知能力的坐标卷积;引入Soft-NMS改善结群行人漏检问题;嵌入注意力机制模块来提升模型检测精度。在公开的红外与可见光行人数据集LLVIP上的消融实验表明:与其他融合方法相比,所提方法行人漏检率降低、检测速度显著提高;与YOLOv7-Tiny相比,改进后的模型检测精度提高了2.4%,每秒检测帧数达到124 frame/s,能够满足低能见度行人实时检测需求。
行人检测 红外与可见光图像 关联式融合 轻量化网络 注意力机制 YOLOv7-Tiny 
激光与光电子学进展
2024, 61(8): 0837014
作者单位
摘要
中国人民解放军战略支援部队信息工程大学地理空间信息学院,河南 郑州 450001
针对当前光学智能遥感卫星有限存储能力对全球控制信息的轻量化需求,提出一种面向光学遥感卫星星上定位精度优化的轻量化矢量控制库技术。首先,在地面提取完整道路网,通过道路细化、节点提取以及拓扑关系构建等处理,生成星上轻量化矢量控制库并上注卫星;其次,星上在轨提取道路结构,并利用随机游走避免道路缺失的影响,生成随机游走矢量结构;然后,引入隐马尔科夫模型,搜索对应矢量,并设计分层匹配策略以精化匹配结果,实现星上轻量化矢量控制库与随机游走矢量结构的匹配;最后,利用不同类型卫星影像进行随机游走矢量结构提取、星上矢量匹配以及定位性能分析。结果表明,所提光学遥感卫星的星上轻量化矢量控制库能够有效改善非量测光学遥感卫星定位精度,验证了其在光学智能遥感卫星中的可行性。
轻量化处理 矢量控制库 星上智能处理 矢量匹配 高分辨率光学遥感卫星 
光学学报
2024, 44(6): 0628003
Author Affiliations
Abstract
1 School of Computer and Communication Engineering, Changsha University of Science and Technology, Changsha 410114, China
2 Wuhan National Laboratory for Optoelectronics (WNLO) and National Engineering Laboratory for Next Generation Internet Access System, School of Optical and Electronic Information, Huazhong University of Science and Technology, Wuhan 430074, China
In this paper, we present a fast mode decomposition method for few-mode fibers, utilizing a lightweight neural network called MobileNetV3-Light. This method can quickly and accurately predict the amplitude and phase information of different modes, enabling us to fully characterize the optical field without the need for expensive experimental equipment. We train the MobileNetV3-Light using simulated near-field optical field maps, and evaluate its performance using both simulated and reconstructed near-field optical field maps. To validate the effectiveness of this method, we conduct mode decomposition experiments on a few-mode fiber supporting six linear polarization (LP) modes (LP01, LP11e, LP11o, LP21e, LP21o, LP02). The results demonstrate a remarkable average correlation of 0.9995 between our simulated and reconstructed near-field light-field maps. And the mode decomposition speed is about 6 ms per frame, indicating its powerful real-time processing capability. In addition, the proposed network model is compact, with a size of only 6.5 MB, making it well suited for deployment on portable mobile devices.
deep learning lightweight neural network few-mode fiber mode decomposition 
Chinese Optics Letters
2024, 22(2): 020604
作者单位
摘要
上海工程技术大学电子电气工程学院,上海 201620
卷积神经网络已在图像超分辨率领域得到广泛应用,Transformer近年来在该类图像处理任务中的扩展更是具有里程碑的意义,然而这些大型网络具有过多的参数量和计算量,其在部署和应用上存在很大局限性。考虑到上述发展现状,提出一种基于交错组卷积与稀疏全局注意力的轻量级图像超分辨率重建网络,该网络引入了以交错组卷积为主的特征提取模块,对Transformer的多头自注意力机制进行优化,设计了一种稀疏全局注意力机制以增强特征学习能力,并提出了一种多尺度特征重构模块来提高重建效果。实验结果表明:相比其他几种基于深度神经网络的方法,所提方法的PSNR、SSIM、参数量、计算量等性能指标都表现较好。而与基于Transfomer的方法相比,所提方法在PSNR、SSIM指标上平均提高0.03、0.0002,在参数量、计算量、运行时间上平均降低2.66×106、130×109、930 ms。
图像超分辨率 交错组卷积 注意力机制 轻量化网络 Transformer 多尺度特征重建 
激光与光电子学进展
2024, 61(4): 0411003

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!