作者单位
摘要
天津大学电气自动化与信息工程学院,天津 300072
针对单样本目标检测样本量较少的问题,提出了一种基于跨域学习的方法。该方法从数据增强的角度出发,增加其他域的数据集作为辅助,增强网络学习能力,同时为解决不同域间存在差异的问题,提出了一种基于图片尺度和实例尺度的跨域学习算法,分别对输入的图片特征与检测网络的候选特征增加域分类器模型,用于增强网络对跨域数据的背景和目标的域适应能力。在两个不同的跨域场景进行实验,其中在PASCAL VOC数据集上与目前主流的单样本目标检测算法进行比较,超过目前最好算法2.8个百分点,从而证明了本文方法可以有效提高单样本目标的检测性能。
卷积神经网络 目标检测 单样本学习 跨域学习 
激光与光电子学进展
2023, 60(4): 0415004
作者单位
摘要
天津大学电气自动化与信息工程学院,天津 300072
交通标志检测是自动驾驶系统的一项重要功能,当前先进的交通标志检测器大多采用Anchor-Based网络模型,根据锚框遍历所有潜在的目标位置。为了减少锚框带来的计算开销和过多的超参数设置,提出了一种基于编码-解码结构的Anchor-Free交通标志检测算法。为了增加解码模块的特征表征能力,在解码模块中引入残差增强分支。为了高效地提取和利用多尺度特征,设计了特征融合子网络,提升对多尺度目标的检测能力,并使用Ghost轻量化模块提取多尺度特征图,不显著引进运算量。在Tsinghua-Tencent 100K数据集上进行验证,所提算法实现了92.5%的召回率和90.3%的准确率,模型的参数量和模型大小分别为1.61×107和64.4 Mbit。实验结果表明,与主流目标检测算法相比,所提算法的检测精度较高,计算开销较低,在综合性能上具有优越性。
机器视觉 交通标志检测 Anchor-Free 残差结构 多尺度特征融合 
激光与光电子学进展
2022, 59(24): 2415002
作者单位
摘要
天津大学电气自动化与信息工程学院,天津 300072
模型压缩可以有效地促进卷积神经网络在资源受限设备上的部署。作为一个研究热点,滤波器剪枝已经受到了从学术界到工业界的广泛关注。滤波器剪枝的本质是对重要滤波器进行选择和保留。然而,现有的研究主要集中在静态滤波器和局部滤波器的选择上,压缩后的模型仍然存在一定的冗余。基于此,提出了一种自适应动态滤波器剪枝方法,该方法通过引入一个激活权值生成模块来生成每个滤波器的激活值。将模块嵌入各种经典网络中,来动态评估卷积层中所有滤波器的重要性,并自适应地选择能提取更丰富信息的滤波器来重构剪枝后的网络。在CIFAR-10和AUC数据集上使用不同卷积神经网络进行了实验,所提方法在CIFAR-10数据集上与目前几种主流的剪枝方法相比具有更优越的性能。在AUC数据集上进行剪枝前后压缩70%左右计算量的情况下,准确率下降不超过0.3个百分点。在不同网络上的实验证明了该方法在不同模型上的泛化能力。
机器视觉 深度学习 卷积神经网络 滤波器剪枝 分类模型 模型压缩 
激光与光电子学进展
2022, 59(24): 2415003
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
针对交通标志只在图像中占极小的区域且难以准确识别的问题,提出一种基于注意力模型的无锚框交通标志识别算法,利用密集连接网络DenseNet-121作为骨干网络并对特征进行提取。为了解决小型交通标志准确率低的问题,在骨干网络中加入注意力模型,可以对特征图进行空间和通道上的自适应调整,通过加强或抑制特征图中元素的权重可以提升对小型交通标志的识别性能。为了减小编码路径与解码路径间的语义鸿沟,引入残差网络的连接方式并提出一种语义连接路径。为了解决锚框中正负样本不均衡的问题,采用无锚框的检测方式可以定位交通标志的中心点、回归边界框的位置与尺寸信息。对所提算法在TT100K数据集上进行验证,实验结果证明所提算法具有优越性。
图像处理 深度学习 交通标志识别 注意力模型 无锚框 
激光与光电子学进展
2021, 58(16): 1610020
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
提出了一种基于深度学习的3D脑肿瘤核磁共振图像(MRI)自动分割方法。为了降低分割难度,采用三级级联网络的策略分割脑肿瘤的三个子区域;为了进一步提高三维分割的精度,采用帧间卷积和帧内卷积,加入额外的多层特征融合机制和空洞卷积;为了进一步细化分割结果,将条件随机场构建的循环神经网络整合到网络结构中。在模型训练中结合了两种损失函数,进一步提高了准确率。该方法在BraTS 2018 数据集上进行验证,对于脑肿瘤整体、肿瘤核以及增强肿瘤,其分割结果的Dice系数分别达到了0.9093、0.8254 和 0.7855,Hausdorff距离达到3.8188、7.8487和4.3264,优于大多数脑肿瘤图像分割方法。
图像处理 脑肿瘤分割 多层特征融合 空洞卷积 条件随机场 
激光与光电子学进展
2021, 58(8): 0810020
作者单位
摘要
1 天津大学电气自动化与信息工程学院, 天津 300072
2 北京智芯微电子科技有限公司, 北京 102200
提出一种基于多视角低秩表征的短视频多标签分类模型。该模型将低秩表征和多标签学习结合到同一框架中,利用不同类型特征的一致性学习本征稳定的低秩表示。同时为了获得标签相关性的潜在表示,构建了标签相关性学习项来自适应地捕获标签的相关性矩阵。此外,模型利用监督信息进一步提高了其表征能力。大量的实验结果证实了所提方法的优越性。
图像处理 低秩表征 多标签学习 多视角学习 短视频 
激光与光电子学进展
2020, 57(22): 221012
作者单位
摘要
天津大学电气自动化与信息工程学院,天津 300072
提出基于卷积神经网络的驾驶行为分析算法,该算法在人脸定位的基础上实现了驾驶员的疲劳检测和行为检测。针对疲劳检测任务,探究了卷积神经网络的不同感受野对疲劳检测精度的影响,并得到了疲劳检测模型的最佳结构。针对行为检测任务,考虑到不同行为对应作用域的大小不同,提出了一种基于多尺度特征的多支路注意力网络模型,该模型通过提取多尺度特征实现了多尺度分类,并且使用注意力机制来强化判别特征。实验结果证明,该方法能够与多种主流卷积神经网络模型相结合并有效提升驾驶行为分析的准确率。
激光与光电子学进展
2020, 57(14): 141018
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
深度卷积网络提取的表情特征易受背景、个体身份等因素影响,其与无用特征混合在一起对表情识别造成干扰。针对此问题,提出一种基于注意力模型的面部表情识别算法,该方法基于一个轻量级的卷积神经网络以避免过拟合,通过通道注意力模块和空间注意力模块对特征图元素进行加强或抑制,应用残差学习单元使注意力模型学习到更丰富的特征并获得更好的梯度流。此外,还提出一种面部表情关键区域截取方案,以解决非表情区域的噪声干扰问题。在两个常用的表情数据集CK+和MMI上对所提方法进行了验证,实验结果证明了该方法的优越性。
图像处理 表情识别 面部分析 卷积神经网络 注意力模型 
激光与光电子学进展
2020, 57(12): 121015
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津300072
提出了一种基于导师-学生网络的驾驶行为识别模型。考虑到驾驶动作是在局部区域发生的,将驾驶行为识别任务拆分成动作定位和动作分类两个子任务。针对动作定位任务,设计了网络层数较浅和接收高分辨率图像输入的导师网络,导师网络通过特征图的响应对动作区域进行弱定位;在动作定位基础上,针对动作分类任务,设计了网络层数较深的接收低分辨率动作区域图像输入的学生网络,学生网络根据深层网络提取的高层次语义特征实现高准确率分类。实验结果证明,导师-学生网络模型能带来较高的识别准确率,具有强稳健性。
图像处理 深度学习 驾驶行为识别 卷积神经网络 弱定位 动作分类 导师-学生网络 
激光与光电子学进展
2020, 57(6): 061019
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
设计了三维成像激光雷达高带宽数据采集与存储系统。为保证系统存储的实时性,通过PCIE 3.0 (peripheral component interface express 3.0)将数据传输到计算机,将回波数据存储到固态硬盘(SSD)大容量盘阵中。针对系统中多片模数转换器(ADCs)采样数据不同步问题,提出了高速信号同步触发电路及现场可编程逻辑门阵列(FPGA)固有路径延迟校准算法。为了精确测量激光雷达内光路触发脉冲与系统时钟之间的延时量,设计了基于多级输入输出延迟(IODELAY)单元的时间数字计数器(TDC)算法,时间分辨率高达52 ps。结果表明,系统最大存储带宽为5.12 GByte/s,存储容量为24 TByte,在数据采集和存储上表现出很强的实时性和同步性,有较高的实用价值。
遥感 三维成像激光雷达 回波信号 高速数据采集 数据存储 
激光与光电子学进展
2019, 56(10): 102801

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!