作者单位
摘要
南京信息工程大学自动化学院, 江苏 南京 210044
针对传统神经网络无法对相似度较高的中式菜品进行有效分类的问题,提出了一种基于改进残差网络的中式菜品识别 RNA-TL (ResNet with Attention and Triplet Loss) 模型。该算法先融合多尺度特征以提取深层次图像的语义信息,然后增加一层注意力机制层,给予图像重要部分更多的关注,最后利用三元组损失(Triplet Loss, TL)计算类间相似度并将结果输入到支持向量机(Support Vector Machine, SVM)中进行分类。实验表明,相较于其他主流算法模型,RNA-TL模型在中式菜品公共数据集上以及课题组采集的数据集上的识别准确率表现出更优越的性能。
图像处理 中式菜品识别 三元组损失 卷积神经网络 注意力机制 
激光与光电子学进展
2021, 58(6): 0610019

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!