中国激光, 2019, 46 (11): 1109001, 网络出版: 2019-11-09   

结合分水岭和回归网络的视频时序动作选举算法 下载: 1152次

Algorithm for Video Temporal Action Proposal Combining Watershed and Regression Networks
作者单位
1 东北大学信息科学与工程学院, 辽宁 沈阳 110819
2 东北大学机器人科学与工程学院, 辽宁 沈阳 110169
图 & 表

图 1. 时序检测整体结构图

Fig. 1. Whole architecture of temporal detection algorithm

下载图片 查看原文

图 2. 改进的分水岭选举算法原理图

Fig. 2. Principle of improved watershed proposal algorithm

下载图片 查看原文

图 3. 内部区域及扩展区域的时序金字塔结构化

Fig. 3. Structure of temporal pyramid of internal and extended regions

下载图片 查看原文

图 4. 候选区域在Thumos 14上的表现。(a) AR-AN;(b) Recall-AN-tIoU

Fig. 4. Performances of candidate regions on Thumos 14. (a) AR-AN; (b) Recall-AN-tIoU

下载图片 查看原文

图 5. 两段式区域选举算法在各阶段产生的候选区域示意图

Fig. 5. Schematic of candidate regions generated in each stage of two-stage regional proposal algorithm

下载图片 查看原文

图 6. 时序上下文信息模块、时序金字塔模块、C3D单元级别特征的消融研究

Fig. 6. Ablation study oftemporal context module, temporal pyramid module, and C3D unit-level feature

下载图片 查看原文

表 1不同时序选举方法在Thumos 14数据集上产生的候选区域在后续定位任务中的表现

Table1. Performances of different temporal proposal methods in subsequent localization in candidate regions on Thumos 14 %

MethodDAPs+SVMSVMSCNNlocalizer
DAPs[14]13.99.516.3
Sparse-prop[15]7.88.115.3
SST[16]15.923.0
BSN[17]20.729.4
SCNN-prop[10]7.614.019.0
Watershed4.96.715.2
Reg8.49.918.6
Watershed+Reg24.723.837.2

查看原文

表 2ActivityNet v1.3数据集中,各方法时序定位坐标在不同tIoU下的mAP

Table2. mAP of temporal localization coordinate of each method with different tIoU on ActivityNet v1.3 dataset %

tIoU0.50.750.95Average
Method in Ref. [3]42.283.760.0514.85
BSN[17]46.4529.968.0230.03
CDC[18]45.30260.2023.80
TCN[19]23.58
SCC[20]4017.904.7021.70
Ours48.5831.748.7131.23

查看原文

表 3各方法运行速度和召回率在Thumos 14 数据集上的比较

Table3. Comparison of FPS and recall rate of different methods on Thumos 14 dataset

MethodAR-AN of 1000FPS
DAPs[4]57.64134.30
Sparse-prop[2]56.6010.20
SST[3]60.27308
CDC[18]500
Proposal-1666.27423.15
Proposal-3262.35760.84
Proposal-w/o unit60.41129.40

查看原文

黄韵文, 王斐, 李景宏, 王国锐. 结合分水岭和回归网络的视频时序动作选举算法[J]. 中国激光, 2019, 46(11): 1109001. Yunwen Huang, Fei Wang, Jinghong Li, Guorui Wang. Algorithm for Video Temporal Action Proposal Combining Watershed and Regression Networks[J]. Chinese Journal of Lasers, 2019, 46(11): 1109001.

本文已被 1 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!