论文-3D卷积 C3D 及衍生方法
1. (C3D)Learning spatiotemporal features with 3d convolutional networks-2015ICCV-facebook
概述:采用 3D 卷积和 3D Pooling 构建了网络。 通过 3D 卷积,C3D 可以直接处理视频(或者说是视频帧的 volume)关键词:C3D,速度快,模型简单论文地址:https://arxiv.org/pdf/1412.0767.pdf论文翻译地址:https://www.jianshu.com/p/09d1d8ffe8a4caff 源码:https://github.com/facebook/C3D
主要贡献1)与 2DCNN 相比,3DCNN 更适合时空特征学习;
2)对于 3D ConvNet 而言,在所有层使用 3×3×3 的小卷积核效果最好;
3)我们通过简单的线性分类器学到的特征名为 C3D(Convolutional 3D),在 4 个不同的基准上优于现有的方法,并在其他 2 个基准上与目前最好的方法相当。
此外,特征是紧凑的:在 UCF101 数据集上得到 52.8%的准确 ...