
东汉末年
计算机视觉 - 视频理解 11 篇经典论文和解读以及代码
2023-02-09 14:34:43
整理了 从2012-2021年间影响力比较大的11篇经典论文,附上对应的论文解读和相关代码。整理自 https://github.com/mli/paper-reading
DeepVideo 提出sports1M数据集

数据集
DeepVideo Medium解读(英文)

Medium
DeepVideo 论文翻译

csdn
Two-stream 引入光流做时序建模

超越手工特征
Two-stream 论文笔记

Two-stream Github代码

pytorch
C3D 深的3D-CNN做视频理解

3DCNN
C3D 论文翻译和解读

csdn
C3D Github 代码

facebook
Beyond-short-snippets 使用LSTM

LSTM
Beyond-short-snippets 论文翻译

简书
Convolutional fusion加强时空间

Convolutional fusion 论文翻译

简书
Convolutional fusion Github

2016
TSN 视频分段建模, tricks

tricks
TSN 论文解读

知乎专栏
TSN Github代码

caffe
I3D Kinetics数据集 3DCNN

3DCNN
I3D 论文解读

I3D Github代码

deepmind
R2+1D 拆分3D卷积核 优化

3DCNN
R2+1D 论文笔记

csdn
R2Plus1D Github 代码

facebook
Non-local 引入自注意力模型

自注意力
Non-local 论文解读

简书
Non-local Github代码

facebookcaffe2
SlowFast 快慢两支提升效率

何凯明
SlowFast 论文解读

SlowFast Github代码

facebook
TimeSformer 引入transformer

transformer
TimeSformer 论文解读

简书
TimeSformer github代码

facebookpytorch
Comments
No comments yet, be the first to comment