Video Classification Using 3D ResNet

This is a torch code for video (action) classification using 3D ResNet trained by this code.
The 3D ResNet is trained on the Kinetics dataset, which includes 400 action classes.
This code uses videos as inputs and outputs class names and predicted class scores for each 16 frames.

PyTorch (Python) version of this code is available here.

Requirements

Torch

git clone https://github.com/torch/distro.git ~/torch --recursive
cd ~/torch; bash install-deps;
./install.sh

json package

luarocks install json

FFmpeg, FFprobe

wget http://johnvansickle.com/ffmpeg/releases/ffmpeg-release-64bit-static.tar.xz
tar xvf ffmpeg-release-64bit-static.tar.xz
cd ./ffmpeg-3.3.3-64bit-static/; sudo cp ffmpeg ffprobe /usr/local/bin;

Python 3

Preparation

Download this code.
Download the pretrained model.
- We recommend ResNet-34.

Usage

th main.lua --input ./input --output ./output.json --model ./resnet-34-kinetics.t7

To visualize the classification results, use generate_result_video/generate_result_video.py.

Citation

If you use this code, please cite the following:

@article{hara3dresnets
  author={Kensho Hara and Hirokatsu Kataoka and Yutaka Satoh}
  title={Learning Spatio-Temporal Features with 3D Residual Networks for Action Recognition}
  journal={arXiv preprint}
  volume={arXiv:1708.07632}
  year={2017}
}

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
generate_result_video		generate_result_video
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
class_names_list		class_names_list
classify.lua		classify.lua
data_loader.lua		data_loader.lua
input		input
main.lua		main.lua
opts.lua		opts.lua
utils.lua		utils.lua

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Video Classification Using 3D ResNet

Requirements

Preparation

Usage

Citation

About

Releases

Packages

Languages

License

kenshohara/video-classification-3d-cnn

Folders and files

Latest commit

History

Repository files navigation

Video Classification Using 3D ResNet

Requirements

Preparation

Usage

Citation

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages