机器学习笔记 - 基于自定义数据集 + 3D CNN进行视频分类

发布时间：2024年01月22日

一、简述

这里主要介绍了基于自定义动作识别数据集训练用于视频分类的 3D 卷积神经网络 (CNN) 。3D CNN 使用三维滤波器来执行卷积。内核能够在三个方向上滑动，而在 2D CNN 中它可以在二维上滑动。

这里的模型主要基于D. Tran 等人2017年的论文“动作识别的时空卷积研究”。

https://arxiv.org/abs/1711.11248v3https://arxiv.org/abs/1711.11248v3

1、模型结构

2、数据集

数据集使用的是别人贡献的开源数据集，感谢所有愿意开源的兄弟。

文章来源:https://blog.csdn.net/bashendixie5/article/details/134660500
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！