解读文生视频大模型ModelScopeT2V技术报告

发布时间:2023年12月17日

Diffusion Models视频生成-博客汇总

前言:ModelScopeT2V是17B的文生视频大模型,由阿里巴巴达摩院发布,且模型和代码完全开源。当中提出的多层时空机制和多帧训练法非常值得借鉴。这篇博客详细解读一下ModelScopeT2V背后的技术。

目录

贡献概述

方法详解

整体流程

文章来源:https://blog.csdn.net/qq_41895747/article/details/134155627
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。