阿里云大模型「让照片跳舞」刷屏朋友圈，有哪些信息值得关注？

发布时间：2024年01月05日

介绍

大家好，我分享聊聊阿里通义千问APP中全民舞王功能。

网络热舞结合AI视频，这是以后不用学习跳舞？

可以尝试下效果，一张图片生成视频。

APP快速使用

搜索下载通义千问APP
在这里插入图片描述
打开APP，选中一张照片来跳舞。

这里上传照片原则：身体保持全身站立，挺胸抬头，图像中不要有其他人，背景简单些。

AI视频一张图片跳科目三

图解原理

虽然一些技术没有开源，我们可以根据阿里通义实验室自研视频生成模型 Animate Anyone，推演原理。

我们通过图讲解下演化，Animate Anyone用于人物动画的图像到视频合成方法，基于扩散模型重构创新所得。

图解扩散模型生成过程

在这里插入图片描述
VAE编码器（输出矩阵）-> UNet (完成当前时间步 t 的噪声预测) -> SD1.x 系列(64x64x4 的向量) -> 采样器 (重复 N 次) 去除噪声 -> VAE解码器 -> 生成图像。

具体可以看我原先的讲解扩散模型

图解Animate Anyone生成过程

参考图像和姿态序列输入，经过VAE编码器，创建一个矩阵（潜在的表示），用到CLIP （文本-图像映射）引导角色原始外观，姿态引导与U-Net结合，类似上述过程，在空间和时间中去噪，输出一个合成视频。

该架构强调保持角色的详细特征、运动的连续性和对动画的控制。

该模型解决了图像到视频合成的挑战，如保持详细信息和确保生成动画的时间稳定性。

论文在从静态图像生成角色视频方面呈现了最先进的结果。

总结

阿里云大模型 Animate Anyone就像一个超级导演。

与过去那些导演只会让演员在视频里面变来变去、动作不连贯不同，这个模型导演出来的视频，无论演员的样子还是动作都非常逼真流畅，就像真人一样。

朋友们可以一块讨论下还适合在什么领域？

我是李孟，独立开源软件开发者，SolidUI作者，对于新技术非常感兴趣，专注AI和数据领域，如果对我的文章内容感兴趣，请帮忙关注点赞收藏，谢谢！

文章来源:https://blog.csdn.net/qq_19968255/article/details/135416235
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！