深度生成模型之图像翻译GAN ->(个人学习记录笔记)

发布时间:2024年01月02日

深度生成模型之图像翻译GAN

图像翻译的应用

1. 风格迁移

  • 各类风格化应用

20240102161501586

2. 数据增强

  • 仿真数据,增强数据的多样性

在这里插入图片描述

3. 经典图像任务

  • 图像上色,图像分割,边缘检测,图像增强,超分辨,图像修复等

在这里插入图片描述

4. 内容创作

  • 交互式图像生成,图像编辑

在这里插入图片描述

5. 人脸图像编辑

  • 人脸表情,年龄,妆容,身份编辑,动漫风格化等

6. 人体图像编辑

  • 虚拟试衣,动作迁移等

在这里插入图片描述

图像翻译模型

1. 有监督图像翻译模型

  • Pix2pix,输入为图片,输出为图片,条件也是图片,需要成对的图片/标签数据进行训练

在这里插入图片描述

  • Pix2pixHD,使用多尺度生成高精度结果(2048×1024)

2. 无监督图像翻译模型

  • Couple-GAN,获取两个域的联合分布

在这里插入图片描述

  • UNIT,使用两个编码器将不同域的样本X1和X2映射到共享潜在空间z,然后分别输入生成器和判别器

在这里插入图片描述

  • CycleGAN,循环GAN

在这里插入图片描述

  • CycleGAN工程技巧

在这里插入图片描述

  • 与CycleGAN近似等价的其他结构,DualGAN,DiscoGAN,XGAN

在这里插入图片描述

3. 多域图像翻译模型

  • StarGAN,多域之间的转换

在这里插入图片描述

  • 部分内容来自阿里云天池
文章来源:https://blog.csdn.net/Slience_me/article/details/135344572
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。