最近比较火的一个AI场景,就是用原声讲外语,嘴型同步,网上找了些资料,今天也跑起来了,推荐 Wav2Lip,官网地址:Github Wav2Lip
上述步骤中涉及到下载地址的,直接访问官网首页对应链接即可下载
将 requirements.txt
中的 opencv-contrib-python>=4.2.0.34
修改为 opencv-contrib-python==4.2.0.34
直接进 pytorch 官网,用官网的方法安装 https://pytorch.org/get-started/previous-versions/#v110
直接用官方的视频demo,进入 https://bhaasha.iiit.ac.in/lipsync/ 这个地址,里面的三个视频可以直接下载使用
推荐这个网站,很好用 https://www.text-to-speech.cn/
python inference.py --checkpoint_path ./face_detection/detection/sfd/wav2lip.pth --face D:/Ekoz/Items/QiuBao/dictator_orig.mp4 --audio D:/Ekoz/Items/QiuBao/output.wav
最终合成的视频,在 results 目录下