VoiceFixer 2:用于语音恢复的工具包

发布时间:2023年12月19日

项目简介

欢迎使用 VoiceFixer 2,下一代 VoiceFixer。VoiceFixer 是一款通用语音修复工具,使用 AI 消除背景噪音、修复降级语音、增强旧录音的音频质量、提高音频分辨率等等,全部功能都在一个模型中!

VoiceFixer 的目标是恢复人类语音,无论其退化有多严重。它可以在一个模型内处理噪声、混响、低分辨率和削波效果!


与原来的 VoiceFixer 有什么不同?

VoiceFixer 的原始版本继续更新,进行了细微的更改和错误修复,但是,如果尝试安装它并开箱即用,则会遇到一些错误,需要修改已安装的软件包才能修复。

有什么问题?这是如何解决的?VoiceFixer 需要旧版本的?librosa?库,该库与新版本的?numpy?库不兼容。我们通过修复旧版本的?librosa?和?voicefixer?解决了这个问题。我们还添加了一些新功能。


VoiceFixer 2 中的新功能

我们在 VoiceFixer 2 中添加了以下功能:

  • 我们添加了 MPS 支持,这意味着您可以在 M1 Mac 上使用 GPU 加速。您可以通过将?cuda?参数设置为?True?来启用此功能。使用命令行界面 (CLI) 时会自动启用它。

  • 我们通过 TQDM 添加了进度条以获取更长的音频

  • 我们现在支持非 WAV 文件(即 MP3)

  • 我们现在使用?cached_path?而不是硬编码缓存路径来增加操作系统支持

  • 我们提供更快的模型下载和 Hugging Face

  • 更多功能即将推出!

安装

不想安装该软件包,但只想尝试一下?

使用我们的免费 API(无需 API 密钥)处理 5 分钟以内的音频文件。仅限非商业用途,可能会收集音频。详情见网页。

curl -X POST -H "Content-Type: multipart/form-data" -F "file=@test.mp3" https://voicefixer-voicefixer-api.hf.space/process_audio > processed_audio.wav

注意:如果您在 Apple Silicon 上有任何问题,请安装 PyTorch Nightly ( pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu )

您可以通过安装我们的软件包。PyPI(Python Package Index),官方 Python 包索引。

pip install voicefixer2

这将安装最新发布的版本。

如果您想安装最新的开发版本,或者出于任何原因不信任 PyPI,请直接从源安装:

pip install git+https://github.com/fakerybakery/voicefixer

项目链接

https://github.com/voicefixer/voicefixer

文章来源:https://blog.csdn.net/AI_SHELL/article/details/135086667
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。