GPT-SoVITS声音克隆

GPT-SoVITS是一个开源的声音克隆项目，由B站UP主、RVC变声器创始人花儿不哭推出

广告也精彩

广告也精彩

1、GPT-SoVITS简介

GPT-SoVITS是一个开源的声音克隆项目，由B站UP主、RVC变声器创始人花儿不哭推出，该语音合成工具结合了GPT(Generative Pre-trained Transformer)模型和SoVITS(Speech-to-Video VoiceTransformation System)变声器技术，仅需通过少量的样本数据实现高质量的语音克隆和文本到语音转换(TTS)。该工具特别适用于需要快速生成特定人声的场景，可以帮助用户在没有或只有少量目标说话人语音样本的情况下，训练出能够模仿该说话人声音(包括情感、音色、语速)的模型。

2、GPT-SoVITS的官网入口

GitHub代码库：https://github.com/RVC-Boss/GPT-SoVITS
Hugging Face模型：https://huggingface.co/lj1995/GPT-SoVITS
CodeWithGPT AutoDL在线体验：https://www.codewithgpu.com/i/RVC-Boss/GPT-SoVITS/GPT-SoVITS-Official
GPT-SoVITS使用指南：https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e
Google Colab运行地址（推荐♥♥♥）：https://colab.research.google.com/github/RVC-Boss/GPT-SoVITS/blob/main/colab_webui.ipynb

3、使用Google-Colab版注意事项

①打开Google Colab地址；

②在菜单“修改”-“笔记本设置”中，选择显卡“GPU”；

③然后在菜单“代码执行程序”中，选择“运行全部”；

④最后运行结束，打开输出结果给出的public URL（只持续72小时）；

⑤具体操作看下面的B站UP“痕继痕迹”教学视频；

⑥由于是使用Colab在云端，所以要上传音频文件到Colab服务器上，这样在Web UI中填写input地址时，就要填写服务器的音频文件地址。

4、以下是B站UP“痕继痕迹”的GPT-SoVITS教学视频（推荐♥♥♥）：

<span data-mce-type="bookmark" style="display: inline-block; width: 0px; overflow: hidden; line-height: 0;" class="mce_SELRES_start"></span>

5、以下是原创作者“花儿不哭”的B站演示视频：

<span data-mce-type="bookmark" style="display: inline-block; width: 0px; overflow: hidden; line-height: 0;" class="mce_SELRES_start"></span>

6、以下是B站UP“西佩特”的GPT-SoVITS保姆级系列教学视频：

课程目录：

GSV教程1：声音克隆

GSV教程2：人声分离和手工校对标注

GSV教程3：训练英文模型

GSV教程4：在Colab中使用GPT-SoVITS

GSV教程5：如何调用API

GSV教程6：新增自动选取参考音频和保存音频历史功能

GSV教程7：API优化及在线推理模型的使用

GSV教程8：0306整合包集成TTS API功能及流式音频生成测试

GSV教程9：极速推理版功能测试和0306fix版本介绍

GSV教程10.1：基于0306FIX版超详细教程 | 训练

GSV教程10.2：基于0306FIX版超详细教程 | 推理

相关导航

字节火山TTS

字节跳动旗下文生音工具

Faster-Whisper(STT语音转写)

Faster-Whisper是基于 OpenAI Whisper模型的重写，在相同精度上，Faster-Whisper的语音转写速度比OpenAI快4倍

大饼AI变声

一款功能强大，专业实用的优秀变声器软件

剪映AI克隆声音

抖音旗下声音克隆工具

ChatTTS-Enhanced

增强版ChaTTTS，各方面性能大幅超越原版ChaTTTS，感谢CCmahua大佬的开源！

阿里FunASR语音识别

阿里推出的实时语音识别开源项目

广告也精彩

暂无评论

您必须登录才能参与评论！

暂无评论...