1、GPT-SoVITS简介
GPT-SoVITS是一个开源的声音克隆项目,由B站UP主、RVC变声器创始人花儿不哭 推出,该语音合成工具结合了GPT(Generative Pre-trained Transformer)模型和SoVITS(Speech-to-Video VoiceTransformation System)变声器技术,仅需通过少量的样本数据实现高质量的语音克隆和文本到语音转换(TTS)。该工具特别适用于需要快速生成特定人声的场景,可以帮助用户在没有或只有少量目标说话人语音样本的情况下,训练出能够模仿该说话人声音(包括情感、音色、语速)的模型。
2、GPT-SoVITS的官网入口
- GitHub代码库:https://github.com/RVC-Boss/GPT-SoVITS
- Hugging Face模型:https://huggingface.co/lj1995/GPT-SoVITS
- CodeWithGPT AutoDL在线体验:https://www.codewithgpu.com/i/RVC-Boss/GPT-SoVITS/GPT-SoVITS-Official
- GPT-SoVITS使用指南:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e
- Google Colab运行地址(推荐♥♥♥):https://colab.research.google.com/github/RVC-Boss/GPT-SoVITS/blob/main/colab_webui.ipynb
3、使用Google-Colab版注意事项
①打开Google Colab地址;
②在菜单“修改”-“笔记本设置”中,选择显卡“GPU”;
③然后在菜单“代码执行程序”中,选择“运行全部”;
④最后运行结束,打开输出结果给出的public URL(只持续72小时);
⑤具体操作看下面的B站UP“痕继痕迹”教学视频;
⑥由于是使用Colab在云端,所以要上传音频文件到Colab服务器上,这样在Web UI中填写input地址时,就要填写服务器的音频文件地址。
4、以下是B站UP“痕继痕迹”的GPT-SoVITS教学视频(推荐♥♥♥):
5、以下是原创作者“花儿不哭”的B站演示视频:
6、以下是B站UP“西佩特”的GPT-SoVITS保姆级系列教学视频:
课程目录:
GSV教程1:声音克隆
GSV教程2:人声分离和手工校对标注
GSV教程3:训练英文模型
GSV教程4:在Colab中使用GPT-SoVITS
GSV教程5:如何调用API
GSV教程6:新增自动选取参考音频和保存音频历史功能
GSV教程7:API优化及在线推理模型的使用
GSV教程8:0306整合包集成TTS API功能及流式音频生成测试
GSV教程9:极速推理版功能测试和0306fix版本介绍
GSV教程10.1:基于0306FIX版超详细教程 | 训练
GSV教程10.2:基于0306FIX版超详细教程 | 推理
相关导航
暂无评论...